搜汉字历史资料文档格式.docx
《搜汉字历史资料文档格式.docx》由会员分享,可在线阅读,更多相关《搜汉字历史资料文档格式.docx(7页珍藏版)》请在冰点文库上搜索。
周朝,由于疆域广阔且诸侯割据日久,汉字在春秋晚期明显出现诸侯国之间文字异形,战国时期的文字异形情况更重。
秦统一后为巩固统治,秦始皇令丞相李斯、中车府令赵高、太史令胡毋敬等整理文字,以秦国大篆为基础制定出小篆,作为标准字体,通令全国使用。
稍后,普遍又依当时民间流行的字体,整理出更简便的字体隶书,并作为日用文字在全国广为流传。
东汉末期,楷书出现,至此汉字的演化已臻完善。
不仅如此,东汉时出现了第一部书法专著《草书势》。
过去常讲汉字始于商代的甲骨文,但其实甲骨文已经是成熟文字,在此之前汉字应该存在一段从产生到成熟的发展过程,因此有人主张推至夏末;
也有人主张推至夏以前,各执己见。
郭沫若在《古代文字之辩证的发展》指出:
“汉字究竟源始于何时呢?
我认为,这可以从西安半坡村遗址距今的年代为指标。
”,“半坡遗址年代距今有六千年左右。
”,“半坡遗址是新石器时代仰韶文化的典型”,“半坡彩陶上每每有一些类似文字的简单刻划,和器上的花纹判然不同。
”“虽然刻划的意义至今尚未阐明,但无疑是具有文字性质的符号。
”“可以肯定地说就是中国文字的起源,或者中国原始文字的孑(ji&
eacute;
)遗。
”如按此说,中国文明则应算成近六千年。
中国文字之源始,究竟在何时?
最古老的文字产生于什么时代?
分别代表什么含义?
至今仍未达成一致意见,有待于大量的材料来说明。
搜汉字历史资料之数量
汉字的数量并没有准确数字,大约将近十万个(北京国安咨讯设备公司汉字字库收入有出处汉字91251个),日常所使用的汉字只有几千字。
据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字则已到99%,简体与繁体的统计结果相差不大。
关于汉字的数量,根据古代的字书和词书的记载,可以看出其发展情况。
秦代的《仓颉》、《博学》、《爰历》三篇共有3300字;
汉代扬雄作《训纂篇》有5340字,到许慎作《说文解字》[2]就有9353字了;
据唐代封演《闻见记;
文字篇》所记,晋吕忱作《字林》有12824字,后魏杨承庆作《字统》有13734字,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字;
唐代孙强增字本《玉篇》有22561字。
宋代司马光修《类篇》多至31319字,宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书;
清代《康熙字典》有47000多字了;
1915年欧阳博存等编著的《中华大字典》有48000多字;
1959年日本诸桥辙次主编的《大汉和辞典》有49964字;
1971年张其昀主编的《中文大辞典》有49888字;
1990年徐仲舒主编的《汉语大字典》有54678字;
1994年冷玉龙等编著的《中华字海》有85000字。
台湾地区教育主管机关编撰的《异体字字典》第五版,内容含正字与异体字,共106230字,是收录最多汉字的字典。
历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。
绝大多数异体字和罕用字已被规范掉,除古文之外一般只在人名、地名中偶尔出现。
此外,继第一批简化字后,还有一批“二简字”,已被废除,但仍有少数字在社会上流行。
如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。
但是《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而今天的书面语里已经废置不用的字。
据统计,十三经(《易经》、《尚书》、《公羊传》、《论语》、《孟子》等13部典籍)全部字数为589283个字,其中不相同的单字字数为6544个字。
因此,实际上人们在日常使用的汉字不过六千多而已。
在汉字计算机编码标准中,最大的汉字编码是台湾地区的CNS11643,5.0版全字库可供查询的字共87,047个汉字、10771个拼音文字及894个符号。
台港民间通用的大五码收录繁体汉字13053个。
GB18030是中华人民共和国现时最新的内码字集,GBK收录汉字简体、繁体及20912个,而早期的GB2312收录简体汉字6763个。
Unicode的中日朝(韩)统一表意文字基本字集则收录汉字20902个,总数亦高达七万多字。
初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。
为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。
汉字数量的过度增加又引发了汉字学习的困难,单一汉字能表示的意义有限,于是有许多单一的汉语意义是用汉语词语表示,例如常见的双字词。
汉语书写的发展多朝向造新词而非造新字。
殷墟的甲骨文更早、与汉字起源有关的出土资料。
这些资料主要是指原始社会晚期及有史社会早期出现在陶器上面的刻画或彩绘符号,另外还包括少量的刻写在甲骨、玉器、石器等上面的符号。
可以说,它们共同为解释汉字的起源提供了新的依据。
搜汉字历史资料之构造
汉字是“形、音、义”的结合体,大多数汉字是由形旁和声旁组成的。
六书是汉字构字的基本原理。
在《周礼》中就提到了六书,只是没有说明具体内容。
到了东汉,许慎在《说文解字》[2]中,详细阐述了“六书”构造原理:
象形、指事、会意、形声、转注、假借。
象形:
这种造字法是依照物体的外貌特征来描绘出来,所谓“画成其物,随体诘诎”是也。
如日、月、山、水等四个字,最早就是描绘日、月、山、水之图案,后来逐渐演化变成如今的造型。
瓜是一个象形字。
“瓜”字中,两撇表示藤,中间竖钩表示瓜,捺表示叶。
“葫芦科植物的统称”就是“瓜”的本义。
“形状像瓜”,在现实生活中有很多东西像瓜形的,比如,“瓜皮帽”是帽子的一种;
“瓜皮船”是船的一种。
“像切瓜一样”,瓜的命运是要被切分的,由此引申出此义。
人们用“瓜分”表示分割或分配。
又指若干强国联合起来分割弱小或不发达国家的土地。
“傻瓜”,表示不聪明,这一词来自古代的“瓜子族”,春秋时期生活在瓜州(甘肃敦煌一带)姜姓人被称为“瓜子族”,他们十分勤劳,受人雇佣时总是一刻不停地干活,可是有些人把他们这种老实的习俗看作“傻”,于是就有了“傻瓜”了。
指事:
这是指表现抽象事情的方法,用象征的符号,或在象形字上加上符号来表示某个词。
所谓“各指其事以为之”是也。
如人在其上写作“上”,人在其下写作“下”,“刃”,在刀口上加一点,表示这里最锋利,这就是刀刃,等等。
自大一点就是“臭”,“富”有田的人,“穷”靠用“力”打工,“贱”的繁体是“贱”,右边两个“戈”,为钱而争斗,自然是“贱”。
形声:
就是文字内以特定形状(字根)表特有的音。
例如胡。
这个字也可为一个字根,结合不同的属性字根,可合成为:
蝴、蝴、湖、葫、瑚、醐等等,而以同样的发音(也有的只有声母一样),表达不同的事物。
形声是汉字里造字最多的方法和神韵。
形声字的形旁和声旁有四种组合方式:
左形右声:
情、忆、哼、犷、构、描&
hellip;
&
右形左声:
期、战、鹦、鸠、领、飘&
上形下声:
宇、笆、雾、草、景、符&
下形上声:
盂、货、娶、基、裘、盒&
内形外声:
闻、问、闷、瓣、辫、辩&
外形内声:
园、囤、病、衷、阁、匣&
形占一角:
疆、腾、栽、裁、载&
有些形声字,随着汉字的改革表音部分的读音有了变化,已经不起表音的作用了,如果再读半边就要闹笑话。
“秀才识字读半边”又成了对“秀才”们读错字的讽刺。
会意:
这种造字法,是用两个或几个字组成一个字,把这几个字的意义合成一个意义。
如“日”和“月”组起来,就是日光加月光变成“明”。
“人”字和“言”字合成“信”字,意思就是人过去所言有信,就是这个人很遵守自己说过的话,“休”,“人”和“木”合在一起,一个人靠在树上,表示休息。
有些会意字是两个或几个同样的字重叠组成的。
二字重叠的多是左右的并列结构,三字重叠的多是塔型的上下结构,看起来像体操活动中的叠罗汉。
例如三个“人”组成“众”;
三个“火”组成“焱”;
三个“木”组成“森”;
三个“日”组成“晶”;
三个“直”组成“矗”;
三个“水”组成“淼”;
三个“口”组成“品”等。
会意字由于字形的变化太大,已看不出它们的字源了。
例如妇女的妇字,为什么在女旁加个歪山呢?
正确的字源分析只能从繁体字“妇”中才能看出。
这个“妇”字左边的“女”旁指妇女,女旁的“帚”是扫帚,前后合在一起的意思是妇女拿着扫帚在家里劳动。
“女、帚为妇”和“力、田为男”是符合当时的“女内男外”、“男耕女织”的社会情况的。
这类不容易看出字源的字相当多,人们叫作“破体字”。
“她”是现代汉语里常用的一个人称代词,专指第三者的女性。
此字是古代“姐”字的异体,20世纪20年代由刘半农首先作为第三人称女性代词使用,并非新造字。
转注:
这是用于两个字互为注释,彼此同义而不同形,汉代许慎解释道:
“建类一首,同意相受,考、老是也。
”这怎么说呢?
此二字,古时“考”可作“长寿”讲,“老”、“考”相通,意义一致,即所谓老者考也,考者老也。
《诗经;
大雅;
棫朴》亦云:
“周王寿考”。
假借:
此法简言之,就是借用一字,去表达别的事物。
一般来说,有一个无法描述的新事物,就借用一个发音接近或是属性近似的字根,来表达这个新事物。
例如“又”,本来是指右手(最早见于甲骨文),但后来被假借当作“也是”的意思。
又如“闻”,本意是用耳朵听的意思,《大学》中就有“视而不见,听而不闻,食而不知其味”,后来被假借成嗅觉动词。
总结以上六书;
;
前两项,“造字法”也;
中两项,“组字法”也;
后两项,“用字法”也。
总而言之,以上原理是古代文字学学者们群策群力归纳出来的文字学理论,其所含的汉字构成法则,并非一人独创,是人们在使用过程中长期演化而成,是一代又一代集体智慧的结晶。
搜汉字历史资料之字形
汉字由表意象形字根,如金、木、水、火、土等,像积木一样组合而成。
因形状方正,有“方块字”的别称,从结构上来看,汉字有以下特色:
规整的字体(如楷书、宋体、隶书、篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。
汉字包括独体字和合体字,独体字不能分割,如“文”、“中”等;
合体字由基础部件组合构成,占了汉字的90%以上。
合体字的常见组合方式有:
上下结构,如“笑”、“尖”;
左右结构,如“词”、“科”;
半包围结构,如“同”、“趋”;
全包围结构,如“团”、“回”;
上中下结构,如“赢”;
左中右结构,如“斑”;
“品”字形结构,如“品”。
汉字的基础部件包括独体字、偏旁部首和其他不成字部件。
汉字的最小构成单位是笔画,笔画也具有一定的含义,如横画
(一),可表示地平线(如旦字中的一横)等。
书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。
基本规则是,先横后竖,先撇后捺,从上到下,从左到右,先外后内,先外后内再封口,先中间后两边。
不同书写体汉字的笔顺可能有所差异。
从字体上分,可将各类汉字的字体分为三大类型。
第一类是从宋代活字印刷发展起来的宋体、黑体(包括粗、细等线体)等;
第二类是由书法演变而来的字体,如楷体、仿宋体、行楷、隶体、魏体、舒体、颜体、瘦金体以及钢笔书写的字体等;
第三类是属于美术字体,如综艺、美黑、琥珀、水柱等。
其他字体多是属于以上三类字体的变异,例如:
由宋体演变的大标宋、小标宋、报宋、长宋、中宋、姚体等;
由黑体演变而成的大黑、平黑、粗黑、等线体(包括粗、中、细等线体,后又演变出粗、准、细圆体)等;
由楷体、仿宋体等演变而来的中楷和细仿宋等;
由黑体和宋体演变而来的美黑;
由隶体演变而来的隶变体等汉字。
笔画最少的汉字只有一划。
有的字在书面上没有,只在民间流传“biang”是笔画较多的汉字,有56笔,异体字共有45笔,繁体字共有59笔。
“biangbiang面”是源于陕西的一种面,也是一家面馆的品牌,还在使用这个字,流传不广,近几年方才流行,声称只能在康熙字典中查到“biang”字写法。
事实上,在康熙字典中查不到“biang”字的写法。
关于biang,有一个字谜:
一点飞上天,黄河两道弯,八字大张口,言字往里走。
东一扭,西一扭。
左一长,右一长,中间坐了个马大王。
心字底,月字旁,打个勾勾挂麻糖,
推个车车逛咸阳。
日文汉字有一个字有84画之多,日语读作“たいと”(Tai-To)。