汉字chapter4Word下载.docx
《汉字chapter4Word下载.docx》由会员分享,可在线阅读,更多相关《汉字chapter4Word下载.docx(23页珍藏版)》请在冰点文库上搜索。
汉字通过分级定量后,可以更切合实际应用的需要。
(二)现代汉字的通用量
1,现代通用汉字的数量估计
通用汉字就是书写现代汉语通常要用的宇,也就是除去有特定使用范围的专用字和罕用的生僻字后留下来的一般要用的字。
根据历代文字资料的统计,从商代到现代,一般使用的汉字数量没有显著变化,可能一直在五六千个左右。
现代制订的具有通用字表性质的汉字标准,基本上维持或略微超过这一数目。
例如:
出版印刷方面:
1965年文化部和中国文字改革委员会联合发布的《印刷通用汉字字形表》,收字6196个。
信息处理方面:
1981年国家标准局发布的GB2312—80《信息交换用汉字编码字符·
基本集》收字6763个。
电报通讯方面:
1983年邮电部编制出版的《标准电码本》(修订本)收字7292个。
从以上三个方面的收字量来看,现代通用汉字的数量大约有六七千个。
这个数量基本反映了我国当前通用汉字的大致情况。
通用字的数量一般比较稳定,这是因为尽管现代社会新词语增加很快,但由于复合词在现代汉语里越来越占优势,而复合词大都用旧字记录,除了科技词语,很少造新字;
即使造一些新字,也总会有一些旧字陆续退出通用范围。
二者相抵,字数变化就不大了。
这是通用字的数量能够在总体上维持相对稳定的原因之一。
2.(现代汉语通用字表)的制定
为了促进语言文字规范化,进一步满足出版印刷、信息处理以及其他方面的用字需要,
1988年3月由国家语言文字工作委员会和新闻出版署联合发布了《现代汉语通用字表》。
《现代汉语通用字表》规定了每个字的字形结构、笔画数和笔顺,(并根据近年来汉字应用的实际情况删去其中的50个字,增收另外的854个字,)共收通用字7000个。
7000个通用字包括常用字和非常用字各;
3500个。
非常用字主要有以下几类字:
1.文言用字,如:
兮叵哉贳枵哂曷矧
2.口语用宇,如:
夯仨顸拽尜哕绗哏尥
3.专业用字,如:
卟氕茳钚钛氡氟胨
4.地名用字,如:
xx邗邛邡荥郢郧朐
5.姓氏用宇,如:
xxxxxxxxxx
6,方言用孛,如:
爿圩夼囝囡凼
7拟声用字,如:
咩哞哟咣嗨嗯嗵
8.译音用字,如:
哔镑咔咖啡哩
它同时也吸收了其他几个规范字表的成果,并作了某些合理的调整。
收了〈第一批异体字整理表〉中的正体字,不收淘汰的异体字,但增收了其中原为异体后因尚需使用而恢复为正体的28个字(阪、挫、雠、诃、、、、(zhe2)、、、、、诓、、桉、、凋、彷、菰、骼、晖、、翦、徼、愣、黏、邱、薰、於)。
再如:
收了《简化字总表》中的简化字,不收相应的繁体字,但增收了在某种情况下不简化的7个繁体宇(乾、夥、藉、、麽、摺、徵)和根据偏旁类推的简化字“馀”。
还增收了1986年修订的<
简化字总表)中规定不简化的“覆、像、叠”和新简化字“”。
经过以上合理调整,所订的字表更切合应用实际。
‘《现代汉语通用字表》是一份很有实用价值的规范字表,它使现代通用的汉字不仅在字量上有了明确的规定,而且在字形上也有了明确的规范。
通用字之外还有一部分专用字,因此通用字的数量确定后,还要研究各种专业用字的字量,并根据专业的门类制订各种专用字表。
专业用字可分为姓名专用字、史地专用字、科技专用字;
宗教专用字、民族专用字、译音专用字、方言专用字等。
(制订现代汉字的各种专业用字表,合理控制专业用字的数量,将是语言文字工作者今后一个相当重要的任务。
(三)现代汉字的常用量
1.现代常用汉字的数量估计
常用字就是书写现代汉语经常要用到的字。
(汉字总字数很多,通用字的数量也不少,可是人们经常使用的字数量并不多,往往只集中在有限的二三千个字种上。
据统计,
孙中山的《三民主义》只用了2134个字种,
老舍的<
骆驼样子)只用了2413个字种,
《曹禺选集》《雷雨》《日出》、《北京人》只用了2808个字种,
即使长达五卷的《毛泽东选集》也只用了3136个字种。
这说明人们写作时经常使用的汉字字种数量是有限的)
如果我们根据政治论文、文艺作品、新闻通讯、科技论文等几方面的语料作字频统计,那么现代汉语用字集中的情况将进一步得到证实。
下面我们综合各家宇频统计的结果,列表说明一个大概情况。
常用字最根本的特点常用性(使用频率较高):
见特点1
┌────────┬─────────┬─────────┐
│字种数│覆盖率(%)│不足率(%)│
├────────┼─────────┼─────────┤
│1000│90│10│
│2400│99│1
│3800│
99.9│
0.1│
├────────┼─────────┼─────────┤│5200│
99.99│
0.01│
│6600│
99.999│
0.001│
└────────┴─────────┴─────────┘
表说明了常用字的常用性这个特点:
简表告诉我们,掌握了前1000个字,就可以读懂文章的90%,掌握了前2400个字,就可以读懂文章的99%,掌握了前3800个字,就可以读懂文章的99.9%,覆盖率已接近100%了.
常用字其他特点:
2、3、4
这张简表告诉我们,前1000个高频字种能覆盖全部被统计语料的90%,前3800个高频字种能覆盖全部被统计语料的
99.9%。
汉字用字集中的情况给我们一个重要的启示:
学习和掌握汉字,必须首先抓住出现频率高的那些常用字,它们是书写现代汉语最需用的宇,是用字的基础,是汉字学习的重点。
因此研制一份覆盖面广的常用字表是十分重要的,它可以提供一个必须掌握的字汇范本,以适应社会多方面的需要。
2.《现代汉语常用字表》的制定
常用字表的研制工作,始于1928年《语体文应用字汇》的编制。
以后几十年间又研制了不少常用字表,其中较有影响的是1952年教育部公布的《常用字表》。
该表选定的2000个常用字一直是扫盲的标准。
可是时隔数十年,社会用字的情况发生了许多变化,有必要重新研制一份新的常用字表,以适应语文教学、辞书编纂和其他方面的需要。
为此,国家语言文字工作委员会和国家教育委员会特制订《现代汉语常用字表》,于
1988年1月正式颁布。
《现代汉语常用字表》在制订过程中确定了选字的三条原则(使用频率高,构词构字能力强,学科分布广),充分利用了自1928年至1986年间的各种统计资料20种(共7千多万字),采取了科学方法和现代手段,最终筛选出3500个常用字。
其中)包括常用字2500个,次常用宇1000个。
共3500字。
(2500个常用字的覆盖率为
97.97%,1000个次常用字的覆盖率为
1.51%,两者相加,)经过检验证明。
这3500字的覆盖率高达
99.48%。
《现代汉语常用字表》中的3500字包括在《现代汉语通用字表》中,这就是说,7000个通用字中恰好有一半是常用字,一半是非常用字。
选取常用字不是为了限制人们学习汉字的数目,而是把应用得最普遍的字先提取出来,以便首先学习,免得初学时就去记一些不太用的字,而把最常用的字反倒忽略了。
《现代汉语常用宇表》的制定,使汉字教学更具科学性,到底应该学多少字,学哪些字,哪些先学,哪些后学,有了一个科学的依据。
3.现代汉语常用字的特点
现代汉语常用字具有以下四个特点:
⑴常用性。
这是常用字最根本的特点。
确定一个字是否常用,主要的依据是该字在被统计的语料中出现的频率是否高。
出现频率高的是常用字,出现频率低的是非常用字。
如“的、一、是、在、不、了、有、和、人、这”等字,在各家的统计资料中出现频率都是最高的,说明它们在现代汉语书面语中是经常被用到的。
认识常用字的常用性,就会充分重视常用字的作用,从而加强常用字的教学,以提高汉字的应用水平。
⑵能产性。
(常用字大都构词能力比较强,因此它具有能产性是必然的。
现代汉语中双音节和多音节词增长速度很快,)常用字由于能产性强,经常被选作新词语的构成成份。
如“电”字,随着科技的进步、文明的发展,由它参与构成的词多达数百个。
(学习汉语,学字与学词几乎是同步进行的,学会了常用字,有利于掌握新词语,扩大词汇量。
⑶稳定性。
(对比几种不同时期制订的常用字表,可以发现,在500高频字内将近80%的字是相同的。
这就是说,)过去和现在虽然社会发生了很大变化,但人们在书面交际中最常用的字变化却不大。
这是因为常用字记录的语素所代表的事物本身的稳定性,使得这些字也长时期被经常地使用着。
当然,稳定性并不是一成不变的,常用字也会发生变化,不过这种变化比较缓慢,在总体上保持相对稳定。
常用字的稳定性说明一份科学的常用字表有相当长的时效。
⑷简易性。
这里的简易性是指书写简易。
文字是记录语言的工具,因此人们总是朝着学习容易、使用方便的方向不断简化已有的文字。
至于哪些字简化,哪些字不简化,起主要作用的是使用频率。
高频字因为经常使用,成为简化的重点对象,它们的笔画相对来说是比较少的。
高频趋简,这是汉字发展中的一条重要规律。
以《现代汉语常用字表》为例,2500个常用字中,简化字共837个,占
33.4%;
1000个次常用字中,简化字共279个,占
7.9%;
二者合计,3500个常用字,简化字共1116个,占
31.8%。
综上所述,在字量问题上,我们采取了古今分流分级定量的方法,把现代汉字定为三个级别:
常用字为2500个,加上次常用字一共为3500个,通用字为7000个,从而有效地兼顾了不同方面、不同层次的用字需球。
《现代汉语通用字表》和《现代汉语常用字表》的制定,正是现代汉字分级定量的研究成果。
二、现代汉字的字序
(一)汉字字序问题的复杂性
字序就是汉字的排列顺序。
在社会生活中,字序的应用极为广泛。
工具书的编排,图书、档案等各种目录的编制,人名地名的排序,汉字在计算机字库中的存储,都要用到字序。
字序对拼音文字来说,是很简单的问题。
拼音文字有字母表,字母表规定了字母的顺序。
词语是由字母拼写而成的,按照字母的顺序很容易地就给词语排定了确定无疑的序列。
汉字不是拼音文字,建立字序比拼音文字要复杂得多。
汉字字序的复杂性表现为汉字的排序具有多样性和互补性的特点:
排序的多样性是指汉字的序列法多种多样,有形序法、音序法、义序法。
每种序列法都自成系统,掌握任何一种序列法都必须掌握这种序列法的系统。
排序的互补性是指众多序列法各成系统又互为补充。
也就是说,汉字的每一种序列法都有用,但又都不能单独地依靠一种序列法来完全解决汉字的排序问题。
每一种序列法都需要借助其他序列法来弥补其不足。
(例如按音序法排序时,遇到同音字就要借助形序法;
按部首法排序时,遇到同部字就要借助笔画法或笔形法。
事实上,由于需要排序的汉字数量较多,想要仅仅用一种序列法来把上万个汉字都排定位次是不可能的,必须同时运用几种序列法,分层次地、逐步地离散。
例如《现代汉语词典》就是依次按“音序——笔画数——笔形”三种序列法来排定所收字的位次的。
从实际应用来看,人们既需要按字形排列的形序法,以便读书时查检字的音义,又需要按字音排列的音序法,以便写作和日常生活中查检字的形义。
因此,目前通行的工具书,一般都以一种序列法为主,其他序列法为辅。
《新华字典》和《现代汉语词典》,正文按音序排列,前边又列有部首检字表;
《汉语大字典》和《汉语大词典》,正文按部首排检法排序,后边又附有笔画检字表。
这些工具书由于采用几种查字法,适应了不同读者的需要。
(二)、现代汉字的序列法
汉字序列法有音序法、形序法、义序法三种。
义序法是按照字义进行分类来排列顺序的,如古代辞书《尔雅》、《释名》等。
《xx》按照系列各类排列:
释诂、释言、释训、释亲、释宫、释器、释乐、释天、释地、释丘、释山、释水、释草、释木、释虫、释鱼、释鸟、释兽、释畜等
现代出版的《简明汉语义类词典》也是按意义排序的。
按意义排序很难定出明确一致的标准,所以,除了特殊需要,一般不采用义序法。
1.音序法
音序法是按照字音来排列字序的方法。
汉字的音序法经历了三个阶段:
声韵序列法、注音字母序列法和汉语拼音字母序列法。
(1)声韵序列法,以<
广韵)为代表。
《广韵)是宋代编纂的字书,(共收字26000个。
《广韵》)先依照所收字的声调把所有的字分为平、上、去、入四类。
由于平声字多,又把平声(字分为上平声和下平声,)分在两卷里,这样四类共有五卷。
每卷内部再按字的不同韵部分先后。
(韵部共206部,分在五卷之中。
)同韵的字再依不同的声母排列先后。
现代编的《中华新韵》和《现代诗韵》等基本上也采用相似的体例。
1941年10月公布的《中华新韵》,把字分为十八部:
麻、波、歌、皆、支、儿、齐、微、开、模、鱼、侯、豪、寒、痕、唐、庚、东。
每部再按照声调分开排列声韵序列法除编排诗韵外,现在已基本不用了。
(2)注音字母序列法。
以《国音字典》(19年)为代表。
它所收的字都按1918年公布的注音字母的顺序排列。
《国音字典》后又几经修订,定名为《国音常用字汇》(1932年),共收字12219个。
以后,许多工具书如《国语辞典》(和它的简本《汉语词典》以及)《词诠》、《同音字典》等也都按注音字母的顺序编排收录汉字。
)《汉语拼音方案)产生前,音序法主要用注音字母序列法。
(3)汉语拼音字母序列法。
这是我国现在通行的音序法。
自1958年《汉语拼音方案》公布后,许多字典都用汉语拼音来给汉字排列次序。
汉语拼音序列法内部还有两种:
一种是单纯的字母序列法,一种是“音节·
汉字·
字母”分层序列法。
单纯的字母序列法:
它完全按照字母表的字母顺序排列。
e排在e后,u排在u后。
zh、ch、sh和er、ng都按第一字母顺序排列.。
声母和韵母完全相同时按声调以阴、阳、上、去、轻为序排列。
声、韵、调全同的同音字按笔画多少排列,笔画数相同的再按照笔形以横竖撇点折(先横折,后竖折)为序排列。
以1991年的<
汉语拼音词汇)为代表。
“音节·
字母”分层序列法:
它先按汉语拼音音节表中的音节次序排则字头,音节相同的字则按字头的汉字字形排序。
当几个多音节词条具有相同的字头时,再根据第二字的拼音字母的顺序安排词条的次序。
以《现代汉语词典》为代表。
汉语拼音序列法在使用过程中还存在一些分歧。
一是汉语的音节究竟有多少,各家还有少许差异。
是同音字究竟以什么为标准安排先后次序,目前还缺乏统一的规范,例如《新华字典》和《现代汉语词典》对同音字的排序就不一样。
音序法优点、缺点:
用音序法排检汉字简单、迅速。
而且由于字母的次序和音节的次序目前已取得一致,因而舅本上可以做到宇有定序。
然而音序法也有局限,
1、主要是遇到不认识的字或读不准音的字,还得借助别的查字法。
2、其次是目前我国普通话还未普及,汉语拼音也不是人人都已掌握,一部分读者运用音序法还有困难。
比如有人声母不分n和l,分不清平翘舌音,碰到某些字(例如“宁”、“资”)就不能确定是查n还是l;
是查z还是zh。
2.形序法:
形序法是按照字形的各个方面特点来排列字序的方法。
(形序法又分部首法、笔画法和笔形法。
)中国最早的一部字典《说文解字》就是根据字形结构特点排列汉字的。
汉字结构复杂,可以作为排序依据的字形信息也相对较多。
形序法包括笔画法、笔形法、四角号码法、部首法等,其中部首法历史最悠久,使用也最普遍。
形序法又分为以下三种:
⑴笔画法是按照宇的笔画数目来排列汉字的方法,笔形法是按照字的首笔笔形的类别来排列汉字的方法。
单纯的笔画法或笔形法很少见,大都是采用“笔画——笔形法”或“笔形——笔画法”。
“笔画——笔形法”是先按字的笔画多少排列汉字,笔画少的在前,笔画多的在后。
笔画数相同的字再按首笔、次笔的笔形排列先后顺序。
笔形一般采用“扎”字法。
即分为五类,顺序为:
例如,同属三画的字可以按笔形排列如下:
横:
三干于亏工士土才下寸大丈与万
竖:
上小口巾山
撇:
千xx亿彳个勺丸凡夕么及久
点:
广亡门丫义之
折:
尸弓己已巳卫子也女飞刃习叉马乡
《现代汉语常用字表》和《现代汉语通用字表》都有按此法排列字序的。
“笔形——笔画法”是先按首笔笔形分类排列,再把首笔笔形相同的字根据笔画数的多少分成小类来排列。
《学文化词典》就是按此法排列字序的。
优点:
笔画法或笔形法都是简单易学、查检迅速的序列法,适用范围很广。
笔画法常用于一些专科辞书的编排,更多的是用于辞书的检索,还用于排列名单、编制电话簿、交通手册等。
笔形法主要作为其他排检法的补充,使汉字在有序排列中最后定位。
缺点:
但是,由于汉字存在繁体和简体、旧字体和新字体的差别,人们的书写习惯又不尽相同,所以有一些字,其笔画数目、起笔笔形往往因人而异,这就增加了笔画法和笔形法使用中的实际困难。
(2)四角号码法:
创建于本世纪20年代末。
是把汉字四角的笔形编成数码,再按每一个字的数码来编排查检汉字的方法。
四角号码法实际上也是笔形法,是一种笔形代码法。
它把汉字四角的笔形归纳为十种并分别用0--9这十个数码代表,数码和笔形的关系见下表:
十种角形及号码说明如下:
0:
表示头,即点下边有一横的角形,用0代表,例如“弯、忘,病、立、库、方、旁、衣、玄、紊、变”等字的上部,角形是“一”。
1:
表示横,四角凡是横,用1表示,例如“珏、班、疆、豇”等字的号码是11。
此外,提也归入横,用1代表,如三点水“’、绞丝旁”和斜土旁“”的最后一笔,在字的左下角用1代表;
竖弯钩和斜右钩也归横,在字的右下角时用1代表,例如“兄、尤、先、风、凤飞、气”等字的右下角均为1。
2:
表示垂,即竖,包括竖、撇,例如“岚、此、低、千、战”等字的左上角均用2代表。
此外,垂还包括直左钩,如“则、丙、疗、同、亏、丐;
巧、行”等字的右下角均作2。
3:
表示点和捺,例如“斗、活、说、心、补、凝、阀、退”的左上角“家、根、茧、”等字的右下角均为3。
4:
表示叉,即两笔交叉构成的形状,例如“吉、草、狠、棒、埋、较”等字的左上角,“梓、椁、校、坟、猝”等字的右下角均为4。
5:
表示串,即一笔穿过另外两笔或多笔构成的形状,例如“中、夫、丰、申、史”这些字,又如“打、未、蛙、靛、盏、击、曹,费、契”等字的左上角(注意:
草头、反犬旁归入叉,不归入串)。
6:
表示方,即四角或某一角是整齐的方形,如“国、回、园、田团”等字,这些字的左下角、右下角要改取里面的笔形,不然,号码都是6000就无法查检了。
例如“园”是6021,“田”是6040。
又如“昆、是、员、只、呆、累、踱、咳、睽、映”等字左上角均作6。
7:
表示角,一笔的转折处如正在字的某一角上,就定为角,例如“忍、灵、召、凡、己、玖、句、羽、卫”等字的右上角,“译、衣、改、包、龟、色、幻、饲”等字的左下角。
此外,两笔笔头相接处形成的笔形也作角,例如“马、牙、肝、匠、压、辟、刚、骨、观、阡、赋”等字的左上角,“岳、山、锐”等字的左下角。
8:
表示八,两笔构成像汉字“八”的形状,如“翁、坌、斧”等字的左上角为8。
此外,还包括“人、入”等形状近似于"
/k”的笔形,例如’兰、全、余、籴、氽、兑、羊,弟、钊、创、割、氧、、午、笺、笳”等字的左上角均为8。
9:
表示小,指形状如“小”的角形,例如“尖、少、劣”等字左上角形状。
此外还包括一些变形,如“恨、举、光、学、灯、卷、精、削”等字的左上角均作9。
此外,还有一些细则需要掌握:
1)取码顺序按照:
左上——右上——左下——右下的顺序;
2)一笔可以分角取码。
如:
“以”2870;
“七”4071;
“几”7721;
“习”1712;
3)相连的两个角共用一个代码笔形的,服从前面的角位,后面的角位用0代替。
“全”8010;
“本”4023;
“禾”2023;
“高”0022
4)一笔上下两段和其他笔画构成不同笔形的,分两角取号。
“大”4080;
“来”4023;
“李”40;
“蛊”5010
5)全包围和“门”结构的字,后两码取里面的笔形。
“园”6021;
“田”6040;
“闭”3724;
“问”3760;
6)一角有单笔和复笔两种笔形时,要取复笔笔形。
“少”9020;
“扎”5201;
“介”8022;
“气”8001;
7)有两复笔可取的,在上角取较高的复笔,在下角取较低的复笔。
“也”4471,“军”3750;
“成”5320;
“皮”4024;
8)当中起笔的撇,下角有其他笔形的,不取撇而取其他笔形。
“衣”0073;
“奎”4010;
“友”40;
“寿”5034;
9)独立或平行的笔形,一律以最左或最右的笔形为角。
如
“非”11;
“市”0022;
“草”4440;
“竹”8822;
下边举一些角形较典型的字,大家可以通过这些实例来体会闽角号码中笔形与号码的关系,掌握查检方法。
弯0002主0010产0020辛0040
非ll豇11驱11xx11
为了便于记忆有人编了四句“四角号码口诀”:
横一/垂二/三点捺,叉四/插五/方框六,七角/八八/九是小,点下有横变零头。
’
汉字取角的顺序是:
左上角、右上角、左下角、右下角(顺序取得四个数码,然后依据这四个数码从小到大排列顺序,查检时只要确定所查字的四角的笔形及号码,即可据此在正文中直接找到要查的字)
这样确定的代码有同码字。
为了减少同码字,又规定增加第五个角,即取右下角上方的笔形为“附号”。
“芥”号码是4422,而这个号码中有四五十个字,所以以右下角上方的笔形“人”去附号8,则“芥”号码是44228。
化2421他2421佳2421
催2421俺2421xx2421
四角号码新词典》就