新世纪五笔基础知识.docx

上传人:b****0 文档编号:17255922 上传时间:2023-07-23 格式:DOCX 页数:18 大小:220.46KB
下载 相关 举报
新世纪五笔基础知识.docx_第1页
第1页 / 共18页
新世纪五笔基础知识.docx_第2页
第2页 / 共18页
新世纪五笔基础知识.docx_第3页
第3页 / 共18页
新世纪五笔基础知识.docx_第4页
第4页 / 共18页
新世纪五笔基础知识.docx_第5页
第5页 / 共18页
新世纪五笔基础知识.docx_第6页
第6页 / 共18页
新世纪五笔基础知识.docx_第7页
第7页 / 共18页
新世纪五笔基础知识.docx_第8页
第8页 / 共18页
新世纪五笔基础知识.docx_第9页
第9页 / 共18页
新世纪五笔基础知识.docx_第10页
第10页 / 共18页
新世纪五笔基础知识.docx_第11页
第11页 / 共18页
新世纪五笔基础知识.docx_第12页
第12页 / 共18页
新世纪五笔基础知识.docx_第13页
第13页 / 共18页
新世纪五笔基础知识.docx_第14页
第14页 / 共18页
新世纪五笔基础知识.docx_第15页
第15页 / 共18页
新世纪五笔基础知识.docx_第16页
第16页 / 共18页
新世纪五笔基础知识.docx_第17页
第17页 / 共18页
新世纪五笔基础知识.docx_第18页
第18页 / 共18页
亲,该文档总共18页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

新世纪五笔基础知识.docx

《新世纪五笔基础知识.docx》由会员分享,可在线阅读,更多相关《新世纪五笔基础知识.docx(18页珍藏版)》请在冰点文库上搜索。

新世纪五笔基础知识.docx

新世纪五笔基础知识

新世纪五笔基础知识

基础知识

5种笔画

字根是由笔画写成。

笔画、字根(部件)、整字,是汉字结构的三个层次。

[4]

1984年王永民教授给笔画定义为:

书写汉字时,一次写成的一个连续不断的线段。

按照书写方向划分笔画的类型,如下图所示,则只有5种——横、竖、撇、捺、折。

前4种是单方向的笔画,“折”则代表一切带转折、拐弯的笔画。

为了便于记忆和排序,我们分别用1、2、3、4、5命名5种笔画的代号。

以下例子可作为这张表的补充说明:

[4]

(1)“提笔”等于“横”:

王 现

(2)“点”等于“捺”:

木 村

(3)“竖左钩”等于“竖”:

 禾

(4)所有带转折的笔画都算作“折”。

为便于书面表示,以后所有的“折”笔,不管怎么“折”,怎么“弯”,怎么“拐”,一律都有“乙”来表示,其笔画代号都是5。

王永民对笔画的以上分类法及代号,现在已经被正式写入了代号为GB/T18031-2000的国家标准中。

给笔画分类,并命名以数字代号,是学习王码输入法时最重要的基础知识。

在实践中,许多人之所以编码出现错误,或对键盘上码元排列的规律性“视而不见”,其根本原因,常是因为没有掌握好五种单笔画的分类及其数字代号。

[4]

3种字型

习惯上,我们把构成汉字的基本笔画结构,称作“字根”或“部件”。

而当“字根”或“部件”用于编码的时候,又可以把它们叫做“码元”,意思是编码的“元素”。

汉字是一种平面文字,同样几个字根,同样的先后顺序,摆放[4]的位置不同,就是不同的字。

如:

叭——只 吧——邑

呐——呙 岂——屺

可见,字根相互间的位置关系,也是汉字图形的一个特征,在汉字编码中,用数字代表这个特征,就成为很有用的、用以分区“重码”的“识别”信息。

根据构成汉字的各个字根之间的位置关系,我们可以把成千上万的方块汉字,分为三种字型:

左右型:

字根左右排列。

上下型:

字根上下排列。

杂合型:

字根互相周围或交叉套迭。

根据各种字型拥有汉字的多少,顺序将字型命以数字代号,如下表所示。

我们便约定:

[4]

1型字,即指“左右型”汉字,其代号为1;

2型字,即指“上下型”汉字,其代号为2;

3型字,即指“杂合型”汉字,其代号为3。

将来,我们给汉字编码时,字型及其代号将非常有用。

这里应当说明,在王码中,仅仅对于那些由2个或3个字根组成的字,我们才关心它的“字型”。

如果一个字由4个或4个以上的字根组成,例如:

编码中,我们就不再计较是什么“型”了。

[4]

键位分布

五笔字型键盘

五笔字型采用标准英文键盘的26个字母键输入汉字。

每个汉字,每条词汇最多打4下键。

汉字是由字根构成的。

我们将构成汉字的字根,优选归纳为125种,也称作“码元”,分配在除Z键以外的25个英文字母键上,形成了五笔字型的“字根键盘”。

新世纪版五笔字型字根键位图:

新世纪五笔字型字根键位图(2张)

 

字根助记歌

为保持技术的连续性,第三代五笔字型(新世纪版)的25个“键名”没有变动。

新设计的字根体系更加符合分区划位规律,更加科学易记而实用,按规范笔顺写汉字的人,取码输入将得心应手。

新世纪版的《字根助记歌》如下[7]:

1区横起笔

11G 王旁青头五一提

12F 土士二干十寸雨

13D 大三肆头古石厂

14S 木丁西边要无女

15A 工戈草头右框七

2区竖起笔

21H 目止具头卜虎皮

22J 日曰两竖与虫依

23K 口中两川三个竖

24L 田框四车甲单底

25M 山由贝骨下框里

3区撇起笔

31T 禾竹牛旁卧人立

32R 白斤气头叉手提

33E 月舟衣力豕豸臼

34W 人八登祭风头几

35Q 金夕犭儿包头鱼

4区点起笔

41Y 言文方点在四一

42U 立带两点病门里

43I 水边一族三点小

44O 火变三态广二米

45P 之字宝盖补示衣

5区折起笔

51N 已类左框心尸羽

52B 子耳了也乃齿底

53V 女刀九巡录无水

54C 又巴甬矣马失蹄

55X 幺母绞丝弓三匕

 

记忆规律

在五笔字型键盘上,多数字根(码元)的安排都是有规律的。

字根键盘分为5个区,区号为1~5;每一个区,各有5个键位,位号也是1~5,从键盘中部向外端排列;区号与位号组合,共形成5×5=25个代码,即区位码:

11…15,21…51…55。

其规律性如下[8]:

1、字根所在的“区号”与“首笔代码”一致[8]

①横起笔的字根,在第1区——“王土大木工”的首笔代号为1;

②竖起笔的字根,在第2区——“目日口田山”的首笔代号为2;

③撇起笔的字根,在第3区——“禾白月人金”的首笔代号为3;

④点起笔的字根,在第4区——“言立水火之”的首笔代号为4;

⑤折起笔的字根,在第5区——“已子女又幺”的首笔代号为5。

2、位号基本上与码元的次笔代码一致[8]

位码与码元次笔关系

3、单笔画的“个数”,与所在的“位号”一致[8]

一、丨、丿、丶、乙都在相应区的第1位;

二、刂、丿丿、丶丶、巜都在各区的第2位;

三、彡、氵、巛都在各区的第3位;

四、灬在相应区的第4位。

4、从字根上“直读”区位号[8]

依照以上3条规律,根据字根的“前两个笔画”,可立即“直读”出“字根”的区位号(即:

前2个笔画的代号连在一起念,就是区位号!

):

例:

参——厶大彡

●厶:

首笔为折(5),次笔为点(4),故“厶”在第5区第4位(54、C)

●大:

首笔为横

(1),次笔为撇(3),故“大”在第1区第3位(13、D)

●彡:

首笔为撇(3),次笔为撇(3),故“彡”在第3区第3位(33、E)

 

单字输入

编辑

 

编码流程图

五笔字型将成千上万个汉字首先分成两大类:

键面上有的“键面字”和键面上没有的“键外字”。

两类汉字的取码法按以下流程图分别取码。

[9]

编码流程图

 

编码输入

五笔字型字根键盘上,本身是汉字的字根,叫“键面字”。

“键面字”分为三类,其输入法分别是[9]:

1、键名字的输入

每一个键位上,最左上角的那个黑体字的码元,叫键名字,它是“一键之名”。

以G键为例,其左上角的字根“王”便是“键名字”或“键名”。

“键名字”的输入法是:

把所在的键连打4下。

例如[9]:

1区1位键名:

王11111111(GGGG)

3区2位键名:

白32323232(RRRR)

4区5位键名:

之45454545(PPPP)

5区3位键名:

女53535353(VVVV)

在王码五笔字型中,键名码元有25个。

1区:

王土大木工(对应键位:

GFDSA)

2区:

目日口田山(对应键位:

HJKLM)

3区:

禾白月人金(对应键位:

TREWQ)

4区:

言立水火之(对应键位:

YUIOP)

5区:

已子女又纟(对应键位:

NBVCX)

2、成字字根的输入

键面上除键名外,凡本身是汉字的码元,叫“成字字根”或“成字码元”。

其输入法是:

先打一下它所在的键(这一下俗称“报户口”),再打第一个、第二个,以及它的最末一个单笔画,最多4下,不足4下,补一个空格键[9]。

例如:

成字字根输入

当输入十、七、九、二、几、儿、乃、刀……这一类只有2个笔画的字根时,“报户口”之后就只能有两个笔画了,不足4个码,笔画打完,要再补打一下“空格键”表示结束。

3、补码码元及其输入

在字根表中,用方圆框“框住”的4个字根,是“补码码元”,它们作为字根参与编码时,像姓氏中的复姓诸葛、司马一样,要编2个码:

“主码(即码元所在键位)+补码(规定取该码元最后的笔画结构)”[9]。

如下表所示:

补码码元

注:

表中带圆圈的笔画丶、氵等,是“补码”的笔画表示形式,作为一个符号,用以提示编码。

这4个补码码元中的“犭、礻、衤”等三个字根,本身也是汉字,这三个汉字的编码规则是,要先“报户口”(主码+补码)(已占用2个码)、再打该字的第1笔和最后1笔,共取4码。

即:

圆圈中的补码码元

注:

键位上只有有的成字的字根可以打出来,而本身并不是汉字字根不能打出来。

 

“键外字”拆分法

凡是“字根总表”上没有的汉字,都是“键外字”。

它们都是由几个码元(字根)组合而成的,我们也把这类字称为“多元字”。

对于“多元字”,只有一个字——拆分。

科学、实用又没有“二义性”的“拆”法,共有以下5项规则[9]:

1、书写顺序

“合体字”拆成“字根”,一般情况下,要按照正确书写顺序进行。

例如:

新:

立木斤(顺序正确)

立斤木(顺序错误)

2、取大优先

要“拆”出“笔画尽可能多”的“字根”。

要以“再添一个笔画,便不能构成为笔画更多的字根”为限度。

例如:

估:

亻古(正确)

亻十口(错误,因为“口”可添到前面的“十”上,“凑”成更多笔画的字根“古”)

注:

“取大优先”,俗称“尽量往前凑”。

因为“向前凑”总是有限度的,要凑成字根表中笔画更多(更大)的一个!

否则,便没有“章法”了,势必有许多种“拆法”甚至都要拆成单笔画!

在汉字拆分中,这是一个最常用到的、保证拆分唯一性的基本原则。

3、兼顾直观

在编码时,为了使码元特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成个别例外的情况。

例:

“国”字

按“书写顺序”,其码元应是:

“冂王丶一”,但这样编码,不但有悖于该字的字源,也不能使码元“囗”直观易辨。

我们只好违背“书写顺序”,按“囗王丶”的顺序编码。

4、能连不交

请看以下取码实例:

天:

一大(正确,“一”与“大”是相连接的关系,比较直观)

二人(错误,“二”与“人”交叉在一起了)

生:

丿(正确,“丿”与“”是相连的,直观可取)

土(错误,“丿”与“”是相连的,直观可取)

一般来说,“连”比“交”更为“直观”,更能显现码元的笔画结构特征,更易于辨认。

5、能散不连

有时候,一个汉字的几个码元,都不是单笔画,这些码元之间的关系,常常在“散”和“连”之间模棱两可。

如:

矢:

大,两个码元按“连”处理,“矢”便是杂合型(3型)字;两个码元如果按“散”处理,“矢”便是上下型(2型)字。

午:

、十(两个字根,可视为散,也可当作连)

都是既可“连”,又可“散”的关系。

当遇到这种既能“散”,又能“连”的情况时,我们规定:

只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系。

 

四元及多元字

1、“四元字”的编码规则

键外字中的“四元字”,是指刚好由四个字根构成的字。

其拆分之后的取码方法是“依照书写顺序输入字根”[9]。

例如:

照:

日刀口灬

22532344

JVKO

重:

丿一日土

31112212

TGJF

2、“多元字”的取码规则——“前三末一”(一二三末)

键外字中的“多元字”,是指由4个以上的字根构成的字。

这种字,不管实际上能“拆”成几个字根,我们只需“按书写顺序,取拆分结果的第一二三及最末一个字根”便可,俗称“一二三末”,共输入四个码[9]。

例如:

暨:

彐厶匚儿日一

53541511

VCAG

攀:

木乂乂木大手

14323232

SRRR

 

识别码

汉字编码输入法的设计,要尽量减少重码,以提高输入的唯一性。

但从以下两种情形我们看到,仅仅输入字根,很容易产生重码[9]:

1、因构字的字根相同,字型不同引起重码:

叭:

口八(2334KW)

只:

口八(2334KW)

这个例子说明,编码中丢失了字型信息,才产生了重码。

2、因几个字根同一键位引起重码:

沐:

氵木(4314IS)

汀:

氵丁(4314IS)

洒:

氵西(4314IS)

这个例子说明,编码没有将“木、丁、西”加以区分,才产生了重码。

由以上两类例子可知,当遇到2-3个字根构成的汉字时,为了避免编码相同(重码),既有必要提取“字型信息”,又有必要从字根上“提取笔画特征信息”用于编码。

复合这两种信息的一个附加码,就是“末笔字型识别码”简称“识别码”,“识别码”只追加在由2-3个字根构成的汉字编码中(见下节)。

“识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。

1、2、3型汉字的识别码共有15个(各有3种形式),其构成如下:

末笔识别码

例:

红:

末笔1,字型1,识别码为11(即“一”);

华:

末笔2,字型2,识别码为22(即“刂”);

团:

末笔3,字型3,识别码为33(即“彡”)。

 

二三元字取码

“键外字”中,只有2个字根的字,叫“二元字”;只有3个字根的字,叫“三元字”。

输入时,键外字毫无例外地都要“拆”。

“二元字”或“三元字”的输入法是:

先“拆”成字根,输入字根后,再追加一个“末笔字型识别码”(简称“识别码”)。

有了识别码可以大量减少重码。

[9]

“识别码”的简易直观表示法——用带圆圈的笔画表示“识别码”:

1、左右型(1型)字的“识别码”

对于1型(左右型)字,字根输入之后,补打“1个末笔画”,就等同于添加了“识别码”,用“一丨丿丶乙”表示。

例如:

红:

纟工一(字根打完,补打1个末笔画“一”,相当于11:

G)

551511

XAG

2、上下型(2型)字的“识别码

对于2型(上下型)字,码元输入之后,补打“2个末笔画”的字根,就等同于添加了“识别码”,用“二刂丿丿丶丶巜”表示之。

例如:

字:

宀子二(字根打完,补打2个末笔画“二”相当于12:

F)

455212

PBF

复:

日夂(字根打完,补打2个末笔画“丶丶”,相当于42:

U)

31223142

TJTU

花:

艹亻匕巜(字根打完,补打2个末笔画“巜”,相当于52:

B)

15345552

AWXB

3、杂合型(3型)字的“识别码”

对于3型(杂合型)字,码元输完之后,补打“3个末笔画”的字根,就等同于添加了“识别码”,用“三川彡氵巛”表示之。

例如:

同:

冂一口三(字根打完,补打3个末笔画“三”,相当于13:

D)

25112313

MGKD

远:

二儿辶巛(字根打完,补打3个末笔画“巛”,相当于53:

V)

12354553

FQPV

注1:

凡是“包围型”的字,如全包围字“国、团”等,半包围字“这、庆”等,均以被包围的那个部分的“末笔”作为整个字的“末笔”来构成“识别码”,如“远”字,要以被包围的“儿”的末笔来构成“识别码”(53:

V)。

注2:

识别码一共有3种表示法,其编码的效果完全相同,都是同一个码。

可以按照下面的方法打“识别码”,例如:

末笔横的1型字:

打11键,就是G键,就是“一”(一个横)键。

末笔撇的3型字:

打33键,就是E键,就是“彡”(三个撇)键。

其所以如此,道理很简单:

1区1位(G)上有1个横“一”,3区3位(E)上有3个撇“彡”……

 

简码和容错码

1、简码输入

一些常用的字,除按它的“全码”可输入外,为减少打键次数,只输入其全码的最前边的1个、2个或3个码,再加打空格键,也可以输入,这就是一、二、三级简码。

简码可以提高输入效率。

[9]

(1)一级简码(又称“高频字”)

将各键打一下,再打一下空格键,即可打出25个最常用的汉字(每键一个):

一地在要工 上是中国同 和的有人我 主产不为这 民了发以经

如:

一:

11(G) 的:

32(R) 和:

31(T)

具体如下表:

一级简码

(2)二级简码(只输入“全码”的前2个码)

化:

亻匕(3455WX)

李:

木子(1452SB)

二级简码表

(3)三级简码(只输入“全码”的前3个码)

想:

木目心(142151SHN)

巍:

山禾女(253153MTV)

2、容错码

“容错码”的涵义是:

“容易”编错,但“容许”按错码输入。

例如:

面:

丆冂三DMJD(正确,按笔顺取大优先)丆囗二DMJF(拆分容错)

四字或以上词

对于4个字或超过4个字的词,取第一、二、三及最后一个汉字的第一码,共4码。

例如:

中华人民共和国:

口亻人囗

23343424(KWWL)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2