1、五笔字型的编码规则汉字的五种笔画和五笔字型字根类型1、汉字的五种笔画五笔字型把汉字的笔画分为五种,分别为横、竖、撇、捺、折。为了便于记忆,规定它们分别用代码1、2、3、4、5来表示。五笔字型五种笔画与代码对应见下表4-2。表4-2 五笔字型五种笔画与代码对应表笔画名称横竖撇捺折代码123452、五笔字型的字根类型汉字是由字根组成的,五笔字型的编码思想就是利用字根来组字,就像堆积木一样。汉字字根较多,并且较复杂。五笔字型规定了130个字根,所有汉字均是通过这130个字根来进行组合。学习五笔字型最大的难点就是对这些字根的记忆。为了便于记忆,五笔字型把字根分为四种类型,并对其进行编码。五笔字型键盘要
2、达到以字根组字的目的,必须把五笔字型字根编码对应到计算机键盘上。为了便于记忆和操作,根据标准键盘的结构,五笔字型将其分为五个区,每区五个键,共计25个键,来对应于25个五笔字型编码代码。位于键盘中行左边的GFDSA键为一区,分别对应于编码11、12、13、14、15;位于键盘中行右边的HJKL和位于下行右边的M键为二区,分别对应于编码21、22、23、24、25;位于键盘上行左边的TREWQ键为三区,分别对应于编码31、32、33、34、35;位于键盘上行右边的YUIOP键为四区,分别对应于编码41、42、43、44、45;位于键盘下行右边的N和左边的BVCX为五区,分别对应于编码51、52、
3、53、54、55。键盘字母键与五笔字型编码对应见下图4-6。 主字根汉字的编码规则主字根汉字也称键名汉字,它是每个键所包含的字根中最主要的一个,或者说,它是每个键的五笔字型中文键名。主字根汉字的编码规则为:连击四下主字根汉字所在的键。例如:“王”的编码为 11 11 11 11 (GGGG)“日”的编码为 22 22 22 22 (JJJJ)“金”的编码为 35 35 35 35 (QQQQ)主字根汉字共计25个,25个主字根汉为:金、人、月、白、禾、言、立、水、火、之、工、木、大、土、王、目、日、口、田、纟、又、女、子、已、山。25个主字根汉字与编码键对应见下图4-8。 成字字根的编码规则在
4、五笔字型键盘上的每一个编码键上,除了主字根外,还有许多其他字根。在这些字根中,有一部分本身就是一个汉字,这些汉字即为字根汉字(也称成字字根汉字)。字根汉字的编码规则为:1、键位代码第一笔代码第二笔代码最后一笔代码;2、如果所输汉字只有二笔,则以空格键结束;3、如果所输汉字只有一笔,则再打两个24(L)键。即第一码输入字根汉字的键位代码,键位代表是指字根汉字所处键的代码,因此第一码也称报户口。第二码输入字根汉字的第一笔笔画代码,第三码输入字根汉字的第二笔笔画代码,第四码输入字根汉字的最后一笔笔画代码。笔画代码:横、竖、撇、捺、折五种笔画的笔画代码分别为11、21、31、41、51。例如:雨:12
5、112141(FGHY)西:14112111(SGHG)十:121121(FGH)八:343141(WTY)一:11112424(GGLL)乙:51512424(NNLL)羽:51514111(NNYG)方:41411151(YYGN)一般汉字的编码规则一般汉字就是除了上述两类汉字之外的所有汉字,这部分汉字也称合体汉字,这是五笔字型需要处理的绝大部分汉字。为了能正常对这些汉字进行编码,五笔字型同时规定了字根码和识别码。1、字根码:五笔字型的每一个字根都位于某一个键上,这个键的编码就是字根码。任何字根,只要位于同一个键上,则它们的字根码都相同。2、识别码:一个汉字的识别码就是这个汉字的最后一笔的
6、代码与该汉字的字型结构代码相组合而成。、汉字的最后一笔代码:汉字的最后一笔可分为五种笔画,其为横、竖、撇、捺、折,分别用代码1、2、3、4、5来表示。、汉字的字型结构代码:五笔字型把汉字分为三种字型结构,即左右结构、上下结构和混合结构,分别用代码1、2和3来表示。如从汉字的组成明显能分成左右两部分,则这类汉字就为左右结构型。如从汉字的组成明显能分成上下两部分,则这类汉字就为上下结构型。除左右结构和上下结构包括汉字的其余汉字均为混合结构型。例如:陈、汉、江、语、码为左右结构代码为1字、笔、定、案、要为上下结构代码为2虎、运、未、图、包为混合结构代码为3、汉字的识别码:汉字识别码汉字最后一笔代码汉
7、字字型结构码。汉字识别码的示例见下表4-6。表4-6 汉字识别码示例表例字最后一笔代码字型结构代码识别码陈捺4左右141识捺4左右141最捺4上下242数捺4左右141字横1上下212案捺4上下242问横1混合313包折5混合353虎折5混合353未捺4混合343回横1混合313一般汉字总的取码原则:、按书写顺序从左到右、从上到下、从外到内的原则。例如:陈字取码顺序是阝(52)、七(15)和小(43)。字字取码顺序是宀(45)和子(52)。、取大优先的原则。即尽量用笔画较多的五笔字型的基本字根来取码,而不是把其分成更小的单元来取码。例如:页字取码顺序是丆(13)和贝(25),而不是丆(13)、
8、冂(25)和人(34)。、兼顾直观的原则。为了以五笔字型基本字根来取码,有时就不一定按书写顺序来取码。例如:固字取码顺序是囗和古,而不是冂、古和一。为了便于理解和记忆,传统的五笔字型把取码原则编成了一首编码口诀,在这里给出该口诀以方便学习理解和记忆:五笔字型最直观,依照笔顺把码编;键名汉字打四下,基本字根请照搬;一二三末取四码,顺序拆分大优先;不足四码要注意,交叉识别补后边。4、一般汉字的编码规则为:(1)、第一字根第二字根第三字根最后一个字根;(2)、如果不足四个字根,则字根取完后再加该字的识别码;(3)、如果加识别码后还不足四码,则以空格键结束。表4-7 达到四字根及以上汉字编码示例表例字
9、第一字根编码第二字根编码第三字根编码最后字根编码键码 智3113 23 22TDKJ键3553 12 45QVFP握32511112RNGF编55415115XYNA搬32313354RTEC围24125121LFNH歌14231434SKSW照22532344JVKO表4-8 三字根汉字编码示例表例字第一字根编码第二字根编码第三字根编码识别码键码等31121242TFFU保34231441WKSY定45112142PGHU顺23132541KDMY虎21152553HAMV别23242221KLJH那531252 21VFBH炮443551 51OQNN表4-9 二字根汉字编码示例表例字第一字根编码第二字根编码识别码键码汉435441ICY字455212PBF伐341531WAT位344211WUG包355153QNV回242313LKD冈253543MQI汇431551IAN注:由于二字根汉字编码不足四码,因此最后必须以空格键结束。汉字常见偏旁部首的拆分
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1