五笔字型输入法教程.docx
《五笔字型输入法教程.docx》由会员分享,可在线阅读,更多相关《五笔字型输入法教程.docx(16页珍藏版)》请在冰豆网上搜索。
五笔字型输入法教程
五笔字型输入法(简称五笔)是王永民在1983年8月发明的一种汉字输入法。
因为发明人姓王,所以也称为“王码五笔”。
五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。
五笔是目前中国以及一些东南亚国家如新加坡、马来西亚等国的最常用的汉字输入法之一。
五笔相对于拼音输入法具有重码率低的特点,熟练后可快速输入汉字。
五笔字型自1983年诞生以来,先后推出三个版本:
86五笔、98五笔和新世纪五笔。
一、汉字的基本笔划与字型结构
汉字是一种拼形文字,它们是由一些构字的基本单位按照一定的规律组合构成的相对独立的结构。
五笔字型将这些构成汉字的基本单位称为字根。
1.汉字的基本笔划
将汉字的笔划分为五类:
横、竖、撇、捺、折。
为了便于记忆,依次用1、2、3、4、5作为代号。
在汉字的具体形态结构中产生某些变形的笔划,作了如下特别的规定:
①提笔“ˊ”视为横“一”。
如:
“扌”、“现”中的提笔为横。
②点笔“丶”视为捺“乀”。
如:
“寸”、“雨”中的点为捺。
③左竖钩为竖。
如:
“判”字的末笔划应属于竖。
④转折均为折,即带转折、拐弯的笔划,都属于折。
2.汉字的三种字型
五笔字型编码是把汉字拆分为字根,而字根又按一定的规律组成汉字,这种组字规律就称为汉字的字型。
汉字的字型分为三种:
左右型、上下型、杂合型。
这三、种字型的代号分别是1、2、3。
1左右
汉湖结封字根之间可有间距,总体左右排列
2上下
字莫花华字根之间可有间距,总体上下排列
3杂合
困凶本天字根之间不分上下左右浑然一体
在五笔字型输入法中,对一些特殊汉字的字形作了如下规定:
字根间是内外型的字型视为杂合型。
如:
团、同、这、边、困、匝等汉字;
字根间是包围与半包围的关系的字型为杂合型。
如:
匡、床、巨、冈、屑等,但“见”为上下型。
字根间位置关系为“连”的字型属于杂合型,如:
自、千、尺、勺、斗、头等。
字根交叉重叠构成的汉字字型为杂合型。
如:
申、里、半、东、串、冉等。
下含“辶、廴”的字型为杂合型:
如:
迕、运、迈、迤、迅、退等。
3.汉字的基本字根
1)字根的键盘布局
根据基本字根的起笔的笔划,将字根分为五类,同一起笔的一类安排在键盘相连的区域,对应键盘上五个“区”:
1区——横区,2区——竖区,3区——撇区,4区——捺区,5区——折区;每类又分五组,对应键盘上五个“位”,共25位,可用其区位号11、12、13、……53、54、55来表示,它们分布在键盘的A~V共25个键位上,每个键位上取一个字根作为其键名字根。
2)五笔字型字根的键位特征
字根首笔笔划代号和所在的区号一致。
相当一部分字根的第二笔代号与其“位号”保持一致。
同一键位上的字根形态相近或有渊源。
部分字根的笔划数目与位号一致,如“三”。
另外,部分字根的键盘安排不符合上述几条原则,对这类字根的记忆一方面要借字根助记词来加以记忆,另一方面要特别用心去记住它,如:
“丁、力、心、车、乃、匕、巴、马”等字。
3)字根助记词
1区横起笔
11G 王旁青头五一提
12F 土士二干十寸雨
13D 大三肆头古石厂
14S 木丁西边要无女
15A 工戈草头右框七
2区竖起笔
21H 目止具头卜虎皮
22J 日曰两竖与虫依
23K 口中两川三个竖
24L 田框四车甲单底
25M 山由贝骨下框里
3区撇起笔
31T 禾竹牛旁卧人立
32R 白斤气头叉手提
33E 月舟衣力豕豸臼
34W 人八登祭风头几
35Q 金夕犭儿包头鱼
4区点起笔
41Y 言文方点在四一
42U 立带两点病门里
43I 水边一族三点小
44O 火变三态广二米
45P 之字宝盖补示衣
5区折起笔
51N 已类左框心尸羽
52B 子耳了也乃齿底
53V 女刀九巡录无水
54C 又巴甬矣马失蹄
55X 幺母绞丝弓三匕
4)汉字字根之间的位置关系
汉字是由字根组成的,基本字根在组成汉字时,按照它们之间的位置关系可以分成单、散、连、交四种类型。
分析汉字的字型结构是为正确确定汉字的字型。
单:
字根本身就单独构成一个汉字。
如:
由、雨、竹、车、斤等。
散:
构成汉字不止一个字根,且字根间保持一定距离,不连也不交。
如:
“讲、肥、昌、张、吴”等。
连:
五笔字型中字根相连不同于常规意义上的相连,特指以下两种情况:
a.单笔划与某基本字根相连
如:
自(丿连目)、且(月连一)、尺(尸连丶)、下(一连卜)等。
b.带点结构
如:
勺、术、太、主、义、头、斗等。
另外:
五笔字型中并不认为以下字字根相连。
如:
足、充、首、左、页等;单笔划与基本字根间有明显距离者不认为相连。
如:
旦、个、少、么。
交:
指两个或多个字根交叉套迭构成汉字。
如:
申(日交丨)、里(日交土)、夷(一、弓人相交)等。
二、单字输入
单字的五笔字型编码口诀是:
五笔字型均直观,依照笔顺把码编;键名汉字打四下,基本字根请照搬;一二三末取四码,顺序拆分大优先;不足四码要注意,交叉识别补后边。
注意:
五笔字型的编码最多取四个,且都用小写字母。
1.编码流程图
五笔字型将成千上万个汉字首先分成两大类:
键面上有的“键面字”和键面上没有的“键外字”。
两类汉字的取码法按以下流程图分别取码。
2.编码输入
五笔字型字根键盘上,本身是汉字的字根,叫“键面字”。
“键面字”分为三类,其输入法分别是:
1)键名字的输入
每一个键位上,最左上角的那个黑体字的码元,叫键名字,它是“一键之名”。
以G键为例,其左上角的字根“王”便是“键名字”或“键名”。
“键名字”的输入法是:
把所在的键连打4下。
例如:
1区1位键名:
王11111111(GGGG)
3区2位键名:
白32323232(RRRR)
4区5位键名:
之45454545(PPPP)
5区3位键名:
女53535353(VVVV)
在王码五笔字型中,键名码元有25个。
1区:
王土大木工(对应键位:
GFDSA)
2区:
目日口田山(对应键位:
HJKLM)
3区:
禾白月人金(对应键位:
TREWQ)
4区:
言立水火之(对应键位:
YUIOP)
5区:
已子女又纟(对应键位:
NBVCX)
2)成字字根的输入
键面上除键名外,凡本身是汉字的码元,叫“成字字根”或“成字码元”。
其输入法是:
先打一下它所在的键(这一下俗称“报户口”),再打第一个、第二个,以及它的最末一个单笔画,最多4下,不足4下,补一个空格键。
例如:
当输入十、七、九、二、几、儿、乃、刀……这一类只有2个笔画的字根时,“报户口”之后就只能有两个笔画了,不足4个码,笔画打完,要再补打一下“空格键”表示结束。
3)补码码元及其输入
在字根表中,用方圆框“框住”的4个字根,是“补码码元”,它们作为字根参与编码时,像姓氏中的复姓诸葛、司马一样,要编2个码:
“主码(即码元所在键位)+补码(规定取该码元最后的笔画结构)”。
如下表所示:
注:
表中带圆圈的笔画丶、氵等,是“补码”的笔画表示形式,作为一个符号,用以提示编码。
这4个补码码元中的“犭、礻、衤”等三个字根,本身也是汉字,这三个汉字的编码规则是,要先“报户口”(主码+补码)(已占用2个码)、再打该字的第1笔和最后1笔,共取4码。
即:
注:
键位上只有有的成字的字根可以打出来,而本身并不是汉字字根不能打出来。
3.“键外字”拆分法
凡是“字根总表”上没有的汉字,都是“键外字”。
它们都是由几个码元(字根)组合而成的,我们也把这类字称为“多元字”。
对于“多元字”,只有一个字——拆分。
科学、实用又没有“二义性”的“拆”法,共有以下5项规则 :
1)书写顺序
“合体字”拆成“字根”,一般情况下,要按照正确书写顺序进行。
例如:
新:
立木斤(顺序正确)
立斤木(顺序错误)
2)取大优先
要“拆”出“笔画尽可能多”的“字根”。
要以“再添一个笔画,便不能构成为笔画更多的字根”为限度。
例如:
估:
亻古(正确)
亻十口(错误,因为“口”可添到前面的“十”上,“凑”成更多笔画的字根“古”)
注:
“取大优先”,俗称“尽量往前凑”。
因为“向前凑”总是有限度的,要凑成字根表中笔画更多(更大)的一个!
否则,便没有“章法”了,势必有许多种“拆法”甚至都要拆成单笔画!
在汉字拆分中,这是一个最常用到的、保证拆分唯一性的基本原则。
3)兼顾直观
在编码时,为了使码元特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成个别例外的情况。
例:
“国”字
按“书写顺序”,其码元应是:
“冂王丶一”,但这样编码,不但有悖于该字的字源,也不能使码元“囗”直观易辨。
我们只好违背“书写顺序”,按“囗王丶”的顺序编码。
4)能连不交
请看以下取码实例:
天:
一大(正确,“一”与“大”是相连接的关系,比较直观)
二人(错误,“二”与“人”交叉在一起了)
生:
丿(正确,“丿”与“”是相连的,直观可取)
土(错误,“丿”与“”是相连的,直观可取)
一般来说,“连”比“交”更为“直观”,更能显现码元的笔画结构特征,更易于辨认。
5)能散不连
有时候,一个汉字的几个码元,都不是单笔画,这些码元之间的关系,常常在“散”和“连”之间模棱两可。
如:
矢:
大,两个码元按“连”处理,“矢”便是杂合型(3型)字;两个码元如果按“散”处理,“矢”便是上下型(2型)字。
午:
、十(两个字根,可视为散,也可当作连)
这两个字都是既可“连”,又可“散”的关系。
当遇到这种既能“散”,又能“连”的情况时,我们规定:
只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系。
4.四元及多元字
1)“四元字”的编码规则
键外字中的“四元字”,是指刚好由四个字根构成的字。
其拆分之后的取码方法是“依照书写顺序输入字根”。
例如:
照:
日刀口灬
22532344
JVKO
重:
丿一日土
31112212
TGJF
2)“多元字”的取码规则——“前三末一”(一二三末)
键外字中的“多元字”,是指由4个以上的字根构成的字。
这种字,不管实际上能“拆”成几个字根,我们只需“按书写顺序,取拆分结果的第一二三及最末一个字根”便可,俗称“一二三末”,共输入四个码。
例如:
暨:
彐厶匚儿日一
53541511
VCAG
攀:
木乂乂木大手
14323232
SRRR
5.识别码
汉字编码输入法的设计,要尽量减少重码,以提高输入的唯一性。
但从以下两种情形我们看到,仅仅输入字根,很容易产生重码:
1)因构字的字根相同,字型不同引起重码:
叭:
口八(2334KW)
只:
口八(2334KW)
这个例子说明,编码中丢失了字型信息,才产生了重码。
2)因几个字根同一键位引起重码:
沐:
氵木(4314IS)
汀:
氵丁(4314IS)
洒:
氵西(4314IS)
这个例子说明,编码没有将“木、丁、西”加以区分,才产生了重码。
由以上两类例子可知,当遇到2-3个字根构成的汉字时,为了避免编码相同(重码),既有必要提取“字型信息”,又有必要从字根上“提取笔画特征信息”用于编码。
复合这两种信息的一个附加码,就是“末笔字型识别码”简称“识别码”,“识别码”只追加在由2-3个字根构成的汉字编码中(见下节)。
“识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。
1、2、3型汉字的识别码共有15个(各有3种形式),其构成如下:
例:
红:
末笔1,字型1,识别码为11(即“一”);
华:
末笔2,字型2,识别码为22(即“刂”);
团:
末笔3,字型3,识别码为33(即“彡”)。
6.二三元字取码
“键外字”中,只有2个字根的字,叫“二元字”;只有3个字根的字,叫“三元字”。
输入时,键外字毫无例外地都要“拆”。
“二元字”或“三元字”的输入法是:
先“拆”成字根,输入字根后,再追加一个“末笔字型识别码”(简称“识别码”)。
有了识别码可以大量减少重码。
“识别码”的简易直观表示法——用带圆圈的笔画表示“识别码”:
1)左右型(1型)字的“识别码”
对于1型(左右型)字,字根输入之后,补打“1个末笔画”,就等同于添加了“识别码”,用“一丨丿丶乙”表示。
例如:
红:
纟工一(字根打完,补打1个末笔画“一”,相当于11:
G)
551511
XAG
2)上下型(2型)字的“识别码”
对于2型(上下型)字,码元输入之后,补打“2个末笔画”的字根,就等同于添加了“识别码”,用“二刂丿丿丶丶巜”表示之。
例如:
字:
宀子二(字根打完,补打2个末笔画“二”相当于12:
F)
455212
PBF
复:
日夂(字根打完,补打2个末笔画“丶丶”,相当于42:
U)
31223142
TJTU
花:
艹亻匕巜(字根打完,补打2个末笔画“巜”,相当于52:
B)
15345552
AWXB
3)杂合型(3型)字的“识别码”
对于3型(杂合型)字,码元输完之后,补打“3个末笔画”的字根,就等同于添加了“识别码”,用“三川彡氵巛”表示之。
例如:
同:
冂一口三(字根打完,补打3个末笔画“三”,相当于13:
D)
25112313
MGKD
远:
二儿辶巛(字根打完,补打3个末笔画“巛”,相当于53:
V)
12354553
FQPV
注1:
凡是“包围型”的字,如全包围字“国、团””等,半包围字“这、庆”等,均以被包围的那个部分的“末笔”作为整个字的“末笔”来构成“识别码”,如“远”字,要以被包围的“儿”的末笔来构成“识别码”(53:
V)。
注2:
识别码一共有3种表示法,其编码的效果完全相同,都是同一个码。
可以按照下面的方法打“识别码”,例如:
末笔横的1型字:
打11键,就是G键,就是“一”(一个横)键。
末笔撇的3型字:
打33键,就是E键,就是“彡”(三个撇)键。
其所以如此,道理很简单:
1区1位(G)上有1个横“一”,3区3位(E)上有3个撇“彡”……
7.简码和容错码
1)简码输入
一些常用的字,除按它的“全码”可输入外,为减少打键次数,只输入其全码的最前边的1个、2个或3个码,再加打空格键,也可以输入,这就是一、二、三级简码。
简码可以提高输入效率。
a.一级简码(又称“高频字”)
将各键打一下,再打一下空格键,即可打出25个最常用的汉字(每键一个):
一地在要工 上是中国同 和的有人我 主产不为这 民了发以经
如:
一:
11(G) 的:
32(R) 和:
31(T)
具体如下表:
b.二级简码(只输入“全码”的前2个码)
化:
亻匕(3455WX)
李:
木子(1452SB)
c.三级简码(只输入“全码”的前3个码)
想:
木目心(142151SHN)
巍:
山禾女(253153MTV)
2)容错码
“容错码”的涵义是:
“容易”编错,但“容许”按错码输入。
例如:
面:
丆冂三DMJD(正确,按笔顺取大优先)丆囗二DMJF(拆分容错)
8.万能键Z
输入汉字时,如果一时不知道某些字的编码,便可以用“万能键Z”来代替“不知道的那个码”。
Z键的用途主要可分以下三种情况:
1)当不知道某个字的拆分时,用Z代替不知道的字根,例:
键:
钅ZZ廴
2)当不知道字根在哪个键位上时,用Z代替,例:
论:
讠人ZZ
3)当不知道字的“识别码”时,可用Z代替,例:
花:
艹亻匕Z
万能键Z也叫学习键。
一旦使用Z键,提示行中便会有比较多的字显示出来,其中会有你要的那个字,而且,字的后边还有正确码的提示。
三、词汇输入
在字母键上,打4个键,不用换档,既能打单字,又能打词汇,字、词之间没有界限,这是发明人1983年的一项重大创造——字词兼容。
在输入词汇时,不管多长的词汇,一律只打4下键,单字和词汇可以混合输入,字词之间不用任何换档或其它附加操作。
词汇输入法为 :
1.二字词
取每个字“全码”的前两个码组成,共4码。
例如:
生产:
丿 立 丿
31 11 42 31(TGUT)
建设:
彐 二 讠 几
53 12 41 34(VGYW)
2.三字词
前两个字,各取第一个码,最后一字取前两个码,共4码。
例如:
电视机:
日礻木几
22451425(JPSW)
3.四字或以上词
对于4个字或超过4个字的词,取第一、二、三及最后一个汉字的第一码,共4码。
例如:
中华人民共和国:
口亻人囗
23343424(KWWL)
特别提醒:
五笔输入法的几项硬性规定:
1、关于“力、刀、九、匕”。
鉴于这些字根的字顺因人而异,五笔输入法规定,当它们参加“识别”时,一律以“折”作为末笔。
2、带“框框”的“国”、“团”等字和带走之旁的“边”、“远”等字,一律以被包围部份的末笔为末笔。
3、“我”、“定”、“成”等字的末笔,由于因人而异,一律规定末笔为撇“丿”。
4、五个单笔画的编码硬性规定为:
“一”是GGLL,“|”是HHLL,“丿”TTLL,“丶”为YYLL,“乙”为NNLL。
5、有些五笔输入法为了避免“劳动”这个常用词组与“蔻”字重码,把“蔻”字编码最后一码改为“L”;同时为避免“靥”不与“大”字重码,把“靥”最后一码改为“L”。