无痛学习 王码五笔字型输入法.docx
《无痛学习 王码五笔字型输入法.docx》由会员分享,可在线阅读,更多相关《无痛学习 王码五笔字型输入法.docx(16页珍藏版)》请在冰豆网上搜索。
无痛学习王码五笔字型输入法
无痛学习王码五笔字型输入法
一、基本知识
1、汉字的构成
人们知道,物质是由分子组成的,成千上万种分子,又是由100多种原子构成,而原子,则是由更小的几种基本粒子如质子、电子、中子等构成。
中国人常说:
木子──李
日月──明
立早──章
双木──林
可见,一个方块汉字是由较小的块拼合而成的。
这些“小方块”如日、月、金、木、人、口等等,就是构成汉字的最基本,也就是最根本的单位,我们把这些“小方块”称做字根”,意思是汉字之本。
“五笔字型”确定的字根有125种。
字根又是什么构成的呢?
试拿笔写一写就知道,字根是由笔画构成的。
这样,我们就发现,物质的构成和汉字的构成十分相似:
基本粒子(几种)──原子(100多种)──分子(成千上万种)
基本笔画(5种)──字根(125种)──汉字(成千上万种)
2、汉字的分解
汉字输入电脑一度举世称“难”。
难在哪里?
难在汉字的“多”:
字数多,笔画而电脑的输入设备键盘,只有几十个字母键,不可能把汉字都摆上去。
所以要将汉字分解开来之后,再向电脑输入。
(1)分解汉字:
像把分子分解为原子那样,把汉字分解开来,比如将“桂”分解成“木、土、土”,“照”分解为“日、刀、口、灬”等。
因为字根只有125种,这样,就把处理几万个汉字的问题,变成了只处理125种字根的问题。
把输一个汉字的问题,变成输入几个字根的问题,这正如输入几个英文字母才能构成一个英文单词一样。
(2)分解过程:
是构成汉字的一个逆过程。
当然,汉字的分解是按照一定的章法实行的,这个章法总起来就是:
整字分解为字根,字根分解为笔画。
3、什么是字根
1、汉字由字根构成:
用字根能够像搭积木那样组合出全部的汉字和全部
词汇。
2、选择字根的条件
(1)能组成很多的字,如王土大木工,目日口田山等,
(2)组成的字特别常用,如白(组成“的”)、西(组成“要”)等。
(3)绝绝大部分字根都是查字典时的偏旁部首,如:
人口手金木水火土等。
相反,相当一些偏旁部首因为太不常用,或者能够拆成几个字根,便不被入选为字根了,如:
比、歹、风、气、欠、殳、斗、户、龙、业、鸟、穴、聿、皮、老、酉、豆、里、足、身、角、麦、食、革、骨、鬼、音、鱼、麻、鹿、鼻等。
3、“五笔字型”的字根总数是125种。
有时候,一种字根之中,还包含有几个“小兄弟”,主要是:
(1)字源相同的字根:
心、忄、;水、、、、等。
(2)形态相近的字根:
艹、、廾、、廿;已、己、巳等
(3)便于联想的字根:
耳、卩、阝等。
所有的“小兄弟”都与其主字根是“一家人”,作为辅助字根,它们同在一个键位上,编码时使用同一个代码(即同一个字母或区位码)。
字根(包括“小兄弟”)总数,以及每一个字根的笔画数是一的,不能增加,也不能减少它们构成了能够构成一汉字的“基本”单位。
二、汉字的五种笔画
1、笔画的定义:
书写汉字时,一次写成的一个连续持续的线段。
(1)两笔写成者不叫笔画如“十、口”等,只能叫笔画结构。
(2)一个连贯的笔画,不能断开成几段来处理。
如:
把“申”分解为“丨、田、丨”等。
2、字根由笔画写成。
汉字、字根、笔画是汉字结构的三个层次。
3、经科学归纳,汉字的基本笔画只有下表所示的5种。
这5种笔
画分别以1、2、3、4、5作为代号:
代号
笔画名称
笔画走向
笔画及其变形
1
横
左→右
一
2
竖
上→下
丨
3
撇
右上→左下
丿
4
捺
左上→右下
丶
5
折
带转折
乙
(1)由“现”是“王”字旁可知,提笔“”应属于横“一”。
(2)由“村”是“木”字旁可知,点笔“丶”应属于捺“”。
(3)由旧体的“”字其竖笔带钩可知,竖笔向左带钩“” 应属于竖“丨”。
(4)其余一切带转折、拐弯的笔画,都归折“乙”类。
三、汉字的三种字型
1、汉字是一种平面文字,同样几个字根,摆放位置不同,也即字型不同,就是不同的字。
如:
“叭”与“只”,“吧”与“邑”等。
可见,字根的位置关系,也是汉字的一种重要特征信息。
这个“字型”信息,在以后的“五笔字型”编码中很有用处。
2、根据构成汉字的各字根之间的位置关系,我们能够把成千上万的方块汉字分为三种字型:
左右型、上下型、杂合型,并根据各型拥有汉字的多少顺序命以代号:
1、2、3、字型代号字型图示字例特征
1左右 汉湘结封字根之间可有间距,总体左右排列
2上下 字莫花华字根之间可有间距,总体上下排列
3杂合 困凶这司乘 本年天果字根之间虽有间距,但不分上下左右浑然一体,不分块
“1型字”:
左右型。
“2型字”:
上下型。
“3型字”:
指不能分块或虽能分块,但块与块之间没有明显左右上下关系的字。
四、五笔字形的键盘分布
1、“五笔字型”字根键盘介绍
1、键盘:
是用手指操作,向电脑输入文字或“发布命令”的设备。
标准英文键盘的主体部分是26个字母键,因为这种标准键盘分上、中、下三排键,手指放在中间一排,上下各紧邻一排,特别适合手指操作,如能沿用英文指法,不但效率高,而且通用性强,所以英文键盘的26个字母键是最好的、最理想的汉字输入设备。
只要把“五笔字型”的字根对应放在英文字母键上,一个螺丝钉也不用动,这个键盘就“改头换面”成为一个“五笔字型”字根键盘了。
2、“五笔字型”字根键盘是依据以下“形码设计三原理”设计完成的:
(1)相容性:
使其字根组合产生的重码最少,重码率要在万分之二以内;
(2)规律性:
使其键位或字根的排列井然有序,让使用者好学易记;
(3)谐调性:
使双手操作打键时“顺手”,充分发挥各手指的功能,使效率最高。
一个有科学依据、有实用价值因而有真正生命力的字根键盘或输入方案,应当同时满足以上三个条件。
2、字根的分区划位
(1)“五笔字型”字根键盘:
在上面我们讲过,“五笔字型”的基本字根(含5种单笔画),共有125种。
将这125种字根按其第个笔画的类别,各对应于英文字母键盘的一个区,每个区又尽量考虑字根的第二个笔画,再分作5个位,便形成有5个区,每区5个位,即5×5=25个键位的一个字根键盘,该键盘的位号从键盘中部起,向左右两端顺序排列,这就是分区划位的“五笔字型”字根键盘。
(2)“五笔字型”字根键盘的键位代码(即字根的编码),既可以用区位号(11~55)来表示,也可以用对应的英文字母来表示。
键盘的分区划位略图如下所示:
35Q 34W 33E32R31T41Y42U43I44O45P
15A14S13D12F11G21H22J23K24L :
/;
Z55X54C53V52B51N25M , >/、 ?
//
(3)字根排列规律:
由图可见,这是一个井然有序的字根键盘,五笔字型”键盘设计和字根排列的规律性为:
①字根的第一个笔画的代号与其所在的区号一致,“禾、白、月、人、金”的首笔为撇,撇的代号为3,故它们都在3区。
②一般来说,字根的第二个笔画代号与其所在的位号一致, 如“土、白、门”的第二笔为竖,竖的代号为2,故它们的位号都为2。
③单笔画“一、丨、丿、、乙”都在第1位,两个单笔画的复合笔画“二、、、冫、”都在第2位,三个单笔画复合起来的字根“三、、彡、氵、巛”,其位号都是3。
3、字根总表
一个包含有125种“五笔字型”基本字根及其全部“小兄弟”的键盘字根总图,登在下面,学习者可以按照键位的排列规律,依据字根的内在联系和特征,通过使用很快地熟悉它们。
《五笔字型汉字编码方案》字根总表 (见附件图wbx、bmp)
表中每一键位上打头的那个黑体字字根,被称为“键名”。
4、字根助记词
为了使字根的记忆可以琅琅上口,特为每一区的字根编写了一首“助
记词”,一并列在下边。
学习者只须反复默写吟诵,即可牢牢记住:
11 王旁青头戋(兼)五一,(“兼”与“戋”同音)
12 土士二干十寸雨。
13 大犬三羊古石厂, (“羊”指羊字底“”)
14 木丁西,
15 工戈草头右框七。
(“右框”即“匚”)
21 目具上止卜虎皮, (“具上”指具字的上部“”)
22 日早两竖与虫依。
23 口与川,字根稀,
24 田甲方框四车力。
(“方框”即“囗”)
25 山由贝,下框几。
31 禾竹一撇双人立, (“双人立”即“彳”)
反文条头共三一。
(“条头”即“夂”)
32 白手看头三二斤,
33 月彡(衫)乃用家衣底。
(“家衣底”即“豕、”)
34 人和八,三四里, (“人”和“八”在34里边)
35 金勺缺点无尾鱼, (指“勹、”)
犬旁留叉儿一点夕, (指“”、儿、”)
氏无七(妻)。
(“氏”去掉“七”为“”)
41 言文方广在四一,
高头一捺谁人去。
(高头“”,“谁”去“亻”为“讠、”)
42 立辛两点六门疒,
43 水旁兴头小倒立。
(指“氵、、、”)
44 火业头,四点米, (“业头”即“”)
45 之字军盖建道底, (即“之、宀、冖、廴、辶”)
摘礻(示)衤(衣)。
(“礻、衤”摘除末笔画即“”)
51 已半巳满不出己,
左框折尸心和羽。
(“左框”即“”)
52 子耳了也框向上。
(“框向上”即“凵”)
53 女刀九臼山朝西。
(“山朝西”即“彐”)
54 又巴马,丢矢矣, (“矣”去“矢”为“厶”)
55 慈母无心弓和匕, (“母无心”即“”)
幼无力。
(“幼”去“力”为“幺”)
五、怎样找字根
字根设计及键位分区划位的规律性,使得初学者可以参考以下方法很快地在键盘上找到所要的字根。
1、依字根的第一个笔画(首笔)可找到字根的区(只有几个例外)如:
“王、土、大、木、工、五、十、古、西、戈”的首笔为横(代号为1),它们都在第1区。
“禾、白、月、人、金、竹、手、用、八、儿”的首笔为撇(代号为3),它们都在第3区。
2、依字根的第二个笔画(次笔)一般来说,可找到位。
如:
“王、上、禾、言、已”的第二笔为横(代号为1),它们都在第1位。
“戈、山、夕、之、纟”的第二笔为折(代号为5),它们都在第5位。
3、单笔画及其简单复合笔画形成的字根,其位号等于其笔画数。
如:
“一、丨、丿、丶、乙”:
都在对应区的第1位“二、、、冫、”:
都在对应区的第2位“三、、彡、氵、巛”:
都在对应区的第3位。
4、少数例外:
有4个字根,即:
力、车、几、心,它们既不在前2笔所对应的“区”和“位”,甚至也不在其首笔所对应的“区”中,实在是因为它们在对应的“区”、“位”里,引起“窝里斗”(引起大量重码),不受欢迎,只得流落他乡。
好在这样的字根只有4个,凭借某种特征,也算容易记住。
例如:
“力”:
读音为LI,故在“L”(24)键上,也说得过去。
“车”:
其繁体字“”与“田、甲”相近,与“田、甲”(24·L)呆在一起,也能四邻皆安。
“几”:
外形与“冂”相近,二者放在一个键(25·M)上也算有个伴。
“心”:
其最长的一个笔画为“乙”,放在“51·N”键上,总有点沾亲带故。
六、“五笔字型”编码规则
1、单字的编码规则
(1)“键面字”输入法
一张“字根总表”,把全部汉字划分成了两大部分。
总表里边有的,是专门用来组成总表以外汉字用的,称为“键面字”或“成字字根”相当于“原子”。
总表里边没有的,全部是由字根组合而成的,称为“键外字”或“复合字”,相当于“分子”。
现在,我们按照前述汉字分解之原则:
“汉字分解为字根,字根分解为笔画”,先来学习“键面字”或“成字字根”的编码输入法。
● 键名输入
各个键上的第一个字根,即“助记词”中打头的那个字根,我们称之为“键名”。
这个作为“键名”的汉字,其输入方法是:
把所在的键连打四下(不再打空格键),例:
王:
王王王王 11111111(GGGG)
又:
又又又又 54545454(CCCC)
如此,把每一个键都连打4下,即可输入25个作为键名的汉字。
● 成字字根输入
①成字字根:
字根总表之中,键名以外自身也是汉字的字根谓之“成字字根”,简称“成字根”。
除键名外,成字根一共有97个(其中包括相当于汉字的“氵、亻、勹、刂”等)。
②成字根的输入法:
先打一下它所在的键(称之为“报户口”)再根据“字根拆成单笔画”的原则,打它的第一个单笔画、第二个单笔画以及其最后一个单笔画,不足4键时,加打一次空格键。
现举例如下表
成字根 报户口 第一单笔 第二单笔 最末单笔 所击键位
文文 (Y) 、(Y) 一 (G) 、(Y) 41 41 11 41 Y Y G Y
用用(E)丿 (T)乙 (N)│(H) 33 31 51 21E T N H
亻亻(W)丿 (T)丨 (H) 34 31 21W T H 空格
厂厂(D)一 (G)丿 (T)│ 13 11 31D G T 空格
车车(L)一 (G)乙 (N)丨 (H)24 11 51 21L G N H
③单笔画输入
许多人不太注意,其实5种单笔画“一、丨、丿、丶、乙”,在国家标准中都是作为汉字来对待的。
在“五笔字型”中,照理说它们应当按照“成字根”的方法输入,除“一”之外,其它几个都很不常用,按“成字根”的打法,它们的编码只有2码,这么简短的“码”用于如此不常用的“字”,真是太可惜了!
于是,我们将其简短的编码让位给更常用的字,却人为地在其正常码的后边,加两个“L”作为5个单笔画的编码:
例:
一:
GGLL 丶:
YYLL
丨:
HHLL 乙:
NNLL
丿:
TTLL
应当说明,“一”是一个极为常用的字,每次都打4下岂不慢事?
别担心,后边会讲到,“一”还有一个“高频字”码,即打一个“G”再打一个空格便可输入。
(2)“键外字”输入法
凡是“字根总表”上没有的汉字,即“键外字”,都可以认为是由表内的字根拼合而成的,故称之为“合体字”──相当于“分子”。
按照前述汉字分解的总原则──“汉字拆成字根”。
我们首先应毫不客气、毫无例外地将一切“合体字”拆成若干个字根。
● 合体字的拆分原则
合体字的拆分原则
①书写顺序:
拆分“合体字”时,一定要按照正确的书写顺序进行。
例:
“新”只能拆成“立、木、斤”,不能拆成“立、斤、木”“中”只能拆成“口、丨”,不能拆成“丨、口”;“夷”只能拆成“一、弓、人”,不能拆成“大、弓”。
②取大优先:
“取大优先”,也叫做“优先取大”。
按书写顺序拆分汉字时,应以“再添一个笔画便不能成其为字根”为限,每次都拆取一个“尽可能大”的,即尽可能笔画多的字根。
例1:
世:
第一种拆法:
一、凵、乙(误)
第二种拆法:
廿、乙 (正)
显然,前者是错误的,因为其第二个字根“凵”,完全可以向前“凑”到“一”上,形成一个“更大”的已知字根“廿”。
例2:
制:
第一种拆法:
、一、冂、丨、刂 (误)
第二种拆法:
、冂、丨、刂 (正)
同样,第一种拆法是错误的。
因为第二码的“一”,作为“”后一个笔画,全可以向前“凑”,与第一个字根“”凑成“更大”一点的字根“”。
总之,“取大优先”,俗称“尽量往前凑”,是一个在汉字拆分中最常用到的基本原则。
至于什么才算“大”,“大”到什么程度才到“边”,这要等熟悉了字根总表,便不会出错误了。
③兼顾直观:
在拆分汉字时,为了照顾汉字字根的完整性,有时不得不暂且牺牲一下“书写顺序”和“取大优先”的原则,形成个别例外的情况。
例1:
国:
按“书写顺序”应拆成:
“冂、王、丶、一”,但这样便破坏了汉字构造的直观性,故只好违背“书写顺序”,拆作“囗、王、丶”了。
例2:
自:
按“取大优先”应拆成:
“亻、乙、三”,但这样拆,不仅不直观,而且也有悖于“自”字的字源(这个字的字源是“一个手指指着鼻子”) 故只能拆作“丿、目”,这叫做“兼顾直观”。
④能连不交:
请看以下拆分实例:
于:
一 十 (二者是相连的) 二 丨 (二者是相交的)
丑:
乙 土 (二者是相连的) 刀 二 (二者是相交的)
当一个字既可拆成相连的几个部分,也可拆成相交的几个部分时,我们认为“相连”的拆法是正确的。
因为一般来说,“连”比“交”更为“直观”。
⑤能散不连:
A、笔画和字根之间,字根与字根之间的关系,可以分为“散”、“连”和“交”的三种关系。
如:
倡:
三个字根之间是“散”的关系;
自:
首笔“丿”与“目”之间是“连”的关系;
夷:
“一”、“弓”与“人”是“交”的关系。
B、字根之间的关系,决定了汉字的字型(上下、左右、杂合)。
(A)几个字根都“交”“连”在一起的,如“夷”、“丙”等,便肯定是“杂合型”,属于“3”型字,不会有争议。
而散根结构必定是“1”型或“2”型字。
(B)值得注意的是,有时候一个汉字被拆成的几个部分都是复笔字根(不是单笔画),它们之间的关系,在“散”和“连”之间模棱两可。
如:
占:
卜 口 两者按“连”处理,便是杂合型(3型)。
两者按“散”处理,便是上下型(2型正确)。
严:
一 厂 后两者按“连”处理,便是杂合型(3型)
后两者按“散”处理,便是上下型(2型正确)。
当遇到这种既能“散”,又能“连”的情况时.我们规定:
只要不是单笔画,一律按“能散不连”判别之。
因此,以上两例中的“占”和“严”,都被认为是“上下型”字(2型)。
(C)作为以上这些规定,是为了保证编码体系的严整性。
实际上,用得上后三条规定的字只是极少数。
● “多根字”的取码规则
所谓“多根字”,是指按照规定拆分之后,总数多于4个字根的字。
这种字,不管拆出了几个字根,我们只按顺序取其第一、二、三及最末一个字根,俗称“一二三末”,共取四个码。
如:
戆:
立早夂心 42 22 31 51(UJTN)
● “四根字”的取码规则
“四根字”是指刚好由四个字根构成的字,其取码方法是依照书写顺序把四个字根取完。
如:
照:
日刀口灬 22 53 23 44(JVKO)
低:
亻七丶 34 35 15 41(WQAY)
● 不足四根字的取码规则
当一个字拆不够4个字根时,它的输入编码是:
先打完字根码,再追加一个“末笔字型识别码”,简称“识别码”。
①“识别码”的组成:
它是由“末笔”代号加“字型”代号而构成的一个附加码。
由于教不得法,以前许多人对“识别码”望而生畏。
其实,按如下做法,你只要5分钟定能学会:
A、“1”型(左右型)字:
字根打完之后,补打1个末笔画即等同于加了“识别码”。
例:
沐:
氵木丶(“”为末笔,补1个“”)
汀:
氵丁丨(“丨”为末笔,补1个“丨”)
洒:
氵西一(“一”为末笔,补1个“一”)
B、“2”型(上下型)字:
字根打完之后,补打由2个末笔画复合构成的“字根”即等同于加了“识别码”。
例:
华:
亻匕十(末笔为“丨”,2型,补打“”作为“识别码”)
字:
宀子二(末笔为“一”,2型,补打“二”作为“识别码”)
参:
厶大彡(末笔为“丿”,2型,补打“”作为“识别码”)
C、“3”型(杂合型)字:
字根打完之后,补打由3个末笔画复合而成的“字根”即等同于加了“识别码”。
例:
同:
冂一口三(末笔为“一”,3型,补打“三”作为“识别码”)
串:
口口(末笔为“丨”,3型,补打“”作为“识别码”)
国:
囗王丶氵(末笔为“丶”,3型,补打“氵”作为“识别码”)至于为什么这些“笔画”可以起到“识别码”的作用,你只要仔细研究一下区位号的设计与“识别码”的定义便会恍然大悟。
②关于“末笔”的几项说明:
A、关于“力、刀、九、匕”。
鉴于这些字根的笔顺常常因人而异,“五笔字型”中特别规定,当它们参加“识别”时,一律以其“伸”得最长的“折”笔作为末笔。
如:
男:
田力 (末笔为“乙”,2型)
花:
艹亻匕 (末笔为“乙”,2型)
B、带“框框”的“国、团”与带走之的“进、远、延”等,因为是一个部分被另一个部分包围,我们规定:
视被包围部分的“末笔”为“末笔”。
如:
进:
二刂辶(末笔“丨”3型,加“”作为“识别码”)
远:
二儿辶巛(末笔“乙”3型,加“巛”作为“识别码”)
团:
囗十丿彡(末笔“丿”3型,加“彡”作为“识别码”)
哉:
十戈口三(末笔“一”3型,加“三”作为“识别码”)
C、“我”“戋”“成”等字的“末笔”,由于因人而异,故遵从“从上到下”的原则,一律规定撇“丿”为其末笔。
如:
我:
丿扌乙丿(TRNT,取一二三末,只取4码)
戋:
戋一一丿(GGGT,成字根,先“报户口”再取1、2、末笔)
成:
厂乙乙丿(DNNT,取一二三末,只取4码)
D、单独点:
对于“义、太、勺”等字中的“单独点”,离字根的距离很难确定,可远可近,我们干脆认为这种“单独点”与其附近的字根是“相连”的。
既然“连”在一起,便属于杂合型(3型)。
其中“义”的笔顺,还需按上述“从上到下”的原则,认为是“先点后撇”。
如:
义:
丶氵(末笔为“丶”3型,“氵”即为识别码)
太:
大丶氵(末笔为“丶”3型,“氵”即为识别码)
勺:
勹丶氵(末笔为“丶”3型,“氵”即为识别码)
2、词语的编码规则
1982年底,“五笔字型”首创了汉字的词语,依形编码、字码词码体例一致、不须换档的实用化词语输入法。
不管多长的词语,一律取四码。
而且单字和词语可以混合输入,不用换挡或其它附加操作,谓之“字词兼容”。
其取码方法为:
1、两字词:
每字取其全码的前两码组成,共四码。
如:
经济:
纟