中文电脑易学易用输入法中华电信退休同人协进会.docx
《中文电脑易学易用输入法中华电信退休同人协进会.docx》由会员分享,可在线阅读,更多相关《中文电脑易学易用输入法中华电信退休同人协进会.docx(94页珍藏版)》请在冰豆网上搜索。
中文电脑易学易用输入法中华电信退休同人协进会
中文電腦文化宜人輸入法
王金土博士45高
要讀本篇論文,請先把您的電腦裝置「宋體外字」,以便能夠顯示出「字根」,如「挑手」、「三點水」、「寶蓋」等,否則無法看懂這篇論文。
其步驟如下:
(1)下載「華康宋體外字」字形檔DFSTD-M3.TTF,置於D:
(2)以滑鼠左鍵點「開始」=>「設定」=>「控制台」=>「字型」=>「檔案」=>「安裝新字型」
(3)磁碟機選D:
(4)您的電腦就會新安裝「宋體外字」,此等外字是除了Big5字集之外,可以顯示王金土特定使用的「字根」,於是上述的「挑手」、「三點水」及「寶蓋」就可以顯示為「」、「」及「」。
這樣您才看得懂這篇文章。
(5)祝您閱讀愉快,心得圓滿。
1、前言
中文電腦輸入法的門檻一直是很高,一般人沒有花太多功夫是很難爬上去的,因此一般人想要利用中文電腦來處理文書作業或發送一則中文的電傳文件,似乎是不太容易的事。
因此要推展辦公室自動化或企業中文化或中文式的e化實在很難達成其預期的目標。
本人累積二十多年在中文電腦的經驗並請教一些文字學有研究的專家們,設計並發明了這套中文電腦易學易用的輸入法,命名為『文化及宜人輸入法』(Cultural&User-FriendlyInputMethod),簡稱『文宜輸入法』,使一般人都能自行學習,利用中文字根與英文字母形狀的相似性,勿需刻憶背記字根在鍵盤的位置,以平常書寫的筆順次序來輸入每一中文字。
另外把中國的數字系統如一二三四...九十,甲乙丙丁...壬癸,壹貳參肆...玖拾,鼠牛虎兔...犬豕,子丑寅卯...戍亥等這些字根安置在鍵盤的數字鍵上,即好記又合乎文化,使中文電腦的操作具有趣味性及教育性,一般人不再視輸入中文字為畏途,定可在最短的時間內學會這種輸入法,加速辦公室自動化企業中文e化的早日達成,並促進資訊化社會的提早來臨。
2、本輸入法的特點
本輸入法的特點有下列幾項:
(1)提供要輸入次一字根的前瞻資訊(NextRootLookAheadInformation)—在使用者輸入第一鍵後,於電腦螢幕的視窗內顯示以此一字根為前導的所有候選字,每一頁若干字(如每頁十個字),在每一候選字之旁附註此一候選字第二鍵要打進去的英文字母、數字或特殊符號,在第二鍵打進去以後,螢幕視窗顯示所有以此二鍵原輸入次序為前導(Prefix)之所有中文候選字,在其旁亦顯示各候選字第三鍵的英文字母、數字或特殊符號,依此類推,直到候選字只有一個字加空格鍵或少數同碼字加空格鍵為止,此時只要按一下空格鍵或對應的數字鍵就可把所需的中文字選出來。
此一特點非常方便自學者自我練習,可以減少操作者的挫折感,增加學習興趣。
(2)採用字根與英文字母形狀的相似性(ShapeSimilarity)—對於懂得英文打字的人來講,英文字母在鍵盤的位置是他們長久以來非常熟習的記憶,尤其是學會雙手觸摸打字者(TouchTyping)或盲目操作者(Blind-foldTyping),如果能夠利用他們這個記憶,把中文字根妥善歸併,利用字根與字母形狀的相似性及關聯性來安置字根在每一個字母鍵上,則打中文字就可以像打英文字一樣的方便了。
例如,下列的英文字母與其下方的中文字根就是選取極為相似的一些中文字根以為對應。
QWERTYUIOP
日火川丁木凵工口尸
曰大小山
臼巳
(River)
ASDFGHJKL
弓囗廾厂女(Lady)
人刀勿
ZⅩCVBNM
乙乂匚心月(Moon)
又
乃
(3)字中有字者其構字輸入的一致性––
每一個中文字常是其他中文字的一部份,例如下列兩個例子中,『寸』與『斤』都是構成其他字的一部份:
寸:
寺、持、等、時、特、尉、蔚、對、濧、辱、褥、守、狩、村、酎、壽等等
這些『寸』都是打『』(0.)
斤:
听、沂、折、浙、逝、芹、近、質、斥、拆、訢、匠、所、斬、斸、斷等等
這些『斤』都是打『』(JT)
這完全合乎『一致性』(Consistency)的原則,也就是同一構字均打同一『字根序列』,使得輸入中文字就像輸入英文字一樣的方便,就像下列的英文字中『tion』就是一個模組或中文中的構字:
telecommunication,action,consideration,operation,nation,revolution,resolution,creation,international,discrimination,etc.
(四)把中國數字系統有關的字根安置在英文數字鍵上,以利中英對照(Chinese-EnglishOnetoOneCorrespondence)—熟習英文打字的人都知道阿拉伯數字是在鍵盤的最上面一排從左到右是1234567890,中國人也有一套非常完整的數字系統,如小寫數字(一二三四五六七八九十)、大寫數字(壹貳參肆伍陸柒捌玖拾佰仟萬)、天干(甲乙丙丁戊己庚辛壬癸)、地支(子丑寅卯辰巳午未申酉戍亥)及十二生肖(鼠牛虎兔龍蛇馬羊猴雞狗豬),其中除了大寫數字中之『肆伍陸柒捌玖拾佰仟』及十二生肖中之『蛇猴雞狗豬』幾個字外,其餘都是構成其他中文字的字根。
把這些字根安置在數字鍵上,具有教育性及趣味性,使操作者在輸入中文字之際能瞭解構字本意及中國數字系統,例如「孩」這個字中有「子」及「亥」分別含有1及12的意義,而「饐膩蔘」三字中分別有「壹貳參」形構字根,而「龘驫羼猋」四字中分別有「龍馬羊犬」形構字根分別代表「5,7,8,11」之意義。
(5)提供異體輸入而顯示正體字––
中文字有很多異體字包括簡體字在內,但是國家訂定了標準字形或稱正體字,這些正體字係用在顯示及印出上,表現其正式性(Formal)。
但簡體字可以用作輸入,以加速輸入的速度。
另外還有一個教育的功能是讓輸入者知道相對應的正體字是怎麼寫的,實具有社會教育的功能。
例如:
「又寸」可以顯示「對」;而「三寸」可以顯示「壽」;而「千口」可以顯示「亂」;而「七十」可以顯示「華」等等
(6)多對一的選字性(Many-to-OneMapping)
同一正體字若拆解字根的觀點不同則導選出同一中文字。
例如:
「立」字可拆解成「」(2V)或「一」(61)則可選出同一字。
因此,「新」字是「立木斤」可以輸入「2VYJT」或「61YJT」均可。
「再」字可輸入「一土」也可以輸入「二」導選出同一字形。
可拆解成「
(七)提供字根加減乘功能
本輸入法的最大特點是依照字根書寫的次序累加的輸入,也就是字根的相加功能,例如:
「田田田土」可以顯示「壘」;而「言賣言」可以顯示「讟」;而「金聿」可以顯示「鍵」字。
某些字也可以用前一字根的筆畫減去後一字根的筆畫,例如,「烏」可以用「鳥一」來表示,而「嗚」也可以用「口鳥一」來表示。
有些中國字內有重複的字根,例如,「龘、驫、羼、壘、壨、器、斷、龠」,其中分別可用「三龍」、「三馬」、「尸三羊」、「三田土」、「四田土」、「四口犬」、「四斤」、「三口」來輸入。
以中國小寫數字冠於重複字根前具有相乘的效果。
(八)提供中文標點符號快速輸入功能
有些中文特有的標點符號在輸入中文文章時使用的頻率是很高的,例如:
「『、。
』」等,這些中文特有的標點符號可以分別用<{:
“}>來作快速輸入用。
以免用內碼或查表的方式作輸入時需要所花很多的時間。
(九)提供中文模式全字形英文字母及各種符號簡便輸入方法
在中文模式中,如要輸入全字形的英文字母或標點符號時,可用一前導鍵「`」(在鍵盤的最左上角1鍵的左邊)加該字母或特殊符號就可輸入該字母或特殊符號的全形字形。
例如:
要輸入ABCD...或abcd...時可分別輸入`a`b`c`d...等(因係重復字,故需按「下箭頭」顯示重復字符視窗後再選1或2);要輸入12345....可分別輸入`1`2`3`4`5....;要輸入!
@#$%△&*()╴+–=時可分別輸入`!
`@`#`$`%`^`&`*`(`)`_`+`-`=;要輸入{}〔〕〈〉|\:
;,./可分別輸入`{`}`[`]`<`>`|`\`:
`;`,`.`/等。
3、實作方法
(一)全部字根的指配
經過分析及合理歸併後,表一至表四乃是鍵盤第一排至第四排每一數字鍵、符號鍵及字母鍵所對應的所有字根,而表五乃是第一排上鍵(Shift)所代表的字根(中文大寫數字、地支及十二生肖),而第一排下鍵(Non-shift)除了中文小寫數字外,尚有天干等這些字根,所需注意者是這些字根與鍵上的數字、符號及字母大部份均有「聯想意義」,只要把這些聯想意義告知使用者,使用者便可不用花太多功夫學習便可記住每一鍵所代表的字根,再依上述節所述的特性依法操作,便可以很容易學會這種輸入法。
表一第一排下面數字鍵的字根指配
鍵
盤主副
符字天字
號:
根干根
1:
一甲
2:
二乙
3:
三丙
4:
四丁目皿
5:
五戊王
6:
六己
7:
七庚匕
8:
八辛
9:
九壬兀几
0:
十癸
-:
土士
=:
片
請注意有底線(Underline者)的字根是『形構字』,是構成其他字的因素,但其本身的字形要以其他筆畫較少的多個字根來輸入。
表二是第二排英文字母鍵及三個符號鍵的安排:
(請注意中文字根與英文字母形狀的相似性)
表二第二排字母鍵及符號鍵的字根指配
鍵
盤主次副
符字字字
號:
根根根
Q:
日曰
W:
火大
E:
手
R:
川
T:
丁巾
Y:
木
U:
臼凵山
I:
工
O:
口中
P:
尸
[:
門
]:
鬥隹
\:
表三是第三排英文字母鍵及二個符號鍵的安排:
(請注意中文字根與英文大寫字母形狀的相似性)
表三第三排字母鍵及符號鍵的字根指配
鍵
盤主次副
符字字字
號:
根根根
A:
人儿入
S:
弓
D:
刀囗力
F:
勿
G:
H:
廾丌廿
J:
K:
L:
女
;:
水
':
卜
表四是最後一排英文字母鍵及三個符號鍵的安排:
(請注意中文字根與英文大寫字母及特殊符號形狀的相似性)
表四最後一排字母鍵及符號鍵的字根指配
鍵
盤主次副
符字字字
號:
根根根
Z:
乙
X:
又乂
C:
匚亡
V:
B:
了乃
N:
心
M:
月
:
弋戈
.:
止
/:
夕土
表五是第一排上鍵(Shift)十二個特殊符號及第二排的最後鍵的上鍵”|”安排為中國大寫數字(壹、貳、參、肆、伍、陸、柒、捌、玖、拾、佰、仟、萬),、地支(子、丑、寅、卯、辰、巳、午、未、申、酉、戌、亥)及十二生肖(鼠、牛、虎、兔、龍、蛇、馬、羊、猴、雞、狗、豬)等字根,由於「蛇猴雞狗豬」是組合字而不是字根,因此用很近似的字根「虫袁鳥犬豕」來代替。
表五第一排上面的符號鍵之字根指配
鍵大十相
盤寫二似
符數地生字
號:
字支肖根
!
:
壹子鼠
@:
貳丑牛(無尾的牛)
#:
參寅虎虍(虎頭)
$:
肆卯兔
%:
伍辰龍
^:
陸巳蛇虫(蛇旁)
&:
柒午馬
*:
捌未羊(無尾的羊)
(:
玖申猴侯猿袁
):
拾酉雞鳥(雞為鳥類)
_:
佰戍狗犬(狗及犬為同義字)
+:
仟亥豬豕(豬及豕為同義字)
|:
萬(\鍵的上鍵)
另外有一些特符號也可安排打出中文的標點符號:
表六中文的特殊標點符號指配在幾個未用的上鍵上
鍵中特
盤文殊
符符
號:
號
{:
『
}:
』
:
:
、
":
。
<:
「
>:
」
如此,一個英文鍵盤就可用來打中文字了,其打法就像是打英文字(Word)一樣,打幾個鍵後就加一個空格鍵(Space),用您已經學會了的筆順順序一個字根一個字根的打進去,既自然又快速,因此一般人不用花太多的功夫就可以學會的一種輸入法,如此,我們中文化裡的辦公室自動化以及企業要e-化才能上路,而在中文化環境下,每個人都可以隨心所欲的用自己的語言發電子郵件,而無需被迫要用英文來發電子郵件,往往因受到語言的程度的限制而詞不達意。
(2)智識庫的建立
依照上述全部字根的指配即可建立每一字的「拼根序列」,而此一拼根序列即為輸入時該字的輸入碼,把全部中文字的拼根序列聚合在一起,依照筆劃由少而多的次序編排,即成了一本『輸入表拼根序』,以此作為參考,立即可以學會輸入每一個中文字了。
下列附件即是此一拼根序列。
(3)軟體的發展
要實施這樣觀念的一個中文電腦系統,必須要發展其相關的軟體,此一軟體除了要定義每一個字的拼根序列之外,必須要將一萬六千多字的拼根序加以整序(Sorting),變成一個輸入資料庫,每一拼根序列所對應的是這個字的內碼(InternalCode),並要發展一套搜尋方法,很有效率地找出所需要的中文字形,顯示在螢幕上。
這樣一個中文電腦輸入法是本人在民國六十八年所發明並得到中央標準兩個專利,一個名稱為『中文及多語言電腦簡便靈活之輸入法』(6812213號),另一個名稱為『中文電腦文化與宜人輸入法』,其中,『兩段尋找法』為此專利的精神所在,即由輸入序列在輸入資料庫中找到所需的內碼,再由所需的內碼去找出其對應的點陣字形,即所謂的『兩段尋找法』。
當時,記憶很貴,而且是用磁心記憶(CoreMemory)時代,且無個人電腦問世,而本人係將此輸入資料庫建立在迷你電腦的磁鼓(Drum)中,利用檔案管理系統自動去尋找拼根序列,並以所得的內碼再去找出其輸出字形的。
以後,半導體記憶體開始發展出來,本人再把此輸入表建立在RAM半導體隨意進出記憶體中,連同其字形製作成一片中文卡,專門容納此龐大的輸入表及字形,每一個輸入序列所需的記憶體為12位元組(Bytes)(每個字最多十個拼根序列,再加二個數元組的內碼),於是一萬六千字即需12x16,000個數元組,即192KB的記憶體,而儲存中文字形更是要花很大的記憶體在裝字形的資訊上,如一個字形為15x16的點陣字形,則16,000字需花30x16,000=480KB的記憶體,故一片中文卡至少需672Kbytes的記憶體,這在當時是很昂貴的一項設計。
其所換取的是輸入的方便性。
故當今所能見到的各種輸入法,大部份都是模仿本人的創意及專利而製作的,而採取法律行動需花費龐大的律師費及檢驗費,非一區區公務人員所能負擔得起的。
所以後來的想法是『專利年費我在繳而專利好處大家享,總有一天老天爺會給我補償的』。
上述所言中文字形檔,因為要花很大的空間,來裝字形資訊,於是又發明了一種方法來自動產生字形,利用幾百個常用的字根來組合所需的中文字形,其名稱為『中文字形輾轉合成法產生技術』,而且也得到中央標準局的專利,譬如,需要『鑼』的中文字形,只要定義其字形是由『金』字旁跟『羅』『左右並排,其比例為3:
7』合成,但『羅』字為標準字,故必須『輾轉』由其構字公式去組合,是由『四』及『維』『上下並排,其比例為4:
6合成,但『四』為字根,『維』為標準字,故必須再去找尋它的構字公式,發現是由『糸』及『隹』『左右並排,其比例為5:
5』合成,此時,『糸』及『隹』都是樹枝末稍的基本字根,故構字公式的搜尋到此為止,開始由下而上的組合每一級的字形,直到最後『鑼』的字形組成,把它顯示在螢幕上。
這一方法無疑的是以電腦的CPU時間來換取電腦的記憶體空間,但這個方法在當時記憶體昂貴的時代不失為一個好的方法。
另外,當時也以此方法,發展出以向量的方式來表示中文字形,把這些基本字形用向量來表示,並配合描繪機(Plotter)來畫字形,而其組字公式大致相同,除了最後以描繪機來畫出中文字形來之外,其他輾轉合成的原理均相同。
此一字形產生技術亦提供一家字形公司使用。
結語
我的一生可以說與中文電腦有深厚的淵源。
民國63年從美國俄亥俄州立大學回國後,因為負責發展『國際公眾電報自動處理系統』,系統的一項要求是要在來報上自動印出中文地址,於是發展出『以字根為基礎的中文輸入法』,這個方法經過三、四十年的改良,現己邁進第八代,雖礙於行銷上面需要龐大的人力及物力,但這個『文宜輸入法』一直陪伴著我,對我的文書作業非常有幫助,我的文件從來不請秘書打字的,都是以電腦作為編輯器,自行編輯好了之後再把檔案交出去印製或散發。
我也很樂意把此輸入法送給朋友,教他們用我的輸入法來寫書,對他們的工作也有幫助。
另外,除了輸入法及輸出法之外,我也花了不少時間在中文字內碼的編輯上,行政院主計處電子處理資料中心要編『中文資訊標準碼』,採用本人的編碼方法,『先筆畫、後部首』的字序,並不跳開ASCII的控制碼,這個編碼方法現在全球碼Unicode就是採用這樣一種編碼方法的。
另外,教育部國語推行委員會要製作中文的標準字形,我也受聘為顧問,針對兩萬多字的中文字一一加以審核,定出它們的標準字形,現在聯合報所用的小字字形就是所制定的國家標準字形。
現在以我所發明的輸入法看如何打下面的一排字:
『慶賀高雄中學王老校長家驥百年誕辰,壽比南山,松柏長青,多福多壽;桃李滿天下,英才遍四海。
』
『{
慶心J41NⅩ
賀力口目DO48
高口口2OMO
雄隹ⅩG〕
中口OⅠ
學了一〔ⅩⅩMB1或
子〔ⅩⅩM!
王一土1–或
三3Ⅰ或
一十一101
老土–/7
校六乂Y6Ⅹ
長FK
家一61FK或
豕6+
驥囗十5EWE7D0H6或
馬囗十&E7D0H6
百日JQ
年AC
誕二口止22O/.Z
辰厂二J2K或
辰%
,`,
壽士工一口–1Ⅰ1O0.或
三3/0.
比77
南十0MⅤ0
山凵UⅠ
,`,
松八Y8G
柏日Y/Q
長FK
青一土月1–M
,`,
多夕夕//
福二小一口囗十2R1OD0
多夕夕//
壽士工一口–1Ⅰ1O0.或
三3/0.
;`;
桃儿YA;
李木了一YB1或
木子Y!
滿廿入入;HTAA
天一大1W
下一卜1’
,`,
英大HMW
才0/
遍尸/PMHZ
四四4
海;AL2
。
“
』}
王金土小檔案
現任台灣國際標準電子股份有限公司董事長
曾任中華電信股份有限公司副總經理
中華電信研究所主任、副所長、所長
交通部電信總局副工程師、工程師、正工程司
國立台灣大學電機系工學士
美國夏威夷大學電機碩士
美國俄亥俄州立大學電腦與資訊科學博士
全文完
附件:
基本中文字輸入方法
一 畫
一:
一1
乙:
乙Z或2
二 畫
丁:
丁T或4
七:
七7
乃:
/B或B
九:
九9
了:
了B
二:
二2
人:
人A
儿:
/Z或A
入:
/\或A
八:
八8
几:
/Z或9
刀:
刀D
刁:
T1
力:
T/或D
匕:
/Z或7
十:
十0
卜:
卜'
又:
又X
乂:
乂X
乜:
1Z
凵:
凵U
匚:
匚C
厂:
厂J
三 畫
三:
三3
下:
一卜1'
丈:
一1X或X\
上:
一'1
凡:
几9.
久:
M\
么:
/G
也:
1IZ
乞:
乙AZ或A2
亡:
.C或C
于:
丁一T1或41或二2I
兀:
一儿1A或9
刃:
刀D.
勺:
一D1
千:
十/0
叉:
又X.
口:
口O
土:
土-
士:
十一01或-
夕:
夕/
大:
一人1A或W
女:
女L
子:
了一B1或子!
孑:
了B1或孑!
孓:
了B\
寸:
0.
小:
I8或R
尢:
一19
尸:
尸P
山:
凵UI或U
川:
川R
工:
工I
己:
IZ或己6
已:
17
巳:
口OZ或巳^
巾:
MI或T
干:
一十 10
廾:
廾H
弋:
弋,
弓:
弓S
才:
0/
万:
一1D
丌:
一1H
乇:
七/7
亍:
一丁1T或14
囗:
一M1或囗D
兀:
一儿1A或兀9
屮:
凵UI或屮U
彳:
/A
四 畫
丑:
士T-或丑@
丐:
一1'D
不:
卜J'
中:
口OI或O
丰:
3I或/E
丹:
M2
之:
.Z
尹:
E/
予:
PT
云:
二2G
井:
二2H
互:
一15或一一1O1
五:
五5
亢:
几29
今:
A1
介:
AH
仄:
厂人JA
元:
一兀19或二儿2A
允:
儿GA
內:
入MA
六:
六6
兮:
八8B
公:
八8G
冗:
几M9
凶:
凵XU
分:
八刀8D
切:
七刀7D
勻:
二D2
勾:
DG
勿:
勿F
匹:
兀9Z
午:
十A0或午&
升:
廾/H
卅:
廾HI
卞:
卜2'
厄:
厂JP
友:
又XX
及:
又DX
壬:
士/-或一十一或壬9
反:
厂又JX
天:
一大1W
夫:
二人2A
太:
大W.
夭:
大/W
少:
小R/
尤:
0Z
尺:
尸P\
屯:
凵7U
巴:
QZ
木:
木Y
欠:
人DA
止:
止.
歹:
一夕1/
毋:
L/
比:
77
毛:
3Z
氏:
C,
水:
水;
火:
火W
爪:
/R
父:
乂8X
爻:
乂XX
片:
片=
牙:
CA
牛:
十A0或/E或牛@
犬:
0\或犬_
丙:
一1MA或丙#
王:
一1-或三3I或王5
世:
廿 HZ
五 畫
丕:
不一J'1
且:
三M3
丘:
工JI
主:
土2-或王.5
乍:
二K2
乏:
之/.Z
乎:
/VI
令:
AP
以:
GA或I.A
凸:
凵SU
充:
一儿1GA或允2GA
兄:
口儿OA
冉:
土M-
冊:
MH或一MM1
冬:
X2
凹:
一S1
出:
凵UU或凵凵