汉字的标准化.docx
《汉字的标准化.docx》由会员分享,可在线阅读,更多相关《汉字的标准化.docx(9页珍藏版)》请在冰豆网上搜索。
汉字的标准化
第三节
汉字的标准化
文字作为辅助语言的交际工具必须实现标准化。
汉字标准化的主要内容是“四定”,就是定量、定形、定音、定序。
一、定量
定量就是确定现代汉字的字量,包括各种专门用字的字量,实现汉字字有定量。
汉字自古至今的总字数多达数万。
《康熙字典》收字47000多字,《汉语大字典》收字54000多字,1994年出版的《中华字海》收字86000多字。
在这86000多字中,大部分是文言古语用字,只有一万多个是现代汉字。
在这一万多个现代汉字中,使用的频率并不相等,有的高有的低。
据统计,按照字频由高到低排列,序号和覆盖率的关系大致如下:
序号:
10002400380052006600
覆盖率:
90%99%99.9%99.99%99.999%
频率最高的1000字在现代白话文中的覆盖率高达90%。
这就是说,在100000字的文章中大约有90000字,是用这1000字写成的。
这样的统计规律可以帮助我们实现汉字的分级定量。
(一)常用字
常用字是教学用字,包括小学、初中等几个级别的教学用字。
根据汉字字频和覆盖率的关系,我们知道:
2400个常用字覆盖率99%,可以作为小学的识字量;3800个常用字覆盖率是99.9%,可以作为初中的识字量。
选定常用字要综合考虑以下四个方面因素:
第一,频率高的;第二,学科分布广的;第三,构词能力和构字能力强的;第四,日常生活中常用的。
1988年1月,国家语言文字工作委员会和国家教育委员会公布的《现代汉语常用字表》,收常用字3500字。
又分为两级:
一级常用字2500字,二级次常用字字1000字。
经检测,一级常用字的覆盖率是97.97%,二级次常用字的覆盖率是1.51%,合计是99.48%。
(二)通用字
通用字是印刷出版用字,是记录现代汉语一般要用到的字。
从全部现代汉字中除去罕用字,得到的就是通用字。
选定通用字对于印刷出版、辞书编纂、汉字的机械处理和信息处理都有重要的作用。
中华人民共和国建立以来,政府主管语言文字的部门公布过四个通用字表。
⑴1965年1月,文化部和中国文字改革委员会联合公布的《印刷通用汉字字形表》,收通用字6196字。
⑵1974年邮电部编辑出版的《标准电码本》,收通用字9317字,其中包括已经废除的繁体字、异体字、日本汉字等。
1983年出版的《标准电码本》(修订本),用简化字代替了繁体字,删除了异体字和生僻字,又增加了106字,共有7292字。
⑶1981年5月,国家标准局公布的《信息交换用汉字编码字符集·基本集》,收6763字,分两级:
一级是常用字3755字,二级是次常用字3008字。
⑷1988年3月,国家语言文字工作委员会和新闻出版署公布的《现代汉语通用字表》,收通用字7000字。
《现代汉语通用字表》是规范字表,它全面体现了国家关于汉字字形的规范。
它显示了每个字的规范字形,包括笔画数、结构和笔顺。
通用字内包括有常用字和非常用字。
《现代汉语通用字表》的7000字,就包括了3500个常用字。
二、定形
定形就是确定现代汉字的字形,实现汉字字有定形。
现代汉字的标准字形是由三个字表确定的。
(一)《第一批异体字整理表》。
异体字指的是读音和意义相同而形体不同的一组组的字,如:
够夠、床牀、窑窰窯。
汉字中有许多异体字,给学习和使用增加了负担,所以要对异体字进行整理。
整理异体字就是从每组异体字中确定一个为标准字,其余的字作为非标准字加以淘汰,停止使用。
确定标准字形的原则是从俗从简,而不是根据传统文字学的规定。
从俗就是选择群众中比较流行的,从简就是选择笔画比较简单的。
1955年12月22日,文化部和中国文字改革委员会公布了《第一批异体字整理表》,表内收异体字810组,每组最少有2字,最多有6字,共有1865字。
经过整理,每组保留一个为标准字,共保留810字,淘汰了1055字。
例如(括号内是淘汰的字):
布(佈)、痴(癡)、唇(脣)、雇(僱)、管(筦)、迹(跡蹟)、杰(傑)、巨(鉅)、泪(涙)、犁(犂)、猫(貓)、升(陞昇)、笋(筍)、它(牠)、席(蓆)、韵(韻)、周(週)、注(註)。
在这之后,国家主管语言文字的部门从淘汰的异体字中恢复了28个字为标准字,实际淘汰了异体字1027字。
(二)《简化字总表》。
汉字简化主要是减少笔画,同时也减少字数。
简体字和简化字的含义略有区别。
简体字泛指比繁体字笔画减省的汉字,而简化字特指《汉字简化方案》和《简化字总表》里的简体字,也就是由政府公布推行的简体字。
早在20世纪初年,就提出了汉字简化的要求,五四时期形成了高潮。
1922年钱玄同在
国语统一筹备会上提出《减省现行汉字的笔画案》,主张把过去只通行于平民社会的简体字正式应用于一切正规的书面语上。
1935年8月,国民政府教育部公布了《第一批简体字表》,准备推行,表内有简体字324字。
后来因为受到国民党领导层保守势力的反对,被迫宣布
“暂缓推行”,因而搁浅。
新中国建立后,人民政府为了扫除文盲、普及教育积极推行简化字。
1955年10月举行
的全国文字改革会议,讨论了汉字简化问题,并就《汉字简化方案》(草案)交换了意见。
1956年1月28日国务院公布了《汉字简化方案》,方案包括515个简化字和54个简化偏旁。
整个方案分四批推行,到1959年7月基本推行完毕。
1964年2月4日国务院就中国文字改革委员会的请示做出了批示,扩大了简化偏旁的数量,同时决定把正式推行的全部简化字编制成《简化字总表》,以便应用。
1964年版《简化字总表》有简化字2236字。
1986年10月10日国家语言文字工作委员会重新发表《简化字总表》,对字表里的个别简化字做了调整,最后有简化字2235字。
这是新中国建立以来政府公布推行的全部简化字。
《汉字简化方案》和《简化字总表》不是毫不相干的两个东西,后者是前者的发展和具体化。
《汉字简化方案》只有54个简化偏旁,《简化字总表》增加到146个,而且把应用这些简化偏旁用类推的办法简化出来的字都列了出来。
新中国汉字简化工作的方针和步骤是“约定俗成,稳步前进”。
“约定俗成”指的是简化工作要在社会习惯的基础上因势利导,简化字的字形尽可能采用社会已经流行的写法。
“稳步前进”指的是全部简化工作不是一次完成,而是分批进行,这样做为的是便于群众熟悉简化字、接受简化字。
实践证明这个方针基本是正确的,推行工作进展顺利,简化字逐渐在群
众中扎下了根。
简化汉字取得了明显的效果。
《简化字总表》里的2235个简化字,平均每字10.3画;已经简化了的繁体字有2264字,平均每字15.6画。
简化字与繁体字相比,平均每字减少了5.3画。
如果写2000个简化字,平均少写10000画。
按每个字平均10画计算,就等于少写了1000个字。
(三)《印刷通用汉字字形表》。
汉字印刷用的传统的宋体和手写楷体有许多差别。
例如:
印刷宋体:
手写楷体:
字形表》收印刷
同是印刷体也常有不同的写法,如:
叙敍敘、别別、羡羨、黄黃等。
为了克服这种分歧,文化部、教育部、中国文字改革委员会、语言研究所等部门于1962年组成汉字字形整理组,对印刷用汉字字形进行整理,最后制成了《印刷通用汉字字形表》。
1965年1月30日文化
部和中国文字改革委员会公布了这个字表,并开始在出版印刷行业推行。
用宋体铅字6196字,规定了每个字的笔画数、结构,并隐含着笔顺。
整理字形的标准是:
同一个宋体字有不同笔画或不同结构的,选择一个便于辨认、便于书写的形体;同一个字宋体和手写楷体笔画结构不同的,宋体尽可能接近手写楷体;不完全根据文字学的传统。
经过这次整理,不少字的字形发生了变化。
人们习惯把《字形表》规定的字形叫新字形,《字形表》公布之前使用的字形叫旧字形。
(新旧字形的差异,见附录)
定音就是确定现代汉字的字音,实现汉字字有定音。
普通话以北京语音为标准音,现代汉字的读音自然也就以北京语音为标准音。
为了做到字有定音,主要要解决好异读字和多音字的读音问题。
(一)异读字的读音。
一个字有两个或两个以上的读音而表示的意义相同,这样的字是
异读字。
汉字自古以来就有异读字。
例如《广韵·阳韵》“镶”汝阳切,又息羊切。
《广韵·皆韵》“稭”古谐切,又古八切。
这两个字在《广韵》里就是异读字。
现代汉字中也有一批异读字。
例如“暂时”的“暂”可以读zn,也可以读zhn。
“菜肴、酒肴”的“肴”
可以读yo,也可以读xio。
为了促进语音规范化、推广普通话,对异读字的读音要
加以审定。
审定异读字的读音,就是从现有的几个读音中确定一个为标准音,其余的读音作为异读停止使用。
1956年1月中国科学院语言研究所聘请专家组成普通话审音委员会开始审定异读词的读音。
单音节的异读词也就是异读字,所以审音委员会的工作虽然以词为审定的对象,实际上在很大程度上也解决了异读字的读音问题。
从1957年到1962年,审音委员会分三次公布《普通话异读词审音表初稿》(简称《初稿》),共审定异读词1800多条。
例如,“暂时”审定为znshí,“菜肴、酒肴”的“肴”审定为yo。
《初稿》自公布以来,受到文教、
出版、广播等部门广泛重视,对规范异读词的读音起到了积极作用。
但是,随着语言的发展,《初稿》中原审的一些读音有了变化;同时,作为语音规范的标准,《初稿》也需定稿。
因此,在1982年6月中国文字改革委员会重建普通话审音委员会,对《初稿》进行修订。
1985
年12月27日由国家语言文字工作委员会等部委发表修订后的《普通话异读词审音表》正式
推行。
修订后的《审音表》共审定读音839条,以字为单位按汉语拼音顺序排列。
“自公布之日起,文教、出版、广播等部门及全国其他部门、行业所涉及的普通话异读词的读音、标音,均以本表为准。
”异读字的读音也应当以审音表的规定为标准。
普通话异读词审
这次修订以符合普通话语音发展规律为原则,以便利广大群众学习普通话为着眼点,采取约定俗成、承认现实的态度。
对《初稿》原订读音的改动,力求慎重。
音表》里凡是注明“统读”的字,表示这个字不论用在什么词语中都读成这一个音。
例如(
代表字头):
阿㈠ā
~訇
~罗汉
~木林~姨
㈡ē
~谀
~附
~胶~弥陀佛
挨
㈠āi
~个
~近
㈡
i~打~说
癌
i
(统读)
蔼ǎi(统读)
隘i(统读)
拗㈠o~口
㈡niù执~脾气很~
(二)多音字的读音。
多音字也叫多音多义字,指的是字具有两个或两个以上的读音而不同的读音又和不同的意义相联系的字。
例如“中”读zhōnɡ,表示中间、中心、跟四周距
离相等;读zhònɡ,表示正对上、遭受、受到。
“脏”读zānɡ,指不干净;读zànɡ,指体内的器官、脏器。
现代汉字中的多音字大约占10%左右。
文章里的多音字要根据它的意义来决定读音。
如果不了解意义,也就难以确定读音。
例如:
离间意思是使发生隔阂。
“间”读jin,不读jiān。
冠心病指的是冠状动脉性心脏病。
“冠”读ɡuān,不读ɡun。
好逸恶劳意思是喜欢安逸、厌恶劳动。
“好”是动词,读ho,不读hǎo。
“恶”是动词,读wù,不读è。
有些字作姓氏时,有特殊的读音。
例如:
单读dān,作姓氏要读shn。
仇读chóu,作姓氏要读qiú。
有些字作地名时,有特殊的读音。
例如:
洞读dònɡ,洪洞县的洞要读tónɡ。
番读fān,番禺的番要读pān。
多音字有两种发展趋势,就是增加和减少。
多音字的增加主要是由于引申和假借。
引申属于词义的发展,假借属于文字的借用。
现代汉语里词义的引申很少引起读音的改变,发生读音改变的多数是古代词义引申在现代的投影。
例如:
瓦⑴wǎ砖瓦。
⑵w
盖瓦。
饮⑴yǐn喝。
⑵yìn使喝:
饮牲口。
背⑵bèi脊背。
⑵bēi用脊背驮。
由文字借用而造成的多音字,例如:
打⑴dǎ打击的打。
⑵ddozen的音译,铅笔、毛巾等十二个为一打;
sodɑ里-dɑ的音译,苏打的打。
茄⑴qié茄子的茄。
⑵jiā雪茄的茄的音译。
发⑴fā出发的发。
發的简化字。
⑵f头发、理发的发。
髪的简化字。
多音字又有减少的趋势。
因为多音字容易读错,不便使用。
人们希望减少读音,就把使用较少的读音归并到经常使用的读音里去。
古代的例子(反切根据《广韵》):
下⑴底下。
胡雅切。
⑵下降。
胡驾切。
⑴⑵古代不同音,现代都读xi。
错⑴错误。
仓故切。
⑵错杂,错综。
仓各切。
⑴⑵古代不同音,现代都读cuò。
别⑴分辨。
方别切。
⑵离别。
皮列切。
⑴⑵古代不同音,现代都读bié。
现代的例子:
胜《国音常用字汇》:
⑴shènɡ,胜利。
⑵shēnɡ,胜任。
⑴⑵本来不同音。
《现代汉语词典》合并为shènɡ。
劳《国音常用字汇》:
⑴láo,劳动。
⑵lào犒劳。
⑴⑵本来不同音。
《现代汉语词典》合并为láo。
养《国音常用字汇》:
⑴yǎnɡ,生养。
⑵yànɡ,供养。
⑴⑵本来不同音。
《现代汉语词典》合并为yǎnɡ。
文《国音常用字汇》:
⑴wén,文采。
⑵wèn,文饰,文过。
⑴⑵本来不同音。
《现代汉语词典》合并为wén。
适当减少多音字的读音对于汉字的使用是有好处的。
四、定序
定序就是确定现代汉字的排列顺序,实现汉字字有定序。
现代生活里,字序的应用极为广泛,工具书的检索、图书档案的排列、各种目录的编制都需要字序。
字母文字通过字母表确定字母的顺序,简单明确,使用方便。
汉字字数繁多,又缺少完备的表音符号,建立字序十分困难。
目前,最常用的字序有两种,就是部首法和音序法。
(一)部首法。
这是传统的字序法,从汉字的字形着手,把具有相同偏旁的字归并为一
部,那个相同的偏旁叫做部首。
部首法要包括立部和归部两部分。
建立多少部、都是哪些部,
属于立部。
某一个字归入哪一部,就是归部。
不同的工具书立部多少常有不同,归部的原则
也有不同。
东汉许慎的《说文解字》首创部首法,立540部。
《康熙字典》、《中华大字典》立214部。
《新华字典》《现代汉语词典》的“部首检字表”立189部,修订本《辞海》立
250部,《汉语大字典》《汉语大词典》立200部。
归部的原则有两大类,一类是据义归部,一类是据位归部。
据义归部是把表义的偏旁作为部首。
以《说文解字》为例,“甥”属男性,归男部;“江”指长江,是水名,归水部;“颖”指禾苗的末梢,归禾部;“素”指白色的细密的丝织物,归糸部。
《康熙字典》《汉语大字典》《汉语大词典》等主要采用据义归部的方法。
据义归部在使用中遇到的主要困难,是部首在字里的位置不固定。
如“江”的部首“氵”在字的左边,“甥”的部首“男”就在字的右边。
使用者不容易确定哪个偏旁是部首,因而也就查不到要查的字。
据位归部是针对据义归部的困难提出的改进方法,它根据偏旁所在的位置确定部首,部首的一般位置在字的上、下、左、右、外。
一般位置没有部首的查中坐,中坐没有部首的查左上角。
修订本《辞海》采用了据位定部的归部法。
一个字具有几个部首的,按照下列次序确定部首:
⑴上、下都有部首的,取上,不取下。
例如:
含(查人部,不查口部),思(查田部,不查心部)
⑵左、右都有部首的,取左,不取右。
例如:
相(查木部,不查目部),划(查戈
部,不查刂部)
⑶内、外都有部首的,取外,不取内。
例如:
闷(查门部,不查心部),医(查匚
部,不查矢部)
⑷中坐、左上角都有部首的,取中坐,不取左上角。
例如:
坐(查土部,不查人部),半(查|部,不查丶部)
⑸下、左上角或右、左上角都有部首的,取下、取右,不取左上角。
例如:
渠(查木部,不查氵部),肄(查聿部,不查匕部)
⑹在同一部位有多笔和少笔几种部首互相叠合的,取多笔部首,不取少笔部首。
例如:
章竟意(部首有丶亠立音,查音部),磨糜靡(部首有丶亠广麻,查麻部)这两种归部的方法各有短长,如果单从查字来说,据位定部使用比较方便。
(二)音序法。
根据字的读音来排定字序。
我国古代的韵书根据四声和韵部编排字序,就属于音序法。
当前使用最广的音序法是汉语拼音音序法,按照汉语拼音字母表里字母的顺序排列字母的先后。
同音字再按照笔画数的多少,由少到多排列。
笔画数相同的,按起笔的笔形横竖撇点折顺序排列。
起笔笔形相同的,按照第二笔笔形,依次类推。
例如读chù的字,
要按下列顺序排列:
亍处怵细畜搐触烘黜矗。
《新华字典》《现代汉语词典》《中国大百科全
书》等的条目排列都采用汉语拼音音序法。
音序法简明严谨,不会出现模棱两可的情况,使用起来比较方便。
不过也有局限性,使
用这种查字法一定要能读准字音,读不准字音就无法查到。
在收字多的大型字典里有很多生
僻字,使用音序法会遇到困难。
附录:
《新旧字形对照表》
新旧字形对照表
(字形后圆圈内的数字表示字形笔画数)
旧字形
新学举例
旧字形
新字形
新字举例
“③
直⑧
肓⑧
值植
L④
L®
龟⑧
41®
幵⑥
开④
咼⑨
咼⑧
丰④
E④
垂⑨
睡郵
巨⑤
巨④
电④
也④
纯慣
耶⑨
郎⑥
瓦⑤
瓦④
录®
反④
丑④
丑④
纽柄
骨⑩
骨®)
滑骼
啊⑩
鬼⑨
印⑥
印⑥
ft®
俞⑨
束⑥
崭耘
旣⑪
愿⑨
呂⑦
吕⑥
祖营
蜀⑩
搔骚
沪⑦
r®
赧⑩
傲遨
爭⑧
净祁
莽⑩
产⑥
产⑥
真⑩
慎填
并⑦
基养
蕃⑩’
念⑩
摇遥
井⑧
井⑥
屏拼|
毅⑪
殺⑩
•坦⑦
吴⑦
蝶虞
黄⑫
険横
角⑦
角⑦
解确
虚⑫
虐⑪
墟顒
奂⑦
换痪
異<8
甫⑧
幽⑦
象⑫
象⑪
像橡
専⑦
奥⑬
奥⑫
总⑨
酋⑧
II
S®
普⑫
(引自《现代汉语词典》)