语言理论摘抄 2.docx
《语言理论摘抄 2.docx》由会员分享,可在线阅读,更多相关《语言理论摘抄 2.docx(19页珍藏版)》请在冰豆网上搜索。
![语言理论摘抄 2.docx](https://file1.bdocx.com/fileroot1/2023-2/25/ace918e7-e793-4321-9edd-0f5b0f0ec913/ace918e7-e793-4321-9edd-0f5b0f0ec9131.gif)
语言理论摘抄2
《语言理论》摘抄
高等学校语言学概论教材《语言理论》彭泽润李葆嘉主编长沙中南大学出版社2002年出版
P3:
中国通过吸收进步国家语言计划的经验,废除文言文,简化汉字。
确定和普及普通话,制定和普及汉语拼音,进行语言规范化包括治理规范文字和词语在社会应用中的混乱现象,逐步普及英语这种国际上最通行的语言。
这些都离不开语言学。
P10:
中国著名语言学家王力非常重视这门课程的知识。
他说:
“可以这样说,最近50年来,中国语言学各部门如果有了一点一滴的成就,那都是普通语言学的恩赐。
”“中国语言学的落后,主要是由于我们的普通语言学落后。
”“我们需要语言学概论来指导我们的工作。
”
由于语言学概论要引用大量的外语例子,给这门课程的教材编写和教学增加了很多困难。
对于教师,懂得的外语越来越好,但是事实上不可能熟练地学会很多外语,对于学生太多的外语资料学起来很困难。
因为有困难,所以在中国的传统中,中文系专课概论,但是不教语言学概论。
这就导致很多人缺乏语言学常识,对语言政策、语言生活和语言研究造成不利影响。
另外,一些教材为了减轻教学负担,基本上用汉语的例子,而且介绍的内容也局限在语言的结构,结果使人产生误解,以为语言学概论不过是在现代汉语课程中加进去一点外语的例子。
中国著名的语言学家吕叔湘说:
“打开任何一本讲语言的书来看,都只看见‘工具’,‘人们’没有了……讲的是这种工具的部件和结构,没有讲人们怎样使唤这种工具。
”因此《语言理论》这本教材重视语用,就是语言应用中的理论。
P50:
我们经常可以在一些语言刊物上看到评论错误使用语言的文章,包括评论《语文》教材上著名作家的文章中有毛病的句子、词语。
在评论它们的时候,从宏观角度来看,一方面我们充分肯定著名语言学家王力、吕叔湘等倡导和实践跟普通话口语一致的现代汉语书面语,另一方面,我们反对不尊重语言发展规律的观点行为。
例如,新闻作品中不用现代汉语的“这”、“把”、“所以”,偏偏要用古代汉语的“此”、“将”、“故”。
在英语翻译成汉语的过程中,通俗的英语往往被翻译成难懂的汉语。
例如,“Mangkindsofrarebirdsandanimalshavevanishedformtheearth.”被翻译成“许多珍禽稀兽已经从地球上灭绝了。
”“珍禽稀兽”不是成语,是生造的文言仿制品,比原文难懂。
如果在语言教育中把它当做“简练”的语言技巧进行提倡就更加不应该。
“珍禽稀兽”如果翻译成“珍贵的鸟类和野兽”或者“珍稀禽兽”就非常明白。
现代英语不能用古代汉语翻译。
否则,简单追求节省文字,就会浪费信息接收和理解的时间。
又例如,“Thenoblestheyarefled,thecommonstheyarecold…”被翻译成“王公贵族,纷纷作鸟兽散。
贫民百姓,则冷冷冰冰。
”这根本不是现代语。
可以翻译成“贵族们个个逃散,百姓们个个冷淡。
”这样不仅简短又符合现代汉语的特点,还在保持原文意思的同时保持了原文对偶,押韵的修辞特点。
从中国语言教育现状中的主要问题来看,一方面我们要肯定对外汉语教材强烈的词意识,另一方面我们否定在对内汉语教学存在的不少问题。
例如,小学语文教育没有词意识,以有通过“生词”带动“生字”教学,拼音没有采用国家标准《汉语拼音正词法基本规则》。
中学语文教学过多强调文言课文的教学,没有明确文言的阅读而不是写作功能,没有突出实用的现代汉语教学的地位。
甚至出现在高考作文评阅过程中错误鼓励用文言写作的思想,违背国家语言法律关于“普通话”是国家通用语言的规定。
还有人在21世纪倒退地主张儿童读古代的经书。
P64:
由于人类的思维和语言都有共性,所以无论语言区别多么大,都可以通过翻译实现思想的沟通。
但是,由于它们也同时具有差异,所以无论什么翻译都无法完整地实现思想的沟通。
有人对那种无法对等翻译的现象,单纯从语言差异找原因,其实也应该同时从思想差异中找原因。
P69:
例如,英语从日尔曼语演变出来,正如法语从拉丁语演变出来。
但是由于古代日尔曼语没有文字记录的文献流传,加上英国被外国长期占领,一直得到很好的应用。
从1150年到1450年英国被法国西部的人诺曼(Normamdie)地区的人占领了300年,英国使用3种语言。
法国是英国宫廷和政府工作语言。
拉丁语是教会和学术语言。
英国是老百姓用的语言,最不受到重视。
英语从1362年才开始逐渐成为国家会议和法庭辩护语言。
又由于文艺复兴运动的复古思潮,使英国文学作品出现大量外来词,包括外来的古代词语,分别来自古代希腊语、拉丁语、法语的词语。
这种混杂局面,导致有些英国作家的作品,如同20世纪初期,中国的文言文、白话文和方言的夹杂的文章。
在用英语翻译传播《圣经》的过程中,也导致英语中产生许多来自《圣经》的熟语。
P70:
不同民族文化造成不同的语言和方言,同时也形成了不同的思维差别。
例如,汉语不重视词在语言结构中形态变化,英语则相反。
这是汉语的灵活性,也可以说反映了汉族人思维中纯在一定的散漫性。
一般来说,西方传统思维模式把逻辑分析和推理作为基础,注重认识活动的细节。
把中国作为代表的东方民族思维方式则把直观综合作为思维基础,比较注重从整体方面来把握对象。
P75:
恩格斯曾经对英国的许多城名称进行考证,认为这些地名是大约1000多年以前的罗马人征服不列颠留下的痕迹。
他说:
“罗马人征服不列颠最永久的纪念碑是把拉丁语言总的词castra(野营)保留成最初曾经是罗马军队驻地的许多城市的名称或者名称的一部分,例如卡斯特、伍斯特、切斯特、温切斯特等”。
P76:
汉族在历史上不断借用外来词。
有些词一直流传下来,由于时间太长,人们已经察觉不到它们是外来词了。
例如“葡萄”、“石榴”、“苜蓿”、“菠萝”、“狮子”、“玻璃”是汉代从西域借来的词,“佛”、“菩萨”、“罗汉”、“阎罗”、“魔”、“僧”、“尼”、“和尚”、“塔”是汉代以后从印度借来的佛教词,“胡同”、“站”、“蘑菇”、是元代从蒙古语中借来的词。
鸦片战争以后,特别是到了现代,像“桑巴”、“探戈”、“扑克”、“卡拉OK”、“巧克力”、“可可”、“的士”、“MTV(musictelevision,音乐电视)”等大量词语从英语中被借用进来。
p81:
不同的语言中声音相同的词有不同意义,意义相同的词有不同声音。
这说明声音和意义之间是任意的。
同样所有语言中的声音和意义也不是绝对不能改变的。
例如英语[rait]可以表示“写(write)”、“正确(right)”、右派“(Right)”、写作“(write)”等多种意义。
[mei]在现代汉语中可以表示“美、没、每”等意思,同时在英语中又可以表示“可以(may)、“五月(May)”等意思。
同时的意义,也可以约定用不同声音表示。
文字和口语的结合同样具有任意性。
例如汉字“新闻”、“手纸”在日语中记录“报纸”、“信”意思的词。
字组“name”在汉语拼音中记录词“那么”,在英语中记录“名字,命名”意思的词。
同样的词语,可以用不同的字记录,这是被文字改革的事实证明了的。
任意性特点告诉我们,语言不是神秘的上帝创造的,不是完全无法改变的。
例如,现代汉语不必坚持使用“故”、“目”、,而是说容易听懂的“所以”、“眼睛”、;不必坚持使用甲骨文那样麻烦的文字,而是使用经过简化的楷书文字。
“从容”可以从读“匆容”改变成读“丛容”,“步”字下面的特殊部件在日语借用的汉字中就可以改变写成方便类推的部件“少”。
p97:
口语是书面语的基础语言是人类特有的标志。
大约在此300万年以前地球上出现了人类。
有了人类就有了口语。
可是,文字是在5万年以前的地中海周围才出现。
有了文字,才有书面语。
口语和书面言语的两种不同的存在方式。
口语是口头语表达信息的听觉符号系统,书面语是书面表达信息的视觉符号系统。
语音系统和语义系统分别构成口语语言的形式系统和内容系统。
文字系统和口语系统分别构成书面语言的形式系统和内容系统。
它们的结构关系可以概括成这样的公式:
书面语言=文字+口语(=语音+语义)
因此,口语和书面语不是平行的两个系统。
口语第一,书面语第二。
口语是书面语的基础和源泉,书面语是口语的转换。
可以说,书面语是用文字包装口语的结果,如果把口语比喻成人,那么书面语是给人做成的雕像或者拍摄成的照片。
看到书面语就想起它代表的你掌握了的口语,如同看到照片就想起照片代表的你见到过的人。
如果你没有学习过那种口语,即使你看到象形文字也无法获得什么语言信息,最多只能获得一些图画信息。
社会的存在虽然不决定于是否有脑子记录的书面语,但是文明发达的社会不能没有文字记录的书面语。
没有书面语就不可能有发达的科学文化。
人类的进步就只能是极端缓慢的。
所以,虽然口语第一,但是文字出现以后,书面语在一定意义上比口语占有更加重要的地位。
书面语会反过来对口语产生一定的反作用。
有些词语和规则是从书面语中产生,再扩展到口语中的。
例如简称一般是这样出现的。
由于受到汉字的制约,汉语的轻声、儿化、语音脱落等现象无法用文字明确的表现出来,从而制约了口语的这些现象的使用和发展。
书面语具有保守性,很容易跟上口语的发展。
当书面语与口语的距离越拉越远,到了一定程度以后,人们会用接近口语的新书面语去替换它。
汉语历史上白花取代文言就是一个典型的例子。
古代拉丁文成为一种死的书面语也是这样。
P145:
注音字母没有把韵尾和韵腹分开标记,所以没有彻底因素化。
现在的《汉语拼音方案》中的字母是彻底因素化的音标,也具有一定的表音文字性质,例如,为零声母设计专用字母和音节隔离符号。
汉语拼音是专门为北京话或者现代汉语的共同语设计的。
如果要准确记录古代汉语、汉语方言的语音,必须采用国际音标。
我们可以通过“汉语普通话声母和韵母配合表格”了解汉语拼音和国际音标记录普通话的对应关系
用汉语拼音给文言文注释声音,严格来说,不科学。
但是,古代汉语的语音系统无法恢复,也没有必要付出巨大的代价在语音现实生活中恢复。
所以只好将就着用现代语音系统标记和说出古代语言
p:
166音位与作为音位变体的音素是什么关系?
是社会单位和自然单位的关系,是概括与具体的关系,是集体和个体的关系,使从属特定语言和不从属特定语言的关系。
从理论上来说,音素和音位一样也有概括性。
因为从音位里分化出来的具体的音素也仍然是存在细微裱画的一些音素的概括,但是这种概括不考虑语言的社会作用,是各种语言共有的。
在特定语言中的一个音位里,相近音素区别往往被使用这种语言的人忽略掉了,这些不同音素给他们的感觉如同一个音素。
这样在不区分的时候,一个音素一般就是指一个音位。
p:
174汉语普通话有以“轻声”为特点的区别意义的重位,但是由于汉字不便于记录,得不到很好的书面反映,从而影响它的使用和发展。
轻声音位用在汉语中一般采用声调的零形式表示。
p:
177相似原则是指凡是既互补分布,又发音特点相似的音素肯定可以合并成一个音位。
例如,英语不送气清塞音[p]、[t]、[k]出现在/s/和元音之间,送气清塞音[p‘]、[t‘]、[k‘]出现在其他情况下。
可见有互补关系。
同时,两组中对应的音素发音特点相似,只有不送气和送气的不同。
所以肯定可以把[p]和[p‘]、[t]和[t‘]、[k]和[k‘]分别合并成/p/、/t/、/k/3个音位。
p:
200汉语是有声调的语言。
当一句话的句调与各个音节的声调结合在一起的时候,音高、音调、音长的变化错综复杂。
从具体的音节来看,音节的调值会因为前后音节的音调和句调的影响而发生一定变化。
一般情况是把双音节音组(词)作为语调的基础而发生一定变化,顺势简化,前后音节调值得过渡尽可能平滑,并且有偏低的趋势。
各个音节的调值变化仍然能够区别意义。
从整个句子来看,音高变化的总体趋势仍然很明显,句子末尾升降的音阶幅度会大一些。
p:
202在动态的语流中,音素等语音单位受到语音环境的影响而发生的临时性变化,叫做语流音变。
引起语流音变的语音环境有两种:
第一,邻近的语音。
第二,语音以外的条件。
p:
203常见的语流音变有6种:
同化、异化、软化、脱落、增加、调换。
其中同化最常见。
不相同或者不相近的声音在语流中连续发出,其中一个音位受到另一个的影响而变得与那个相同或者相近,这种现象叫做同化。
同化是最常见的语流音变。
p:
204相同或者相近的声音在语流中连续发出,其中一个音位受到另一个的影响而变得与那个不相同或者不相近了,这种现象叫做异化。
汉语普通话的上升相连成生的变调也是一种异化。
列入,“理想、美好”,前一个上升从[214]异化成[35]。
本来不比他声音弱的声音在语流中连续发出,由于受到邻近语音的强势地位的影响变得比较弱,这种现象叫做软化。
同化、异化是为了发音方便,软化是为了发音省力。
这样省力有条件。
有的是对前面的语素进行重复的结果,例如“爸爸”;又得是在表达意义方面不是主要语素,例如“鞋子”。
软化经常表现成音长变短、音高变低、音强变弱,也表现在音质上的辅音和元音的变化。
辅音的弱化表现成受到阻碍的程度减弱,具体表现成清音变浊音,塞音变成擦音等。
p:
205一组声音在语流中连续发出,其中一个或者几个被丢失或者删除了,这种现象叫做脱落,又叫做减音。
脱落常常发生在说话比较快或者随意的时候,是语音进一步弱化的结果。
英语中脱落现象比较多,而且在文字上可以体现出来。
英语中的“失去爆破”就是一种常见的脱落现象。
汉语也有,但是汉字无法体现,把它掩盖起来了,要留心语音实际才能发现。
一组声音在语流中连续发出,为了发音自然流畅而增加了原来没有的音,这种现象叫做增加。
汉语普通话语气词“啊a”受到前面音素的同化等作用而发生增加语音现象,变成“呀ia”、“哇ua”、“哪na”等。
英语的不定冠词a后面接一个以元音开头的词语的时候,要增加一个[n],写成an。
p:
209文字必须记录口语。
我们不能把文字当作图画。
即使汉字的形体在现代文字中相对接近图画,我们也不能认为汉字可以跳过口语的语音直接表示意义。
如果一种视觉符号系统,没有与口语形成比较一致的稳定联系;那么,这种视觉符号系统的形式,即使它的形态看上去像文字,也只能叫做图画那样的东西。
p:
210有人看到汉字是语素文字,每个字一般记录一个语素,语素有意义,而英语用音素文字,每个字记录的一般是没有意义的音素,就以为只有记录有意义的语素或者词的视觉单位才是字;所以把汉字的“字”和英语的“词”等同起来,说学习汉语只需要掌握几千个常用字,学习汉语只需要掌握几千个常用字,学习英语需要掌握几万个“词”。
有人直接把英语的“词”叫做“字”。
“有人说,一个‘英文字’平均用5个字母……这是误解。
所谓‘英文字’实际上是词儿。
”有人甚至把英语词中的语素(包括词根,词缀,词尾)当作汉字的部件(包括部首),把词的结构和字的结构混淆起来,例如有《英文部首字典》这样不恰当比喻的书名。
这本书的作业在“前言”中说“英文字母和单词之间有没有类似汉字的偏旁部首的桥呢?
有,这就是英文部首。
”这违背了语言学的基本常识。
这较好像错误地把词根加词缀与声母加韵母去类比。
p:
211用文字表现的书面语,与用语音表现的口语不是平行的两个系统。
这是因为口语是书面语的基础,书面语中体现着口语。
没有口语就没有书面语,但是,没有书面语可以有口语。
p:
213从文字中占主体地位的字直接记录的口语单位的性质来看,我们可以把文字分为词文字、文字、音节文字、音素文字。
这是文字的本质类型,因为文字的本质是记录口语,文字的基本单位是字。
词和语素是容易感觉的数量比较少的直观语言单位,所以古老的文字都是这种类型。
但是语素在一种语言中数量比音素多得多。
相反,音素难以分析出来,但是音素在一种语言中数量比语素少得多。
音节的数量位置在中间。
从方便的角度来看,人们当然喜欢字的总数少的文字。
这就是为什么今天绝大多数文字都是音素文字的原因。
p:
216我们从封建社会中醒悟以后,发现了汉字在现代化面前的不方便,但是汉字在观念上已经难以从汉语解脱。
正如封建思想难以在短时期从中国人的脑袋中彻底消失。
即使汉字在麻烦的编码的搀扶下能够勉强进入电脑我们仍然不得不承认它在现代化面前的不方便。
当然,我们已经给汉字配备一个助手来弥补汉字的不足。
这个助手就是威力越来越大的汉语拼音,它目前虽然不是法定的主要汉字,但是它在传统汉字不方便的许多领域发挥自己的作用,成为拼音汉语的法定工具。
在将来的很长一段时间,我们已方面应该优化并且正确使用现行汉字,同时应该执行国家的法律,按照《汉语拼音正词法基本规则》等国家标准正确使用汉语拼音,使汉语通过两种书面方式充分发挥自己的作用。
p:
221朝鲜从公园300年开始,一方面在书面语中使用用汉字表示的汉语文言文作为他们的书面语;另一方面借用汉字将就着记录朝鲜语言。
这样持续了大约500年。
后来创造和实验音节文字,又经历了大约500年。
终于在公园1446年公布了朝鲜语用的全音素化音节文字,叫做“谚文”。
朝鲜北方在1948年废除了汉字,全部使用这种音节文字。
南方(韩国)有的报纸也全部采用音节文字,有的混合音节和语素文字,就是谚文和汉字。
不过像日本一样,汉字的使用数量受到限制,大约100个。
p:
223音素文字是能够基本上把语言中不同的音素用不同的单字表示出来的文字。
例如英语的“study(学习)”这个词的形式有5个音素,是用5个音素字记录的。
当字不够用或者为了节省字的情况下,也可以用字组或者字兼职的方式补充。
例如英语的“thing(东西)”这个词只有3个音素,但是用了5个字,“th”和“ng”都是字组记录的音素。
汉语普通话用的拼音富豪中“zh、ch、sh、ng、er”等也是用字组表示音素。
由于历史发展等原因,也会出现一个字表示几个音素的情况,例如英语“box(盒子)”中的“x”。
拉丁文字,又叫做“罗马文字”,是现代世界上记录语言最多、使用范围最广泛的通行文字。
它分布在美洲、澳洲的几乎全部、非洲、欧洲的大部分,亚洲的土耳其、越南、印度尼西亚、马来西亚、菲律宾等将近100个国家和地区。
用它记录的英语也是最通行的语言,所以,有人干脆把它叫做“英语文字”。
p:
232字是最小又自由的文字单位,它是文字体系中的基本单位。
在排版中能够自由地被调动位置的最小单位就是字。
从缩写中也可以看到字作为最小单位的自由性质。
例如,英语可以写“Jack(Jforshort):
‘don’tdoit!
’”从这里可以知道“J”是一个自由的最小的“字”。
对应的汉语翻译是“杰克(简称‘杰’):
‘别这样!
’”从这里可以知道“杰”和“J”是同样地位的“字”,虽然它们分别记录的是“音素”和“多音节语速中的一个音节”。
p:
233“字母(letterofanalphabet)”习惯上用来指表音文字中的字,包括英文中那样的音素字,包括英文中那样的音素字,日文中那样的音节字,朝鲜文字中那样的音素化音节字。
“字母”是在一种误解中为了表达这种外来概念创造的名称。
英语“alphabet(字表)”在古代拉丁语中写成“alphabetum”,是通过希腊文字表格前面两个字的个体名称“alpha”和“beta”组合创造的表示集体概念的词。
过去使用汉语的人经常把“词”叫做“字”。
这样“字”有时用来表示与“字”有关的其他感念。
例如用“字义”来表示“语素意义”或者“词义”,在“字正腔圆”中用“字”表示“音节”。
因此,人们很容易从这种错误基础出发,把音素文字中记录一个词的字组当作一个字,真正的字就降低级别,当作字内部的下层单位,也就是部件,叫做“字母”。
音素文字中的字即使不表示声音,例如“Who”中的“W”,也是字;语素文字的字即使没有单独表示意义,例如“巧克力”中的“巧”等,也是字。
p:
234字跟音节、词、语素有联系,但是我们不能混淆它们,必须明确区分它们。
词和语素是形式和内容结合的语言单位,字只是语言的书面形式单位。
明白了字和词的不同,就不会产生这样的误解:
认为掌握了几千个汉字就掌握了汉语的所有词,认为英语等因素文字中的字就是词,英语的字数以万计,难以掌握。
p:
241一种语言的音素(音位)往往是几十个,然而一种语言的常用的语素总是多到几千个,一种语言的常用的词总是多到几万个。
相反,一个词里面包含的音素比包含的语素要多几倍。
例如,英语采用音素文字,字的总数只有26个;汉语采用语素文字,一般要7000个。
p:
244词式书写可以强化汉语使用中的词意识。
例如英语的词history和law分别对应汉语的词“历史”和“法律”。
可是人们在写作或者翻译中经常用不能做词用的语素“史”、“法”代替,出现“世界当代科技史”、“国家通用语言文字法”等现象。
在词式书写中,很容易发现“史”和“法”在不自由局面,从而重新调用真正的现代汉语的词“历史”和“法律”。
p:
256可以想象要是让手指语和盲文来直接区分几千个汉字非常难。
所以,在汉语这样没有表音文字的语言中,汉语拼音由于它只有25个字就能够写出汉语的声音,所以它在这些领域发挥着文字使者的特殊作用。
p:
264但是,一般的共时词典收集的都是一种语言在特定时期通用的词语,数量相对少,不到10万。
例如《现代汉语词典》有5万多个词语。
然后一般由文化的人真正掌握了2万个常用词就基本满足需要了。
p:
265在整个词汇体系中,有些词表示的事物或者行为与人们世世代代的日常生活有着密切的关系,这些词连同表示它们的结构关系的常用虚词,都是基本词。
基本词是词汇的核心部分,被不同时代不同地域使用同一语言的人普遍使用。
基本词往往是一个语素形成的词,而且往往是一个音节表现的词,但是不排除具备条件的多语素多音节的词。
基本词中的单语素词是基本词汇也是整个词汇的核心,这就是根词。
根词和词根不同,词根是作为词的主体部分的语素。
基本词具备以下三个主要特点:
第一,永久使用。
这些词能够经受时间的考验,生命长久。
例如“人”、“手”、“山”、“打”、“十”、“百”等词语,在甲骨文中就已经存在。
p:
266至今仍然是汉语中主要的和常用的词语;英语中的“father”、“man”、“and”、“way”、“to”从中古到现代一直使用。
这些词表示的事物和概念都非常稳定,这种稳定性决定词语有顽强的生命力。
第二,普遍使用。
这些词能够经受空间的考验,在一定的时代被整个民族共同使用,流行地域广泛。
人们可能因为受到各种因素的限制而不知道方言词、行业语。
却不能不使用基本词,否则就没有办法交际。
例如“我”、“你”、“好”、“坏”;英语的“we”、“they”、“good”、“bad”、“eye”等词语,都是基本词,任何阶层、任何职业的人都必须使用。
第三,构成词的能力强。
这些词能够经受能力的考验,可以通过组合生成大量的新词。
随着社会的发展,新事物不断出现,新概念层出不穷,新的词语也随着大量产生。
基本词由于是历史流传的词语,便于人们理解和接受,所以自然成了构成新词的基础和材料。
大多数基本词都有构成词的能力,其中有的构成词能力还相当强,例如“学”,是一个基本词,它还可以用语素的身份和别的语素一起构成新词,例如“学费”、“学历”、“学派”、“学识”、“文学”、“学说”等。
事实上,由于语言在不断变化,不可能出现绝对意义上的时代使用的词。
有的基本词到了后来可能变成构成词的基本语素。
p:
267词汇体系中的基本词以外的词统称非基本词。
主要包括新造词、方言词、古语词、行业词、外来词等。
词在不同时间和空间的交际中出现的频率不同,出现次数多的事高频词,出现次数少的事低频词。
一般来说基本词是高频词,非基本词是低频词。
但是也有相反的情况。
一个非基本词经常可以成为高频词。
例如“作业”、“考试”对于学校是高频词,“改革”在20世纪和21世纪交界时期的中国是高频词。
p:
268随着科学技术的发展,语言学家利用计算机对词语进行统计使得高频词语低频词的统计更加客观。
现代汉语统计的结果表明,虽然《现代汉语词典》收集了5万多个词语,但是最常用的2千个词和4千个词在话语中的覆盖率分别可达到80%和90%,其中位置在前面的190个词就覆盖了50%。
2千个高频词在各种语言中占的覆盖程度出入不大,英