基于语料库的对外汉语词汇例句收集研究.docx
《基于语料库的对外汉语词汇例句收集研究.docx》由会员分享,可在线阅读,更多相关《基于语料库的对外汉语词汇例句收集研究.docx(10页珍藏版)》请在冰豆网上搜索。
基于语料库的对外汉语词汇例句收集研究
基于语料库的对外汉语词汇例句收集研究
基于语料库的对外汉语词汇例句收集研究基于语料库的对外汉语词汇例句收集研究-汉语言文学基于语料库的对外汉语词汇例句收集研究单天罡摘要:
本文首先明确了例句在词汇教学中的重要价值,剖析了传统收集词汇例句的两种途径所出现的问题。
鉴于利用各类语料库收集例句成为一种新趋势,我们又通过例证提出:
利用专门语料库或是开放的网络新闻搜索寻找到的例句仍然存在词汇超纲、句式复杂、句群数量巨大等诸多问题,缺乏可操作性和便利性。
基于以上分析,本文提出了建立国际汉语教学词汇例句语料库的设想,并阐述了收集例句语料的原则和方法。
关键词:
对外汉语词汇教学例句语料库词汇教学在对外汉语教学中占有相当重要的地位,很多学者认为词汇学习是语言学习的核心问题,如何帮助非母语学习的学生有效地理解和掌握词汇,成为很多学者研究的课题。
目前对外汉语教学领域倾向于使学生在语境中掌握词汇,词的教学与句子的教学相结合是词汇教学的有效途径之一,因而例句就成为词汇学习过程中重要的组成部分。
例句既能帮助学生体会词汇意义,又能指导学生掌握词汇在语境中的用法,帮助对外汉语教师顺利地进行语言教学。
好的例句能有效地展示所教生词的意义,体现其使用的典型情景,给学生留下深刻的印象,使教学活动事半功倍。
对处于不同阶段、不同环境的汉语学习者,例句都十分重要。
中高级阶段,虚词用法复杂.例句可以更全面地展示语用特征;初级阶段,学习者语言水平低,很难理解词汇的专门解释,具体的例证既能帮助学生体会词汇意义,又能指导学生掌握词汇的用法。
另外,在国外学习汉语的学生,缺乏汉语语言环境,接触到的目的语十分有限,例句便成为重要的语言输入材料。
一、传统例句设计的途径及利弊例句在对外汉语词汇教学中具有如此重要的地位,但教材中为词汇提供的例句却十分有限,教师往往需要补充大量的例句丰富课堂教学。
对外汉语教师设计例句主要有以下两种传统方法:
词典查询与教师在生活中收集或自创。
这些方法虽各有优势,却也存在很多不足。
(一)词典例句词典例句的优势在于方便查询,言简意赅,权威性强,但现在常用的汉语词典都是为母语使用者所设计的。
词典例句存在以下几方面的问题:
1.词典例句数量少且形式单一,每个词条后边一般只跟一至两个例句,有的词条甚至没有例句,不能满足教学例句数量上的需求。
如“冷静”和“冷饮”,“冷静”在《现代汉语词典(第6版)》(以下简称《现汉)中给出的例句:
(1)夜深了,街上显得很冷静。
(2)冷静下来,好好儿想想。
例
(1)所对应的意思为“人少而静;不热闹”,例
(2)对应的为“沉着而不感情用事”,每条注释后只举一个例子,数量太少。
而“冷饮”一词则仅仅标注了词义“餐饮业中指温度低的饮料,大多是甜的,如汽水、酸梅汤等”,并没有给出例句。
2.词典例句包含提示信息少,隐性预设多,语境提示能力差。
大多数义项中的用例甚至只是短语而非句子。
以《新阶梯——中级汉语教程》第十课中出现的动词“动心”为例,在《现汉》中给出的例句:
(3)经人一说,他就动了心了。
对于例(3),中国人一看就明白,因为中国人在理解时可以自动激活大脑中的相关知识补足句子所隐匿或省略的信息,字典例句自然无需赘述。
但对于留学生来说,省略了语境信息,理解上就会出现困难,“什么人?
”“说了什么?
”“为什么别人说就动心?
”“动心想干什么?
”语境信息的缺失使这个例句空有架子,无助于理解。
3.词典例句多以中华文化为背景,对于母语为非汉语的学习者或文化差异较大的学习者来说,例句中的文化元素本身就难以理解,更不用说辅助理解词语了。
比如《新阶梯——中级汉语教程》第十课中另一个词语“执着”,《现汉》给出例句:
(4)执着地献身于祖国的教育事业。
例(4)首先是一个不完整的句子。
其次,“献身祖国的教育事业”在当代中国的现实背景下是一种倡导的理念、既定的说法,而对外国学生来说,则可能带有意识形态色彩,会影响他们理解这句话中“执着”的含义。
4.词典例句中的用词等级往往高于词条本身。
如“HSK词汇等级大纲”中的甲级词汇“代表”:
(5)这三个人物代表了三种不同的性格。
“代表”一词是“HSK词汇等级大纲”中的甲级词汇,而“性格”一词则是乙级词汇。
(二)教师自创的例句在教学过程中,很多时候教师常常采用自己创造例句的方式以适应教学进度和学生水平,但很多教师在创造例句时,受限于自己的固定思路、专业领域、兴趣爱好或生活圈子,创造的例句存在诸多问题:
1.例句题材的选择单一。
比如有的老师要么热衷于以自己熟悉或感兴趣的领域为取材对象,例句中多是购物、孩子教育等话题范围;要么主要以学生的学习为话题,所造例句枯燥乏味。
如:
(6)只要学习努力,就会有进步。
(7)小丽能够熟练地说汉语。
(8)杰克上汉语课很专心。
以上三个例句是有的老师为“进步”“熟练”“专心”创造的例句,例句题材全部同汉语课堂有关,容易使学生产生疲劳感,不利于学生通过发散思维理解例句。
2.例句真实性差,有的教师为了例句而创造例句,脱离具体语境,难免不自然。
二、利用语料库设计词汇例句的尝试与困惑语料库是一个由大量的语言真实使用的信息所组成、专供语言研究、分析和描述的语言资料库。
语料库提供了大量丰富的语言材料,而这些材料都是通过词语切分,属性标注等方式存入语料库的。
研究者利用计算机可以从数百万的语料中调出某个词、短语或者句子的实例。
所以,使用语料库可以快速针对某一个词汇搜索出海量的句子,这些句子涉及面广、内容真实、题材多样、表达自然,如能恰当使用,应该能满足对外汉语词汇教学对于例句的需求。
我们这里尝试收集例句所使用的语料库包括两种:
一种是专门建设的封闭性语料库(如北京大学CCL语料库、国家语委现代汉语通用平衡语料库),一种是开放性的语料库,即时更新的网络新闻资源(如XX新闻搜索栏)。
在利用这两种语料库进行例句检索的过程中,我们同样发现了不少问题。
(一)专门语料库用于检索例句存在的问题我们以《博雅汉语·准中级II》第八课中的词汇“单调”为例,利用“北大语料库”检索语料,寻找合适的例句。
部分句子如下:
(9)课业过分繁重、生活单调、未来就业压力巨大等因素,是造成青少年普遍心理失衡和焦虑的重要社会原因。
(10)旅游产品单调明显成为三亚旅游创汇的一大弱项。
(11)日渐富裕的中国人已不再满足于过去那种单调的家庭生活,开始懂得走出家庭生活,开始懂得走出家庭的小圈子去看看祖国的大好河山。
(12)小饭馆门前大声的叫卖、拉客的吆喝以及招揽顾客的刺耳音乐,高声录音机反复播放的语言单调的广告,如今,这类声音越来越多,不绝于耳。
通过整理例句,我们发现专门语料库用于例句检索存在的问题如下:
1.例句数量繁多,这是利用专门语料库检索语料寻找例句存在的一个不可避免的问题。
用“北大语料库”检索“单调”一词,共得到包含“单调”一词的句子1715条,如此巨大的句量让教师很难有精力穷尽性阅完所有句子。
2.时效性仍有局限。
北大语料库最后更新时间是2009年,如果仅采用其中收集的语料,则有时难以与当今社会环境相结合,影响语料的鲜活度。
3.词汇超纲。
例句(9)、(10)、(11)、(12)中的“繁重”“失衡”“焦虑”“创汇”“吆喝”“招揽”都不是HSK词汇大纲中的词汇,属于超纲词。
4.句子结构复杂。
例句(11)、(12)给出的句子信息太多,语境难以清晰明了地帮助学生理解“单调”的含义。
(二)开放性语料库用于检索例句存在的问题在教学备课过程中,有的教师会通过互联网的新闻专栏检索词语寻找例句。
因为网络新闻时效性强、贴近日常生活,而且网络例句语境真实,网络资源丰富、涉及范围极广。
但是在进行了大量的操作性试验之后,我们发现,网络新闻作为开放语料库的例句来源渠道存在更多棘手的问题。
先看收集到的例句:
(13)在英超教练里曼奇尼绝对可以算得上“文雅”,但今天他憋不住火,阿圭罗第88分钟进球被判越位,已经让他怒上心头,比赛快结束时对方在禁区内的犯规还被裁判视而不见,哨声一响曼奇尼便冲进场地对着裁判发泄怒火。
(14)林书豪被寄望成为火箭的领袖,大合同让他任何出色的发挥都被视为理所应当,他对自己的发挥期许很高,林林总总,让他在球场上变得患得患失,束手束脚。
(15)科比上场比赛虽然个人得分再次超过30分,但如果他继续执迷不悟的沉溺于单打独斗,湖人想要赢球恐怕依然很难。
以上三个例句分别是通过网络新闻为“憋不住”“患得患失”“执迷不悟”寻找的较为合用的例句,从中大致可以发现这样几个与我们预期的效果相悖的问题。
1.涉及面受限。
网络新闻为了吸引更多的点击量,内容题材上多是体育新闻或娱乐新闻,在检索结果列表的前10页中,涉及面很有限。
2.篇幅过长。
检索出的例句存在于整篇新闻中,能达到较好的语境提示作用。
但描写事件前因后果的篇幅过长,既不符合例句简洁明了的要求,又有喧宾夺主之嫌,容易把学生的注意力从词汇引向别处。
如果继续删节,则会导致事件因果关系不明确,希望通过语境理解词汇意义的目的便也达不到了。
3.重复语料太多。
网络媒介的特性之一,就是大量转载、转发的存在,而网络新闻的搜索结果为按时间排序,各媒体在同一时间段的新闻关注点较为相似。
这就造成一个困局:
利用搜索引擎会找到大量的重复语料,如2012年搜索“杞人忧天”,搜索结果的前46页全部是“‘2012世界末日’?
专家批杞人忧天”这一条新闻,如果希望找到多样性的例句,则会造成检索时间过长成本过高的状况。
4.词汇意义在使用过程中变异。
网络媒体为了寻找新的视觉冲击来吸引受众,满足人们的求新心理,往往会对原有的语言形式进行各种语义变异,如“节奏”一词:
(16)腾讯文学这是要干掉盛大的节奏啊!
“节奏”一词在《现汉》中有两个义项:
①音乐或诗歌中交替出现的有规律的强弱、长短的现象;②泛指均匀的、有规律的进程。
在例句(16)中,网络媒体故意删除了“节奏”的第二个义项中“均匀的、有规律的”这一修饰成分,把“节奏”等同于“进程”来使用,给人一种新奇的感觉。
对于这种没有规范的语义引申,我认为应该采取保守态度,避免学生在掌握词汇本义时与引申义产生混淆。
所以,不论是利用专门语料库还是开放性的网络新闻搜索例句,在具有信息量大、语料丰富优势的同时,同样存在诸如词汇起纲、语境提示过于庞杂、筛选成本过高等问题,实际使用中难以满足对外汉语教师收集例句的需求。
三、关于构建汉语例句语料库的思考在对外汉语领域,为了满足多种教学活动的需求,不少学者提出了构建口语语料库、中介语语料库、韵文语料库等新型语料库的设想,比如张则顺先生提出构建学习者主动参与的“学习者语料库”,李如龙提出建设“课本配套语料库”等等。
为了满足课堂教学对词汇例句的需求,建立一个方便快捷的词汇例句语料库是十分必要的。
(一)例句语料库构建的原则根据前人对于词汇例句设计的研究,如果要建立一个对外汉语教学词汇例句语料库,我们认为语料的收集应该遵循以下原则:
1.例句设计要有效展示词汇的用法特点例句的设计终究是为学生理解并掌握词汇而服务的,所以例句应该紧紧围绕被解释词语的意义和用法来设计。
同时,为了充分说明词语的意义和用法,应该对应性地设计多个例句形成例句群。
教师在使用例句语料库检索例句,展示词语的语法搭配时,可以结合教学大纲的要求和学生水平,选取适合的例句。
2.例句要提供充足的、形象的语境信息本文一开始就提到”好的例句能有效地展示所教生词的意义,体现其使用的典型情景,给学生留下深刻的印象,使教学活动事半功倍”。
语境能形象地提供词语理解的语义背景,在学习者脑海中产生“画面感”。
充分考虑学习者的认知能力,围绕核心词汇,尽量提供充足的信息,使句子中那些容易被母语使用者为降低冗余程度而省略的隐性预设显性化,让学生了解、掌握所学词汇使用时的语义背景,从而更好地理解并掌握该词语。
3.例句的语义背景要具有普遍性。
认知心理学认为,对概念的熟悉程度影响语言使用者对语言的理解。
留学生来自不同的国家,具有不同的文化背景。
初学汉语的人,由于对中华文化缺乏了解,对同一事物的理解可能和中国人大相径庭。
为语料库设计例句时,要特别注意背景信息的普遍性,尽量提供与学习者认知语境相关联的信息,最大程度地降低他们在理解时的困难。
4.例句应当具有实用价值学生不仅仅要掌握词语的语义和语法,更重要的是学会实际运用。
例句不仅对学生的知识学习有帮助,对他们的交际也应该起到辅助作用。
所以例句语料库收集的例句也应该是学生实际生活中用得上的,即使有些词语尚未学习,也不会影响到他们学习的积极性。
例句还应该体现词语在交际中的语用限制,如词语在交际场合适用的具体语境,帮助学生减少交际失误。
5.例句语料题材要多种多样例句涉及的题材应该能够涵盖日常生活的方方面面,不能仅仅局限于某一领域。
多种题材的例句能够大大活跃课堂气氛,给学生带来新鲜感,激发学生的兴趣,使学生积极地参与到例句的讨论中,取得更好的学习效果。
(二)例句语料库建设的途径与方法例句语料库的建设,总体来说应该是各种传统设计方式与新型收集方式的整合,并发挥各自的优势。
为了更直观地表现例句语料库设计的思路,我们把语料库建设的方法用路径图的形式呈现出来。
我们认为,词汇例句语料库中语料的来源,应该依托专门语料库以及开放性语料库。
对有运用价值的“原料”进行二次加工,或是替换超纲词汇,或是改编前后语境,或是在检索例句的过程中受语料启发创造合用的例句,把不合用的“生语料”加工成适合学生水平的“熟语料”后,再放入词汇例句语料库。
1.内容上,保留专用语料库中语料题材多样、内容真实、实用性强的特点;保留开放性语料库时效性强、语料新鲜的特点。
2.形式上,要将语法和词汇等级匹配起来,替换掉原语料中的超纲词汇,改变语法结构以适应不同水平的学生:
对原语料的语境信息,需要做合理的删补,删除不必要的语境信息以保持句子简洁易懂,补充必要的语境信息,使隐性预设显性化,帮助学生理解句意。
建设一个语料库并非一人一朝一夕所能完成,需要语料库语言学家、第二语言习得专家和对外汉语一线教师相互合作共同完成。
(单天罡山东济南山东大学国际教育学院)