DOC对外汉语计算机辅助教学的理论研究郑艳群主编.docx
《DOC对外汉语计算机辅助教学的理论研究郑艳群主编.docx》由会员分享,可在线阅读,更多相关《DOC对外汉语计算机辅助教学的理论研究郑艳群主编.docx(5页珍藏版)》请在冰豆网上搜索。
DOC对外汉语计算机辅助教学的理论研究郑艳群主编
《对外汉语计算机辅助教学的理论研究》(郑艳群主编,2006,商务印书馆)中,涉及语料库与对外汉语教学和研究的文献。
第二章中文信息处理与汉语教学
第一节语料库的建设、加工与检索
1.1汉语语料库建设与发展
张普《关于汉语语料库的建设与发展问题的思考》,《中文信息处理若干重要问题》科学出版社2000年版,第166页。
西文,由于有较丰富的形态标志,词处理向句处理的过渡也有良好的基础。
字处理阶段:
字频、汉字编码、汉字输入法、汉字交换码、汉字内码、汉字点阵、汉字库、汉字卡。
词处理阶段:
词频、词汇编码、词库设计、自动分词、分词规范、词性标注、电子词典。
语言研究现代化的三个组成部分:
理论的现代化
↑
方法的现代化
↑
手段的现代化
从建库目的来看,可以把语料库分为两大类:
面向语言的本体研究和语言教学的;
面向语言信息处理的。
语料库的建立、加工、检索。
对语言进行计量分析、形式分析。
计量语言学。
语言信息处理面临的问题:
不仅要能处理规范文本,而且必须要能处理大规模真实文本,才能走向实用。
语料库语言学的崛起,反映了“现代语言学研究中经验主义思潮的复苏”,在语法研究方面促动“从宏观到微观的回归”。
经验的——基于语料库的——基于统计的
唯理主义——基于规则——基于内省的——依据语言学家的直觉和语感——主观理性——后天语言实践的结果,每个人都不一样。
是经验的?
语料分布:
学科领域;地域;时间;语体。
1.2分词规范问题探讨
宋柔《关于分词规范的探讨》,《语言文字应用》1997年第3期。
1.3语料检索方法的研究与实现
陈小荷《语料检索方法的研究与实现》,《E-Learning与对外汉语教学》清华大学出版社2002年版,第401页。
随着计算机应用的普及和语料库语言学的兴起,出现了一种跟全文检索相关,但又有所区别的检索技术:
语料检索,它是为从事语言研究、语言教学和语言信息处理的语言学工作者服务的,用户群不大,但检索要求特殊而复杂。
第二节现代汉语语料库与中介语语料库
2.1“现代汉语研究语料库系统”概述
孙宏林、黄建平、孙德金、李德钧、邢红兵《“现代汉语研究语料库系统”概述》,《第五届国际汉语教学讨论会论文选》北京语言文化大学出版社1997年版,第459页。
是一项基础工程,其目的主要是为语言学研究工作者提供一个方便高效的研究平台。
计算机语料库与传统的研究手段相比,优越性体现在效率和方法两个方面。
《人民日报》是一份综合性报纸,题材丰富。
2.2建立“汉语中介语语料库系统”的基本设想
储诚志、陈小荷《建立“汉语中介语语料库系统”的基本设想》,《第四届国际汉语教学讨论会论文选》北京语言学院出版社1995年版,第537页。
长期以来,我们的研究重点集中在学和教的内容以及执教者怎样教这两方面,学习者怎样学则成了我们理论研究最薄弱的环节。
由于对学习者的学习规律知之甚少,因此我们对语言教学规律,对语言本身的认识都受到了限制。
多方面、系统全面的理论研究。
研究语言学习理论必须从学生在语言学习过程中的语言表现入手,以中介语研究为突破口。
2.3“汉语中介语语料库系统”介绍
陈小荷《“汉语中介语语料库系统”介绍》,《第五届国际汉语教学讨论会论文选》北京语言文化大学出版社1997年版,第450页。
·汉语中介语语料库系统,真实详尽地反映汉语中介语的本来面貌;
·为汉语教师全面、系统地观察学生在学习过程中的语言表现提供语料和方便快捷的检索手段;
·在教学实践方面,可以帮助教师了解学生,了解汉语学习过程和影响学习的各种因素,从而有效地优化学习条件,自觉地按照学习规律来组织教学,提高学习效率;
·在学科建设和理论研究方面,一个有相当规模的语料和完备的语篇属性信息的中介语语料库,可以成为建立和发展汉语学习理论的坚实基础,为总体设计、教材编写、课堂教学、测试各环节提供依据,——学科理论建设的一个基础工程。
中介语语料库加现代汉语语料库,可以为汉语中介语研究和一般的汉语研究提供各种相互比较和参证的统计数据。
语料抽样、加工,都有一定的细则。
2.4汉语语素数据库初探
邢红兵《基于〈汉语水平词汇等级大纲〉的语素数据库建设》,《数字化对外汉语教学理论与方法研究》清华大学出版社2004年版,第457页。
·有研究证明,语言材料的统计规律和人脑所储存的知识十分接近,这说明人的语言知识的获得和语言材料有直接的关系。
·探索数据库方法在语言教学和相关研究中的运用和作用。
第三节汉语教学语料库建设设想
3.1汉语口语教学语料库
赵金铭、郑艳群《汉语口语教学与多媒体口语数据库的建立》,《南京大学学报》2002年特刊。
针对目前对外汉语口语教学中存在的问题,重新认识现代汉语口语、口语教材以及口语教学。
在此基础上,提出建立口语教学用多媒体数据库的设想,从而为对外汉语口语教学探索一条新的路子。
3.2汉语中介语语音语料库
王韫佳、李吉梅《建立汉语中介语语音语料库的基本设想》,《世界汉语教学》2001年第1期。
方法是实证性的,手段是仪器性的,结果是定量的——较为成熟的研究模式。
唯有进行较大规模的采样分析,才能揭示语音习得中的共性特征,从而为教学实践提供可靠的理论参考。
特点:
以文本、语音和声学参数三种形式与用户见面。
3.3汉语句型教学语料库
胡翔《语料库在汉语句型教学中的应用》,《数字化对外汉语教学理论与方法研究》清华大学出版社2004年版,第522页。
从计量语言研究的角度出发,调查现代汉语句型的使用频率、研制出体现汉语特点,突出汉语语法教学的常用句型表,建立句型语料库——为教材建设、语法教学、汉外对比、测试,提供有关句型方面的科学数据和丰富的句例。
3.4汉语专业阅读材料语料库
方向红《试论有专业倾向的汉语阅读材料语料库》,《数字化对外汉语教学理论与方法研究》清华大学出版社2004年版,第495页。
目前没有合适的教材,应提供给学生一些专题性的,生动丰富并包含一定专业知识的语言材料,激发兴趣,增强汉语言知识感悟和接受能力。
汉语阅读材料语料库应比传统意义上的阅读教材内容更新鲜,更贴近当代社会现实,包含更大信息量,满足语言生和其他专业留学生等汉语学习者课外阅读的需要。
第四节网络环境下的汉语语料库建设及检索
卢伟《基于WEB的对外汉语教学语料库建设及在线检索程序开发》,《海外华文教育》2003年第3期。
满足更大范围的语料检索需求,实现共享。
综述(节选)
郑艳群
自上个世纪80年代以来,人们借助语料库技术,通过统计、概率等量化数学方法,对汉语汉字进行了史无前例的大规模量化研究,其成果不但基本解决了汉字进入计算机的问题,也促进了汉语教学和研究水平的提高。
近十年来,通过建立面向对外汉语教学的现代汉语语料库和汉语中介语语料库,并进行多角度的分析与研究,使得汉语教学大纲的制订和教材的编写从早期的定性分析和凭经验的估计分析,推进到了比较精确和客观的定量分析,因此更具有科学性与针对性。
研究方法的改进,使我们对汉语本体和汉语教学规律的认识更加系统和深入,并自觉地运用到汉语计算机辅助教学系统和课件的研发中去。
孙宏林等的《“现代汉语研究语料库系统”概述》和储诚志等的《建立“汉语中介语语料库系统”的基本设想》正是这一时期重要的研究成果。
计算机辅助教学的本质是把一切与教学有关的内容和过程都用计算机转化成数据,然后再进行处理。
计算机的处理过程实际上就是一个量的流程,它的方方面面都离不开量化研究,而量化处理的基础则依赖于对汉语本体和汉语教学的量化研究。
利用语料库的研究方法,对汉语作为第二语言的各种语言现象进行统计分析,已经成为汉语教师和汉语教学工作者开展教学和科研的基本方法。
然而,对语料库的分析又有赖于计算机环境的支持,即对语料库进行加工(如分词和词性标注)并检索出数据(语言材料)的软件工具。
汉语教师必须借助检索工具才能完成检索任务,宋柔的《关于分词规范的探讨》和陈小荷的《语料检索方法的研究与实现》,正是他们长期以来从事这方面研究工作的结晶。
卢伟的《基于WEB的对外汉语教学语料库建设及在线检索程序开发》是对网络环境下满足更大范围语料检索需求,实现共享的探讨。
汉语语料库的发展是不平衡的。
目前书面语语料库较多,而口语语料库较少,这在对外汉语教学领域也反映出了同样的情形:
上述面向对外汉语教学的现代汉语语料库和汉语中介语语料库已经在教学和科研中发挥了重要作用;相比之下,汉语中介语口语语料库的建设还处在设想阶段,如赵金铭等的《汉语口语教学与多媒体口语数据库的建立》和王韫佳等的《建立汉语中介语语音语料库的基本设想》。
各种语料加工技术对汉语计算机辅助教学系统和课件的设计与应用都是非常重要的。
例如,汉语词处理和句处理技术可以应用于学习者写作水平的评测,即通过判断学生作文中所用字、词、句的量,以及这些字、词、句的等级、重现率等,可以客观、自动地评测学生的写作水平。
目前,对语言各层面的标注发展水平也是很不平衡的,“发展较快的层面有词汇层、句法层、语音层和音位层等,今后会重点加强语义层和语用层的标注”。
(黄昌宁,2002)在对外汉语教学界,句法层的标注刚刚开始,面向汉语中介语的各种切分、标注和分析有其特殊的困难,研究还有待时日,结果尚不能满足教学和科研的需要。
计算机除了具有对语言条目进行检索、计数和排序等功能外,如果具有成熟的对中介语处理和研究的能力,那么计算机也应该能够准确地计算这些条目在文本中的概率,而这些统计数据又可以形成统计语言模型,作为判断学习者语言能力模型的基础。