ImageVerifierCode 换一换
格式:DOCX , 页数:5 ,大小:61.56KB ,
资源ID:6679850      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/6679850.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(留学生汉语中介语语料库的建立与研究.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

留学生汉语中介语语料库的建立与研究.docx

1、留学生汉语中介语语料库的建立与研究留学生汉语中介语语料库的建立与研究中介语(interlanguage )概念由美国学者Seiinker于1969 年提出,并于1972年在论文中介语中进行了详细论述。 Seiinker认为中介语是由不同心理过程生成的规则构成的一个单一 语言系统。中介语理论在20世纪80年代引入我国,对对外汉语 教学及相关研究领域发展产生了极大的促进作用。1984年,鲁健骥 先生发表论文首次引进“偏误”与“中介语”两个概念,并分析了外 国人学习汉语过程中产生语音偏误的五个原因。鲁先生认为,中介语 是学习外语的人在学习过程中对于目的语规律所 做的不正确的归纳和 推论而产生的一个语

2、言系统,这个语言系统既不同于学习者的母语, 也区别于他所学的目的语(鲁健骥,1984)。 1鲁先生的文章在国内学术界产生了巨大影响,此后越来越多的学者开始这方面的研究, 使得偏误分析和中介语研究成为第二语言习得研究领域的主要课题。一、汉语中介语语料库建立与研究的现状语料是中介语研究的基 本材料。而语料的搜集与整理是很繁琐费时的工作,因此,中介语 语料库的建设就成了研究者迫切所需。针对留学生汉语学习的语料库 是汉语中介语语料库,它是为研究母语非汉语的学生在学习汉语过程 中的中介语现象而制作的专门用途语料库。按照国家标准术语的界 定,语料库是“文本的有序集合。各种分类、检索、综合、比较 的基础。”

3、随着计算机技术的发展,我国在20世纪90年代开始有了汉语中介语语料库的建设。第一个建成的是北京语言学院的汉语中介语 语料库检索系统,该语料库对语料进行了分词和词性标注(储诚志、 陈小荷,1993),收入经过处理的语料约104万字,内容为成篇成 段的汉语作文或练习材料。随后有暨南大学留学生汉语中介语语料 库,规模达300万字;中山大学留学生中介语语料库,初期收入语料 近70万字(张舸,2008),该语料库收录2003年以来留学生的字 句练习和作文资料,前期主要进行字、词、句加工标注,后期重点建 设汉字偏误标注的语料库,目前语 料总数达到约200万字(张瑞朋, 2013);南京师范大学外国学生汉语

4、中介语偏误信息语料库,收入作 文、练习90万字(周文华、肖奚强,2009);北京语言大学的HSK 动态作文语料库,2006年建成,该语料库从1992年至2005年期间 两万多份留学生HSK考试试卷中选取了 11569名考生的HSK作文答 卷,总计424万字,并从字、词、句、篇以及标点符号等角度进行全 面标注,是目前汉语中介语语料库中规模最大的语料库。上述语料库 除北京语言大学的HSK动态作文语料库面向全社会开放外,其他都只 供内部人员使用,外人难以了解实情,因而造成了这样的局面:一方 面许多人想用却没法用,另一方面语料库的使用率并不高(任海 波,2010) o而面对日益增长的对外汉语教学的多方

5、面研究需求,已 建成的五个汉语中介语语料库数量相对较少(张宝林, 2010),远远不能满足需求。目前我们能见到并且可以使用的仅有北京语言大学的HSK动态作 文语料库。该语料库只收入参加高等考试的考生作文(初、中等没有写作考试),因而只能对高级阶段学习者的习得情况进行横向的断 面考察,而无法对初级和中级学习者的情况进行考 察,更无法对学习 者的整个学习过程进行纵向的全面研究。其次,HSK动态作文语料库 只收入文本语料,偏重的是词汇和句法的偏误标注,对汉字偏误处理 较简单,对于汉字习得的研究也缺乏足够的语料支持。再次,HSK动 态作文语料库虽然从字、词、句、篇以及标点符号等角度对全部语料 中存在的

6、偏误现象进行了标 注,但对语料中正确的语言现象并未标 注,也就是只有偏误标注 而没有基础标注,这就会导致研究中出现确语言表达,从而使 得全面考察学习者的语言习得情况受到较大限制。上述问题都给 基于语料库的相关研究造成了诸多困难。鉴于此,我们设想建立昆明理工大学的留学生汉语中介语语料库。首先,本语料库基于本校教育在线网络教育平台建立,面向全社 会开放,以便资源共享。其次,本语料库将收入零起点、初级、中 级、高级各阶段汉语学习者的语料。再次,本语料库将 分设错别字语 料库和语句语料库。虽然目前我校留学生规模尚不足以支持建立大型 语料库,但我们可以先建立一个语料种类齐全,样本较多,标注内容较全面,能

7、够反映各阶段汉语学习者的学习过程与特征的小型语料 库。将来如果条件成熟,本语料库可以与其他兄弟院校或国家大型语料库实行对接,甚至共建语料库 网,充分实现资源共享。二、汉语中介语语料库建立与研究的意义汉语中介语的研究离不开大量真实的中介语语料。而真实的留学生汉语中介语语料的收集,必须依据中介语理论和语料库语言学理论,建立专门针对留学生的汉语中介语语料库。 基于昆明理工大学留学生的规模,我们考虑建立针对本校留学生的小型汉 语中意义:以对留学生汉语学习者的大量语言样本进行量化分析, 为汉语中 介语研究、汉语二语习得研究以及偏误分析提供真实可靠的语言 数 据。运用本语料库中的错别字、语句等语料来考察汉

8、语学习者 在汉 字、词汇、语法等方面的习得情况,可以进行对外汉语教学 的多方面 研究,例如汉语中介语研究、第二语言习得研究、对外 汉语教学理论 研究、对外汉语教材研究、汉语水平考试研究以及从中介语的角度来进行汉语本体研究等等。 第二,有利于全方位探索汉语学习者的语言特征。汉语中介语语料库将比较 全面 地搜集能反映汉语学习者的各种语言属性、个体特征等信息,如姓 名、性别、年龄、国籍、是否华裔、第一语言、文化程 度、入校时 间、年级、学习阶段、学习汉语年限、语料提供时间、语料来源、语 料类别等,为全方位探索汉语学习者的语言特征提 供参考依据。第三,有利于对外汉语的学科建设。汉语中介语语料库的建 设

9、和研究服务。将汉语中介语语料库引入对外汉语教学课堂,可以使学 生和教师得到丰富的语料资源和在线帮助, 增加了汉语学习中的真实材料”和真实交际,提高了学习的交互性。基于昆明理工 大学教育在线网络教育平台,我们还能够以此平台为依托,加强与外 界的沟通,促进昆明理工大学对外汉语学科建设的发展。三、汉语中介语语料库建设思路与构成原则汉语中介语语料库建设的主要应用是为对外汉语教学的一线教师 提供教学和研究服务,以及为外国留学生的汉语学习提供辅助,因此 语料库的建设主要注重以上两类服务对象的应用需 求。基于此种要 求,我们对汉语中介语语料库的建设做了以下几点考虑:第一,汉语中介语语料库是为研究母语非汉语的

10、学生在学习 汉语 过程中的中介语现象而制作的专门用途语料库。第二,中介语语料包括书面语料和口语语料,由于技术层面的 原因,口语语料的搜集与加工操作比较困难,我们现阶段只搜 集书面 语料。第三,对语料的加工釆取人工为主,计算机为辅的方式。具体操作是,在语料分词和词性标注上釆用人机互助标注方式, 其他语言学方面的标注则米用人工标注方式。汉语中介语语料库建设的基本思路如下:(一) 搜集零起点、初级、中级、高级、本科各阶段留学生 汉语学习者的语料,包括来自平时作业、练习、测试和学期课程 考 试、汉语水平考试的不同语料。同时完整记录每份语料的背景信息, 以及语料提供者的详细信息,如姓名、性别、年龄、国籍

11、、是否华 裔、第一语言、文化程度、入校时间、年级、学习阶段、学习汉语年 限、语料提供时间、语料来源、语料类别等。(二) 对语料进行加工,包括偏误标注和基础标注。(三) 将加工后的语料分别存入错别字语料库和语句语料库 这两个子库。每个子库包括生语料库、熟语料库、背景信息库三个部分。生语料库用于存放扫描的原始图片或语音材料, 熟语料库用于存放经过各种加工处理的语料,背景信息库用于存放学习 者背景信息和语料信息。汉语中介语语料库建设的构成原则有如下三个:第一,语料的真实性原则。语料的真实性主要包含两个层面的意 义,第一个方面是指语言水平的真实性, 即收入的语料必须是外国留学生真实语言能力的产物, 是

12、留学生汉语学习过程中的 原始语料,能真正反映留学生的语言水平状况。因此,我们选取的语 料主要是留学生在课堂上的随堂练习、 课后作业、平时测验和期末考试、汉语水平考试的材料。语料的真实性第二个方面是指语 料的忠实性,即收入的语料必须不经任何篡改,要忠于语料的原始 面貌,并且对字、词、标点、格式等错误均原样录入,后 期对语料的 标注也要尽量忠实于其本来面貌,对错误的保存和呈现要能体现出错 误特征。第二,语料的平衡性原则。语料的平衡性主要包含两个层面的意义,第一个方面是指语料来源国别的平衡性,即提供语料的留学 生国别比例要尽量平衡。目前来华留学生中学习汉语的韩国、日本学 生数量远超其他国家,因而,国

13、内最大规模的语料库,北京语言大学 HSK动态作文语料库收录韩、日学生语料数最多。尽管如此,语料库 收录语料仍然要确保在一定规模下达到一种分布的平衡。昆明理工大 学留学生以东南亚国家,如泰国、老挝、越南等国居多,欧美和非洲 国家相对较少。因此,我们在选取语料时要尽量考虑保持语料来源国 别的平衡性。语料的平衡性第二个方面是指层级的平衡性,即提供 语料的留学生汉语水平分类要合适、比例要尽量平衡。我们对留学生 汉语水平的分类按学生自然班级进行,包括“零起点、初级I、初级 H、中级I、中级H、高级I、高级H、本科上、本科下”这九个层 级。尽管随着学生的汉语水平不同和语言产出能力不同,所能提供的 语料数量

14、肯定不等,但在选取语料时我们也要尽量考虑保持各层级比 例的平衡性。第三,信息的完备性原则。信息的完备性主要包含两个层面 的 意义,一方面是指提供语料的留学生背景信息要全面完整。我们在 语料库建设过程中,注重搜集能反映汉语学习者的各种语言属性、个 体特征等信息,包括如姓名、性别、年龄、国籍、是否华裔、第一语 言、文化程度、入校时间、年级、学习阶段、学习汉语年限、语料提 供时间、语料来源、语料类别等,力求能全面覆盖语料提供者背景各 方面细节。另一方面是指搜集的语料信息要全面完整,即保证每一 篇语料能和学生背景信息一一对应,并且最好能随着学生阶段和水平 的提升采集跟踪信息,使语料信息能覆盖语料提供者的各个学习阶段 和不同水平层次。四、结 语 留学生汉语中介语语料库的建立是个复杂的工程,要 建成大规模的语料库,需要一个大型团队的力量和各方面技术的支 撑。限于人员和技术的因素,目前我们仅能建设小型的汉语中介语语 料库。但是在语料库的建设过程中,我们积累了宝贵的经验,对 于整 个语料库的建设流程有了深切的亲身体验,对于语料库建设过程中的 一些困难与问题也有了体会和克服的经验,尽管由于能力所限,我 们只能说是在语料库建设方面做了一些尝试,但这些 有益的尝试为今 后的进一步研究打下了良好的基础。(本文为昆明理工大学人才培养基金项目,项目编号KKZ3201253001。)

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1