ImageVerifierCode 换一换
格式:DOCX , 页数:61 ,大小:83.53KB ,
资源ID:8211517      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/8211517.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(句子难度度量研究.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

句子难度度量研究.docx

1、句子难度度量研究摘 要本文在引介国内外学者对教材难度、语篇难度、作文难度度量等研究的基础上,针对当前语料难度研究中多数都是基于语篇难度的宏观度量,缺乏微观的诸如语篇的基本组成部分句子难度度量的这一现状,展开了对句子难度度量的研究。并分析了影响句子理解的各项因素,讨论了其定量分析的可行性。在此基础上,利用对外汉语教材、国内小学生教材及报刊语料等,制定了两套句子难度度量问卷,从字、词、语法三个层面上测定影响句子理解的各项因素。调查对象分别是厦门大学海外教育学院汉语水平为中级的留学生和国内某小学五年级的学生。通过问卷结果对比分析,发现成语和俗语是留学生和小学生这两个不同群体在句子理解方面的共同难点,

2、但在人名、地名、补语等方面存在较大差异。此外,丙丁级词语数与句子的难度等级关系密切,一般情况下句中有两个以上的丙丁级词语则基本上可以判断其属于难理解的句子。最后,在以上分析基础上,草拟了一套适合计算机评测的句子难度度量公式,并利用该公式制作了一个句子难度度量软件,希望对句子难度度量的定量研究及自动评测提供参考。本文最后陈述了论文的有待进一步完善之处和日后要深入的方向。关键词:句子难度; 对比分析; 难度公式AbstractBased on the introduction of the domestic and foreign scholars research of teaching mat

3、erials difficulty, texts difficulty, compositions difficulty and so on, this thesis, in view of the current difficulty research of language materials is mostly based on macroscopic measuring way and lacking research in microscopic way, such as sentences difficulty-a basic part of texts, discuss the

4、factors which would produce an effect on sentences understanding and analyze the feasibility of quantitative analysis by the use of them. By taking advantage of Chinese textbooks for foreigners, domestic primary school textbooks and corpora (language materials) of newspapers, two sets of questionnai

5、res about assessment difficulty of sentences had been made by taking into account concerned factors related sentences understanding from three aspects, the character, the word phrase and the grammar. The objects of testing are students of Xiamen University Overseas Education Institute whose Chinese

6、proficiency are at primary or intermediate level and some domestic elementary school students in grade five. By the contrast analysis of questionnaires results, finds that the idioms and the folk adages are the common difficulties between the two groups while the two have many differences in underst

7、anding peoples names, place names, complement and so on. Besides, the number of words on the third lever or the forth level has much relationship with the difficulty levels of sentences. Generally speaking, the sentence which has more than 2 words which of the third level or the forth level could be

8、 accepted as difficult sentence basically. Afterwards, according to the analysis of the questionnaires results, drafts a difficulty formula suit for computer operating. By taking advantage of the formula, the author has manufactured a set of software for measuring sentence difficulty and hope for pr

9、oviding certain reference function for the quantitative investigation and automatic measuring sentences difficulty.Finally, the article states the weak points of the paper and the authors further research.Key Words: Difficulty of Sentences; Contrast Analysis; Difficulty Formula目 录第一章 绪 论 11.1选题缘由 11

10、.2研究目的及意义 11.3本文结构 2第二章 语言难度及其度量 32.1研究对象的界定 32.2本研究中的语言难度的定义 32.3语言难度的研究现状 42.3.1国外关于语言难度度量的研究 42.3.2国内关于语言难度度量的研究 62.4现阶段语言难度度量方法 8第三章 句子难度度量 93.1句子难度定义 93.2句子分析 93.3影响句子难度的因素 103.3.1内部因素 103.3.2外部因素 133.4难度度量因素分析 143.4.1字、词层面 143.4.2短语层面 153.5度量句子难度的手段和方法 153.5.1主观经验 153.5.2问卷调查 163.5.3软件验证 16第四章

11、 难度度量调查及度量公式 174.1问卷设计 174.1.1调查目的 174.1.2设计思想 174.1.3问卷形成 184.1.4问卷说明 194.2问卷统计及分析 204.2.1 问卷结果统计 204.2.2 问卷结果分析 264.3难度公式初探 294.3.1 理论上的难度公式 294.3.2 软件设计中的难度公式 30第五章 难度度量系统设计 335.1系统设计 335.1.1 算法设计 335.1.2 相关数据库设计 345.2软件介绍 345.3软件测试及结果分析 355.3.1软件测试 355.3.2测试结果分析 375.3.3难度公式的适用性讨论 37第六章 余 论 396.1

12、本文研究的理论实践意义 396.2存在的问题与不足 396.3未来的研究 41参考文献 42附 录 45致 谢 59ContentsChapter One Introduction 11.1 Reasons for the Research 11.2 Goals and Significance of the Research 11.3 The Structure of the Present Thesis 2Chapter Two Meanings and Measuring Way of Language Difficulty 32.1 Range of the Research 32.2

13、 The Definition of Language Difficulty 32.3 Current Situation of Language Difficulty Research 42.3.1 Language Difficulty Research from Abroad 42.3.1 Domestic Language Difficulty Research 62.4 Ways of Measuring Language Difficulty 8Chapter Three Measuring Sentence Difficulty 93.1 Definition of Senten

14、ces Difficulty 93.2 Analysis of Sentences 93.3 Factors Which Would Affect Sentences Difficulty 103.3.1 Internal Factors 103.3.2 External Factors 133.4 Factors Which Would Produce an Effect on Measuring Sentences Difficulty 143.4.1 Aspect of Characters and Words 143.4.2 Aspect of Phrase 153.5 Means o

15、f Measuring Sentences Difficulty 163.5.1 Experts Knowledge 163.5.2 Investigation by Doing Questionnaires 163.5.3 Checking by a Certain Software 17Chapter Four Investigation of Difficulty and the Difficulty Formula 184.1 Designation of the Questionnaires 184.1.1 The Aims of Investigation 184.1.2 Idea

16、s for Investigation 184.1.3 The Process of Designing Questionnaires 194.1.4 Introduction of Questionnaires 194.2 Analysis about the Results of Questionnaires 204.2.1 Statistics of the Results of Questionnaires 204.2.2 Analysis about the Results of Questionnaires 254.3 The Draft of the Difficulty For

17、mula 284.3.1 The Theoretical Difficulty Formula 284.3.2 The Formula for the Software 30Chapter Five Designation for the Measuring Sentences Difficulty System 335.1 System Designing 335.1.1 Algorithmic Gist 335.1.2 The designation of Related Corpus 345.2 Introduction of the Software 345.3 Checking th

18、e Results and Related Analysis 355.3.1 Checking the Results by Software 355.3.2 Analysis of the Results 365.3.3 Discussion of the Formulas Adaptability 36Chapter Sixth Conclusion 376.1 Theoretical and Practical Significance of the Paper 376.2 Week Points and Limitations 386.3 Further Research 39Refe

19、rences 40Appendixes 42Acknowledgements 56第一章 绪 论随着学习汉语的热潮席卷了全世界,对外汉语教学的各个方面的成果层出不穷。其中,有部分学者把目光投向了对外汉语教材的编写上面。毋庸置疑,对外汉语教材的质量对于对外汉语教学的效果起到了一个很重要的作用。而教材质量的一个重要参数教材难度是否合适又成了近年来学者们研究的一个热点。国内学者在引进西方的语料难度研究的基础上,开发出了若干针对汉语的语料难度度量方法。也有少数学者更深入一步,研究影响句子理解的各项因素。本文正是在此基础上,论述对于句子难度度量的理解和研究。1.1选题缘由如果阅读材料与读者的阅读能力不匹

20、配,就会引发各种矛盾:太难的阅读材料会超出人的信息加工系统能力,使阅读者丧失成就动机,太简单的材料则会使读者感觉乏味,没有继续阅读的兴趣。而有效地衡量阅读材料的难易程度,为读者找到合适难度的阅读材料可以解决这一矛盾。在阅读相关语言难度度量研究文献的基础上,笔者发现绝大多数的语言难度的度量都是站在篇章级别的角度来研究语言难度,比如研究教材的语言难度、文本的语言难度等,但是缺少语篇的基本组成部分句子的难度度量研究。为此,本文在学习已有的对于篇章级别语言难度度量研究的基础上,通过分析句子本身的特点,运用问卷调查、对比分析等方法,展开了句子难度度量的研究。1.2研究目的及意义句子是组成篇章的基本单位。

21、目前有很多有关教材难度的研究,都把句子的长度、使用简单句还是复杂句等作为重要的考察因素。他们测量的变量不外乎词汇难度和句子难度。从这个意义上说,考查句子难度,实际上也就是从微观的、更精细的角度来考察语料的难度。而目前的现状是,学者们考察句子中的超纲字、词、短语等,都是站在篇章的角度从总体的数量上的角度来考察,而没有把它们作为句子的组成部分来考察,更没有把特定的句子作为一个完整的单位来考察。对单个句子的考察有助于我们更精细的考察教材的难度。此外,对句子难度的考察也有助于语文教学。分析学生作文中的句子难度可以考察出该学生对于语言的运用能力。同样的,对句子难度的考察还可以服务于高考作文的评卷工作和H

22、SK中的作文评卷工作等。承上所述,本文研究的对象是句子的难度,目前对于该项研究的资料还很少,涉及该项研究的人员也很少。本研究希望在对句子分析、难度分析及结合调查问卷的基础上,得出适合度量句子难度的公式和成型的软件,对语言能力、语料难度的自动评测有所帮助。1.3本文结构本文在引介国内外对于语料难度研究的基础上,提出句子难度度量的意义、手段和方法,通过对调查问卷的结果分析得出初步的句子难度公式,并依此设计出句子难度度量软件。本文共分六章,前面三章从理论上讨论了语料难度度量的研究现状和方法,指出句子难度度量的研究目前还比较稀缺,接着从句子本身出发指出影响句子理解的各个要素。第四章以调查问卷的形式对影

23、响句子理解的若干关键要素进行调查,通过对句子学习较敏感的国内五年级学生和厦门大学海外教育学院的初中级留学生所作的调查问卷的反馈和对比,总结了国内小学生和国外留学生学习句子时的难点及异同点。在此基础上,初步提出一套句子难度度量公式。第五章在第四章所总结的影响句子理解的各要素的基础上,设计一套句子难度度量软件,并分析该公式和该软件的作用和局限性。第六章总结和分析本文的研究所得,在对本文做了一个整体的概述后指出了本文的研究的局限性以及将来可以扩展研究的内容,之后的内容是参考文献、附录和致谢,全文到此结束。第二章 语言难度及其度量我们在学习语言的过程中,很自然的会在头脑中形成某一个句子是否容易理解的初

24、步印象,并由此可以比较出两个句子的难易,通常这种判断是一种笼统的思维活动的结果,我们并不能很清楚的说出这种判断的依据。而语言难度的客观度量,则将这种对语言难度的感性认识上升到了理性认识。语言难度对于作者和读者都具有十分重要的意义:作者写作时需要考虑到读者的语言能力水平,而读者会根据自己的语言能力水平选择合适的阅读材料,这两个过程都离不开对语言难度的考察。2.1研究对象的界定本论文的研究对象是现代汉语书面语中单句的难度。现代汉语书面语中的单句是汉语发展史上最为简单易懂的句子。我们知道,现代汉语比古代汉语直白易懂,而书面语又不像口语那样灵活多变,它有一定的语法规范性,容易入手;并且单句是复句的组成

25、基础,是文字表达的基本单元。因此,现代汉语书面语中单句的句子难度度量研究是一项基础性而又富有意义的工作。2.2本研究中的语言难度的定义难度,通俗的说,指的是不容易达到的程度。现代汉语词典(商务印书馆,2002年增补本)中关于难度的定义是:工作或技术等方面困难的程度。与之类似的说法有难度系数,在08年奥运会的跳水等项目的直播过程中,播音员口中经常出现如“这套动作的难度系数是(省略部分为数字)”等话语,这里的难度系数是难度的具体数据体现。不同的难度系数满分值不一样,有的是1,有的是3,有的是5,等等。通常我们所说的“难度”指的是“困难的程度”,有时候也指的是其具体数据体现形式难度系数。语言难度,顾

26、名思义,指的是人们对语言材料理解的困难程度。与之相对的说法有易读性或易读度,也有人称之为可读度,语言材料容易理解的程度。语言的难度和易读度是两个相对立的概念,简单的说,难度=1易读度(设定难度和易读度和为1)。本文的研究中只考虑语料的内容本身,针对清晰的而非辨认困难的语料。在阅读该语料时,也假定阅读者不受周围环境的影响;本文讨论的语言难度,仅仅针对因为构成语料本身的字、词、短语、句子、段落等对阅读者造成的影响。语料难度的重要性在各种语言测试中的作用尤为突出。比如全国普及的各种英语等级考试、普通话测试等。因为各种考试所用的语料都需要经过精心挑选,所选的语料的难度也必须合乎一定的要求。2.3语言难

27、度的研究现状2.3.1国外关于语言难度度量的研究语料难度的度量研究最先起源于国外,国外学者们的研究主要集中在两个方面:一是研究究竟哪些因素与语料的难度有关系,另一方面就是如何去测定这些因素对语料难度的影响。相关的研究成果很多,Flesh,Betts等人都对此做出了重要的贡献。广为人知的Flesch公式(1948)是最为常见的易读性公式之一,它采用的变量适用于评判成人阅读语料。该公式是:阅读难易度(Reading Ease Score)=206.835(0.846每100词所含音节数)(1.015每句平均词数)贝茨(Betts,1949)发现影响难度的因素主要有:每个句子的平均单词数、简单句数、

28、介词短语数、不同词的百分比、不常见词数、以某些字母开头的词数、多音节词数、形容词和副词数、人称代词及其他具有人称指称性质的词数等。他认为含有许多不常见的词、不同的词、多音节词、介词短语以及复杂的长句的阅读材料通常难度较大,而含有经常性的人称指代、较大比例的常用词和短句的材料则难度较小。亨特(Kellogg WHupt)在1965年提出“可终止的最小单位”(minimal-terminable-unit)的长度是衡量句法复杂程度(syntactic complexity)和成熟程度(maturity)的标准。这个标准后来被广泛接受,称作“T单位标准”(T-unit Measure)。这里的T单位

29、,对应到汉语中其实就是一个完整的小句。其他学者还发现T单位的长短和文体大有关系。论说文(argument)中的T单位最长,然后依次是说明文(exposition)、记叙文(narration)和描写文(description)。那么,T单位的长短当然也其实体现了句子的长短。德尚和史密斯( Dechant,E. V. & Smith,1961/1977)在分析了各种易读性公式所涉及的因素之后指出,一般来讲,阅读材料的易读性受以下各因素的影响:词长、不同词的比例、句长、人称代词、音节数、代词数、词缀数、介词短语数、依据词汇表所确定的难词数、使用简单句还是复杂句、事实密度及其不常见性、插图数目、趣味

30、性及写作目的、概念负载量词汇的抽象程度、材料的组织及印刷版式、内容之间的相互关系等。1977年美国拉格斯大学(Rutgers University)阅读中心的爱德华弗莱(Edward B Fry)在他所著的初级阅读教学中首次公开了一种用句长和音节数来衡量阅读难度的方法。他在对美国从小学到大学使用的一千多种教材进行分析研究后认为:英语的难度主要取决于句子的长短和句子中音节的多寡。如果句子长而单词的音节数多,难么一般来说,这样的句子难度就大。反之,句子短而且音节数少,那么这样的句子难度就小。他设计了一个阅读难度评估指示图来衡量阅读难度。爱德华弗莱所提出的句子的长度和音节数对阅读理解的重要影响作用后

31、来被许多学者所证实。主要原因在于:一是英语中单音节词和双音节词占多数。二是学者们研究发现,人们所能接受的容易理解的句子长度是有一定限度的。无论是Flesch公式,还是后来提出的T单位标准抑或是爱德华弗莱提出的“句长-音节数”测量法,都存在一定的缺陷。他们提出的测量变量无外乎词汇难度的句子数、句子长度等因素,缺少对句子更深层次的挖掘。有的文章句子并不长,单词音节也不多,但是由于文化、社会等因素使得对它们的理解存在困难。而这是以上方法都不能解决的。除了材料本身的性质与阅读难度高度相关外,学者们还发现阅读者的主观性和周围环境也对阅读难度产生一定的影响。同一份材料,对其熟悉的人阅读起来明显比对其不熟悉

32、的人要容易;而良好的阅读环境和清晰的阅读材料也明显比不合适阅读的环境(如嘈杂的公交车上)和不甚清晰的阅读材料更加适合阅读,在一定程度上降低了阅读难度。2.3.2国内关于语言难度度量的研究我国学者在引进了国外学者的理论和方法的基础上,结合汉语的特点,提出了一些新的理论和测量方法。为了本研究的需要,根据语料的层次性,可以把语料分为篇章级和篇章级以下(段落和句子)两个层次。目前对第一个层次的语料难度的研究比较多。比如教材的难度、文本的难度。“从语言本身来看,决定语篇难度的主要因素是语法复杂度和词汇难易度。语法复杂度的显著标志是句子的长度。句子越长其语法结构一般就越复杂。”学者李绍山在易读性研究概述中指出,考察语料易读性时,当词汇难度与句法难度分别考虑时,前者尤其是词频是一个更好的预测变量;一个句

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1