1、1.1选题缘由 11.2研究目的及意义 11.3本文结构 2第二章 语言难度及其度量 32.1研究对象的界定 32.2本研究中的语言难度的定义 32.3语言难度的研究现状 42.3.1国外关于语言难度度量的研究 42.3.2国内关于语言难度度量的研究 62.4现阶段语言难度度量方法 8第三章 句子难度度量 93.1句子难度定义 93.2句子分析 93.3影响句子难度的因素 103.3.1内部因素 103.3.2外部因素 133.4难度度量因素分析 143.4.1字、词层面 143.4.2短语层面 153.5度量句子难度的手段和方法 153.5.1主观经验 153.5.2问卷调查 163.5.3
2、软件验证 16第四章 难度度量调查及度量公式 174.1问卷设计 174.1.1调查目的 174.1.2设计思想 174.1.3问卷形成 184.1.4问卷说明 194.2问卷统计及分析 204.2.1 问卷结果统计 204.2.2 问卷结果分析 264.3难度公式初探 294.3.1 理论上的难度公式 294.3.2 软件设计中的难度公式 30第五章 难度度量系统设计 335.1系统设计 335.1.1 算法设计 335.1.2 相关数据库设计 345.2软件介绍 345.3软件测试及结果分析 355.3.1软件测试 355.3.2测试结果分析 375.3.3难度公式的适用性讨论 37第六章
3、 余 论 396.1本文研究的理论实践意义 396.2存在的问题与不足 396.3未来的研究 41参考文献 42附 录 45致 谢 59ContentsChapter One Introduction 11.1 Reasons for the Research 11.2 Goals and Significance of the Research 11.3 The Structure of the Present Thesis 2Chapter Two Meanings and Measuring Way of Language Difficulty 32.1 Range of the Res
4、earch 32.2 The Definition of Language Difficulty 32.3 Current Situation of Language Difficulty Research 42.3.1 Language Difficulty Research from Abroad 42.3.1 Domestic Language Difficulty Research 62.4 Ways of Measuring Language Difficulty 8Chapter Three Measuring Sentence Difficulty 93.1 Definition
5、 of Sentences Difficulty 93.2 Analysis of Sentences 93.3 Factors Which Would Affect Sentences Difficulty 103.3.1 Internal Factors 103.3.2 External Factors 133.4 Factors Which Would Produce an Effect on Measuring Sentences Difficulty 143.4.1 Aspect of Characters and Words 143.4.2 Aspect of Phrase 153
6、.5 Means of Measuring Sentences Difficulty 163.5.1 Experts Knowledge 163.5.2 Investigation by Doing Questionnaires 163.5.3 Checking by a Certain Software 17Chapter Four Investigation of Difficulty and the Difficulty Formula 184.1 Designation of the Questionnaires 184.1.1 The Aims of Investigation 18
7、4.1.2 Ideas for Investigation 184.1.3 The Process of Designing Questionnaires 194.1.4 Introduction of Questionnaires 194.2 Analysis about the Results of Questionnaires 204.2.1 Statistics of the Results of Questionnaires 204.2.2 Analysis about the Results of Questionnaires 254.3 The Draft of the Diff
8、iculty Formula 284.3.1 The Theoretical Difficulty Formula 284.3.2 The Formula for the Software 30Chapter Five Designation for the Measuring Sentences Difficulty System 335.1 System Designing 335.1.1 Algorithmic Gist 335.1.2 The designation of Related Corpus 345.2 Introduction of the Software 345.3 C
9、hecking the Results and Related Analysis 355.3.1 Checking the Results by Software 355.3.2 Analysis of the Results 365.3.3 Discussion of the Formulas Adaptability 36Chapter Sixth Conclusion 376.1 Theoretical and Practical Significance of the Paper 376.2 Week Points and Limitations 386.3 Further Resea
10、rch 39References 40Appendixes 42Acknowledgements 56第一章 绪 论随着学习汉语的热潮席卷了全世界,对外汉语教学的各个方面的成果层出不穷。其中,有部分学者把目光投向了对外汉语教材的编写上面。毋庸置疑,对外汉语教材的质量对于对外汉语教学的效果起到了一个很重要的作用。而教材质量的一个重要参数教材难度是否合适又成了近年来学者们研究的一个热点。国内学者在引进西方的语料难度研究的基础上,开发出了若干针对汉语的语料难度度量方法。也有少数学者更深入一步,研究影响句子理解的各项因素。本文正是在此基础上,论述对于句子难度度量的理解和研究。1.1选题缘由如果阅读材料
11、与读者的阅读能力不匹配,就会引发各种矛盾:太难的阅读材料会超出人的信息加工系统能力,使阅读者丧失成就动机,太简单的材料则会使读者感觉乏味,没有继续阅读的兴趣。而有效地衡量阅读材料的难易程度,为读者找到合适难度的阅读材料可以解决这一矛盾。在阅读相关语言难度度量研究文献的基础上,笔者发现绝大多数的语言难度的度量都是站在篇章级别的角度来研究语言难度,比如研究教材的语言难度、文本的语言难度等,但是缺少语篇的基本组成部分句子的难度度量研究。为此,本文在学习已有的对于篇章级别语言难度度量研究的基础上,通过分析句子本身的特点,运用问卷调查、对比分析等方法,展开了句子难度度量的研究。1.2研究目的及意义句子是
12、组成篇章的基本单位。目前有很多有关教材难度的研究,都把句子的长度、使用简单句还是复杂句等作为重要的考察因素。他们测量的变量不外乎词汇难度和句子难度。从这个意义上说,考查句子难度,实际上也就是从微观的、更精细的角度来考察语料的难度。而目前的现状是,学者们考察句子中的超纲字、词、短语等,都是站在篇章的角度从总体的数量上的角度来考察,而没有把它们作为句子的组成部分来考察,更没有把特定的句子作为一个完整的单位来考察。对单个句子的考察有助于我们更精细的考察教材的难度。此外,对句子难度的考察也有助于语文教学。分析学生作文中的句子难度可以考察出该学生对于语言的运用能力。同样的,对句子难度的考察还可以服务于高
13、考作文的评卷工作和HSK中的作文评卷工作等。承上所述,本文研究的对象是句子的难度,目前对于该项研究的资料还很少,涉及该项研究的人员也很少。本研究希望在对句子分析、难度分析及结合调查问卷的基础上,得出适合度量句子难度的公式和成型的软件,对语言能力、语料难度的自动评测有所帮助。1.3本文结构本文在引介国内外对于语料难度研究的基础上,提出句子难度度量的意义、手段和方法,通过对调查问卷的结果分析得出初步的句子难度公式,并依此设计出句子难度度量软件。本文共分六章,前面三章从理论上讨论了语料难度度量的研究现状和方法,指出句子难度度量的研究目前还比较稀缺,接着从句子本身出发指出影响句子理解的各个要素。第四章
14、以调查问卷的形式对影响句子理解的若干关键要素进行调查,通过对句子学习较敏感的国内五年级学生和厦门大学海外教育学院的初中级留学生所作的调查问卷的反馈和对比,总结了国内小学生和国外留学生学习句子时的难点及异同点。在此基础上,初步提出一套句子难度度量公式。第五章在第四章所总结的影响句子理解的各要素的基础上,设计一套句子难度度量软件,并分析该公式和该软件的作用和局限性。第六章总结和分析本文的研究所得,在对本文做了一个整体的概述后指出了本文的研究的局限性以及将来可以扩展研究的内容,之后的内容是参考文献、附录和致谢,全文到此结束。第二章 语言难度及其度量我们在学习语言的过程中,很自然的会在头脑中形成某一个
15、句子是否容易理解的初步印象,并由此可以比较出两个句子的难易,通常这种判断是一种笼统的思维活动的结果,我们并不能很清楚的说出这种判断的依据。而语言难度的客观度量,则将这种对语言难度的感性认识上升到了理性认识。语言难度对于作者和读者都具有十分重要的意义:作者写作时需要考虑到读者的语言能力水平,而读者会根据自己的语言能力水平选择合适的阅读材料,这两个过程都离不开对语言难度的考察。2.1研究对象的界定本论文的研究对象是现代汉语书面语中单句的难度。现代汉语书面语中的单句是汉语发展史上最为简单易懂的句子。我们知道,现代汉语比古代汉语直白易懂,而书面语又不像口语那样灵活多变,它有一定的语法规范性,容易入手;
16、并且单句是复句的组成基础,是文字表达的基本单元。因此,现代汉语书面语中单句的句子难度度量研究是一项基础性而又富有意义的工作。2.2本研究中的语言难度的定义难度,通俗的说,指的是不容易达到的程度。现代汉语词典(商务印书馆,2002年增补本)中关于难度的定义是:工作或技术等方面困难的程度。与之类似的说法有难度系数,在08年奥运会的跳水等项目的直播过程中,播音员口中经常出现如“这套动作的难度系数是(省略部分为数字)”等话语,这里的难度系数是难度的具体数据体现。不同的难度系数满分值不一样,有的是1,有的是3,有的是5,等等。通常我们所说的“难度”指的是“困难的程度”,有时候也指的是其具体数据体现形式难
17、度系数。语言难度,顾名思义,指的是人们对语言材料理解的困难程度。与之相对的说法有易读性或易读度,也有人称之为可读度,语言材料容易理解的程度。语言的难度和易读度是两个相对立的概念,简单的说,难度=1易读度(设定难度和易读度和为1)。本文的研究中只考虑语料的内容本身,针对清晰的而非辨认困难的语料。在阅读该语料时,也假定阅读者不受周围环境的影响;本文讨论的语言难度,仅仅针对因为构成语料本身的字、词、短语、句子、段落等对阅读者造成的影响。语料难度的重要性在各种语言测试中的作用尤为突出。比如全国普及的各种英语等级考试、普通话测试等。因为各种考试所用的语料都需要经过精心挑选,所选的语料的难度也必须合乎一定
18、的要求。2.3语言难度的研究现状2.3.1国外关于语言难度度量的研究语料难度的度量研究最先起源于国外,国外学者们的研究主要集中在两个方面:一是研究究竟哪些因素与语料的难度有关系,另一方面就是如何去测定这些因素对语料难度的影响。相关的研究成果很多,Flesh,Betts等人都对此做出了重要的贡献。广为人知的Flesch公式(1948)是最为常见的易读性公式之一,它采用的变量适用于评判成人阅读语料。该公式是:阅读难易度(Reading Ease Score)=206.835(0.846每100词所含音节数)(1.015每句平均词数)贝茨(Betts,1949)发现影响难度的因素主要有:每个句子的平
19、均单词数、简单句数、介词短语数、不同词的百分比、不常见词数、以某些字母开头的词数、多音节词数、形容词和副词数、人称代词及其他具有人称指称性质的词数等。他认为含有许多不常见的词、不同的词、多音节词、介词短语以及复杂的长句的阅读材料通常难度较大,而含有经常性的人称指代、较大比例的常用词和短句的材料则难度较小。亨特(Kellogg WHupt)在1965年提出“可终止的最小单位”(minimal-terminable-unit)的长度是衡量句法复杂程度(syntactic complexity)和成熟程度(maturity)的标准。这个标准后来被广泛接受,称作“T单位标准”(T-unit Measu
20、re)。这里的T单位,对应到汉语中其实就是一个完整的小句。其他学者还发现T单位的长短和文体大有关系。论说文(argument)中的T单位最长,然后依次是说明文(exposition)、记叙文(narration)和描写文(description)。那么,T单位的长短当然也其实体现了句子的长短。德尚和史密斯( Dechant,E. V. & Smith,1961/1977)在分析了各种易读性公式所涉及的因素之后指出,一般来讲,阅读材料的易读性受以下各因素的影响:词长、不同词的比例、句长、人称代词、音节数、代词数、词缀数、介词短语数、依据词汇表所确定的难词数、使用简单句还是复杂句、事实密度及其不常
21、见性、插图数目、趣味性及写作目的、概念负载量词汇的抽象程度、材料的组织及印刷版式、内容之间的相互关系等。1977年美国拉格斯大学(Rutgers University)阅读中心的爱德华弗莱(Edward B Fry)在他所著的初级阅读教学中首次公开了一种用句长和音节数来衡量阅读难度的方法。他在对美国从小学到大学使用的一千多种教材进行分析研究后认为:英语的难度主要取决于句子的长短和句子中音节的多寡。如果句子长而单词的音节数多,难么一般来说,这样的句子难度就大。反之,句子短而且音节数少,那么这样的句子难度就小。他设计了一个阅读难度评估指示图来衡量阅读难度。爱德华弗莱所提出的句子的长度和音节数对阅读
22、理解的重要影响作用后来被许多学者所证实。主要原因在于:一是英语中单音节词和双音节词占多数。二是学者们研究发现,人们所能接受的容易理解的句子长度是有一定限度的。无论是Flesch公式,还是后来提出的T单位标准抑或是爱德华弗莱提出的“句长-音节数”测量法,都存在一定的缺陷。他们提出的测量变量无外乎词汇难度的句子数、句子长度等因素,缺少对句子更深层次的挖掘。有的文章句子并不长,单词音节也不多,但是由于文化、社会等因素使得对它们的理解存在困难。而这是以上方法都不能解决的。除了材料本身的性质与阅读难度高度相关外,学者们还发现阅读者的主观性和周围环境也对阅读难度产生一定的影响。同一份材料,对其熟悉的人阅读
23、起来明显比对其不熟悉的人要容易;而良好的阅读环境和清晰的阅读材料也明显比不合适阅读的环境(如嘈杂的公交车上)和不甚清晰的阅读材料更加适合阅读,在一定程度上降低了阅读难度。2.3.2国内关于语言难度度量的研究我国学者在引进了国外学者的理论和方法的基础上,结合汉语的特点,提出了一些新的理论和测量方法。为了本研究的需要,根据语料的层次性,可以把语料分为篇章级和篇章级以下(段落和句子)两个层次。目前对第一个层次的语料难度的研究比较多。比如教材的难度、文本的难度。“从语言本身来看,决定语篇难度的主要因素是语法复杂度和词汇难易度。语法复杂度的显著标志是句子的长度。句子越长其语法结构一般就越复杂。”学者李绍山在易读性研究概述中指出,考察语料易读性时,当词汇难度与句法难度分别考虑时,前者尤其是词频是一个更好的预测变量;一个句
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1