句子难度度量研究Word文档格式.docx

上传人:b****6 文档编号:21347821 上传时间:2023-01-29 格式:DOCX 页数:61 大小:83.53KB
下载 相关 举报
句子难度度量研究Word文档格式.docx_第1页
第1页 / 共61页
句子难度度量研究Word文档格式.docx_第2页
第2页 / 共61页
句子难度度量研究Word文档格式.docx_第3页
第3页 / 共61页
句子难度度量研究Word文档格式.docx_第4页
第4页 / 共61页
句子难度度量研究Word文档格式.docx_第5页
第5页 / 共61页
点击查看更多>>
下载资源
资源描述

句子难度度量研究Word文档格式.docx

《句子难度度量研究Word文档格式.docx》由会员分享,可在线阅读,更多相关《句子难度度量研究Word文档格式.docx(61页珍藏版)》请在冰豆网上搜索。

句子难度度量研究Word文档格式.docx

1.1选题缘由1

1.2研究目的及意义1

1.3本文结构2

第二章语言难度及其度量3

2.1研究对象的界定3

2.2本研究中的语言难度的定义3

2.3语言难度的研究现状4

2.3.1国外关于语言难度度量的研究4

2.3.2国内关于语言难度度量的研究6

2.4现阶段语言难度度量方法8

第三章句子难度度量9

3.1句子难度定义9

3.2句子分析9

3.3影响句子难度的因素10

3.3.1内部因素10

3.3.2外部因素13

3.4难度度量因素分析14

3.4.1字、词层面14

3.4.2短语层面15

3.5度量句子难度的手段和方法15

3.5.1主观经验15

3.5.2问卷调查16

3.5.3软件验证16

第四章难度度量调查及度量公式17

4.1问卷设计17

4.1.1调查目的17

4.1.2设计思想17

4.1.3问卷形成18

4.1.4问卷说明19

4.2问卷统计及分析20

4.2.1问卷结果统计20

4.2.2问卷结果分析26

4.3难度公式初探29

4.3.1理论上的难度公式29

4.3.2软件设计中的难度公式30

第五章难度度量系统设计33

5.1系统设计33

5.1.1算法设计33

5.1.2相关数据库设计34

5.2软件介绍34

5.3软件测试及结果分析35

5.3.1软件测试35

5.3.2测试结果分析37

5.3.3难度公式的适用性讨论37

第六章余论39

6.1本文研究的理论实践意义39

6.2存在的问题与不足39

6.3未来的研究41

参考文献42

附录45

致谢59

Contents

ChapterOneIntroduction1

1.1ReasonsfortheResearch1

1.2GoalsandSignificanceoftheResearch1

1.3TheStructureofthePresentThesis2

ChapterTwoMeaningsandMeasuringWayofLanguage

Difficulty3

2.1RangeoftheResearch3

2.2TheDefinitionofLanguageDifficulty3

2.3CurrentSituationofLanguageDifficultyResearch4

2.3.1LanguageDifficultyResearchfromAbroad4

2.3.1DomesticLanguageDifficultyResearch6

2.4WaysofMeasuringLanguageDifficulty8

ChapterThreeMeasuringSentenceDifficulty9

3.1DefinitionofSentencesDifficulty9

3.2AnalysisofSentences9

3.3FactorsWhichWouldAffectSentencesDifficulty10

3.3.1InternalFactors10

3.3.2ExternalFactors13

3.4FactorsWhichWouldProduceanEffectonMeasuringSentencesDifficulty14

3.4.1AspectofCharactersandWords14

3.4.2AspectofPhrase15

3.5MeansofMeasuringSentencesDifficulty16

3.5.1Experts’Knowledge16

3.5.2InvestigationbyDoingQuestionnaires16

3.5.3CheckingbyaCertainSoftware17

ChapterFourInvestigationofDifficultyandtheDifficulty

Formula18

4.1DesignationoftheQuestionnaires18

4.1.1TheAimsofInvestigation18

4.1.2IdeasforInvestigation18

4.1.3TheProcessofDesigningQuestionnaires19

4.1.4IntroductionofQuestionnaires19

4.2AnalysisabouttheResultsofQuestionnaires20

4.2.1StatisticsoftheResultsofQuestionnaires20

4.2.2AnalysisabouttheResultsofQuestionnaires25

4.3TheDraftoftheDifficultyFormula28

4.3.1TheTheoreticalDifficultyFormula28

4.3.2TheFormulafortheSoftware30

ChapterFiveDesignationfortheMeasuringSentencesDifficultySystem33

5.1SystemDesigning33

5.1.1AlgorithmicGist33

5.1.2ThedesignationofRelatedCorpus34

5.2IntroductionoftheSoftware34

5.3CheckingtheResultsandRelatedAnalysis35

5.3.1CheckingtheResultsbySoftware35

5.3.2AnalysisoftheResults36

5.3.3DiscussionoftheFormula’sAdaptability36

ChapterSixthConclusion37

6.1TheoreticalandPracticalSignificanceofthePaper37

6.2WeekPointsandLimitations38

6.3FurtherResearch39

References40

Appendixes42

Acknowledgements56

第一章绪论

随着学习汉语的热潮席卷了全世界,对外汉语教学的各个方面的成果层出不穷。

其中,有部分学者把目光投向了对外汉语教材的编写上面。

毋庸置疑,对外汉语教材的质量对于对外汉语教学的效果起到了一个很重要的作用。

而教材质量的一个重要参数——教材难度是否合适又成了近年来学者们研究的一个热点。

国内学者在引进西方的语料难度研究的基础上,开发出了若干针对汉语的语料难度度量方法。

也有少数学者更深入一步,研究影响句子理解的各项因素。

本文正是在此基础上,论述对于句子难度度量的理解和研究。

1.1选题缘由

如果阅读材料与读者的阅读能力不匹配,就会引发各种矛盾:

太难的阅读材料会超出人的信息加工系统能力,使阅读者丧失成就动机,太简单的材料则会使读者感觉乏味,没有继续阅读的兴趣。

而有效地衡量阅读材料的难易程度,为读者找到合适难度的阅读材料可以解决这一矛盾。

在阅读相关语言难度度量研究文献的基础上,笔者发现绝大多数的语言难度的度量都是站在篇章级别的角度来研究语言难度,比如研究教材的语言难度、文本的语言难度等,但是缺少语篇的基本组成部分——句子的难度度量研究。

为此,本文在学习已有的对于篇章级别语言难度度量研究的基础上,通过分析句子本身的特点,运用问卷调查、对比分析等方法,展开了句子难度度量的研究。

1.2研究目的及意义

句子是组成篇章的基本单位。

目前有很多有关教材难度的研究,都把句子的长度、使用简单句还是复杂句等作为重要的考察因素。

他们测量的变量不外乎词汇难度和句子难度。

从这个意义上说,考查句子难度,实际上也就是从微观的、更精细的角度来考察语料的难度。

而目前的现状是,学者们考察句子中的超纲字、词、短语等,都是站在篇章的角度从总体的数量上的角度来考察,而没有把它们作为句子的组成部分来考察,更没有把特定的句子作为一个完整的单位来考察。

对单个句子的考察有助于我们更精细的考察教材的难度。

此外,对句子难度的考察也有助于语文教学。

分析学生作文中的句子难度可以考察出该学生对于语言的运用能力。

同样的,对句子难度的考察还可以服务于高考作文的评卷工作和HSK中的作文评卷工作等。

承上所述,本文研究的对象是句子的难度,目前对于该项研究的资料还很少,涉及该项研究的人员也很少。

本研究希望在对句子分析、难度分析及结合调查问卷的基础上,得出适合度量句子难度的公式和成型的软件,对语言能力、语料难度的自动评测有所帮助。

1.3本文结构

本文在引介国内外对于语料难度研究的基础上,提出句子难度度量的意义、手段和方法,通过对调查问卷的结果分析得出初步的句子难度公式,并依此设计出句子难度度量软件。

本文共分六章,前面三章从理论上讨论了语料难度度量的研究现状和方法,指出句子难度度量的研究目前还比较稀缺,接着从句子本身出发指出影响句子理解的各个要素。

第四章以调查问卷的形式对影响句子理解的若干关键要素进行调查,通过对句子学习较敏感的国内五年级学生和厦门大学海外教育学院的初中级留学生所作的调查问卷的反馈和对比,总结了国内小学生和国外留学生学习句子时的难点及异同点。

在此基础上,初步提出一套句子难度度量公式。

第五章在第四章所总结的影响句子理解的各要素的基础上,设计一套句子难度度量软件,并分析该公式和该软件的作用和局限性。

第六章总结和分析本文的研究所得,在对本文做了一个整体的概述后指出了本文的研究的局限性以及将来可以扩展研究的内容,之后的内容是参考文献、附录和致谢,全文到此结束。

第二章语言难度及其度量

我们在学习语言的过程中,很自然的会在头脑中形成某一个句子是否容易理解的初步印象,并由此可以比较出两个句子的难易,通常这种判断是一种笼统的思维活动的结果,我们并不能很清楚的说出这种判断的依据。

而语言难度的客观度量,则将这种对语言难度的感性认识上升到了理性认识。

语言难度对于作者和读者都具有十分重要的意义:

作者写作时需要考虑到读者的语言能力水平,而读者会根据自己的语言能力水平选择合适的阅读材料,这两个过程都离不开对语言难度的考察。

2.1研究对象的界定

本论文的研究对象是现代汉语书面语中单句的难度。

现代汉语书面语中的单句是汉语发展史上最为简单易懂的句子。

我们知道,现代汉语比古代汉语直白易懂,而书面语又不像口语那样灵活多变,它有一定的语法规范性,容易入手;

并且单句是复句的组成基础,是文字表达的基本单元。

因此,现代汉语书面语中单句的句子难度度量研究是一项基础性而又富有意义的工作。

2.2本研究中的语言难度的定义

难度,通俗的说,指的是不容易达到的程度。

《现代汉语词典》(商务印书馆,2002年增补本)中关于难度的定义是:

工作或技术等方面困难的程度。

与之类似的说法有难度系数,在08年奥运会的跳水等项目的直播过程中,播音员口中经常出现如“这套动作的难度系数是……(省略部分为数字)”等话语,这里的难度系数是难度的具体数据体现。

不同的难度系数满分值不一样,有的是1,有的是3,有的是5,等等。

通常我们所说的“难度”指的是“困难的程度”,有时候也指的是其具体数据体现形式——难度系数。

语言难度,顾名思义,指的是人们对语言材料理解的困难程度。

与之相对的说法有易读性或易读度,也有人称之为可读度,——语言材料容易理解的程度。

语言的难度和易读度是两个相对立的概念,简单的说,难度=1﹣易读度(设定难度和易读度和为1)。

本文的研究中只考虑语料的内容本身,针对清晰的而非辨认困难的语料。

在阅读该语料时,也假定阅读者不受周围环境的影响;

本文讨论的语言难度,仅仅针对因为构成语料本身的字、词、短语、句子、段落等对阅读者造成的影响。

语料难度的重要性在各种语言测试中的作用尤为突出。

比如全国普及的各种英语等级考试、普通话测试等。

——因为各种考试所用的语料都需要经过精心挑选,所选的语料的难度也必须合乎一定的要求。

2.3语言难度的研究现状

2.3.1国外关于语言难度度量的研究

语料难度的度量研究最先起源于国外,国外学者们的研究主要集中在两个方面:

一是研究究竟哪些因素与语料的难度有关系,另一方面就是如何去测定这些因素对语料难度的影响。

相关的研究成果很多,Flesh,Betts等人都对此做出了重要的贡献。

广为人知的Flesch公式(1948)是最为常见的易读性公式之一,它采用的变量适用于评判成人阅读语料。

该公式是:

阅读难易度(ReadingEaseScore)=206.835-(0.846×

每100词所含音节数)-(1.015×

每句平均词数)

贝茨(Betts,1949)发现影响难度的因素主要有:

每个句子的平均单词数、简单句数、介词短语数、不同词的百分比、不常见词数、以某些字母开头的词数、多音节词数、形容词和副词数、人称代词及其他具有人称指称性质的词数等。

他认为含有许多不常见的词、不同的词、多音节词、介词短语以及复杂的长句的阅读材料通常难度较大,而含有经常性的人称指代、较大比例的常用词和短句的材料则难度较小。

亨特(KelloggW·

Hupt)在1965年提出“可终止的最小单位”(minimal-terminable-unit)的长度是衡量句法复杂程度(syntacticcomplexity)和成熟程度(maturity)的标准。

这个标准后来被广泛接受,称作“T单位标准”(T-unitMeasure)。

这里的T单位,对应到汉语中其实就是一个完整的小句。

其他学者还发现T单位的长短和文体大有关系。

论说文(argument)中的T单位最长,然后依次是说明文(exposition)、记叙文(narration)和描写文(description)。

那么,T单位的长短当然也其实体现了句子的长短。

德尚和史密斯(Dechant,E.V.&

Smith,1961/1977)在分析了各种易读性公式所涉及的因素之后指出,一般来讲,阅读材料的易读性受以下各因素的影响:

词长、不同词的比例、句长、人称代词、音节数、代词数、词缀数、介词短语数、依据词汇表所确定的难词数、使用简单句还是复杂句、事实密度及其不常见性、插图数目、趣味性及写作目的、概念负载量——词汇的抽象程度、材料的组织及印刷版式、内容之间的相互关系等。

1977年美国拉格斯大学(RutgersUniversity)阅读中心的爱德华·

弗莱(EdwardB·

Fry)在他所著的《初级阅读教学》中首次公开了一种用句长和音节数来衡量阅读难度的方法。

他在对美国从小学到大学使用的一千多种教材进行分析研究后认为:

英语的难度主要取决于句子的长短和句子中音节的多寡。

如果句子长而单词的音节数多,难么一般来说,这样的句子难度就大。

反之,句子短而且音节数少,那么这样的句子难度就小。

他设计了一个阅读难度评估指示图来衡量阅读难度。

爱德华·

弗莱所提出的句子的长度和音节数对阅读理解的重要影响作用后来被许多学者所证实。

主要原因在于:

一是英语中单音节词和双音节词占多数。

二是学者们研究发现,人们所能接受的容易理解的句子长度是有一定限度的。

无论是Flesch公式,还是后来提出的T单位标准抑或是爱德华·

弗莱提出的“句长-音节数”测量法,都存在一定的缺陷。

他们提出的测量变量无外乎词汇难度的句子数、句子长度等因素,缺少对句子更深层次的挖掘。

有的文章句子并不长,单词音节也不多,但是由于文化、社会等因素使得对它们的理解存在困难。

而这是以上方法都不能解决的。

除了材料本身的性质与阅读难度高度相关外,学者们还发现阅读者的主观性和周围环境也对阅读难度产生一定的影响。

同一份材料,对其熟悉的人阅读起来明显比对其不熟悉的人要容易;

而良好的阅读环境和清晰的阅读材料也明显比不合适阅读的环境(如嘈杂的公交车上)和不甚清晰的阅读材料更加适合阅读,在一定程度上降低了阅读难度。

2.3.2国内关于语言难度度量的研究

我国学者在引进了国外学者的理论和方法的基础上,结合汉语的特点,提出了一些新的理论和测量方法。

为了本研究的需要,根据语料的层次性,可以把语料分为篇章级和篇章级以下(段落和句子)两个层次。

目前对第一个层次的语料难度的研究比较多。

比如教材的难度、文本的难度。

“……从语言本身来看,决定语篇难度的主要因素是语法复杂度和词汇难易度。

语法复杂度的显著标志是句子的长度。

句子越长其语法结构一般就越复杂。

”学者李绍山在《易读性研究概述》中指出,考察语料易读性时,当词汇难度与句法难度分别考虑时,前者尤其是词频是一个更好的预测变量;

一个句

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1