1、翻译基于语料库的词汇研究对英语学习产生了深刻的影响,而且丰富的证据证明这将会保持到可见的未来。可能最大的挑战在于如何定义在统计和分析中如何定义一个单一单词。在这个问题上的重点有重大的分歧,不仅是词汇的自我归属,并且源于教育学原理以及时间。本文调查了许多研究领域来讨论现存困境,特别注意到三个问题的与电脑加工词汇库区域。A.词汇之间的形态学关系B.同音异义和一词多义C.多字体项文章包括基于语料库的对评定文字结构的有效性建议。语料库和语料库研究对于教育理论和实践的影响同时体现在第一语言和第二语言中。(e.g. Granger et al. 2002; Hunston 2002; Nagy and A
2、nderson 1984; Nation 1990, 2001; Nation and Waring 1997; Partington 1998; Schmitt 2004; Sinclair 2004a)。可能没有其他地方比这里更有这种影响-词汇统计,词汇训练以及理论建立。比如由Nagy和Anderson在学校里出现的地标就是基于American Heritage Intermediate语料库。研究的结果对于建立Incidental Vocabulary Learning或从内容中获得对于各种泛读的流行练习的主要冲击有所帮助。由国家及相关机关研究的词汇等级是另一个语料库词汇调查使教育实践有
3、所计划的例子。在其他有所帮助的申请中,VL研究与高亮词汇相关联占据了一个十分重要的地位-导出语料库的大量数据统计需要直接的提示,因为他们占据了英语学习者学习中将会遇到的大部分词汇。支持者进一步辩解,在阅读上需要大量延展词汇量,学习者必须首先掌握这些高频率,高覆盖率词汇。否则,语料库需要的多数真正的文本由于前后文词汇理解的作用会阻止阅读者获取相应的阅读等级,以及相应理解。但是,基于相应的紧密测试,这两个有效种子实验项目模型,和语料库词汇申请,出现许多研究者为了技术和统计使语料库结构开始运转的方法。一些提高了有效性的变量,包括英语词族形态学的多面性,多重词义的影响以及英语词典中的多词项。除此之外,
4、当语料库词汇结果用于报告和支持已知研究,会另外涉及到基于研究者的词汇概念化问题,实际上与词汇的心理学上的实现有关。所有的这些词汇有效性项目对依赖于或者基于电脑编排的语料库应用词汇有着特别的影响。那些符合条件的例子包括:a.调查学习者词汇量规模;b.调查学习者词汇能力;c.调查究竟多少词汇使得学习者能够适应一门语言;(d)评估词法特点,分布,或各种书面或口头文本的密度(e.g. Gardner 2004; Hirsh and Nation 1992; Kyongho and Nation 1989;Nation 1990,2001;Nation and Kyongho 1995; Sutarsy
5、ah etal.1994 (e) 产生用于教学或信息目的一系列词汇 (e.g. Carroll etal.1971; Coxhead 2000; Francis and Kuc era 1982; Xue and Nation 1984)和(f)假设所涉及的实际词汇习得的过程(e.g. Nagy and Anderson 1984)。此外,有基于语料库的词汇研究的成果(e.g. Nagy and Anderson 1984)已被用于支持其他教育场所理论的例子(e.g. Krashen 1989,1993)。本文的目的是通过研究多个领域进行调查,以提高这道两难的应用基于语料库的词汇研究的认识,并
6、提出改善这种研究的有效性通知英语教育的建议。我的目的不是批评,而是为了提高在教育研究和实践运用语料库。对于这个讨论的读者,我想在对演讲的这些比较大的多学科小组应用词汇研究者(即那些利用语料库通知并支持第一和第二语言习得)和语料库语言学的适当领域(即那些利用语料库研究和描述语言的)之间做出明显的区别。而从后场的证明将被用于支持本研究的某些说法,我不提供对于词语构建的广泛审查在语料库语言学中。话虽如此,但是,我也想认识传统语料库语言学和语言教育的日益多孔性边界,就证明了大量的研究文章和书籍处理语料库在语言教学中的各种用途(e.g. Biber etal.2004; Granger etal.200
7、2; Hunston 2002; Hunston and Francis 1998;Nessel hauf 2003; Parting ton1 998; Schmitt 2004; Sinclair 2004a)。在这方面,目前讨论的某些方面也可能是适用的,如匹配基于语料库的词汇应用(语料库索引等),以学习者的技能语言背景,和大巨型语料库之间的词义冗余的潜在差异和较小的专业语料库,等等。最后,更多的读者提出就是讨论是那些有兴趣的语言教育工作者谁希望能够更好地了解基于语料库的词汇研究和应用其特定的教学环境(cf.Seidlhofer2002)的可能性和局限性。随着语言学习者本身,这些都是谁最有
8、可能受到了本文所讨论的景点的潜在词汇的人。批判词的构造的研究基础从调查各个领域的融合词汇和形态的研究中,基于语料库试图告知英语语言教育为其提供了评估词汇构建的基础。摆脱这些研究三个关键因素似乎是表面处理的大量应用基于语料库词汇研究:(a)在何种程度上的不同语言背景及技能水平的学习者可以进行形态学相关的词之间的连接;(b) 同音异义和一词多义的影响(c)在词汇多字项目的影响。我认为,从以上领域或在任何一个领域,或者他们可能的组合而所产生的词汇扭曲,可以在语言教学理论与实践有长期的影响。词与词之间的形态关系词目的概念在解决单词之间的形态关系,许多语料库语言学家在很大程度上依赖于引理。这是由弗朗西斯
9、和KUC时代(1982:1),为“一组词汇形式妆一样词干和属于相同的主要词语类中定义的概念,不同的只是在拐点和/或拼写。词目的例子是动词的基础形式还连同连同他们的变化形式(e.g. climb, climbs, climbing, climbed)。所有四个动词形式将根据词目Climb考虑,用大写引导实际的词目一集(cf.Stubbs2002)。然而,名词派生climber将被视为其自身的词目因为它代表了不同的词类(是名词不是动词)。这个词汇集属于名词引理climber也包括复数形式climbers,可能这两个所有格形式的climbers和climbers.。Francis and Kuc e
10、ra关于词目的定义也允许列入不规则动词形式的词汇集(e.g. went 属于 GO; ew and own属于 FLY; broke and broken 属于 BREAK; am, is, are, was, were, been, and being 属于 BE)。然而,不规则的情况下带来有关该relation-ships的心理有效性严重的窘境,即,该不透明的拼写和词目头词和词族成员之间的语音连接,一定会造成比透明的互相对应部分还不同的问题。也意味着在词目的传统定义是,词法集必须属于同一个语法类(所有名词,所有动词cf.Hunston2002)。有些语料库语言学家也做了额外的区别,而且我认
11、为,它是从应用的角度来看是一个关键的区别-除属于同一语法类之外还必须享有相同的释义(e.g.Stubbs2002)。这个定义把词目与之比肩的语义相提并论,语料库语言学家用另一个术语来形容的词形和含义之间的关系。 语义:一组共享相同的基本含义的词形(除了与该区分他们的屈折变化有关)属于相同的词语的类(Biber etal.1999:54)。而在语料库语言学的定义的讨论不是本文的目的,关键是要了解什么是不同概念化的构成词汇是如何影响应用基于语料库的词汇研究的结果和结论。首先,这将是几乎不可能达到相同的语法和类相同含义的标准在分组词语,除非有搜索者能够获得一个语法和语义标注语料库或复杂的搭配词分析程
12、序-这两者都是在他们的发展处于起步阶段(cf. Landes etal.1998; Ravin and Leacock 2000; Sinclair 2004b). 如果没有这样的资源,就像MAKE这样一个词目的机器为基础的频率计数可能会错误地计算词汇动词形式(make, makes, making, made) 与常见的名词形式(make and makesas in makes and models of cars) 动名词形式(makingas in the making of the lm) 和即使是多义动词成分短语动词像make out (makes out, making out,
13、 made out), make up (makes up, making up, make up),和make off (makes off, making off, made off ). 在这些类型的过度泛化造成词频计数的扭曲肯定会影响到旨在建立教学生词词汇研究的有效性,评估在书面和口头的文本词汇负荷。确定所述词汇需要理解的文本,等等。词族的概念关于构成词汇的概念,用于计数目的和潜在的学习目的也一直在L1和L2的教学环境中持续争论了很长时间。(Anderson and Freebody 1981; Anderson and Nagy 1992; Bauer and Nation 1993
14、; Hazenberg and Hulstijn 1996; Goulden etal. 1990; Nagy and Anderson 1984; Wesche and Paribakht 1996): 什么算作一个词语将取决于研究者的主要目的。然而,词缀和派生是词汇知识的重要元素,并与他们角色的几个问题是相当重要:以什么方式的基本或根本形式的知识与复合形式的知识相关?将条目从概念上有组织的个人字典,使得知道的复合词的概率是相同的,知道其所有的词族成员,包括基本形式?或者是知道的化合物的特定的复合元素的频率的某种组合的机会?多少是从研究中获得到这些问题在这个广泛的一些词汇所面临的研究者关注的
15、形态特征,专家们将形态和学习者的潜能知识和频率的问题搭配。虽然有可能是一般的强的原因分析词族的频率,而不是单个单词的各种形式的频率,也有证据表明,在图形相似性和意义的冗余,词级形态的关系有不同程度的透明度,因此在多大程度上到不同年龄,不同语言背景的学习者都能够相关联的单词(Nagy etal.1993)。鉴于屈折和派生词缀在英语多产性质,(i.e 附着的形式多于四比一的基本形式Cunningham1998)。这也就难怪,词汇的研究人员已经确定词的构建上有困难,在一个极端,我们也许会只计算独特的拼写,因为这是在美国传统中级(AHI)语料库的情况(Carroll etal.1971)。这就完全避免
16、了形态词缀的作用,但它失去了很大的心理有效性。例如,它是极不可能的,在第三至第九级普通读者(该AHI研究的重点)会看到boy and boys, or between walk and walks.的联系。在另一个极端,然而,可能有一种倾向,认为,无论形态分类法,我们想出来的相关的词必须与以学习者在头脑中的联系词汇有一定的相关性。这个观点鉴于多变的方向是特别有问题的,个别学习者有形态的问题,必须占的广大形态的变量。Bauer and Nation(1993:257) 提供的几个在解决这些形态变量的方法也许是最好的尝试,因为它们涉及到实际的学习知识。他们在兰开斯特 - 奥斯陆 - 卑尔根(LOB
17、)语料的分析结果,其中有搜索者认为是对“实用”,而不是“理论”目的是有用的一个七级分类方案。他们也谨慎地解释说,七个级别(下文概述)不是离散的或绝对的,而是代表可能的“步骤沿背斜”词族认同(1993:257),而某些词缀可以出现在多个级别取决于限制性的用法:Level 1:每个形式是不同的单词。这里的假设是,学习者有词与词之间的形态关系的基本概念。研究人员认为这是一个很“悲观”看法,但是当为同一词形多义被认为是 - 一个将在本文后面讨论点可能有用的假设。Level 2: 屈折后缀。在这个层面上,假定学习者不得不承认大多数语调执行“最低字形形态分析,也就是说这些后缀大致相当于那些将在语料库语言学
18、词目的分类中下降。Level 3:最经常和定期派生词缀。这个包括词缀诸如-able, -er, -ish, -less, -ly, -ness, -th, -y, non-,和un-.Level 4: 频繁,经常拼写规则词缀。鉴于有搜索者比口语更重视书面文本,这里有搜索者优先发生频率优于生产力,正字法优于音韵。在这个层面上,有搜索者发现受限制(在这种情况下,透明)使用的-al, -ation, -ess, -ful, -ism, -ist, -ity, -ize, -ment, -ous, 和in-。Level 5:这个水平增加了许多词缀是相当规则的,但它们不单独大大增加这样就使学习者增加词的
19、数量的理解(e.g.-age,-al,-an, -hood,-let, anti-, arch-,and bi-).Level 6: 频繁,但不规则的词缀。在这个水平词缀可能是在语言中相对频繁。他们没有少创建分段的主要问题他们没有少创建分段的主要问题,或者是因为它们引起总值(正字)同质异精在它们的基部(即,除了在基座部分被删除或添加需要后缀),或者因为有涉及分割它们引起的单应性矩阵的主要问题有不同的含义相同的形式。词缀在这个水平是-able, -ee, -ic, -ify, -on, -ist, -ition,-ive,-th,-y,pre-,和 re-Level 7:古典词根和词缀。在这个级
20、别属于所有经典根的比比皆是,在英语单词和它不仅发生在英语界根(如栓塞),也可作为新古典主义的化合物(如摄影)中的元素。根据Bauer and Nation。无论母语和L2环境必须被 “明确地”教这种形式。这七个级别的分类方案的一个明显的优势是词或词族可以在广泛的辩护水平下操作便于分析或是相对分析-至少根据学习者的能力联系形态学相对的词汇。根据Bauer 和 Nation这样一个框架能够估算研究的一致性在涉及词汇量,与年龄相关的形态发育,词汇存储和词典建设。然而,该框架在应用基于语料库的词汇研究的背景下有一些潜在的弱点需要进一步讨论,首先,事实上,许多在不同层面(e.g.-able,-y,-is
21、t)粘贴的形式重复表明,使用超过一定的区别(如没有词族关系与所有的词族关系,或所有的曲折变化与所有的派生变化)主要框架可能会成为极为困难,特别是如果考虑一个事实,即水平决定之前,评估形式是必要的,以确定是否一个多产的派生词缀行事透明与否。虽然这可能不是提出了一个困境包含几个不同的单词小语料库,它肯定会造成重大的障碍对于有许多不同的单词较大样本的文本。第二个有研究者倾向于将派生词缀在一起,但却忽略了没有考虑一个事实,即派生前缀和后缀派生可能会对发展的读者出现不同的学习难题(Nagy etal.1993)。例如,派生前缀往往是可释义(e.g. non-and un-in Bauer and Nat
22、ions Level 3 mean not)的,他们不改变他们被添到基础的词性(e.g. entity and nonentity 都是名词; do and undo都是动词 )。相比之下,派生后缀改变词性,另外,释义贡献许多派生后缀诸如 ment, ness, 和ish 其实并不难界定,但他们对于学习着来说难以掌握(cf. Nagy etal.1993).。第三个值得关注的是,该框架没有充分解决的的在派生形式中词干的角色。例如,研究表明,由L1学生(约9至13岁)给出的派生的定义经围绕词干本省而很少或是不注意词义的后缀(Freyd and Baron 1982; Wysocki and Je
23、nkins 1987)。在一个特定的L1研究中,Tyler and Nagy (1989)做了一些低层次的学习者的后缀知识的检测,其中研究人员归因于在研究中使用了更精确的测量工具。然而,研究人员还发现,只是在他们学会辨别词干后他们才在派生变化中学习会后缀。Hancin-Bhatt 和Nagy (1994)在196个英语西班牙语双语学生的三个年龄(大概九,十一,十三)发现学生们的低水平的后缀知识,然而,研究人员还得出结论,同源词干往往比非同源词干在后缀上得以实现,这就提示词干的性质而不是后缀是决定是否学生加词尾的主要因素。总之,这些研究结果表明,词族的心理上有效的定义应该解决涉及解决词缀的话题,
24、我将更详细讨论本条第一后面的章节中的相对贡献前语素词干图形和语义透明度问题。最后一个关切的是, Bauer and Nation的框架,像其他框架一样确定年代,似乎假设学习者的形态学相关词汇的接触和所得是某种程度上的线性关系-换句话说,语言学习者在在他们在获得曲折变化和派生变化词汇成员知识前就收获了基础词汇的知识。然而,Biemiller and Slonim (2001) 指出年幼孩子在他们收获他们的词根对应物前就可能实际上收获了许多派生形式。这个特殊的关注的问题是是否当他们最初的和扩展的接触词干可能会经过曲折变化和派生变化形式,而不是基础形式时,拥有丰富技巧和相当语言背景的学习者能否有能力
25、认知和这实用这些共同的形态学在一个词族的词干。现存的研究在这一方面表明,这样的非线性处理可以是对学习者更加困难。例如,Stahl and Shiel(1992:233) 认为,“许多儿童,特别是较差的读者,很难隔离词根”。更进一步,当指示倾向于在他们词缀之前而有利于词根的形式呈现(cf. Jiang 2000),没有办法控制这样的接触在地道的文本和自然的阅读以及会话体验中。这似乎只可能通过已经工程化语言材料和对话文本以至于控制词汇的呈现。发展的和语言背景的问题在上述讨论的问题说清楚,决定由应用语料库的研究人员进行分组,并计算基于形态学的关系的词汇,如果结果是在通知语言教学与理论建设可以真正有用
26、,必须通过学习者的差异得到锻炼。往往这样的决定是基于研究者的偏好,电脑的局限性,或方便,得到的结果往往是对于现实世界的应用过于笼统抽象。以下是已考虑有关收获的英语知识形态发育和语言背景问题的研究成果进行了简要的合成。1 学龄学习者在收获派生形态学之前收获英语曲折变化形态学知识。Berko (1958) 和Derwing和 Baker(1979)建立了第一语言孩童在派生在前学习曲折变化和合成。事实上,曲折变化的知识被假定为对于第一年级是良好的(Berko 1958)。另一方面,派生的形态学知识有时开始在四年级在前(9岁Carlisle2000;Tyler and Nagy 1989),持续在小学
27、高中年级(10到14岁,Carlisle 2000; Mahony etal. 2000; Singson etal. 2000; Tyler and Nagy1989),通过高年级(15岁至18岁),或是可能超过 (Nagy etal.1993;TylerandNagy1990)。Hancin-Bhatt和Nagy(1994) 补充说,双语儿童(大约九到十三岁)比派生变化(不同语法范畴)在屈折形式(同一语法范畴)表现更好。此外,这些调查者建议一个年龄相关的的发展模式存在于孩子们的关系中在英语和西班牙语派生词缀之间(1994:305)。然而,在形态学知识的增长与年龄关系成正面联系,所有的知识”
28、关于英语词缀和他们和西班牙语词缀的关系”,甚至在最大的孩子中,依然是相对较低(1994:306)2. 第二语言成年学习者在收获派生形态知识之前收获曲折变化形态知识。Schmitt and Meara (1997) 发现表明,成年英语学习者(95 Japanese L1)比派生动词后缀有较早和英语屈折动词后缀更深刻的认识(receptive and productive)。该研究者认为这一发现对英语屈折形态的基于规则的性质以反对英语的更奇特的派生形态派生。Schmitt and Zimmerman (2002) 发现了类似的结果在106非母语者(大学生)他们的研究,绘制了以下的教学结论:“这项研
29、究表明,教师不能想当然地认为学习者接触自动理解一个字词族的派生形式 (2000:163)。3 在语言能力的个体差异在知识形态明显变化。从Freyd和 Baron(1982)的研究结果也表明,语言能力,而不是年龄或年级的个体差异,是派生词汇知识的关键因子。他们发现,早熟的五年级(十岁)比一般的八年级学生(十三岁),在派生形态知识上展现出了更多的认识。几项研究还发现形态学的知识和卓越的阅读能力之间有很强的相关性(Carlisle 2000;Freyd And Baron 1982; Mahony etal.2000; Nagy etal.1993; Singson etal. 2000; Tyle
30、r and Nagy 1989, 1990)。这些相关性强烈建议之间存在相互关系中的两个认知能力,也就是形态知识是熟练的阅读既是一种副产品也是熟练的阅读的贡献者。4 明确的训练可以提高学习者的实用形态学知识的能力。越来越多的研究表明,学习者形态学发展可以通过直接的词根形式和他们词缀的词族成员的教学获得富有成效的提高。这个形态学的认识提高通过词汇分析技术对所有组的学习者,包括第一语言的学习者(Cunningham 1998; Stahl and Shiel 1992),第二语言学习者(Carlo etal. 2004) 和第二语言成人学习者(Mirhassani and Toosi 2000).
31、呈现出有效性。同音异义和一词多义Grabe (1991)指出词汇的聘雇经常被如下事实阻碍, “每个词汇的形式被算作一个单独的词汇,尽管在现实中,每个词汇形式可能代表许多的不同的含义,其中一些词汇很大程度取决于于阅读文本,一些在每个意义中都是相当不同的。 具有相同或相似的词汇形式间的词汇释义变异已经在语义学中讨论多年(Anderson and Nagy 1991)。在非常基础的说平上学者认同一个单独的词汇形式可以有多数的释义例如row (一排椅子) 和row (连续的船) (Goulden etal.1990: 344). 这里还承认,一个词汇的多重释义可以被清晰辨析(同音异义),就如在row的
32、例子中,或是更多地密切的关联(一词多义) : 多义词是一个词的词义的许多变体,其中很明显的词义是真正相关的。动词break 有许多不同的变体,他们都是相关联系的He broke his leg; The cup broke; She broke his heart; She broke the world record, etc. 动词put同样有一系列的同义词。同音异义(有时被称作homographs),在另一方面,是相似拼写的变异体但是这在释义上没有显著的共性。最经典的例子是单词bank,这个词可以表示金融机构银行或是河边亦或是等级或是一系列的客观事物(诸如在篮球比赛的一排座位)等。一个关于研究的核心问题是是否一词多义诸如在上文的break例子可以成为一个相同的词(是否有不变的Gesamtbedeutung 对他们进行排名)或者是否应该有些被列为单独词汇的项(Hatch and Brown 1995:49)。释义变体的潜力(同音异义和一词多义)变成更加复杂当考虑到形态学词族时。例如,呈现相关的形式通过词缀可能在文本中成为一词多义(e.g. bear, 动物的复数,and bears/bearing,动词示意味着携带),或是相同词缀形式的重复可能是一词多义的(e.g. bears, 动物复数
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1