翻译英语语料库与基于翻译英语语料库的描述性翻译研究.docx
《翻译英语语料库与基于翻译英语语料库的描述性翻译研究.docx》由会员分享,可在线阅读,更多相关《翻译英语语料库与基于翻译英语语料库的描述性翻译研究.docx(17页珍藏版)》请在冰豆网上搜索。
翻译英语语料库与基于翻译英语语料库的描述性翻译研究
翻译英语语料库与基于翻译英语语料库的描述性翻译研究
2007年第1期No.1,January2007
外国语
JournalofForeignLanguages
总第167期GeneralSerialNo.167
文章编号:
1004-5139(2007)01-0067-07
中图分类号:
H059 文献标识码:
A
翻译英语语料库与基于翻译英语语料库的描述性翻译研究
陈 伟
(武汉理工大学外国语学院, 湖北430063)
摘 :
人们对于翻译文本和翻译过程总特征的探索从对翻译过程的实证研究、要发声思维的内省法、Translog法再到综合归纳和演绎的方法经历了几个发展阶段,这为后来建立翻译语料库来分析译文特征奠定了方法论基础。
多元系统理论学家的倡导和发展描述性研究方法与MonaBaker对翻译总特征的系统研究促成了翻译英语语料库的诞生。
本文介绍了翻译英语语料库的建立及其主要特征,回顾了基于翻译英语语料库的描述性翻译研究,并对翻译英语语料库的应用潜力进行了概括性的分析。
关键词:
翻译英语语料库;描述性翻译研究;翻译过程;翻译文本;翻译总特征
(SchoolofForeignLanguages,WuhanUniversityofTechnology,Hubei430063,China)
研究历时已久。
从二十多年前对翻译过程的实证研缩写为TAP)的内省法(introspection),再到后来让电脑软件记录译者使用文字处理器时手指敲击键盘的情况来反映译者思维痕迹的Translog法①,其宗旨无
究(empiricalstudy)到发声思维(think2aloudprotocol,
3本文作者衷心感谢中国留学基金委提供留学基金资助。
本文作者在英国曼彻斯特大学翻译与跨文化研究中心访学期间得到了该中心主任MonaBaker教授和MaeveOlohan博士的支持和帮助,在此一并致以诚挚的谢意。
① 具体使用方法参阅Translog网站http:
//www.translog.dk.② Bell(1991:
29)所说的归纳法(induction)是指从翻译文本(translationproduct)来推理翻译过程(translationprocess)的情况;至于演绎(deduction)则指使用日记等内省材料(introspectivedata)来说明一些现象。
Abstract∶Theexplorationofuniversalfeaturesoftranslationwiththeempiricalstudyoftranslationprocess,think2aloudpus2basedtranslationstudiesTheemergenceofTranslationalEnglishCorpus(TEC)wastriggeredbytheincentive.tivetranslationstudiesandproposesthepotentialwaysofexploitingthiscorpusresource.lationproduct;universalfeaturesoftranslation
1.引言
protocol,Translogandthecombinationofinductionanddeductionhasestablishedamethodologicalfoundationforcor2suggestionsofdescriptivetranslationstudiesbypolysystemstheoristsandbyMonaMaker’systemicstudyofuniversalsfeaturesoftranslation.ThispaperdiscussesthecompilationofTECanditsmajorfeatures,reviewsTEC2baseddescrip2Keywords∶TranslationalEnglishCorpus(TEC);descriptivetranslationstudies(DTS);translationprocess;trans2
人们对于翻译文本和翻译过程总特征的探讨和
?
1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.
TECandTEC2basedDescriptiveTranslationStudies
CHENWei
非是想研究和解释翻译过程中的认知特点。
后来
Bell[1∶-39]提出通过综合归纳(induction)和演29
绎(deduction)的方法②来研究译文,即通过分析译文来找出翻译文本的一些基本特征[2∶]。
与此同38
Toury和AndréLefevere等人提倡改用描述性研究方
时,多元系统理论学家如ItamarEven2Zohar,Gideon法(descriptiveapproach)[3∶-653],他们也相继652
3
67
促进了描述性翻译研究(descriptivetranslationstudies,简称为DTS)理论的发展[4∶]。
Stubbs在文中也109明确提到采用这种研究方法的优势,她认为:
如果我们研究词频(frequency)和典型性(typicality)、事例
(instances)和规范(nors)之间的关系,我们就能通m
TEC的基本框架结构是Baker教授1995年首次提出
的,但是其具体设计原则在Laviosa-Braithwaite
⑤(1996)[9]和(1997)的论文中才阐述清楚。
TEC是当今翻译英语语料库,也是世界上首个
这种类型的语料库,由MonaBaker教授负责建造和管理,该项目得到英国科学院(theBritishAcademy)的基金资助,开始于1996年,1999年用户可在线浏览免费使用⑥,客户端处理语料库的Java程序可从网上免费下载⑦,该程序是由都柏林三一大学(Trini2
tyCollegeDublin)的SaturninoLuz博士设计的,目前
过这些翻译过程中有意或无意表露出来的特点,分析其过程中所隐含的、为常人所知的特征[5∶不
151]。
那么,什么是描述性翻译研究?
它与传统的
规范性翻译研究到底有何不同之处?
林克难[6∶]引述MariaTymoczko的观点说:
43规范性翻译理论根源在于把翻译看作一种纯粹的语言艺术,用一些超越时间的语言规则来加以考察,带有很强的局限性。
而描写性翻译研究则在研究翻译的过程、产品③以及功能的时候,把翻译放在时代之中去研究。
也就是说,它根本不关心传统翻译理论中带有二元对立关系的直译和意译,而是把翻译语境化(contexualization),从政治、意识形态、经济、文化等宏观的角度去解释翻译现象,同时描述翻译中存在的概然性法则(probabilistictranslationlaws)[4∶
124]。
描述性翻译研究方法和理论的确立和完善为
他本人也在负责该语料库的技术维护。
2.2TEC的主要特征
TEC的语料由欧洲和欧洲以外的一些语种的公
开发行出版物未经过任何删改译成英语的文本组成,译文的源语包括法语、德语、西班牙语(包括西班牙的国语、南美洲和中美洲的西班牙语)、葡萄牙语
(包括葡萄牙本国和巴西的葡萄牙语)、意大利语、威
尔士语、波兰语、阿拉伯语、汉语、希伯来语、泰语和泰米尔语等。
TEC文本译者都是以英语为母语的年以后翻译的,代表了当代英语译文的一般特征
[10]。
文本范畴有四种:
传记、小说、报纸和飞机上
人,译者中男女性别都有,而且多数文本都是1983
后来建立翻译语料库来分析译文特征打下了方法论基础。
在长期的翻译实践和翻译学术研究中,Mona
Baker[7∶-177]发现在翻译文本中存在一些显176
著的特征?
?
?
明朗化(explicitation)、简略化(simpli2
fication)、规范化(normalization)和中性化(levellingout),她认为这些特征可能与某种语言的具体特点
有关。
因此她[7∶]提出了大胆的论断:
使用可比176语料库(comparablecorpus),通过比较翻译文本与非翻译文本的方法,我们不仅可以搞清楚这些翻译文
translation),而且还可研究那些隐含的、译者本人在
(本和翻译过程的“翻译总特征”universalfeaturesof
使用语言时无意识地表现出来的一些特点。
[2∶]37
tionalEnglishCorpus,简称为TEC)。
于是她就开始着手筹建翻译英语语料库(Transla2
2.翻译英语语料库的筹建及其主要特征
2.1翻译英语语料库的筹建MonaBaker教授是英国曼彻斯特大学语言、语言
学和文化学院翻译与跨文化研究中心(CTIS)④的主任,她在提出可以使用翻译语料库和非译文的可比语
料库研究翻译的观点之后,同她当时的博士生Sara
Laviosa一起开始设计和编写翻译英语语料库。
[8]
68
?
1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.
的休闲杂志(in2flightmagazines)。
其中,80%以上的内容是小说,小说和飞机上的休闲杂志这两方面的
Olohan[2∶]在书中介绍说,一旦获得其它的文本60up)之后就可继续增加新的翻译文本。
③这里的翻译产品指翻译文本。
内容约占95%。
至今为止,其库容为1000万词次。
版权许可,扫描、编辑和简单的标注(minimalmark2为了能进行深层次的译文特征研究,TEC的建设者们对它进行了标注,标注有两种形式:
文本标注和
④CTIS原来属于UMIST的语言工程系,2003年迁到曼彻斯特大学,2004年10月1日曼彻斯特大学与UMIST合并成立新的曼彻斯特大学。
⑤网页上的介绍参照以下网址http:
//paginaspersonales.deusto.es/abaitua/konzeptu/htxt/ht_lib.ht。
m⑥TEC的原来网址为http:
//www.ctisumistac.uk,现..在的网址为http:
//www.artman.ac.uk/S/ctis/research/,或.ML者http:
//ronaldo.cstcd.ie/tec/。
.⑦TEC浏览器的应用程序作了不少改进,MonaBaker教授给Ouadoud答复的一封电子邮件上提到详细的改进情况,Ouadoud把它发在TranslatorsCafécom网站的论坛上,具.体参阅http:
//www.translatorscafe.com/cafe/MegaBBS/thread-view.asp?
threadid=615&posts=
1。
元数据标注。
对于翻译文本,TEC只是做了简单标注,其目的是确保翻译文本自身的整体性(integrity),对于编辑提示和前言等非翻译部分(non2translated
material),尽管也作了标注,但在数据库索引程序中,
文学分库与BNC的文学体裁分库对say/tell+比,TEC里that使用得较多。
Burnett(1999)检查了TEC和BNC里的一些其他类似的动词,Olohan[13]分析了动词promise+that结构,其结果也大体相同。
(2)Olohan[13∶-432]对TEC和BNC中其423
ωthatλ这种结构进行了量化研究,她们发现:
与BNC相
对于这种与译文本身的相关信息他们作了特殊处理,因此它们被隐含起来,不会在索引词条或词频表中出现⑧。
出于研究的需要
guisticfeatures):
译者的姓名、性别、国籍、职业、翻译
的方向、译文的源语、出版社/商名、文本的范畴和字数、原文作者姓名、性别、国籍、地点和年代等。
这些采用XML标码,与目前世界上通行的TEI或元数据标码(metadatascheme)等标注法则不一致,这些标注支持以下一些方面的翻译研究,如比较实词/虚词
ratio)、句长、词语搭配规律、具体词语在男女不同译
是以独立的文本附加信息(headerfile)形式标注的,
比率(lexicaldensity)⑨、类符/形符比率(type/token者译文中的使用频率,同一分库中译自不同源语的译文差异和具体译者的翻译特点等。
[11]到目前为止,TEC客户端浏览器的主要功能有:
一般句法查询、设定不同参数查询、词频显示、左右跨距(span)为±的索引行搭配及其排序、6显示扩展语境、保存检索结果等。
限于篇幅,对于TEC的特点我们将另文介绍。
3.基于TEC的描述性翻译研究回顾
译研究集中在研究译文与原文的词法和句法特征差异上,如:
明朗化、简略化和规范化[10]。
然而,根据我们现已掌握的资料显示,如果按照是否参照其他现成语料库作为对比研究的标准,这些基于TEC的
υCorpus)λ的子库一起进行译文与自然语言的对比研
翻译研究可分为四大类:
与BNC(theBritishNational究、TEC翻译文本的特征研究、与non-TEC对TEC
?
TEC的文本对比研究λ、与CTF的并列研究。
3.1TEC与BNC的对比研究
较翻译文本和非翻译文本的特定结构(patterns)差异,因此需要一种没有译文的可比语料库,TEC的语料库设计者就是以BNC的几个子库来作为可对比和BNC子库的翻译研究。
的研究对象的[2∶]。
以下集中介绍一些基于TEC60
(1)Olohan&Baker[12∶-158]利用TEC的141
ta)详细记录了翻译文本的以下超语言特征(extralin2Olohan提到,到目前为止,大多数基于TEC的翻
由于使用可比语料库的大多数翻译研究旨在比
?
1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.
TEC的元数据(metada2
他可省性句法特征(optionalsyntacticfeatures)进行了探析,结果发现可省性句法成分翻译文本多于非翻译文本。
(3)Olohan[14∶-89]对TEC和BNC中的人59
称代词同助动词/系动词的缩写和不缩写情况进行
了统计和比较,发现人称代词I,you,he,she,we,
they在BNC分库里明显多于TEC分库。
在此之前,Olohan&Baker[12]调查了TEC和BNC的缩写情况(contractions),发现非正式文本易缩略,并且缩写形
式偏多,所以缩写形式BNC明显多于TEC。
(
4)Olohan[10]对英语方言的四个特征进行了调
查研究,这四个特征包括:
多音节修饰词的缩略(con2有地域变体(regionalvariation)的方言或社会方言的缩
(5)Hansen-Schirra[15]把TEC中记叙性文体
略。
结果发现:
它们在BNC出现的频率明显高于TEC。
英语译文与BNC中的英语原文进行比较,结果发现非典型小说特色的名词化现象(nominalization)在译文中比原文要多,这表明英语译文并没有符合译语规范,这使得译文名词化现象严重,从而使译文比原文更显得抽象、难懂。
(
6)Olohan[2∶-108]使用TEC和BNC中的104
语料对翻译中可省性句法词语(optionalsyntacticele2
ments)的几种情况首次进行定量分析,这几种情况
包括:
类符/形符比率、关系代词的省略、秃头不定式
Luz20
04。
Baker(1995:
237;2
43)。
υλ?
λ
BNC的网址为htttp:
//www.bnc.orguk。
.尽管BNC和下面提到的CTF也属于non2TEC的范畴,但是BNC是现成语料库,而这里所说的non2TEC是指根据研究需要,研究者自己建的非TEC英语译文语料库;而CTF是在参照TEC的基础上建立的翻译芬兰语语料库。
ωλ在这里Olohan&Baker把它称之为可省性报告词(optionalreportingword)。
tractionofmultisyllabicmodifier)、感叹词的缩略(inter2jectioncontractions)、口语中-ing,and,than的缩略、带
⑧有关TEC标注的具体细节参阅Luz&Baker2000,⑨关于实词/虚词比率的概念和具体计算方法参阅
69
(符号(complementizer)to的省略、while)+-ing和(after)+having+participle结构的省略和inorder
事结构(narrativestructure)密切相关。
(
12)Olohan[14∶-89]利用TEC小说和传记59
结构的省略。
研究结果表明:
与BNC子库相比,TEC子库通过不省略这些可选性句法词语而显示出更高频次的明朗化句法结构。
(7)Olohan[2∶108-117]在TEC小说子库(TECFIC)和BNC小说子库(BNCFI)里,通过C
子库与BNC文学体裁子库组成可比语料库来研究译文中的缩写现象(contractions),发现英语文学翻译与现代英国文学写作在缩写的多样性(variety)和频次(frenquency)上有很大的差异,并且她对缩写和非缩写形式作了功能上的描述,她还发现在不同的译文中,缩写的差别因人而异。
(
13)Olohan[2∶]认为TEC的翻译文本属于106
对-ish形式的统计分析来研究类比构词现象(lexi2
calproductivity)。
结果发现,TEC中-ish形式大多属于
颜色词(colourter的范畴,因此在源语有颜色词而译ms)语却没有这些基本颜色(non2basiccolours)的情况下,翻形式来表示颜色而不需要增加颜色同义词。
(8)Olohan[2∶-122]通过对BNCFIC和117TECFI里的颜色词的分析调查研究词语的多样性C(lexicalvariation),结果发现:
BNCFIC中颜色同义词(coloursynonyms)明显多于TECFIC的颜色同义词,
比较规范的变体(standardvariant),里面很少有方言或社会色彩语言标记语(dialectalorsocialectalmark2库文本相比较,结果发现:
TEC小说分库文本不像
BNC小说分库文本那么典型,更为奇怪的是,TEC中
3.2TEC翻译文本特征研究ers)。
她用DouglasBiber的英语分类标准(dimen2sionsofEnglish)把TEC小说分库文本与BNC小说分(
1)Laviosa[17∶-178]提到:
Hati(1999)159m(
2)Baker[18∶-266]选择TEC中英国翻译241
译的对应(mapping)就会存在一定的难度,译者通过-ish
小说带有英语学术散文(academicprose)的特点。
这表明:
相对而言,翻译文本里指代颜色的词语缺乏多样性。
(9)Olohan[2∶122-143]在Biberetal.
认为翻译中whatis“in”whatis“of”和的区别长期它可以通过语篇分析法来诠释,而“of”则指意识意义上的文本整体性(i