机器翻译的现状和未来.docx

上传人:b****6 文档编号:8407054 上传时间:2023-01-31 格式:DOCX 页数:6 大小:21.99KB
下载 相关 举报
机器翻译的现状和未来.docx_第1页
第1页 / 共6页
机器翻译的现状和未来.docx_第2页
第2页 / 共6页
机器翻译的现状和未来.docx_第3页
第3页 / 共6页
机器翻译的现状和未来.docx_第4页
第4页 / 共6页
机器翻译的现状和未来.docx_第5页
第5页 / 共6页
点击查看更多>>
下载资源
资源描述

机器翻译的现状和未来.docx

《机器翻译的现状和未来.docx》由会员分享,可在线阅读,更多相关《机器翻译的现状和未来.docx(6页珍藏版)》请在冰豆网上搜索。

机器翻译的现状和未来.docx

机器翻译的现状和未来

机器翻译的现状和未来

ternet机器翻译嚣的应用,并预测其未来的前景.从1954年第一次机器翻译试验成功到今天,机器翻译虽然没有象文字处理软件和电子表格软件那样得到广泛的应用,却一直被认为是一个大有可为的计算机应用领域.不过,它的发展并不是一帆风顺,经历了从萧条到昌盛,从昌盛到萧条的一条曲折的遭路.

六十年代是发展处于低着的十年.最初被当作计算语言学主流的经验主义方法.由于当时计算性能低,价格昂最,对计算机语言学的研究不够深入.致使其很快就走入丁一条死胡同直至七十年代.由Chomsky提出"理性主义"方法后,加上人工智能的研究进展,许多基于该方法的系统相继产生.越来越多的系统从实验研究进入丁实用研究.这些都证明了理性主义"方法强大的生命力.但传统语言学家总结出的语言规则并不是专门为自然语言处理服务的很难直接移植到机器翻译系统中来.因此t在八十年代后期,研究人员开始建立机器可读的t能够定量地,精确地描述语言的大规模语料库,在语料库的帮助下{由计算机自动对语言素材进行分析.同时.这一时期计算机性能也有了飞速的发展工作站的出现,使"经验主义"研究方法再度被提上议程到九十年代初期,一些在此基础上开发研翩的系统已经问世并且取得很大成功目前人们正在试图从两条路发展下去.一条是继续优化改进"理性主义"方法;另一条就是开发新的经验主义研究

方法为基础的系统.二者取长补短,最终必将导致两个方法的结合t这也体现丁未来的趋势.下面,我将试图从各种不同的角度更具体,详细地探讨这些问题.

现状

1.计算语言学

试图继续发展"理性主义"方法的研究人员重视加深对亡}算语言学的研究,进一步优化规则库的组成和内容,增加有关语义分析的规贝l},扩大语法分析规则的数量及深度同时另辟蹊径,考虑到近年来专家们对词汇学"的研究日渐成熟,试图从诃法的角度解决问题,已经有一些方法问世.并得到了应用.如:

"shakeandbake"方法便是其中之一.它利用源语译语间词汇的等价关系完成转换过程,而不再象停统的方法那样通过语法语义结构进行转换.另外,以前被大多数人否定的如假设检验等方法也仍在某些研究人员的重视下发展着.?

经验主义"方法的研究和应用是目前许多人感兴趣的焦点所在.其中,日本京都大学长尾真提出的基于实例的翻译方法EBMT的基本思想是利用已有的翻译结果作为今后翻译的模板.首先依据输入语句在词典中寻找相似的例子合并起来得出输出译文的结果.在EBMT方法中关键的技术在于如何通过计舅:

得出双语料库中与源语语句最相似的一些例子:

同时,如何将所得的各个例子的不同部分合并起来,这些都需要坚强的计算语言学知识作后盾.在耳前存在的各个以EBMT方法为基础开发的实用系统中,大多数都或多或少地利用丁传统"理性主

义方法中的某些思想和技术;同时,语言学知识所起的作用也十分明显.如利用传统的谮法数据库,词汇规则,知识表示等等.

另一种由WarrenWeaver和Shannon提出的以统计为基础的翻译方法(SBMT)是目前倍受重视的一

种研究方法,近几年几乎所有的国际会议都将其作为一个重点的讨论议题.SBMT方法假设规则存在于大量已有的翻译结果中可用统计方法将相应的翻译结果抽取出来.最简单的模型是只寻找在源语和译语间词与词之间的对应分配关系.其它的也有寻找短语问关系的等等SBMT方法最初的应用是由美国IBM公司PeterFBrown研制的法英翻译系统.到今天,SBMT的翻译方法已有了很大完善和改进但是,该方法存在的问题也很多,除丁需要大容量的数据库外,利用SBMT法开发的机器翻译系统都是建立在机器完垒不懂译语的前提下.这样产生的结果正确率敷低.因此,同样的,sBMT方.

?

55?

碰彩琢

磐?

一墼一

法也需要词汇,语法等语言知识的铝合.目前.SBMT方法成功的应用例子还比较少,研究人员仍处于边探索边开发的过程中

2.翻译理论

传统的直译法由于应用范围狭窄已基本被淘汰,目前大多数大规模的应用系统均采用转换法和中间语言方法作为第二代技术的转换法的基本思想是.先对源语进行分析,利用大量的转换规l幔《将分析结果转换成中间表达式,再由该中间表达式生成译文.树形图是主要针对语法分析转换的,生成后存在大量歧义,而语义网络是在深层语义分析基础上转换生成的.歧义较少.目前,大多数转换规则仍只是对语法结构进行转换,缺少深层的语义表示.所以用转换方法难以进行较探人的分析和推理另一种较新的方法是"中间语言"(interHngua)方法.被当作第三代技术,是在"独立分析和独立生成的思想下形成的.即把源语的句子变成某种知识表达形式——"中间语言",再由该表达式牛成泽语.在此,源语的分析与译语的生成完全独立.克服了转换方法缺乏深层语义分析和表示的缺靛,另外,系统设计者也不需再熟悉多种语言.只熟练掌握母语即可.但是"中间语言"方法存在着许多技术上的问题.比如:

会出现源语语句的"中问语言表达式"与译语语旬的"中间语言表达式"有时不完全等价的情况.或者一个源语语句生成多个"中间语言表达式"以厦一

个中间语言表达式语句牛成多个译语葺旬的情况等.为解决这些问题.有时不得木求助于转换方法的某些策略蒯如,在日本.多国语机器翻译系统cI—CA;项目中,采用"中间语言"方法的同时.也利用了转换规则来解决一些该方法无法解决或解决起来十分复杂的问题.

3.新的翻译领域

(1)语音翻译:

语音翻译(SpeechTranslation)是机器翻译中近几年才*起的一个较新的领域,但在美国,日本及欧洲都已得到了广泛的重视.越来越多的人力投』,到它的研究中经验表明语音技术与机器翻译的接口比预想的要简单.目前在开发研制中比较有效的方法和技术包括;规则与经验相结合的翻译方法;在深层语法及浅层语义上实行转换的方法;流水线技术;快速处理技术f高质量语音台成技术以及会话现象模型化的研究等

语音翻译已经有不步比较成功的系统问世如美国的A.rR翻译电话系统",德国的VerbmoN1.AT&T的BLAST等等.ATR在1993年已实现了在?

56?

日本,美国,德国间试验越洋电话的实时翻译目标.但是,目前系统功能较为有限,讲话内容,速度,口音等都必须限定在一定的范围内,日此,对话人时刻都能感受到该翻译系统的存在.从1993年,ATR开始了又一个七年计划,开发研制"先进的语言理解和表达"系统脚RA.集台语音识别,语言翻译和语音合成技术.扩大词汇量,克服原有系统的局限继续其在语音翻译方面的研究与应用.目前,ASURA的词典容量及语句类型都已有丁很大扩充研究人员正在努力试图提高其日前的准确率,并且降低处理时间.

目前,语音翻译还存在着不步迫切需要解决的问题.如缺步前后编辑处理工作和可视反馈,以及语法分析正确率低等,有待于今后进一步的研究和改进.

(2)以知识为基础的翻译:

这是一个较新的翻译

方法.基于该方法的系统在翻译处理过程中需要各种语言知识,包括计算语言学,语音学等.需要好计算结构和处理算法,以及语法,语义分析技术和语言生成技术等.已经开发出来的比较成功的系统有由Carnegie—Mellon大学的KANT系统等.(3)开发多国语系统中的电子字典:

多国语翻译系统与一般机器翻译系统有不同特点,其电子词典也与一般词典不大一样.近几年这方面的研究和开发有很大发展.1986年,日奉开始了?

个研究开发大规模睹子词典EDR的九年计划.研制出来的电子词典包措两个词典(基本词典20万词.专业技术词典0万词);双语字典30万词;并行字典30万词条;两个概念字典(概念分类字典4O万词条.概念描述字典40万词条)以及一个25万旬的语料库.这样开发出来的电子诃典的结构和容量都比较适应多国语翻译的要求,它包含了机器翻译过程中需要的绝大部分信息以及进行正确的语言分析和生成所需要的相关领域的知识.另外.在欧洲,ACQUILEX年口MULTILEX两个项目也正在致力于开发电子词典.AcQUILEX旨在改进开发单国语字典的技术t以建立起多匿语词法知识库.MUITILEX则研究开发多国语,多功能的词典标准等.在美国,在纽约大学的语法说明书及普林斯顿大学的概念字典WordNet的基础上开发的电子词典cOMLEx也引起了人们普遍的关注.(4)其它t另外.如口语翻译(spokelanguagetranslation),相关领域知识的研究等也都十分热门的一些新课题.

总之,近几年机器翻译的蓬勃发展,不但使翻译

水平得到大幅度提高,也扩展丁机器翻译领域昕陟及的范围在社会生活中,机器翻译开始在深度和广度上产生多方面的越来越大的影响

4,应用现状

近几年来.机器翻译得到越来越广泛的应用.国际上已商品比酌系统就有一百多个,表l列出几个较大系统的性能数据.另外,分析其产品市场,有几个明显趋势:

(1)出现大量微机上的系统:

由于移植到微机上的机器翻译系统竹格低廉,使用灵活方便.有些还采用台成语音的输出方式,致使其甩户骤然增加.例幻,IBM公司的执LMT(以逻辑为基础的机器翻译系统)移植过弃的"十人翻译器.到95年巳收到丁1000多个订单.一些英日,13英翻译系统也先后在微机上实现.LOGOSVISTA在美国卖到795美元一个专家预计到2000年,一般的机器翻译系统价格有可能为l5万美元左右而傲机上的系统将可卖到1495美元.

表1几个实用系统性能对比

PsEE日…II址ll?

埘;垂^:

1,{}JLFLI'l{?

^.10坪}

:

L一Gk^,岫m^?

?

I

j{0rf耐.z^J'^J日

1^10目

}?

s…~e-400}1&《

n,,LP~LX*?

&?

I?

日Ms删.;9

Luw^RDl

't,hlH}眦I72.1埘l?

日^:

味t

*目1w叫2甘1轴^.J3日

月^自I

同时.这些微机上的系统也不断地发展,许多巴能在Windows环境下运行.如95年上半年.Sy~tran和Intergraph先后将它们的机器翻译系统从工作站

所上移植到了Window~上,并且保持了原有系统的有处理能力和功能

(2)研制出Internet同络板翻译器:

目前,已有几个实用机器翻译系统在Internet同上实现了翻译功能.例如在日本.就有冲电机的PENSEEl/e】,】e;N0VA的Netsurfer/eJ;龟岛产业的Franpad以及高电社的Worldnet,/ej等.这类系统能使[nternet用户在E—mail和www上获得的文件是经过翻译的,不存在语言障碍,使用户更快走向世界.

Internet上的翻译器将一种语言文本翻译为另一

种语言文本.原文中的插图照片,图象等视图信息仍保持在原文中相应位置不加处理.

(3)用户多样化:

93年前,机器翻译的用户大致可分为两大类型工业需求方面要求翻译技术资料的用户以及少量零散的,偶尔使用一下的用户近几年来,尽管前者仍是机器翻译主要的服务对象,其它许多有趣的应用已经慢慢出现了特别是微机上的翻译系统出现以后,人们发现了机器翻译与手工翻译相比高效率,低成本的优点.开始将其用在日常工作学习中,太大加快了机器翻译产品的商品化速

度,也体现丁今后机器翻译的一个应用动向.二,展望和趋势

机器箭译的迅速发展使人仃l欣喜地强见到许多可喜的未来例如:

机器翻译产品进八到社会生活的各个领域,学校,图书馆,办公室以及居家住户都可以方便地用上各种类型的机器翻译系统.这些系统被发展成某种携带方便,并且十分容易掌握使用的工具,在任何时间,任何地点都能不费力地派上用场如掌式翻译机,多国语发音电子词典等等.这样一幅美好的1l!

f图是需要各方面技术的发展,集成以厦机器翻译工作者持续不断的努力才能达到的.就近期看来,机器翻译领域的研究和开发将在以下几个方面上:

(1)研制出以理性主义"与"经验主义相结舍的翻译方法为基础的系统在前面分析中不难发现:

将以规则为基础的番}j译方法中好的特性与新发展的经验主义方法很好地结合起来,同时充分利用各个相关领域的知识及技术是机器翻译今后发展的必经之路目前,已有一些研究人员在做这方面的研究和开发.让我们设想一个这样的系统:

以EBMT方法为基础,结合运用语言规刚,在翻译方式上将"中间语言方法和转换方法结合起来.利用字典词汇驱动词法信息,特定领域的知识数据库,并将概蛊统计方j击运用到词法分析上等.这样得到的机器翻译系统,定是高质量,高性能,并且能够满足更多?

57?

』摘要:

机械工程实际中,常使用网络匿表达结构或信息对豪啦夏寸豪之间的相关

关系.在网

'鸯匿的变换过程中,网络匿的结点或结点连垮需要扩充和复旮,这种情况-F阀蹲

园的变换往往是

等竹的,因此一艏的匿论理论已经不能表达这样的知识,需要研完一种新方法砷匿

论理论进行扩

充,适应网络图中结点的增加时工程上的等价网络知识的表达拳文对该方法实现

了面向对豪

编程.并且实现寸囊空间的钟态分配

关键词:

面向寸豪等价网络匿

1.引言一

机械工程实际设计中常用面向对象的图论技术进行产品结椅及性能的表达,其圈论基本理论如下.定义l:

由结点和连接它们的连线的有限巢组成阿络图[1].每一结点代表某个结构或信息对象,每一

连线代表对象z间的几何,装配,位置,约柬或方向等联系一个网络图可定义为一个偶对(v,E).记作;G一(V,E),其中V是一个非空集舍,它的元素就是结点.E是无序积V&v的一个子集,其元煮就是连线

定义2:

连接两个相同结点的连线的个数称为网络图的重数.它表示了结点之间的多重联系.定义3:

设G一(V,E)和G一(Vr,E)都是网络{

v_

图l基于图的表示方法.

(a)G网络图,(b)Gr子图

需要的产品

(2)发展完善辅助翻译工具.尽管机器翻译的长远目标是进行垒自动翻译,但就近期的发展现状

及各方面技术条件看,辅助翻译还是必不可少的,而且将仍起着很大的作用.近年来,辅助翻译工具越来越多.它们使机器翻译的速度,准确率和实用性都有相当大的提高我们熟悉的如IBM公司的Transla—tlonMarmger/2t不但能进行词典查找,前,后处理等,还能重用以往的资料并进行检查;同时它可以调节翻译进程,如文件管理,专业词典管理与文字处理软件的接口等,使之高效率,高质量地工作同时存在的还有LOGOS的人工翻译工具,SmartCQrnmu—nlcatJon公司的专家编辑器MAX等等.电子词典也是辅助机器翻译的一个重要资源.利用词典的各种,

?

58?

词条进行前,后编辑,或帮勋那些只需在词典中查找一

些词和词组就能理解垒文的用户阅读资料或文件等.这样的电子词典与真正机器翻译过程所需要的词典相比结栲较简单,但用途广泛而且深受欢迎,是今后一段时同由仍有研究和开发价值的一个课题.

(3)Internet上的翻译器将从双向翻译发展为多国语言翻译,并且尽量提高翻译速度和正确率.随着越来越多的系统开发出网络版,世界性的交流将会更加方便和广泛.这一前景深溧地吸引着众多的机器翻译工作者们

(4)对语音输入,分析,翻译及其合成输出的进一

步深入研究,将使翻译电话系统在有限范围内逐步达到实用化.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 理学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1