机器翻译历史.docx
《机器翻译历史.docx》由会员分享,可在线阅读,更多相关《机器翻译历史.docx(18页珍藏版)》请在冰豆网上搜索。
![机器翻译历史.docx](https://file1.bdocx.com/fileroot1/2023-5/15/ae3e2802-6f70-4a6f-a532-ebfe6e113a8d/ae3e2802-6f70-4a6f-a532-ebfe6e113a8d1.gif)
机器翻译历史
机器翻译历史的大纲
1.机器翻译的概念
(1)机器翻译术语的出处:
(2)机器翻译又称自动化翻译,是一种高级的人工智能技术,它是计算机科学、数学和语言学等多学科共同参与研制的结晶。
机器翻译之所以成为可能,一是因为两种语言之间存在着可译性,二是因为人的翻译过程具有可模拟性。
2.机器翻译历史
(1)最早的机器翻译起源于1933年,苏联人P.P.特罗绛斯基提出借助机器进行翻译的详细步骤,并设计出由一条带和一块台板依靠机械原理进行翻译工作的样机。
(2)70年代之前在欧美的发展
(3)70年代之前在中国的发展
我国在1956年开始研究机器翻译问题。
用计算机实现一种自然语言到另一种自然语言的转换。
一般指自然语言之间句子和全文的翻译。
机译系统可划分为基于规则的和基于语料库的两大类。
前者由词典和规则库构成知识源;后者由经过划分并具有标注的语料库构成知识源,既不需要词典也不需要规则,以统计规律为主。
机译系统是随着语料库语言学的兴起而发展起来的,世界上绝大多数机译系统都采用以规则为基础的策略,一般分为语法型、语义型、知识型和智能型。
不同类型的机译系统由不同的成分构成。
抽象地说,所有机译系统的处理过程都包括以下步骤:
对源语言的分析或理解,在语言的某一平面进行转换,按目标语言结构规则生成目标语言。
技术差别主要体现在转换平面上。
语法型机译系统研究重点是词法和句法,以上下文无关文法为代表,早期系统大多数都属这一类型。
语法型系统包括源文分析机构、源语言到目标语言的转换机构和目标语言生成机构3部分。
源文分析机构对输入的源文加以分析,这一分析过程通常又可分为词法分析、语法分析和语义分析。
通过上述分析可以得到源文的某种形式的内部表示。
转换机构用于实现将相对独立于源文表层表达方式的内部表示转换为与目标语言相对应的内部表示。
目标语言生成机构实现从目标语言内部表示到目标语言表层结构的转化。
语义型系统研究重点是在机译过程中引入语义特征信息,以Burtop提出的语义文法和CharlesFillmore提出的格框架文法为代表。
语义分析的各种理论和方法主要解决形式和逻辑的统一问题。
利用系统中的语义切分规则,把输入的源文切分成若干个相关的语义元成分。
再根据语义转化规则,如关键词匹配,找出各语义元成分所对应的语义内部表示。
系统通过测试各语义元成分之间的关系,建立它们之间的逻辑关系,形成全文的语义表示。
处理过程主要通过查语义词典的方法实现。
语义表示形式一般为格框架,也可以是概念依存表示形式。
最后,机译系统通过对中间语义表示形式的解释,形成相应的译文。
知识型系统目标是给机器配上人类常识,以实现基于理解的翻译系统,以Tomita提出的知识型机译系统为代表。
知识型机译系统利用庞大的语义知识库,把源文转化为中间语义表示,并利用专业知识和日常知识对其加以精练,最后把它转化为一种或多种译文输出。
智能型系统 目标是采用人工智能的最新成果,实现多路径动态选择以及知识库的自动重组技术,对不同句子实施在不同平面上的转换。
这样就可以把语法、语义、常识几个平面连成一有机整体,既可继承传统系统优点,又能实现系统自增长的功能。
这一类型的系统以中国科学院计算所开发的IMT/EC系统为代表。
machinetranslation
又称自动化翻译。
应用语言学中的一门新兴的实验性学科,研究如何利用电子计算机按一定程序自动进行自然语言之间的翻译问题。
20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。
1933年,苏联发明家П.П.特罗扬斯基设计了把一种语言翻译成另一种语言的机器,并在同年9月5日登记了他的发明。
但是,由于30年代技术水平还很低,他的翻译机没有制成。
1946年电子计算机问世后,英国工程师A.D.布斯和美国工程师W.韦弗在讨论电子计算机的应用范围时,提出了利用计算机进行语言自动翻译的想法。
1949年,韦弗发表了一份以《翻译》为题的备忘录,正式提出了机器翻译的问题。
1954年,美国乔治敦大学在国际商用机器公司的协同下,用IBM-701计算机进行了世界上第一次机器翻译试验,此后,苏联、英国、日本、中国等国,也相继进行了机器翻译试验。
1966年11日,美国科学院语言自动加工咨询委员会公布了一个题为《语言与机器》的报告,对机器翻译采取否定态度,一些国家的机器翻译研究转入低潮。
70年代初,由于现实的需要及技术的进步,机器翻译又重新兴旺起来,现在仍在不断发展中。
美国、加拿大、法国、日本、苏联都先后建立了一批翻译能力较强的机器翻译系统。
有的系统已提供给一些单位试用,如法国的俄法机器翻译系统。
有的系统已在一定范围内正式投入使用,如加拿大的TAUM-METEO英法机器翻译系统,用于天气预报。
还有的系统已投入市场,如美国的SYSTRAN系统和WEIDNER系统。
前者在大计算机上运行,每小时能译几十万词,但译后需加工。
后者在微型机上运行,速度虽比前者慢,但仍比人译得快。
中国机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家,60年代中期以后一度中断,70年代中期以来有了进一步的发展。
现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都在进行机器翻译的研究;上机进行过实验的机器翻译系统已有十多个,翻译的语种和类型有英汉、俄汉、法汉、日汉、德汉等一对一的系统,也有汉译英、法、日、俄、德的一对多系统(FAJRA系统)。
此外,还建立了一个汉语语料库和一个科技英语语料库。
中国机器翻译系统的规模正在不断地扩大,内容正在不断地完善。
机器翻译的研究是建立在语言学、数学和计算机科学这3门学科的基础之上的。
语言学家提供适合于计算机进行加工的词典和语法规则,数学家把语言学家提供的材料形式化和代码化,计算机科学家给机器翻译提供软件手段和硬件设备,并进行程序设计。
缺少上述任何一方面,机器翻译就不能实现,机器翻译效果的好坏,也完全取决于这3个方面的共同努力。
整个机器翻译的过程可以分为原文分析、原文译文转换和译文生成3个阶段。
在具体的机器翻译系统中,根据不同方案的目的和要求,可以将原文译文转换阶段与原文分析阶段结合在一起,而把译文生成阶段独立起来,建立相关分析独立生成系统。
在这样的系统中,原语分析时要考虑译语的特点,而在译语生成时则不考虑原语的特点。
在搞多种语言对一种语言的翻译时,宜于采用这样的相关分析独立生成系统。
也可以把原文分析阶段独立起来,把原文译文转换阶段同译文生成阶段结合起来,建立独立分析相关生成系统。
在这样的系统中,原语分析时不考虑译语的特点,而在译语生成时要考虑原语的特点,在搞一种语言对多种语言的翻译时,宜于采用这样的独立分析相关生成系统。
还可以把原文分析、原文译文转换与译文生成分别独立开来,建立独立分析独立生成系统。
在这样的系统中,分析原语时不考虑译语的特点,生成译语时也不考虑原语的特点,原语译语的差异通过原文译文转换来解决。
在搞多种语言对多种语言的翻译时,宜于采用这样的独立分析独立生成系统。
迄今存在和正在研制的机器翻译系统按其加工的深度可以分为3种类型:
第1类是以词汇为主的机器翻译系统;第2类是以句法为主的机器翻译系统;第3类是以语义为主的机器翻译系统。
从美国乔治敦大学的机器翻译试验到50年代末的系统,基本上属于第1类机器翻译系统。
它们的特点是:
①以词汇转换为中心,建立双语词典,翻译时,文句加工的目的在于立即确定相应于原语各个词的译语等价词;②如果原语的一个词对应于译语的若干个词,机器翻译系统本身并不能决定选择哪一个,而只能把各种可能的选择全都输出;③语言和程序不分,语法的规则与程序的算法混在一起,算法就是规则。
由于第一类机器翻译系统的上述特点,它的译文质量是极为低劣的,并且,设计这样的系统是一种十分琐碎而繁杂的工作,系统设计成之后没有扩展的余地,修改时牵一发而动全身,给系统的改进造成极大困难。
60年代以来建立的机器翻译系统绝大部分是第2类机器翻译系统。
它们的特点是:
①把句法的研究放在第一位,首先用代码化的结构标志来表示原语文句的结构,再把原语的结构标志转换为译语的结构标志,最后构成译语的输出文句;②对于多义词必须进行专门的处理,根据上下文关系选择出恰当的词义,不容许把若干个译文词一揽子列出来;③语法与算法分开,在一定的条件之下,使语法处于一定类别的界限之内,使语法能由给定的算法来计算,并可由这种给定的算法描写为相应的公式,从而不改变算法也能进行语法的变换,这样,语法的编写和修改就可以不考虑算法。
第2类机器翻译系统不论在译文的质量上还是在使用的方便上,都比第1类机器翻译系统大大地前进了一步。
70年代以来,有些机器翻译者提出了以语义为主的第3类机器翻译系统。
引入语义平面之后,就要求在语言描写方面作一些实质性的改变,因为在以句法为主的机器翻译系统中,最小的翻译单位是词,最大的翻译单位是单个的句子,机器翻译的算法只考虑对一个句子的自动加工,而不考虑分属不同句子的词与词之间的联系。
第3类机器翻译系统必须超出句子范围来考虑问题,除了义素、词、词组、句子之外,还要研究大于句子的句段和篇章。
为了建立第3类机器翻译系统,语言学家要深入研究语义学,数学家要制定语义表示和语义加工的算法,在程序设计方面,也要考虑语义加工的特点。
目前世界上绝大多数的机器翻译系统都是第2类机器翻译系统,研究的重点主要放在句法方面。
有些系统以句法为主,适当增加了一些语义参数,以解决句法上的歧义问题。
由于语义研究还不成熟,建立第3类机器翻译系统还有相当大的困难。
还在计算机降临人世之前,人类就萌生出一种极富魅力的梦想,希望有一天能够制造出一种机器,请它在讲不同语言人中间充当翻译。
把这种翻译机器揣在衣兜里就能走遍天下:
到了英国,它讲英语,到了法国,它又会讲法语……,无论操何种语言的外国人与你谈话,只要拨一下开关,它都能在两种不同语言间充当“第三者”,准确地表情达意。
人类有了它,又何愁“天下谁人不识君”呢?
20世纪20年代,有位俄国人想动手实现这一梦想,他造了一台机械装置,试图通过那些齿轮的转动把俄语翻译成英语,终于以失败而宣告结束。
20世纪40年代,电子计算机的发明又重新勾起了人们美好的憧憬。
1949年,美国学者沃伦·韦弗向大约200名友人发出一份备忘录,他热情地指出,用计算机完全能够解决语言的翻译问题。
他认为,人们可以让计算机模拟人类翻译家的作法,使用一部两种语言对照的词典作工具,用一种语言的单词去查出另一种语言的等价词,然后编排整理成文。
这种翻译机至少可以用来帮助解决世界范围的文献翻译。
韦弗先生的设想简单明晰,却颇有吸引力,引起了美国科学界人士极大的兴趣。
当历史跨入50年代后,美国人甚至有点迫不急待。
因为在激烈的世界科技竞争面前,大部分美国科学家和工程师都不能阅读俄语书,而大部分前苏联科学家和工程师却都精通英语。
美国科学家十分担心自己会根不上俄国人定期发布的优秀科技论文的水平。
机器翻译的研究项目因此受到了高度重视并获得大量的经费资助。
美国计算机界铆足了劲,要一举摘下机译的皇冠。
从1954年实力雄厚的计算机公司IBM和乔治城大学研究小组合作的首次试验起,韦弗设想的那种“词对词”的计算机翻译系统开始了它的蹒跚学步。
粗略想一想,在两种语言间实现“逐词替换”似乎并不困难。
比如,想把英语句子翻译成汉语,只需把英语句子分解为单词,用对应的汉语单词顶替,然后按汉语语法规则整理成句式。
“Thisisacomputer”是一个英语句子,分别把“this”用“这”、“is”用“是”、“a”用“一台”、“computer”用“计算机”顶替,不就翻译成汉语句子“这是一台计算机”吗?
这里所需要的是大量储存并快速搜索两种语言的对应词汇,而“大量储存”“快速搜索”恰好是计算机的拿手好戏。
美国人初期开发的机译系统正是“俄英翻译”,他们也确实把俄语文献翻译成了英语版本。
可惜好景不长,早期从事机译的人们很快就沮丧地发现,通过逐词替换,大约可完成80%的翻译工作,还有20%的文字根本“顶替”不下来。
更不能容忍的是,整个翻译过程极慢,甚至达不到人工翻译的速度;同时,机器翻译的文章必须由人进行整理才能读得通,还不如让人自己来干。
当时的机器翻译闹出了不少笑话。
据说,当美国人向计算机里输入一个英语谚语“心有余而力不足”时,输出的俄语意思却变成“酒是好的,但肉已经变质”。
再输入一则英语谚语“眼不见,心不烦”,你知道机器把它译成了什么?
输出俄语的意思实在叫人啼笑皆非——“眼睛失明,精神失常”,大概就是那台翻译机器的自我写照吧。
这样一来,计算机翻译背上了一个很糟糕的名声,人们的热情一落千丈。
连美国政府也于1966年发布了一本黑皮书《语言和机器》,认为这种研究得不偿失。
黑皮书给刚出襁褓的翻译机泼了一大盆凉水,同时撤消了对机器翻译项目的大部分资助,不少研究课题组纷纷下马,最后仅留下5个单位惨淡经营,机器翻译从此进入低谷时期。
机器翻译的先驱者们大都陷入了迷茫:
象计算机这种无生命的机器,真的能够完成只有人类大脑才能承担的翻译工作吗?
在60年代的研究低潮中,机译界的人们并没有完全停止耕耘,不过,的确需要认真地反思,找出问题的症结所在。
用逐词顶替的方法为什么不能得到满意的翻译结果?
可以设想一下,人类自己担任翻译时,是否也只是做了这种替代呢?
显然,任何一个人,哪怕他把一本《双语词典》背得滚瓜烂熟也当不成翻译,关键在于理解所翻译文章的意思,还要掌握各种相关知识。
而在“词对词”机译系统中,把“computer”一词用“计算机”一词替代,担任翻译的机器并不理解“计算机”或“computer”是什么东西。
换言之,让电脑“理解”人类语言应该是机译突破的焦点。
让机器理解人类的语言谈何容易!
语言是人类进行思维判断和相互交际最主要的工具,有了语言,人类才最终从动物里划分出来,成为真正的人。
今天我们为计算机编制程序的语言都是“人工语言”,而人类自己使用的语言却都叫“自然语言”。
如果说,机译实现的唯一通路在于“自然语言理解”,那么,成功的希望已经寄托在“人工智能”的研究之上,让机器增加智能,象人那样学会用自然语言“思维”。
当然,还特别需要借助语言学家、心理学家的协助和支持,它必须成为一门综合性学科。
接触过计算机的人都知道“人机对话”这一术语,象BASIC那样的语言还被加上了“人机对话语言”的桂冠,似乎机器早就可以与人“交谈”。
千万不要把这种“高级语言”想象得神乎其神,其实,人机之所以能够对话,是人学会了计算机语言,而不是计算机学会了人的语言。
经过漫长的历史岁月,人类语言已发展到极其复杂的阶段。
一个人即使想要掌握本国的母语,从出世开始,直到小学中学,甚至上了大学还得孜孜不倦地学习。
以汉语为例,除了书面语之外,还有大量不规范的口语方言俚语。
在一个传统的相声段子里,逗捧双方的演员打赌,看谁能用最短的话表现一个情节:
小孩夜间起床小便,家人问他干什么。
结果,用河南方言的表演者令人叫绝,他只用了四个字:
“谁?
”“俺。
”“啥?
”“尿。
”
这种精练到家的语言,叫机器如何理解?
为了帮助机器初步学习理解人类语言,人工智能的研究者作过各种实验,开始艰难的探索历程。
例如,1961年美国曾发表过一个名叫“棒球”的系统。
通过技术处理,这一系统能够回答人们用英语提出的有关美国棒球锦标赛的一些问题。
如“红队7月在哪里比赛?
”,“蓝队曾在一节中赢过6分吗?
”等等,还只能算是雕虫小技。
在这类实验性的研究中,1966年美国麻省理工学院的威森鲍姆编写的“伊莉莎”(ELIZA)可能是最有趣的语言程序之一。
“伊莉莎”取名于英国著名戏剧家肖伯纳的戏剧《偶像》中的角色,它能够使计算机与人用英语谈话。
在自然语言理解技术尚未真正取得突破性进展时,这是一个令人费解的现象。
请看“伊莉莎”在计算机上与一位姑娘的谈话摘要:
姑娘:
男人们全都一样。
伊莉莎:
在哪些方面?
姑娘:
他们总找借口躲避我们
伊莉莎:
你能举个例子吗?
姑娘:
好吧,我的男朋友要我到你这里来。
伊莉莎:
哦,你的男朋友要你到我这里来。
姑娘:
他说我很烦闷。
伊莉莎:
你很烦闷,这使我很难过。
根据上述对话,“伊莉莎”不仅听懂了姑娘的讲话内容,而且很有同情心,象知心朋友一样给人以安慰。
这个程序发表后,许多心理学家和医生都想请它为人进行心理治疗,一些病人在与它谈话后,对它的信任甚至超过了人类医生。
这种状况令程序编制者和人工智能专家们深感忧虑:
一台机器居然让一些受过良好教育的人和它进行长时间的亲密交谈,而机器其实完全不理解人的喜怒哀乐!
仔细分析“伊莉莎”与人对话的内容,一旦明白了其中的奥妙,对话人可能会大呼上当。
“伊莉莎”对人说的话,只不过是颠倒一下谈话人的语序,为其中的某些“关键词”匹配上合适的“对应词”,然后再返回给谈话人。
当然,它的编排相当巧妙,比如你说“很烦闷”,它就说“很难过”;你说“我想哭”,它就问“为什么想哭”。
当它找不到合适的对应词回答问题时,为了避免出洋相,它就机敏地讲一些无关痛痒的废话搪塞一下,如“这很有意思,请继续说”,或者“请你说详细点好吗?
”从技术观点看,“伊莉莎”程序与人的对话,不是在对句子理解的基础上进行的,顶多给人们开了一个小小的玩笑。
“伊莉莎”的作者后来也承认说:
“我没有想到,一个简单的计算机程序,在极短的时间内会在用正常方式思考的人们中间引起了如此大的误会,今后在解决问题时需要考虑这种因素”。
机器翻译,本质上是对人类思维和语言活动的模拟。
解决这一难题的途径是对人类的语言作出科学的分析,获取人类思维活动的材料,然后才能正确地构造可以解释人类行为的计算机程序。
在这一点上,语言学家给了人工智能研究很大的支持。
自1957年美国语言学家乔姆斯基发表著名的《句法结构》始直到70年代,语言学中的“乔姆斯基革命”不断发展,不仅极大地推动了现代语言学科的成熟,而且使得“自然语言理解”的研究不同程度地涉及到句法、语义和语用三大语言学领域,机器翻译从此开始走向复兴。
这里,我们不得不占用一些篇幅,结合“自然语言理解”早期研究中的成果,对三个语言学中的概念作一点趣味性的说明。
让计算机学习人类的语言,入门的练习似乎可以象小学生那样从“填空”学起。
准备几种类型的单词,在事先造好的句式中故意留下几个空格,要求计算机有选择地填入。
例如,对于下列句式:
开往______的______列车在______时从______站台发车。
计算机只要在4个空格处分别填入表示地点、车别、时间和站台的词汇即可。
实际上,某些火车站就利用语音合成装置以这种方式进行广播。
填满空格后的句子可能成为:
开往纽约的特快列车在13时从3站台发车。
然而,在计算机没有理解上述句子意义之前,人们必须为它准备与每个空格对应的适当词汇,否则,任它自由填入一些单词,句子可能变成:
开往地狱的疯狂列车在午夜时从魔鬼站台发车。
不管哪个火车站的广播里报出这种通知,恐怕都会把旅客们吓得半死。
人类语言中的词汇是不能随心所欲加以组合的。
词汇不仅有名词、动词、代词、形容词、副词等词性区别,它们的组合还必须遵循一定的规则。
例如,汉语中的代词“我”、名词“饭”和动词“吃”,按上述顺序排列成“我饭吃”,谁看了也不会认为是汉语中的句子。
这三个词必须按照汉语的句法,分别充当句中的某一成分,“我”充当主语,“饭”充当宾语,“吃”只能作谓语,组成“我吃饭”即“主——谓——宾”句式。
这就是句法分析,当然,更多的句子要比“我吃饭”复杂得多。
但是,即使我们完全遵守句法规则造句,也不一定就能够得到有意义的句子。
例如在上句里交换“我”和“饭”的位置,造出一个“饭吃我”的句子,句法上挑不出一点毛病,但不好理解,或者说这是一个句法正确但没有意义的句子,它表明了句法和语义是语言学中不同的知识领域。
为了便于机器翻译,首先需要把自然语言的句子经过句法分析,分解为不同的成分。
然而,一些句子可以有不同的分解方法,不同的分解会产生不同的语义。
请看下一句子的两种分解法:
咬死了猎人--的狗。
咬死了--猎人的狗。
前一分解法应解释为:
狗把猎人咬死了;后一分解法则应解释为:
把猎人的狗给咬死了。
这就叫“句法歧义”。
会产生歧义的句子在语言中比比皆是,再比如:
“一个半劳力”。
如果让机器作句法分析,是分解为“一个半”“劳力”,还是分解为“一个”“半劳力”呢?
这些例子说明在句法分析时,还需要补充许多有关语义和相关知识的信息,有的句子还必须结合上下文的关系才能获得正确的分析结果。
例如,知道了上文是“狼来了”,理解下文“咬死了猎人的狗”时,就不会再有歧义;或者上文是“我爷爷年纪大了”,下文是“他只能算一个半劳力”,联系上下文一起分析,“一个半劳力”便只剩下一种含义。
理解人类语言时,还有一些因素必须考虑。
有时非得知道人物、时间、场合等等,才有可能解释某个句子。
例如,让机器理解这样一句话:
“红塔山一包”。
要是不知道这句话的背景是顾客在商店里向售货员购买香烟,想理解它的意思是不可能的。
研究语言的这些因素属于语用学的任务。
以上我们只以汉语为例进行了说明,其他的自然语言与之也基本相似。
由此可见,计算机对人类语言的理解,必须把句法、语义、语用和其他相关知识结合在一起全面分析,否则很难做出准确的翻译。
从计算机机械地模仿到理解人类的语言,机器翻译逐步向人工智能的方向靠拢,已在黑暗的摸索中看到了黎明的晨曦。
大约在70年代以前,国外的机译界业已从“词对词”的替换方式,发展为以句法结构分析为主的转换和生成。
这种“句对句”方式产生的译文质量有了一定的提高,但由于机器处理其他知识的能力不足,前进的步伐依然不大。
1971年美国有人作过比较:
人自己进行翻译的速度是每小时处理450个词,而计算机对同一文章作出翻译后,还必须请人编辑和改错,这种后一步骤人工处理的速度也只能达到每小时400词。
当人类社会在70年代中期大踏步地迈进了信息时代之际,“信息爆炸”使人类的相互交流急剧增长,社会需要带来巨大的推动力。
人们对翻译匮缺的呼声日愈强烈,据当时的一些资料报道,欧洲共同体使用8国文字公布文件,雇请100多位翻译专家只完成了工作量的1/10,有人估计急需补充翻译2万名;联邦德国每出版8本书就有一本是译著;加拿大议会因使用两种语言,每年都要斥巨资搞文件翻译……。
人们又一次迫切地向计算机求助,机器翻译在走了一个马鞍形的曲折之路后,又成了人类梦寐以求的瑰宝。
于是,机器翻译技术被列为21世纪世界十大科技难题的第一位。
世界上各发达国家聚集各路高手,不惜以亿万重金投资,都试图率先突破机译的难关,抢占翻译机器的巨大市场。
欧洲共同体7国联手,注入资金3850万欧洲货币单位;日本对此项研究开发的投资高达8亿美元;美国仅对其中的一项子课题的理论研究,就投进了1600万美元的血本……。
世界上已出现了十几个较成功的机译系统,在美国、法国、加拿大等国担任了“初级翻译”的角色。
80年代的计算机,与当年美国科学家搞“词对词”翻译时用的老式机器简直不能同日而语。
机器翻译的理论和技术也开始向语义分析与语言理解为主的方向进展,即实现以句段为加工单位即“段对段”的第三代智能方式的机译。
此时此刻,东方中国的上空,有一颗耀眼的“机译之星”正在冉冉升起……
中国的机器翻译研究起步并不算太晚。
早在1957年,机译就被列入了我国科学工作的发展规划。
1959年,在早期的104大型机上,我国计算机专家成功地进行了俄汉机器翻译的试验。
不过,现在说起来有点好笑:
那台机器翻译的是代码,而不是汉字。
因为那个时期,电脑还不“认识”汉字,即没有可用的汉字输出装置供机器翻译“书写”译文。
80年代中期以后,中国的机译界奋起直追世界潮流,上机实验过的就有英汉、俄汉、法汉、德汉、日汉等“一对一”系统,和汉译英、法、德、俄、日等“一对多”系统