ImageVerifierCode 换一换
格式:PPTX , 页数:71 ,大小:9.80MB ,
资源ID:10525995      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10525995.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第12课机器翻译与本地化工程概论(下)-课程讲义.pptx)为本站会员(zf)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第12课机器翻译与本地化工程概论(下)-课程讲义.pptx

1、计算辅助翻译原理与实践俞敬松机器翻译与本地化工程概论(下)Introduction to Machine Translation and Localization Engineeringhttp:/ global economy/society?“new economy is global because the central activitiesofproduction,consumptionand circulation,as well as their components(capital,labour,raw materials,management,information,tech

2、nology,markets),are organized on a global scale,either directly or through a network of connectionsbetweendifferenteconomic agents”.(Cronin 2003)GILT?GILT!跨越跨越语语言障言障碍的努力碍的努力Globalization 全球化Internationalization 国际化 Localization 本地化 Translation 翻译图片来自小米手机-MIUI国际站G11NL10NI18N经经济济全球全球化化与与语语言言的的全球全球化化“T

3、ranslation partakes both of the Self and of the Net”.(Cronin 2003)强强势语势语言言某些语言具有文化、科技、政治的优势而广泛使用,导致语言趋同,升值成为中间语言。语语言多言多样样性性因为文化、主权、情感等多种因素,语言多样性成为很多地区、很多社群人们的诉求。经经济济全球全球化化与与语语言言的的全球全球化化互相牵制、互相影响的两种工作:Internationalization国国际际化:化:设计一款产品使其可以很容易被世界上其他地区人们所接受;Localization本地化:本地化:让一款已经设计完成的产品根据特定地区市场的需求进行

4、裁剪、修改和补充完善。国际化全球化翻译本地化全球化国际化本地化翻译为使产品可以行销世界,而进行的一系列准备工作:GLOBALIZATION:全球全球化化同时考虑国内和国际市场;为本地化工作做好国际化准备;对于消费类产品尤其重要;需要有整套的保证措施,工作设计和规划;整体的行为:从技术到市场,从销售到服务。12345INTERNATIONALIZATION:国国际际化化所有为使本地化工作更容易而进行的设计工作多种语言和文化习惯的内建支持比如电源插头文字输入、显示、打印就够了?排序!货币符号,特殊排版习惯图片来自于Internet 搜索引擎LOCALIZATION:本地本地化化为了让产品适合当地市

5、场而做出的从语言、文化到技术的所有努力和工作:1.以跨语言、跨文化交流为基础2.以商业目的的达成为依归3.技术研发既是工作支撑,也是工作目标Globalization:(全球本土化?)强调两方面的重要性http:/en.wikipedia.org/wiki/Glocalisation不只遵从国际标准也注重在地的特点TRANSLATION:翻翻译译语言转换:跨越语言、文化的交流和传播;本地化、国际化工作的核心内容;传统翻译是基础,此外还必须注意:1.技术支撑,CAT/Localization/PM 系统的广泛使用2.嵌入技术环境,“%1杀死了%2,获得了3%”3.服务于产品的商业目的(广义的翻译

6、目的论)翻翻译译公司公司的的变变迁(迁(服服务务内容内容扩扩大大)SDL International(必然伴随技必然伴随技术术支撑支撑)TransPerfect Translation(整合解决方案整合解决方案)TAUS 曾曾经认经认定定的的 翻翻译译行行业业的的变变化化现现代代语语言言服服务务行行业业和的普及语言服务保质保量的关键在于和应用。翻译出版技术写作教育咨询技术开发多语种规模化市场化专业化语言服务是以语言技术为技能和内容提供专业服务,它以翻译为基础,但是已经的范畴。全球化内容呈内容呈现现特征特征趋势趋势本地化在做些什么呢?本地化在做些什么呢?从文字翻译到语言服务工程软软件本地件本地化

7、化的几个示例的几个示例网网站本地站本地化化网网站本地站本地化化游游戏戏本地本地化化文文档本地档本地化化字字幕与配幕与配音音程程序的多序的多语语种支种支持持良良好的本好的本地地化化软软件件带带来的好来的好处处更满意的用户体验降低用户认知负担用户更愿意长时间、深入的使用减少客户支持负担更多的客户更大的市场更多的收入本本地化翻地化翻译译的具体的具体工工作及工作及工具具文字文字载载体:体:PDF、FM、Indd、HTMLPHP、Java、JavascriptXML工作量:工作量:动辄几十万字 以亿为单位工具:工具:格式转换工具、文件管理翻译记忆、术语库、机器翻译翻译管理工具人力:人力:几十甚至上百人的

8、团队工作模式:工作模式:敏捷开发、写作、翻译本本地化翻地化翻译译的具体的具体工工作及工作及工具具现现代化翻代化翻译译项项目流目流程程项目需求项目分析计划会议前期设置翻译、编辑、校对内部计划与进度项目总结和客户满意调查客客户户复复查查工程DTP语言复查功能测试/最终语言QA最后交付抽样语言测试软软件本地化概要件本地化概要软件系统是怎样拥有多语言支持的软软件件本地本地化化翻翻译译工工作作的最美的最美好好的理的理想想翻翻译译工作工作与与程序开程序开发发彻彻底的底的分离:分离:1.新的语言不必开发新的代码;2.翻译完成之后,不必重新编译;3.新增加语言,软件不需要重新测试;4.发行本地化版本不造成延误

9、;5.新的发行和升级依然可以沿用旧版本的翻译;6.在别的软件上也可以重用翻译结果;7.翻译工作可以交给任何译员,即使这位没有任何程序开发经验。软软件的内件的内涵涵与外与外延延软件核心的国际化支持几乎是必须的软件用户界面的翻译是最关键的技术写作是翻译工作顺利的基石软件周边的翻译/本地化工作占据了相当的工作量CBTcomputer-based-trainingUIuser interfacesMarketingpackages,webDocumentationmanuals,help filesSupportcustomer,technical,web国国际际化支化支持持documentdocum

10、ent document文本档案文本档案显显 示示内内容容color,graphics,icons,symbols,display organizationdate,time,calendar,currency,number,addressinterface:menus,dialogs,messages,prompts,alerts,document organization,writing systemmetadata,vocabulariescontent:help files,auxiliary documents,HTML/XML document contentnon-linguis

11、ticlinguistic来自于Kent 大学Shreve 讲稿结结构构-内容内容-呈呈现现:层层次清晰、分离次清晰、分离思想思想-结结构构-内容内容-呈呈现现-交互交互层层次之次之间间互相独立互相独立程程序代序代码码与与文字文字输输入入输输出出#include main()int n;char y5;printf(This program converts decimal numbers to hexadecimalnn);while(1)printf(nEnter decimal number:);scanf(%d,&n);printf(nNumber entered is decimal

12、 and hexa,n,n);printf(nDo you want to continue?);scanf(%s,y);if(strcmp(y,yes)printf(n exiting.n);exit();户户的字符串直接的字符串直接写在程序内写在程序内注意:注意:变变量写在量写在了了错误错误:显显示示给给用用语语句内句内时时,当心,当心语语序,特序,特别别是缺乏上是缺乏上下文的下文的时时候候程序程序资资源文源文件示例件示例(菜(菜单单可可由由此生此生成成)PortfolioMenu MENU BEGINPOPUP&File BEGINMENUITEM&Add Student,1MENUIT

13、EM SEPARATORMENUITEM&Delete Student,2 MENUITEM SEPARATORMENUITEM&Update Student,3 MENUITEM E&xit,4ENDPOPUP&Tools BEGINMENUITEM Add&Portrait,5ENDPOPUP&Help BEGINMENUITEM About Portfolio,6MENUITEM SEPARATORMENUITEM Contents,7ENDEND注意:快捷注意:快捷键键的定的定义义,变换语变换语言,按言,按键键通常通常 不能不能变变,于是失去了,于是失去了 助助记记的功能候的功能候软软

14、件翻件翻译译时时的的质质量量控控制制检查检查清清单单(不(不完完整列表整列表)字字符集符集是否正是否正确确,兼容性,兼容性是否完整翻译了?本地化内容中夹杂了格式标签、控制标签的时候的处理有无非法标签(语法错),语义错误(标签及文字的顺序)由程序其他部分生成的动态文字或属性中的文字源程序的格式指令是否适用于目标语言市场图片是否也同步处理好了?文字和图片的关系是否依然正确?软件与说明书之间及其他媒体间是否保证了翻译的一致性?本地化本地化软软件件的功能的功能格式处理待翻译段落、语句的抽取翻译过程中的支持(翻译记忆,术语管理)翻译过内容的放回多语言软件的测试支持(伪翻译)翻译工程项目的管理软软件本地件

15、本地化化的部分的部分最最佳佳实实践践软件本身切割成程序和界面设计(资源文件)尽量引用操作系统级别的字符串处理功能尽量使用Unicode/UTF-8编码尽量使用程序和批处理作业模式,手工工作越少,工作效率越高,且工作质量也越高从软件开发的源头起,包括核心部分、用户界面及用户手册都要做到国际化支持整个团队都应该具有全球化的视野和策略安排软软件件项项目目本本地化地化实实战过战过程程I18N受 控 语 言术 语 表软软件、件、软软件帮助文档件帮助文档,说说明明书书,市市场场宣宣传传材料,材料,帮助帮助 文文字字技技术术写作写作L10N本地化服务供应商计算机辅助翻译+机器翻译依依赖赖关系、一致性控制关系

16、、一致性控制软软件件项项目本目本地化支地化支撑撑环环境境L10N本地化软件的发行版项目管理工具及系统本地化工具集合工作流管理和优化文档及文档管理控制译译员员/工程工程师师QA工具/测试软件/软件的可用性评估本地化本地化工程工程项项目目项项目目经经理理翻译记忆术语管理术语抽取工具译译员员/工程工程师师Java 程序程序设计设计的国的国际际化化和本地化和本地化最简单的一个示例本节示例引用自:Alexander Schonfeld 程序改造程序改造为为多多语语言支言支持的前持的前后后对对比比System.out.println(Hello.);System.out.println(How are y

17、ou?);System.out.println(Goodbye.);执执行行结结果果%javajava I18NSampleI18NSample frfr FRFRBonjour.Bonjour.CommentComment allez-allez-vous?vous?Au Au revoir.revoir.%javajava I18NSampleI18NSample enen US US Hello.Hello.HowHow areare you?you?Goodbye.Goodbye.代代码码区域区域的含的含义义1.指示当前程序运行的语言环境2.根据网络浏览器、操作系统的标识,用户的主动设

18、定而确定3.影响所有与语言和地区相关联的地方,比如排序、日期、时间、货币、数字等格式messageslabels on GUI componentsonline helpsoundscolorsgraphicsiconsdatesTimesnumberscurrenciesmeasurementsphone numbershonorifics and personal titlespostal addressespage layouts要要翻翻译译的内容的内容为为了翻了翻译译的便捷而的便捷而进进行的国行的国际际化化设设定定BAD!Button okButton=new Button(“OK”)

19、;Good!String okLabel=ButtonLabel.getString(OkKey);Button okButton=new Button(okLabel);Java国国际际化程序范化程序范例例不不同同语语言言下下的运行的运行结结果,注果,注意意细节细节currentLocalecurrentLocale =en_USen_USAtAt 1:151:15 PMPM onon AprilApril 13,13,1998,1998,wewe attackattack thethe 7 7 shipsships onon thetheplanetplanet Mars.Mars.cur

20、rentLocalecurrentLocale =de_DEde_DEUmUm 13.15 Uhr13.15 Uhr amam 13.13.AprilApril 19981998 habenhaben wirwir 7 Raumschiffe7 Raumschiffe aufauf dem dem PlanetenPlaneten MarsMars entdeckt.entdeckt.请思考:遇到单复数的时候如何处理遇到主动、被动语态时如何处理?Sample RuncurrentLocalecurrentLocale =en_USen_USareare nono filesfiles onon

21、 XDisk.XDisk.There There There There There There ThereThereisis oneone file file areare 2 2 filesfilesareare 3 3 filesfilesonon XDisk.XDisk.onon XDisk.XDisk.onon XDisk.XDisk.currentLocalecurrentLocale =fr_FRfr_FRnn y y a a paspas desdes fichiersfichiers sursur XDisk.XDisk.IlIlIl yIl y a una un fichi

22、erfichierIlIl y y a 2a 2 fichiers fichiers IlIl y y a 3a 3 fichiers fichierssursur XDisk.XDisk.sursur XDisk.XDisk.sursur XDisk.XDisk.345 987,246345.987,246345,987.246fr_FR de_DE en_US9 avr 98 fr_FR 9.4.1998 de_DE 09-Apr-98 en_USGood!判判断一个断一个字字符是否符是否是字母是字母BAD!if(Character.isLetter(ch)/ch is a letteri

23、f(ch=a&ch=A&ch=Z)/ch is a letter预预置的字符置的字符类类型型LOWERCASE_LETTERUPPERCASE_LETTERMATH_SYMBOLCONNECTOR_PUNCTUATIONetc.isDigit,isLetterisLetterOrDigitisLowerCase,isUpperCaseisSpaceCharisDefined其其他本地他本地化化处处理上理上的麻的麻烦烦单词、句子的边界(哪里可以折行?)1.不同的语言规则是完全不一样的2.要么逐语言写处理模块3.要么把处理函数抽象出来,主程序就可以自由书写,实际处理函数随着新增语言写好各有优缺点从

24、左到右的语言与从右到左的语言混排处理上下左右都有标记符号的语言混排处理本地化需要的规范无规则不成方圆,现代工业尤其如此对对本地化本地化行行业业来来说说比比较较重要重要的的一些一些标标准准规规范范1.EN 15038:质量规范.2.SRX(Segmentation Rules eXchange):翻译单元的切分规则.3.TBX(Term Base eXchange):术语交换的格式.4.TMX(Translation Memory eXchange):翻译记忆交换格式.5.UNICODE:计算机处理多语言时的内码标准6.XLIFF(XML Localization Interchange Fil

25、e Format):为了翻译处理其他文件格式的统一处理规范.7.UAX#29,#14(Unicode Annex 29,14):Unicode处理多种语言时的附加标准,专门解决语言单位的额“边界”问题参参与制定与制定标标准的国准的国际组织际组织1.ETSI:European Telecommunications StandardsInstitute2.GALA:Globalization and Localization Association3.OASIS:Organization for the Advancement of Structured Information Standards

26、,XLIFF是其代表作.4.TAUS:Translation Automation Users Society5.UNICODE ULI TC,Unicode Localization Interoperability Technical Committee参参与制定与制定标标准的国准的国际组织际组织Brigham Young University Translation Research Group新新世世纪纪的的翻翻译译活活动动1.质量要求千差万别2.长尾理论很多种的语言需要处理3.内容巨量增长:自己创作、分享与购买的4.有语义的数据是问题的关键5.翻译活动持续进行6.翻译成为工程任务多人

27、/多地点同步/异步合作7.用户驱动的多方向翻译翻翻译译行行业业的的驱动驱动力力、压压力与力与策策略略选选择择MachinesOpen(Collaborative)Closed(Competitive)Human&Machine4.Dataiscore3.Unlimitedcontent1.Onetranslationqualityfitsall2011201220132.Long-tailoflanguages1.Qualitydifferentiation.5.Projectbased4.TMiscore3.Countingwords2.Selectinglocales5.Continuou

28、stranslationTranslationasutility7.Cascadedsupplychain6.One-directional7.Collaborative translation6.Multi-directional资料来源:TAUS,GALA关关键键性的性的标标准准曾经的LISA.org 倒闭了,但是留下了若干关键性的标准化协议,包括:TMX,TBX,SRX 和 GMXETSI 持有上述协议,并继续发展目前游戏玩家主要是 TAUS,GALA,ISO TC 37,OASIS,W3CETSI-LISA 成员:WhP(convenor),HP,Huawei,Alcatel-Luce

29、nt,Lionbridge,Cisco,IBM.for all加入:http:/docbox.etsi.org/HF/Open/ISGLISHow can I join and participate?1)Download and sign the ISG Agreement ETSI ISG LIS KIT FOR SIGNATURE.zip http:/docbox.etsi.org/HF/Open/ISGLIS/*and*2)Subscribe to ISG LIS email exploder list and participate in conference calls,virtu

30、al meetings and face-to-face meetings collocated with Localisation events in all regions.OASIS XLIFF 业业内最重要的内最重要的标标准之一准之一XLIFF 2.0 core specification:1.Committee Draft within 20112.Public review Q120123.OASIS standard Q22012Characteristics of 2.01.Non-negotiable core2.Optional modules for specialize

31、d functionalities3.Explicit conformance criteria and processing requirements for both core and modules4.Although the XLIFF 1.x standard was intended primarily as anexchange format the industry practice shows that the defined format is also suitable for storage and legacy content leverage purposes.OA

32、SIS的其他的其他任任务务1.Leverage UAX#29 as the rule specification standard2.Update SRX(Segmentation Rule eXchange)based on UAX29 for interchange between systems3.Establish core definition at per language level thru CLDR(Unicode CommonLocale Data Repository)4.Allow for extension possibilities per language per

33、 domain thru ULIsegmentation repertoire(TBD)5.Provide reference implementation where applicable:6.Deliver basic implementation of segmentation thru ICU(InternationalComponent for Unicode)7.Integrate ICU in public domain translation workbench and management software such as OpenTMS/OpenTM2 or GlobalSight8.Shared reference implementation of XLIFF for localization data transfer为加入本地化行业做好准备“懂语言、懂文化、懂技

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1