第12课机器翻译与本地化工程概论(下)-课程讲义.pptx

上传人:zf 文档编号:10525995 上传时间:2023-02-17 格式:PPTX 页数:71 大小:9.80MB
下载 相关 举报
第12课机器翻译与本地化工程概论(下)-课程讲义.pptx_第1页
第1页 / 共71页
第12课机器翻译与本地化工程概论(下)-课程讲义.pptx_第2页
第2页 / 共71页
第12课机器翻译与本地化工程概论(下)-课程讲义.pptx_第3页
第3页 / 共71页
第12课机器翻译与本地化工程概论(下)-课程讲义.pptx_第4页
第4页 / 共71页
第12课机器翻译与本地化工程概论(下)-课程讲义.pptx_第5页
第5页 / 共71页
点击查看更多>>
下载资源
资源描述

第12课机器翻译与本地化工程概论(下)-课程讲义.pptx

《第12课机器翻译与本地化工程概论(下)-课程讲义.pptx》由会员分享,可在线阅读,更多相关《第12课机器翻译与本地化工程概论(下)-课程讲义.pptx(71页珍藏版)》请在冰豆网上搜索。

第12课机器翻译与本地化工程概论(下)-课程讲义.pptx

计算辅助翻译原理与实践俞敬松机器翻译与本地化工程概论(下)IntroductiontoMachineTranslationandLocalizationEngineeringhttp:

/globaleconomy/society?

“neweconomyisglobalbecausethecentralactivitiesofproduction,consumptionandcirculation,aswellastheircomponents(capital,labour,rawmaterials,management,information,technology,markets),areorganizedonaglobalscale,eitherdirectlyorthroughanetworkofconnectionsbetweendifferenteconomicagents”.(Cronin2003)GILT?

GILT!

跨越跨越语语言障言障碍的努力碍的努力Globalization全球化Internationalization国际化Localization本地化Translation翻译图片来自小米手机-MIUI国际站G11NL10NI18N经经济济全球全球化化与与语语言言的的全球全球化化“TranslationpartakesbothoftheSelfandoftheNet”.(Cronin2003)强强势语势语言言某些语言具有文化、科技、政治的优势而广泛使用,导致语言趋同,升值成为中间语言。

语语言多言多样样性性因为文化、主权、情感等多种因素,语言多样性成为很多地区、很多社群人们的诉求。

经经济济全球全球化化与与语语言言的的全球全球化化互相牵制、互相影响的两种工作:

Internationalization国国际际化:

化:

设计一款产品使其可以很容易被世界上其他地区人们所接受;Localization本地化:

本地化:

让一款已经设计完成的产品根据特定地区市场的需求进行裁剪、修改和补充完善。

国际化全球化翻译本地化全球化国际化本地化翻译为使产品可以行销世界,而进行的一系列准备工作:

GLOBALIZATION:

全球全球化化同时考虑国内和国际市场;为本地化工作做好国际化准备;对于消费类产品尤其重要;需要有整套的保证措施,工作设计和规划;整体的行为:

从技术到市场,从销售到服务。

12345INTERNATIONALIZATION:

国国际际化化所有为使本地化工作更容易而进行的设计工作多种语言和文化习惯的内建支持比如电源插头文字输入、显示、打印就够了?

排序!

货币符号,特殊排版习惯图片来自于Internet搜索引擎LOCALIZATION:

本地本地化化为了让产品适合当地市场而做出的从语言、文化到技术的所有努力和工作:

1.以跨语言、跨文化交流为基础2.以商业目的的达成为依归3.技术研发既是工作支撑,也是工作目标Globalization:

(全球本土化?

)强调两方面的重要性http:

/en.wikipedia.org/wiki/Glocalisation不只遵从国际标准也注重在地的特点TRANSLATION:

翻翻译译语言转换:

跨越语言、文化的交流和传播;本地化、国际化工作的核心内容;传统翻译是基础,此外还必须注意:

1.技术支撑,CAT/Localization/PM系统的广泛使用2.嵌入技术环境,“%1杀死了%2,获得了3%”3.服务于产品的商业目的(广义的翻译目的论)翻翻译译公司公司的的变变迁(迁(服服务务内容内容扩扩大大)SDLInternational(必然伴随技必然伴随技术术支撑支撑)TransPerfectTranslation(整合解决方案整合解决方案)TAUS曾曾经认经认定定的的翻翻译译行行业业的的变变化化现现代代语语言言服服务务行行业业和的普及语言服务保质保量的关键在于和应用。

翻译出版技术写作教育咨询技术开发多语种规模化市场化专业化语言服务是以语言技术为技能和内容提供专业服务,它以翻译为基础,但是已经的范畴。

全球化内容呈内容呈现现特征特征趋势趋势本地化在做些什么呢?

本地化在做些什么呢?

从文字翻译到语言服务工程软软件本地件本地化化的几个示例的几个示例网网站本地站本地化化网网站本地站本地化化游游戏戏本地本地化化文文档本地档本地化化字字幕与配幕与配音音程程序的多序的多语语种支种支持持良良好的本好的本地地化化软软件件带带来的好来的好处处更满意的用户体验降低用户认知负担用户更愿意长时间、深入的使用减少客户支持负担更多的客户更大的市场更多的收入本本地化翻地化翻译译的具体的具体工工作及工作及工具具文字文字载载体:

体:

PDF、FM、Indd、HTMLPHP、Java、JavascriptXML工作量:

工作量:

动辄几十万字以亿为单位工具:

工具:

格式转换工具、文件管理翻译记忆、术语库、机器翻译翻译管理工具人力:

人力:

几十甚至上百人的团队工作模式:

工作模式:

敏捷开发、写作、翻译本本地化翻地化翻译译的具体的具体工工作及工作及工具具现现代化翻代化翻译译项项目流目流程程项目需求项目分析计划会议前期设置翻译、编辑、校对内部计划与进度项目总结和客户满意调查客客户户复复查查工程DTP语言复查功能测试/最终语言QA最后交付抽样语言测试软软件本地化概要件本地化概要软件系统是怎样拥有多语言支持的软软件件本地本地化化翻翻译译工工作作的最美的最美好好的理的理想想翻翻译译工作工作与与程序开程序开发发彻彻底的底的分离:

分离:

1.新的语言不必开发新的代码;2.翻译完成之后,不必重新编译;3.新增加语言,软件不需要重新测试;4.发行本地化版本不造成延误;5.新的发行和升级依然可以沿用旧版本的翻译;6.在别的软件上也可以重用翻译结果;7.翻译工作可以交给任何译员,即使这位没有任何程序开发经验。

软软件的内件的内涵涵与外与外延延软件核心的国际化支持几乎是必须的软件用户界面的翻译是最关键的技术写作是翻译工作顺利的基石软件周边的翻译/本地化工作占据了相当的工作量CBTcomputer-based-trainingUIuserinterfacesMarketingpackages,webDocumentationmanuals,helpfilesSupportcustomer,technical,web国国际际化支化支持持documentdocumentdocument文本档案文本档案显显示示内内容容color,graphics,icons,symbols,displayorganizationdate,time,calendar,currency,number,addressinterface:

menus,dialogs,messages,prompts,alerts,documentorganization,writingsystemmetadata,vocabulariescontent:

helpfiles,auxiliarydocuments,HTML/XMLdocumentcontentnon-linguisticlinguistic来自于Kent大学Shreve讲稿结结构构-内容内容-呈呈现现:

层层次清晰、分离次清晰、分离思想思想-结结构构-内容内容-呈呈现现-交互交互层层次之次之间间互相独立互相独立程程序代序代码码与与文字文字输输入入输输出出#includemain()intn;chary5;printf(Thisprogramconvertsdecimalnumberstohexadecimalnn);while

(1)printf(nEnterdecimalnumber:

);scanf(%d,&n);printf(nNumberenteredisdecimalandhexa,n,n);printf(nDoyouwanttocontinue?

);scanf(%s,y);if(strcmp(y,yes)printf(nexiting.n);exit();户户的字符串直接的字符串直接写在程序内写在程序内注意:

注意:

变变量写在量写在了了错误错误:

显显示示给给用用语语句内句内时时,当心,当心语语序,特序,特别别是缺乏上是缺乏上下文的下文的时时候候程序程序资资源文源文件示例件示例(菜(菜单单可可由由此生此生成成)PortfolioMenuMENUBEGINPOPUP&FileBEGINMENUITEM&AddStudent,1MENUITEMSEPARATORMENUITEM&DeleteStudent,2MENUITEMSEPARATORMENUITEM&UpdateStudent,3MENUITEME&xit,4ENDPOPUP&ToolsBEGINMENUITEMAdd&Portrait,5ENDPOPUP&HelpBEGINMENUITEMAboutPortfolio,6MENUITEMSEPARATORMENUITEMContents,7ENDEND注意:

快捷注意:

快捷键键的定的定义义,变换语变换语言,按言,按键键通常通常不能不能变变,于是失去了,于是失去了助助记记的功能候的功能候软软件翻件翻译译时时的的质质量量控控制制检查检查清清单单(不(不完完整列表整列表)字字符集符集是否正是否正确确,兼容性,兼容性是否完整翻译了?

本地化内容中夹杂了格式标签、控制标签的时候的处理有无非法标签(语法错),语义错误(标签及文字的顺序)由程序其他部分生成的动态文字或属性中的文字源程序的格式指令是否适用于目标语言市场图片是否也同步处理好了?

文字和图片的关系是否依然正确?

软件与说明书之间及其他媒体间是否保证了翻译的一致性?

本地化本地化软软件件的功能的功能格式处理待翻译段落、语句的抽取翻译过程中的支持(翻译记忆,术语管理)翻译过内容的放回多语言软件的测试支持(伪翻译)翻译工程项目的管理软软件本地件本地化化的部分的部分最最佳佳实实践践软件本身切割成程序和界面设计(资源文件)尽量引用操作系统级别的字符串处理功能尽量使用Unicode/UTF-8编码尽量使用程序和批处理作业模式,手工工作越少,工作效率越高,且工作质量也越高从软件开发的源头起,包括核心部分、用户界面及用户手册都要做到国际化支持整个团队都应该具有全球化的视野和策略安排软软件件项项目目本本地化地化实实战过战过程程I18N受控语言术语表软软件、件、软软件帮助文档件帮助文档,说说明明书书,市市场场宣宣传传材料,材料,帮助帮助文文字字技技术术写作写作L10N本地化服务供应商计算机辅助翻译+机器翻译依依赖赖关系、一致性控制关系、一致性控制软软件件项项目本目本地化支地化支撑撑环环境境L10N本地化软件的发行版项目管理工具及系统本地化工具集合工作流管理和优化文档及文档管理控制译译员员/工程工程师师QA工具/测试软件/软件的可用性评估本地化本地化工程工程项项目目项项目目经经理理翻译记忆术语管理术语抽取工具译译员员/工程工程师师Java程序程序设计设计的国的国际际化化和本地化和本地化最简单的一个示例本节示例引用自:

AlexanderSchonfeld程序改造程序改造为为多多语语言支言支持的前持的前后后对对比比System.out.println(Hello.);System.out.println(Howareyou?

);System.out.println(Goodbye.);执执行行结结果果%javajavaI18NSampleI18NSamplefrfrFRFRBonjour.Bonjour.CommentCommentallez-allez-vous?

vous?

AuAurevoir.revoir.%javajavaI18NSampleI18NSampleenenUSUSHello.Hello.HowHowareareyou?

you?

Goodbye.Goodbye.代代码码区域区域的含的含义义1.指示当前程序运行的语言环境2.根据网络浏览器、操作系统的标识,用户的主动设定而确定3.影响所有与语言和地区相关联的地方,比如排序、日期、时间、货币、数字等格式messageslabelsonGUIcomponentsonlinehelpsoundscolorsgraphicsiconsdatesTimesnumberscurrenciesmeasurementsphonenumbershonorificsandpersonaltitlespostaladdressespagelayouts要要翻翻译译的内容的内容为为了翻了翻译译的便捷而的便捷而进进行的国行的国际际化化设设定定BAD!

ButtonokButton=newButton(“OK”);Good!

StringokLabel=ButtonLabel.getString(OkKey);ButtonokButton=newButton(okLabel);Java国国际际化程序范化程序范例例不不同同语语言言下下的运行的运行结结果,注果,注意意细节细节currentLocalecurrentLocale=en_USen_USAtAt1:

151:

15PMPMononAprilApril13,13,1998,1998,weweattackattackthethe77shipsshipsononthetheplanetplanetMars.Mars.currentLocalecurrentLocale=de_DEde_DEUmUm13.15Uhr13.15Uhramam13.13.AprilApril19981998habenhabenwirwir7Raumschiffe7RaumschiffeaufaufdemdemPlanetenPlanetenMarsMarsentdeckt.entdeckt.请思考:

遇到单复数的时候如何处理遇到主动、被动语态时如何处理?

SampleRuncurrentLocalecurrentLocale=en_USen_USarearenonofilesfilesononXDisk.XDisk.ThereThereThereThereThereThereThereThereisisoneonefilefileareare22filesfilesareare33filesfilesononXDisk.XDisk.ononXDisk.XDisk.ononXDisk.XDisk.currentLocalecurrentLocale=fr_FRfr_FRnnyyaapaspasdesdesfichiersfichierssursurXDisk.XDisk.IlIlIlyIlyaunaunfichierfichierIlIlyya2a2fichiersfichiersIlIlyya3a3fichiersfichierssursurXDisk.XDisk.sursurXDisk.XDisk.sursurXDisk.XDisk.345987,246345.987,246345,987.246fr_FRde_DEen_US9avr98fr_FR9.4.1998de_DE09-Apr-98en_USGood!

判判断一个断一个字字符是否符是否是字母是字母BAD!

if(Character.isLetter(ch)/chisaletterif(ch=a&ch=A&ch=Z)/chisaletter预预置的字符置的字符类类型型LOWERCASE_LETTERUPPERCASE_LETTERMATH_SYMBOLCONNECTOR_PUNCTUATIONetc.isDigit,isLetterisLetterOrDigitisLowerCase,isUpperCaseisSpaceCharisDefined其其他本地他本地化化处处理上理上的麻的麻烦烦单词、句子的边界(哪里可以折行?

)1.不同的语言规则是完全不一样的2.要么逐语言写处理模块3.要么把处理函数抽象出来,主程序就可以自由书写,实际处理函数随着新增语言写好各有优缺点从左到右的语言与从右到左的语言混排处理上下左右都有标记符号的语言混排处理本地化需要的规范无规则不成方圆,现代工业尤其如此对对本地化本地化行行业业来来说说比比较较重要重要的的一些一些标标准准规规范范1.EN15038:

质量规范.2.SRX(SegmentationRuleseXchange):

翻译单元的切分规则.3.TBX(TermBaseeXchange):

术语交换的格式.4.TMX(TranslationMemoryeXchange):

翻译记忆交换格式.5.UNICODE:

计算机处理多语言时的内码标准6.XLIFF(XMLLocalizationInterchangeFileFormat):

为了翻译处理其他文件格式的统一处理规范.7.UAX#29,#14(UnicodeAnnex29,14):

Unicode处理多种语言时的附加标准,专门解决语言单位的额“边界”问题参参与制定与制定标标准的国准的国际组织际组织1.ETSI:

EuropeanTelecommunicationsStandardsInstitute2.GALA:

GlobalizationandLocalizationAssociation3.OASIS:

OrganizationfortheAdvancementofStructuredInformationStandards,XLIFF是其代表作.4.TAUS:

TranslationAutomationUsersSociety5.UNICODEULITC,UnicodeLocalizationInteroperabilityTechnicalCommittee参参与制定与制定标标准的国准的国际组织际组织BrighamYoungUniversityTranslationResearchGroup新新世世纪纪的的翻翻译译活活动动1.质量要求千差万别2.长尾理论很多种的语言需要处理3.内容巨量增长:

自己创作、分享与购买的4.有语义的数据是问题的关键5.翻译活动持续进行6.翻译成为工程任务多人/多地点同步/异步合作7.用户驱动的多方向翻译翻翻译译行行业业的的驱动驱动力力、压压力与力与策策略略选选择择MachinesOpen(Collaborative)Closed(Competitive)Human&Machine4.Dataiscore3.Unlimitedcontent1.Onetranslationqualityfitsall2011201220132.Long-tailoflanguages1.Qualitydifferentiation.5.Projectbased4.TMiscore3.Countingwords2.Selectinglocales5.ContinuoustranslationTranslationasutility7.Cascadedsupplychain6.One-directional7.Collaborativetranslation6.Multi-directional资料来源:

TAUS,GALA关关键键性的性的标标准准曾经的LISA.org倒闭了,但是留下了若干关键性的标准化协议,包括:

TMX,TBX,SRX和GMXETSI持有上述协议,并继续发展目前游戏玩家主要是TAUS,GALA,ISOTC37,OASIS,W3CETSI-LISA成员:

WhP(convenor),HP,Huawei,Alcatel-Lucent,Lionbridge,Cisco,IBM.forall加入:

http:

/docbox.etsi.org/HF/Open/ISGLISHowcanIjoinandparticipate?

1)DownloadandsigntheISGAgreementETSIISGLISKITFORSIGNATURE.ziphttp:

/docbox.etsi.org/HF/Open/ISGLIS/*and*2)SubscribetoISGLISemailexploderlistandparticipateinconferencecalls,virtualmeetingsandface-to-facemeetingscollocatedwithLocalisationeventsinallregions.OASISXLIFF业业内最重要的内最重要的标标准之一准之一XLIFF2.0corespecification:

1.CommitteeDraftwithin20112.PublicreviewQ120123.OASISstandardQ22012Characteristicsof2.01.Non-negotiablecore2.Optionalmodulesforspecializedfunctionalities3.Explicitconformancecriteriaandprocessingrequirementsforbothcoreandmodules4.AlthoughtheXLIFF1.xstandardwasintendedprimarilyasanexchangeformattheindustrypracticeshowsthatthedefinedformatisalsosuitableforstorageandlegacycontentleveragepurposes.OASIS的其他的其他任任务务1.LeverageUAX#29astherulespecificationstandard2.UpdateSRX(SegmentationRuleeXchange)basedonUAX29forinterchangebetweensystems3.EstablishcoredefinitionatperlanguagelevelthruCLDR(UnicodeCommonLocaleDataRepository)4.AllowforextensionpossibilitiesperlanguageperdomainthruULIsegmentationrepertoire(TBD)5.Providereferenceimplementationwhereapplicable:

6.DeliverbasicimplementationofsegmentationthruICU(InternationalComponentforUnicode)7.IntegrateICUinpublicdomaintranslationworkbenchandmanagementsoftwaresuchasOpenTMS/OpenTM2orGlobalSight8.SharedreferenceimplementationofXLIFFforlocalizationdatatransfer为加入本地化行业做好准备“懂语言、懂文化、懂技

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1