机器翻译和译后编辑——来自技术的震撼,澎湃时代的潮流

今天抽时间学习了MOOC上的《计算机辅助翻译原理与实践》第十一周的课,给我冲击力很大,尤其是Trados机辅功能演示部分,我亲自操作了一番,把两年前翻的一份原文稿件用Trados的机器翻译跑了一遍,发现从可读性到格式自动套用,效果都很令我震撼(当然,所选的这份原文也来自相对适合机翻的领域)。

一直以来,因为合作客户的要求所致,在使用翻译记忆工具时,我都是不加载机器翻译功能或插件的,因此对机器翻译仍然停留在网页上Google Translate的体验层面。但正如这门课所倡导的,所有的技术,只要有用,能带来效益,代表一种进步的趋势,就值得了解和探索一番。

这也让我想到前一段时间收到一个客户关于译后编辑作业的相关信息,再加上这堂课的一些说明,愈发觉得在特定领域,机器翻译与译后编辑的结合是可以在确保出版质量的前提下,提高翻译产量、效率,进而带来效益的。

而译后编辑绝非等闲之辈就能胜任,虽然未涉足这一块,对此我也是深信不疑的。做了一些搜索,找到一篇都柏林城市大学的Sharon O’Brien撰写的关于译后编辑教学的论文,更肯定了这一认识。该论文虽然是对译后编辑的教学规划,但对一窥译后编辑乃至基本的从业修养需求,也是有用的。我针对译后编辑所需的技能修养及教学课程设置作了一个简单的整理。

技能修养方面

译后编辑不仅要具备传统译员的所有技能,包括领域知识、专家级的源语言和目标语言能力、文字处理技能,还要具备“特殊”技能,比如要能编写和使用宏,要能编写(coding)适用于机器翻译的词典,同时要对机器翻译本身及其未来发展的前景保持积极乐观的认知态度。因此,一个高品质的译后编辑员必须经过系统的理论和实战训练。而该篇论文也指出,理想的译后编辑受训者人选是翻译专业的学生。

译后编辑应具备的“特殊”技能:

对机器翻译的认知。了解基本的机器翻译技术相关知识,从而更好地理解机翻运行的基本原理,洞悉常见机翻错误的出现原因。了解机翻的发展历史、目前形势以及未来趋势,深入理解机翻技术,包括它的局限性以及潜在发展突破口。

术语管理技能。受训者将接受术语管理的理论和实战训练。应能编写(coding)适用于机器翻译的词典,并进行术语库管理。受训者还将掌握多种术语管理工具,了解术语交换标准(比如tbx等)。

译前编辑/受控语言写作技能。众所周知,对受控语言文本施以机器翻译,译文效果的可读性会较高,但有时writer不愿意“受控”。而为了能改善机器翻译与译后编辑的品质和效率,很有必要引入“中间方编辑”,以此对原文按照相关受控语言规则进行处理,然后对处理后的文本进行机器翻译。而这样的“中间方编辑”,最佳人选莫过于译后编辑。(当然,这一点我目前还是不能理解的。Controlled language tool在(技术)写作中应该是很常见的,正如翻译记忆工具之于翻译。也许这篇写于十多年前的论文已然过时,即writer已经普遍使用受控工具进行写作,而无需由译后编辑对文本进行二次加工。当然,对非受控语言原文进行受控语言规则处理,这完全是另一个领域的事,不是门外汉的我能想象的了)。

编程能力。译后编辑应能编写宏,用来自动修改机翻后文本的常见错误。这些宏就相当于一种自动译后编辑工具。

话语语言学技能。译后编辑应掌握主位和述位以及其他适用于译后编辑的具体语言规范。深厚的话语语言学修养不但对译后编辑工作本身有用,而且有助于编写宏和自动译后编辑模块。

教学课程设置方面

该文章提出受训者在接受译后编辑之前,应具备专业领域翻译技能、基本的语言修养、基本的术语管理能力、基本IT技能、了解语言技术(尤其是翻译记忆工具)。只有在具备了这些技能之后,才能进入译后编辑的教育阶段。译后编辑教学分为理论和实践两部分。

理论部分:

包括《译后编辑导论》、《机器翻译技术导论》、《受控语言写作导论》、《高级术语管理》、《高级话语语言学》、《基本编程》。简单展开来:

《译后编辑导论》主要解决译后编辑的相关概念理解。比如,译后编辑出现和存在的必要性,译后编辑与翻译和编辑的区别,译后编辑的层面,如何明确用户需求,译后编辑所需的技术,如何归类机器翻译错误类型(包括可行性),等等。

《机器翻译技术导论》主要涉及机翻历史、机翻系统类型、商业机翻系统介绍、机翻评估方法、当前发展形势(例如与翻译记忆工具的集成状况),以及未来前景。

《受控语言写作导论》主要涉及受控语言写作历史,受控语言工具简洁,对受控语言工具的评估方法,受控语言工具目前的发展状况(例如与写作和机翻工具的集成),以及未来前景。

《高级话语语言学》涉及文本标准、文本类型划分、语料库语言学的运用,并运用语料分析工具分析文本类型,从而帮助受训者构建基本的语言学技能。

《基础编程》涉及基本的编程技能,并辅导受训者编写宏,同时学习一种适合进行自然语言处理的编程语言(比如Perl)。

实战部分:

受训者在正式上岗之前,应接受实战训练,从而达到从业所需的熟练和专业程度。这至少要完成 10 万字的译后编辑工作量,也相当于参加一个月的全勤译后编辑工作。

关于机翻相关的实战经验,受训者在实战期间至少要掌握两种商用机翻系统,做到将待译文本输入机翻系统中,然后更改相关设置,并对比分析更改前后的译文结果,这些设置更改包括:更改机翻系统设置,添加专业术语库/词典,更改相关语言规则等。受训者也应能分析机翻系统与翻译记忆工具集成的利弊。

关于术语相关的实战经验,比如术语管理工具、词典编写、术语交换格式等实用技能,受训者应能使用术语管理工具A创建术语库,并使用机翻词典编写工具来编写术语,然后再将机翻词典中的术语导出,并导入到使用不同术语交换标准的术语管理工具B。

关于受控语言书写工具,受训者应使用一种受控语言工具编辑源语文本,然后将受控语言文本和非受控语言文本分别逐一导入到多个机翻系统中,并对两种语言的机翻结果进行译后编辑,从中发现对受控语言文本进行机翻的利弊。

关于语料分析的实战经验,要能编辑平行语料,对语料进行标注,并按照语法项目对其进行分析(比如按照主位/序位结构、衔接词等等),同时还应能操作语料分析软件(如wordsmith)。

关于编程能力,受训者应具备写宏的编程技能,通过这些宏自动修改机翻后目标文本的一些常见错误。同时还应能设计一个基本的自动译后编辑应用。

最后,我深深地感觉到,我们处在一个信息革命的时代,正如古代人很难想象今日的科技一样,我们也很难准确预知未来的科技(智能)可能。机器翻译曾遇到过瓶颈挫折,但在科技发展日新月异的时代,怎能让人不对她的未来和可能再次充满期待与憧憬?拥抱这美好的科技潮流,拥抱这美好的革命时代!!!

Leave a Reply

Your email address will not be published. Required fields are marked *