初试微软机器翻译:惊艳与局限

这几年机器翻译比较热,尤其是神经机器翻译的问世,甚至又出现了“机器替代人”的标题党。由于我从事的翻译领域主要是创意性文案,很少涉及机器翻译,加上多少有些不以为然,毕竟人类的语言太复杂了,因此没有怎么实际体验。前一段时间作为“娱乐”领略了一下微软机器翻译,有被惊艳到,尽管也看到了它的局限性。

我体验的是Translator App上的语音翻译功能以及网页版Bing Microsoft Translator上的文本翻译功能。

对于一般文本,比如下面截图所示,翻译结果还算不错,而且在下图的例子中,它很惊艳地把第二句话隐藏的主语正确地补上了。

对于一般的语句,App的语音翻译也不错,能比较正确地识别语音,断句也还可以。

 

但它的局限性也非常多。简单地说,在语音翻译中,如果连续讲话,语音识别的断句会出现问题,一些词语会识别失误,这直接影响了翻译质量。在文本翻译中,有几类文本是它处理不好的:文化类、语境类、专业文案。

文化类是指包含鲜明地方文化特色或文化寓意的语句,比如:

语境类是指一些词语的意思要根据语境来选择,而机翻选择了错误的意思,或者说选了最字面的意思,但并不符合当时的语境。就比如下面的:

除了选错多义词的语境含义,还有可能出现对整段话的理解太过字面,没有把真正的意思表达出来。

专业文案是指比如法律合同,它会出现语意理解上的偏差甚至做出意思截然相反的翻译。

但有趣的是,正如我们在翻译的时候会经常面对不完美原文文本,机翻面对的也往往是不完美文本。比如在语音翻译方面,很大的概率是人讲出的话本身就是逻辑不够,有重复,不连贯,在不该停顿的地方停顿。由于所录入的文本质量不高,机器无法识别真正的信息,自然输出的译文就一塌糊涂。当然,这并不是像有些观点所说的,要倒逼人讲便于机器识别和翻译的语句;相反,人在讲话时出现的诸多“不完美”正是需要人工译员来处理,甚至是一种机器很难企及“智能”。在文本方面,一些机器很难处理的文化创意文案,实际上对人工翻译也是非常大的挑战;有的即使是“完美原文”,比如一些法律合同中的权责归属关系,但文本含义太绕了,机器很难处理妥当。其实所有这些所谓的局限性既是人工翻译的价值和机遇所在,也是我们对机器翻译的奇幻寄托。

不管怎样,现在的机翻水平是前些年所无法想象的,这是非常激动人心的进步,对翻译从业者来说是福音而绝非威胁。这些日新月异的科技进步,把我们从重复性作业中很好地解放了出来,让我们反思作为人的真正价值所在,也督促我们去实现更加原创的价值。在一次次迭代中,突破局限,领略惊艳。

Leave a Reply

Your email address will not be published. Required fields are marked *