文章

译者,濒危物种?

20世纪50年代,人们开始尝试使用公共机器翻译,一种观点从此不断传播,那就是机器翻译必将取代人工翻译。然而,如今从事翻译行业的人数却比以往任何时候都要多。尽管在线翻译系统已经变得非常高效,并且大多数人都具备使用条件,但翻译这一职业从未因此被扼杀,而仅仅是得到了改变。
Adrià Fruitós for The UNESCO Courier

乔斯·莫肯斯Joss Moorkens

爱尔兰都柏林城市大学应用语言和跨文化研究学院和数字内容创新全球卓越中心副教授。

1954年,由 IBM 公司和华盛顿特区乔治城大学的研究人员牵头,开展了首次公共机器翻译试验,目的是在几年内实现从俄语到英语的高质量自动翻译。自此,关于机器很快就会取代译者的说法不绝于耳。2018年,微软公司声称其开发的中译英新闻机器翻译可以与人工翻译媲美。尽管如此,在大多数人都有条件使用自动翻译系统的情况下,全世界翻译行业从业人员的数量却比以往任何时候都要多——大约有60万人。这样看来,职业译者是否并不需要感到忧虑?

实际上,情况远比其表象更复杂。首先,译者自己也使用数字翻译工具。他们在进行重复性或迭代性文本翻译时可能会使用翻译记忆库,即重新利用与之前翻译过的相同或相似的内容,从而节省劳动力。许多译者使用机器翻译,并在机器生成文本的基础上译后编辑。不过也有人不喜欢机器翻译后再进行编辑这份工作,他们认为这份工作枯燥乏味,报酬也很低。

当然,也有完全由机器翻译、没有人工参与的文本。现在,数字内容比任何时候都要多,要想翻译全部内容,人工翻译根本不够用。总的来说,决定人工投入的一般经验指导原则是,自动翻译要视文本的使用期限,以及错译造成的风险水平而定。这表示自动翻译可以运用于在线旅游评论或推文,但印刷材料(例如市场宣传或医药文本)则需要加强人工核查。

破灭的希望

随着自动翻译出现而产生的一个问题是,人们往往会高估其输出内容的质量。1954年,人们寄予机器翻译的希望落空了,而2018年关于新闻内容的机器翻译水平可与人工媲美的说法则基于非常有限的评判标准。当然,过去几年中,这些技术取得了很大进步。

最早的在线翻译系统以一套手工编码规则和双语字典为基础。自20世纪90年代以来,这些系统利用已有的人工翻译文本,计算原文句子在统计上最可能的翻译结果。到21世纪头10年,免费的机器翻译随处可得。2016年前后,机器翻译质量有了长足进步,产生了神经机器翻译(NMT)。神经机器翻译系统旨在复制人脑的神经系统,从而试图通过“训练数据”,即原句和人工翻译材料,产生概率最高的翻译结果。

可及性和质量的提高使得这些在线翻译系统变得更加有用,也更受欢迎。例如,谷歌公司在2016年宣布,谷歌翻译系统每天产出1430亿个单词。不过有时候,单词的准确度还有待提高。

误译和偏见

尽管神经机器翻译复杂的机制运作可以生成看似通顺的翻译结果,但有时也会产生完全出人意料的结果。常见的问题是,对句子中的名词或动词误译,翻译结果读起来虽然通顺,但与原句的意思有出入。另一个陷阱是:系统中植入的偏见使得某些形容词带有特定意味,例如“美丽”“活泼”或“性感”是用来形容女性的,而“体面”“精明”或“讨人喜欢”是用来形容男性的。

这类问题难以察觉,也很难解决。此外,一些词汇模棱两可,让早期系统感到困惑,这个难题现在依然未决。神经机器翻译有时也会产生完全出人意料的结果,研究人员称之为“幻觉翻译”,而后者曾经引发媒体的慌乱。2018年的一篇报道指出,谷歌翻译将随机组合的单词翻译成了类似宗教预言的文本。

作者的意图无法编入机器翻译系统。

目前,作者的意图和文本的目的无法输入机器翻译系统。由于默认采用训练数据中最常见的单词,机器翻译结果无法呈现丰富的词汇,尤其对创意文本而言,所有反映作者想法的细微描述都会丢失。

削减成本

尽管存在不足,机器翻译仍被频繁使用,译后编辑已经成为许多译者工作中不可或缺的部分。机器翻译的质量已经提高,又能节约成本,这使机器翻译的使用变得具有吸引力。由于大部分译者都是兼职,他们可能很难完全避免机器翻译。例如,为了节约成本和完工时间,许多字幕翻译工作都包括对机器翻译的译后编辑,而这通常会招致观众对翻译质量的不满。关于文学的机器翻译,英国萨里大学翻译和多模态技术高级讲师安娜·古贝罗 夫· 阿 雷 纳 斯(Ana Guerberof Arenas)博士最近发表报告称,尽管读者能够理解机器翻译的结果,但他们对此类文本的兴致不高,阅读体验也不如人工翻译。

总而言之,机器翻译既能提高效率,又能提供便利,不论译者是否参与其中。尽管如此,高度自动化的工作流程可能会让翻译工作变得不那么有吸引力。有人担心机器翻译和人工翻译会难以为继。但我们不要忘记,爱尔兰都柏林城市大学应用语言和跨文化研究学院多萝西·肯尼(Dorothy Kenny)教授曾经说过,机器翻译在试图取代人工译者的同时,始终依赖着后者提供的训练数据和对合理性的校验。

翻译连接世界
UNESCO
2022年第2期
UNESCO
0000381067