加拿大外贸
9月30日国际翻译日前夕,Google发布新版神经机器翻译(GNMT)系统,并表示使用了最先进的训练技术,翻译质量会有较大提升。这个消息出来后,当然引起相关人群的一阵骚动,甚至发出了‘是不是以后都不用学英语了’的感叹。尤其活跃的是过度解读这个新闻的媒体和段子手们。作为身处其中的翻译们,会怎么来看这个事件呢?
也许有些人会忧心忡忡,虽然站在他们的角度——‘人工翻译是永远不可取代的’仍然是自己的口号,但是却总有些淡淡的哀伤在撩拨着他们的思绪。这种莫名的哀伤是什么呢?其实就是对机器翻译到底能进步到什么程度不够了解,不好判断不知道未来的变化究竟怎样。最大的恐惧来自于无知。
关于GNMT:
神经机器翻译(NMT: Neural Machine Translation)是一种用于自动翻译的端到端的学习方法,该方法有望克服传统的基于短语的翻译系统的缺点。不幸的是,众所周知 NMT 系统的训练和翻译推理的计算成本非常高。
GNMT即Google Neural Machine Translation系统。
已经经历10年成长的谷歌翻译这次发布的GNMT系统到底取得了什么进步呢?用一张图来直接说明效果:
来自对比评估的数据,其中人类评估者对给定源句子的翻译质量进行比较评分。得分范围是 0 到 6,其中 0 表示「完全没有意义的翻译」,6 表示「完美的翻译」。
在谷歌论文《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》中提到,机器翻译在一些人工翻译绝不会出现的低级错误方面还有很长的路要走,例如漏词和错误翻译专有名词或罕见术语,以及将句子单独进行翻译而不考虑其段落或页面的上下文。
下面的可视化图展示了 GNMT 将一个汉语句子翻译成英语句子的过程。首先,该网络将该汉语句子的词编码成一个向量列表,其中每个向量都表征了到目前为止所有被读取到的词的含义(「编码器(Encoder)」)。一旦读取完整个句子,解码器就开始工作——一次生成英语句子的一个词(「解码器(Decoder)」。为了在每一步都生成翻译正确的词,解码器重点注意了与生成英语词最相关的编码的汉语向量的权重分布(「注意(Attention)」,蓝色链接的透明度表示解码器对一个被编码的词的注意程度)。
使用人类评估的并排比较作为一项标准,GNMT 系统得出的翻译相比于之前的基于短语的生产系统实现了极大的提升。在双语人类评估者的帮助下,我们在来自维基百科和新闻网站的样本句子上测定发现:GNMT 在多个主要语言对的翻译中将翻译误差降低了 55%-85% 以上。
现在,移动版和网页版的 Google Translate 的汉英翻译已经在 100% 使用 GNMT 机器翻译了——每天大约 1800 万条翻译。GNMT 的生产部署是使用谷歌公开开放的机器学习工具套件 TensorFlow 和谷歌的张量处理单元(TPU:Tensor Processing Units),它们为部署这些强大的 GNMT 模型提供了足够的计算算力,同时也满足了 Google Translate 产品的严格的延迟要求。
来看看专业人士的点评吧:
Google翻译达到了人类翻译的水准吗?那要看在什么语言,什么领域,什么任务上。举个极端的例子,如果只是翻译单个单词,我们99.99%的人都比不过电子词典。如果只是翻译比较短的句子,训练语料里覆盖得全而且次数多的句子,机器翻译自然有优势。但要是一个全面的比较,机器翻译跟专业译员的距离相差还是很大的。其实所有的人工智能都是同样的,什么人脸识别超过人类,语义理解超过人类等等,下次再碰到这么说的公司或者媒体,别理他!活不好好干,就知道忽悠人。
翻译也是这样,机器翻译在可以预见的未来取代不了人工翻译。尤其是现在的人工翻译的市场跟机器翻译的市场基本上不重合,人工翻译对准的是高端市场,要求很精准的翻译需求,而机器翻译则是:
1. 要求不那么精准的翻译情景,比如旅游,比如网页浏览,比如信息监控等等。
2. 机器翻译帮助专业翻译人员提高效率。
如果中国对外交流的程度达到欧美现在的程度,那么中国的高端翻译市场将会是无比巨大的。有志于从事翻译的同学,放心大胆地进来吧。当然了,作为一个翻译,如果你到现在还装作看不见机器翻译的进步,还在完全排斥机器翻译,那么被市场淘汰就怨不得别人了。
点评人:加拿大国家研究委员会NRC多语言处理研究组陈博兴研究员。他1998年本科毕业于北京大学,2003年博士毕业于中国科学院声学研究所,主要研究兴趣是自然语言处理、机器翻译和机器学习。
前面对翻译质量的评分结果可以看到,拉丁语族语言之间的相互翻译的质量明显超过汉英之间的互译。
汉英翻译作为最‘难’的语言对中的一种,不但由语言本身的特点所决定,而且更多的是支撑两种语言背后的文化有着巨大的差异。
这种差异我们只需要通过为广大群众喜闻乐见的一个谷歌神翻译‘松下问童子’就可以感知一二。
机器翻译的进步不但不会让翻译市场萎缩,反而会让它更繁荣。因为机器翻译可以进一步消除基本的语言障碍,促进文化的交流。文化交流加强的结果就是翻译的市场增加了。
所不同的是,市场对翻译的质量有了更高的要求。
谷歌翻译的应用场景可能是这样的:
也可能是这样的:
还可能是这样的:
或者是这样的:
但是,人工翻译的以下这些领域,包括谷歌翻译在内的机器翻译还不能涉足:
在人工翻译领域,深谙文化的母语级的翻译也会随着翻译市场的繁荣而大幅增加,高端的场景翻译会大幅增加。
也就是说伴随着谷歌的进步,翻译也需要进步。
英译中的需求会更多,需要中国人来做英译中的外国人会更多。
中译英的需求会更多,需要外国人来做中译英的中国人也会更多!
其他语种也是一样的趋势。即使没有机器翻译来加速推动,文化交流发展方向也是逐渐向着发达和深入的方向进行的。
评论
机器还是不如人工的翻译的,尤其中文有很多典故和成语故事,想让机器翻译出来的话,现在还不现实
评论
正是因为中国文化特别的深厚,而且与西方文化存在巨大的差异,也不像日文那样因受到西方文化影响而阉割了自己的语言,所以才造成了今天中译英成为最困难的配对的局面。
这既是不幸,也是大幸。
评论
让他翻译一篇文言文
评论
即便是通顺地翻译一份信用证也不能胜任,更何况是文言文。
awen2188
评论
是的。举个例子如下:
信用证条款原文:WE HAVE INSTRUCTIONS FROM THE ISSUING BANK TO ADD OUR CONFIRMATION TO THE ABOVE CREDIT.AND IF ,THE BENEFICIARY REQUIRES US TO DO SO , PLEASE INFORM US BY MEANS OF A LETTER ACCORDINGLY AND CONFIRMATION CHARGES TO BE ADVISED LATER. HOWEVER ,WE SHALL ADD CONFIRMATION SUBJECT TO THE RECEIPT OF APPROVAL FROM OUR H.O.
谷歌的翻译:我们有来自发行银行的指示,要求我们向上述信用证的确认,如果,受益人要求我们这样做,请通过信件的方式通知我们,并确认收费以后再告知我们,我们将添加确认主题 到我们HO的批准书。
百度的翻译:我们从开证行添加我们确认上述信贷如果受益人的指示,要求我们这样做,请用一封信并确认费用待以后通知方式通知我们。然而,我们将补充确认接受我们的H. O的批准。
有道的翻译: 我们的指示开证行添加确认上述信贷。如果受益人要求我们这样做的时候,请通知我们通过相应的一封信和确认费用的建议。然而,我们将添加确认收到批准我们的H.O。
上述信用证条款很简单的。一般的单证员一看就能明白。但三种机翻却不能达标,和人工翻译远远不能相比的。
awen2188
加拿大电商刚从事这行半年,对电子行业不了解,自己整理了些,算是学习,供大家分享,也请大家补充。我毕竟是个文科生,对这方面知识严重欠缺。 DVD:英文全名是Digital Video Disk, 即数字视频光 加拿大电商昨天我把提单复件发给了客户,今天收到了他回信,如下: Dear Nicholas, please send all shipping documents. We will check B/L copy and we will reply ASAP. Thank you Best Regards .........................................
·中文新闻 驻扎在北端地区的日本军队向中国发出明确信息
·中文新闻 Bluesky:社交媒体网站吸引了大量当地 X 难民