阿拉伯世界的报纸以乏味的官腔闻名,这也不全是空穴来风。比方说某天,你可能会读到:
伊朗外交部相关人士向《生活报》(Al-Hayat)透露,“只要对方不违反核协议,德黑兰就会继续遵守条约”。
这篇报道本身没什么特别之处,但不同寻常的是,因为谷歌,英语读者现在也能自己阅读阿拉伯报纸了。
过去几个月里,免费在线翻译的质量一下子提高了不少,这可能给在线翻译平台的老用户们带来了惊喜。而就在11月,谷歌又推出了新版翻译系统。旧版翻译是“以短语为单位”的机器翻译,把一句话分成几块单独翻译,译文通常断断续续,错误频出。
新版翻译仍然会犯错,不过与旧版的错误百出相比,情况好了很多。新版系统采用人工神经网络,将各层的数字“神经元”串联起来,这样每层就能将输出结果传递给下一层,这种方法与人类大脑的运作方式大致相似。以短语为单位的旧版翻译系统首先要接受大量人工翻译文本的“训练”,神经网络翻译系统也是如此。不过,它会拎出单个词语,结合所在语境,把词语转换成一种抽象的数字表达,然后,根据之前学习过的目标语言的语料库,找出最合适的表达。神经网络翻译系统处理长句的能力要比旧版好得多。
谷歌的新版翻译系统起初只能实现8种语言和英语之间的互译,其中大部分属于欧洲语系。对机器(和人类)来说,完成两种相似语言之间的互译要容易很多。不过,谷歌后来又拓展了神经网络翻译系统,使其能够翻译汉语等语言(汉语是谷歌的首批研究对象之一),最近还增加了阿拉伯语、希伯来语、俄语和越南语。掌握这些语言十分重要,却也是非常困难,因此这是个激动人心的进步。4月25日,谷歌又拓展了9种印度语言的翻译。同时,微软的神经网络翻译系统也可翻译一些难度较大的语言了。
但是,谷歌翻译仍时不时地会冒出一些错句。比如,以色列《国土报》(Harretz)上有一则希伯来语报道,其导语用谷歌翻译出来如下:
According to the results of the truth in the first round of the presidential elections, Macaron and Le Pen went to the second round on May 7. In third place are Francois Peyon of the Right and Jean-Luc of Lanschon on the far left. 根据第一轮总统竞选事实的结果,马卡龙和勒庞晋级5月7日的第二轮角逐。右翼候选人弗朗索瓦·佩永和极左派朗雄的让-吕克位列第三。