2016年9月28日星期三

谷歌翻译使用神经机器系统

  谷歌宣布,网络和移动版的谷歌翻译将使用新的神经机器翻译系统。这项新技术名为 Google Neural Machine Translation,它能让翻译系统不再像以前一样逐字逐句的翻译,而是根据整篇文章的大意来对句子进行分析。在新技术使用后,翻译错误可减少 60%及以上。

  今年早些时候,谷歌高级研究员杰夫·迪恩透露说,谷歌正致力于研究将深入学习功能更多地整合到谷歌翻译中。此前谷歌也曾在谷歌翻译中使用神经网络,但具体仅用于实时视频翻译功能。据了解,目前谷歌已经把深层神经网络整合到越来越多的应用中,包括智能即时通讯工具 Google Allo 和 Gmail Inbox,同时也帮助谷歌更有效地运行数据中心。

  Google Brain 的研究团队成员表示,使用这种技术的翻译质量,已经能够接近普通的人类译员。团队内科学家富国乐和麦克·舒斯特指出,“在双语评委的帮助下,从维基百科和新闻网站选取的几种语言对样句,翻译错误实际上下降了 55-85%。”

  但是,据了解,这一系统并非尽善尽美。翻译的准确性仅限于同一语系的不同语言,比如从英语翻译成法语。但在英汉互译的情况之下,准确度就会大幅度下降。此外,漏译和误译专有名称或罕见术语以及脱离上下文语境的问题仍然存在。富国乐和舒斯特写道:“还有很多工作要做,我们会为用户更好地服务。然而,GNMT 代表了一个重要的里程碑。”

  谷歌研究人员在其论文中说道:“人工评估显示,就英法、英西和英中翻译而言,谷歌神经机器翻译系统的出错率比基于短语的翻译系统少了60%。进一步的试验显示,前者的质量跟人类译员的平均质量更加接近。”

  不过,谷歌Brain团队科学家Quoc Le和Mike Schuster今天发表博客称,尽管谷歌神经机器翻译系统取得了很大的进步,但它还是会犯一些人类译员不会犯的重大错误,比如说漏掉一些词语、专有名词和罕见术语翻译错误、脱离语境孤立地翻译句子。

  对于谷歌翻译,谷歌还有很多工作要做,但是谷歌神经机器翻译系统代表着一个重大里程碑。