我看谷歌翻译辱华事件-月光博客

　　11月26日，微博一些营销号发现了一些新的国外公司“辱华”证据，该营销号称，在谷歌翻译的英文翻中文程序中，在英文对话框输入“艾滋病人”等相关词汇，对应的中文翻译就会出现恶毒攻击中国的词汇。

　　最为一个比较懂技术的人，这事情其实一眼就能看明白是怎么回事，但很多外行却不明白，我这里就给大家解释一下这里面的原理。

我看谷歌翻译辱华事件

　　以往的翻译通常都是使用一个一个词地“死译”，由于词义的多变性，同样一个单词在不同的场合下可能会出现完全不同的含义，因此原先的那种翻译效果可谓“惨不忍睹”，翻译质量普遍很差，Google Translate谷歌翻译服务是目前中文翻译领域中表现最为突出的一个，主要原因是谷歌翻译具有人工智能的词义辨识能力，具有机器自动学习功能。

　　谷歌翻译的一个改善翻译质量的功能就是提供用户反馈，当用户使用谷歌翻译一个句子，不满意谷歌的翻译质量，可以提交用户的反馈信息，如果提交的数量足够多，谷歌就会接纳这种信息，用来提升翻译质量。

我看谷歌翻译辱华事件

　　好了，那么我们现在就还原一下事情的真相。

　　营销号事先现在谷歌翻译里输入“艾滋病人”，谷歌会自动识别源语言是“中文”，对应翻译中文也是“艾滋病人”。这时候营销号将源语言设置为英文，显然“艾滋病人”并不是一个英文单词，谷歌便会将其理解为一个新的英文单词，营销号再点击右侧“提出修改建议”按钮，将翻译的内容修改为特定的辱华词语，然后进行提交，对谷歌翻译的数据进行“数据污染”，经过多次数据污染，谷歌翻译即可在将被指定为英文的“艾滋病人”翻译为特定的辱华词语。

我看谷歌翻译辱华事件

　　这实际上就是一个非常简单的微博营销号财富密码，通过这种简单的技术操作可以凭空制造出一条“辱华”新闻来获取流量赚钱，客观上却造就了一个反智社会上愚民的集体狂欢，真不知道这算是这些营销号的悲哀还是整个社会的悲哀。

2021年11月28日星期日

我看谷歌翻译辱华事件