月光博客 » 软件应用 » 我看谷歌翻译辱华事件

我看谷歌翻译辱华事件

11月26日,微博一些营销号发现了一些新的国外公司“辱华”证据,该营销号称,在谷歌翻译的英文翻中文程序中,在英文对话框输入“艾滋病人”等相关词汇,对应的中文翻译就会出现恶毒攻击中国的词汇。

如果是比较懂互联网技术的人,这事情其实一眼就能看明白是怎么回事,但很多外行却不明白,我这里就给大家解释一下这里面的原理和背后的真相。

我看谷歌翻译辱华事件

以往的翻译通常都是使用一个一个词地“死译”,由于词义的多变性,同样一个单词在不同的场合下可能会出现完全不同的含义,因此原先的那种翻译效果可谓“惨不忍睹”,翻译质量普遍很差,Google Translate谷歌翻译服务是目前中文翻译领域中表现最为突出的一个,主要原因是谷歌翻译具有人工智能的词义辨识能力,具有机器自动学习功能。

谷歌翻译的一个改善翻译质量的功能就是提供用户反馈,当用户使用谷歌翻译一个句子,不满意谷歌的翻译质量,可以提交用户的反馈信息,如果提交的数量足够多,谷歌就会接纳这种信息,用来提升翻译质量。

好了,那么我们现在就还原一下事情的真相。

营销号事先现在谷歌翻译里输入“艾滋病人”,谷歌会自动识别源语言是“中文”,对应翻译中文也是“艾滋病人”。这时候营销号将源语言设置为英文,显然“艾滋病人”并不是一个英文单词,谷歌便会将其理解为一个新的英文单词。

我看谷歌翻译辱华事件

重点来了,营销号这时候再点击右侧“提出修改建议”按钮,将翻译的内容修改为特定的辱华词语,然后进行提交,对谷歌翻译的数据进行“数据污染”,经过多次数据污染,谷歌翻译就可以将被指定为英文的“艾滋病人”翻译为特定的辱华词语。

我看谷歌翻译辱华事件

这个问题之所以是被“创造”而不是被“发现”的,原因很简单,没有正常人会这么用网络翻译软件。“艾滋病人”并不是英文,为什么要强制使用“英译中”的翻译模式?“艾滋病人”本身就是中文,为什么还要将其翻译为中文。显然,正常人不可能使用这种异乎寻常、极其罕见的操作方式,而这个所谓的“英文新词”也比较容易进行“数据污染”,于是就有了上面这场闹剧。

这实际上就是一个非常简单的微博营销号财富密码,通过这种简单的技术操作可以凭空“创造”出一条“辱华”新闻来获取流量和金钱,客观上却造就了反智网民的集体狂欢,真不知道这算是这些营销号的悲哀还是这个社会的悲哀。

所以说网民还是要提高自己的知识水平,多学一些互联网技术知识,提高自己的档次,否则整天被这些反智营销号忽悠得晕头转向,自己连一点识别能力都没有,早晚会吃大亏。

对于营销号来说,多行不义必自毙,整天污染和破坏别人的网络服务,实际破坏的是自己的信誉和声望,你所做过的所有坏事,总有一天会报应到自己的身上。

我看谷歌翻译辱华事件

顶一下 ▲()   踩一下 ▼()

相关文章

  1. 1
    bo   说道:
    可能是营销号自己做成提交的辱华词来诬陷谷歌,太坏了
    支持(29反对(9回复
  1. 2
    anhei   说道:
    多学习,避免踩一些没必要踩的坑
    支持(7反对(2回复
  1. 3
    张三   说道:
    干坏事的人哪里都有.
    支持(5反对(0回复
  1. 4
    HH   说道:
    媒体还是要提高自己的姿势水平
    支持(7反对(6回复

发表留言