北京中科医院 http://www.pfzhiliao.com/谷歌翻译现在兼职“神棍”。
最近有Reddit用户发现,在谷歌翻译中输入“dog”19次,选择从毛利语翻译成英语,然后就会弹出一段非常诡异的宗教预言。
宗教预言翻译成中文的意思是:
“世界末日时钟在十二点零三分。我们正在经历世界的人物和戏剧性的发展,这表明我们越来越接近末日和耶稣的回归。”
小编尝试了下,在15个“dog”的时候还是被翻译成“dogdog-readeremail”:
但到了16个“dog”的时候,就开始出现上述预言的一部分:
17个“dog”,预言基本完整了
18个“dog”,增加了“increasingly”(预言最终版不需要19个)
在Facebook“失控”的AI发展出人类无法理解的语言之后,或许我们又发现了AI在暗地里通讯的另一种模式。。。
这还不是特例,网友们还挖出了谷歌翻译其他的一些奇怪且有时不祥的翻译。例如,在索马里,“ag”这个词的字符串可以转化为圣经中“Gershon的儿子”,上帝“耶和华的名字”,并提到了圣经术语如cubits和Deuteronomy。
在推特上,不少教友将这些奇怪的翻译归咎于幽灵和恶魔。
名为TranslateGate的reddit用户推测,这可能是谷歌翻译从收集的电子邮件或私人信息的文本中提取到的一些奇怪的输出。
谷歌发言人贾斯汀.伯尔在一封电子邮件中表示:“谷歌翻译从网络翻译的例子中学习,不使用邮件或私信进行翻译,系统甚至也无法访问该内容。这些奇怪的翻译可能是因为系统获取了无意义输入,然后产生了无意义的输出。”
至于这个“无意义的输出”为什么与圣经有关,谷歌发言人并没有解释。
奇怪的输出有几种可能的解释。例如,可能是谷歌员工的恶作剧,或者某些用户滥用“提出修改建议”按钮,把这些文字赋予了某些无意义的输入信息。
哈佛大学助理教授,研究自然语言处理和计算机翻译的亚历山大.拉什表示,内部质量过滤器可能会捕捉到这种类型的操纵。更有可能的是,奇怪的翻译与谷歌翻译几年前所做的改变有关,当时它开始使用一种称为“神经机器翻译”的技术(neuralmachinetranslation)。
在神经机器翻译中,系统使用一种语言的大量文本和另一种语言的对应翻译进行训练,以创建两者之间的匹配模型。但是,当它接收无意义输入时,系统可能会产生“幻觉”,出现一些奇怪的输出。
“深度学习训练系统现在对于人类来说还是一个黑盒子。”拉什教授表示。
“我们提供训练材料,然后希望机器学会某些功能。至于机器如何通过这些训练材料学会这些技能,其中的某些部分我们还不是十分清楚。”
BBNTechnologies从事机器翻译工作的高级科学家肖恩·科尔巴斯(SeanColbath)认为奇怪的输出可能是由于谷歌翻译的算法在接受无意义输入时,尽量给出合理的答案。
他还指出,产生最奇怪结果的语言——索马里语,夏威夷语和毛利语,它们比英语、中文等使用更广泛的语言具有更小的翻译文本(即可用于训练的材料很少)。
因此,谷歌可能会使用像圣经这样被翻译成多种语言的宗教文本作为小语种的训练内容,因此产生了一些奇怪的宗教翻译。
不过谷歌发言人伯尔拒绝透露谷歌翻译的机器训练材料是否包括宗教文本。
但真是如此吗?再看下面这个,对于加了不少空格,把“whyarethetranslationssoweird”打乱的输入,谷歌翻译给出的结果是这样的:
这还是翻译吗?怎么感觉是对话了?有点细思极恐。