本文由robot.tv译自IEEE Spectrum: Baidu’s AI Can Do Simultaneous Translation Between Any Two Languages (《百度的AI可以同时翻译任意两种语言》)

银河系的未来旅行者感到兴奋:中国科技巨头百度发明了一种翻译神器,让我们向“巴别鱼”迈进了一步。

对于那些不熟悉道格拉斯·亚当斯科幻小说的人,请允许我解释一下。巴别鱼是一种滑溜溜的虚构生物,它居住在人类的耳道中,利用它们的神经系统提供他们听到的任何语言的即时翻译。

在现实世界中,到目前为止,我们必须与人力和软件口译员合作,尽力跟上。但百度研究公司新推出的人工智能工具,名为STACL,可以大大加快速度。它使用复杂类型的自然语言处理,只落后几个字,并通过预测未来保持不变。

百度硅谷人工智能实验室的首席科学家梁煌说:“值得注意的是,它预测并预测说话者将来会说几秒钟。” “这是人类口译员一直使用的技术 – 而且对解释技术的实际应用至关重要。”

STACL(具有预期和可控延迟的同声翻译)工具可与在联合国会议期间坐在展位内的人工口译相媲美。这些人的工作很艰苦。作为一个高官说话,口译员必须同时倾听,精神翻译和用另一种语言说话,通常只落后几句话。这是一项艰巨的任务,联合国口译员通常在团队中工作,轮班时间只有10到30分钟。

需要那种并行处理的任务 ——听,翻译,说话 ——似乎非常适合计算机。但直到现在,对他们来说太难了。最好的“实时”翻译系统仍然执行所谓的连续翻译,在这种翻译中,他们等待每个句子结束,然后再用另一种语言呈现它。这些系统提供了非常准确的翻译,但它们很慢。

梁煌告诉IEEE Spectrum,同声传译的重大挑战来自各种语言的词序差异。 “在联合国,有一个着名的笑话,一个从德语翻译成英语的翻译会暂停,似乎陷入困境,”他说。 “如果你问为什么,他们会说’我正在等待德语动词。’”在英语中,动词在句子的早期出现,他解释说,而在德语中它出现在句子的最后。

STACL通过根据过去看到的所有句子预测动词来解决这个问题。对于他们目前的论文,百度研究人员对新闻专线文章进行了STACL的培训,其中同样的故事以多种语言出现。因此,它擅长对涉及国际政治的句子进行预测。

梁煌给出了一个中文句子的例子,最直接的翻译是“习近平法国总统访问表达赞赏。”然而,STACL会从句子开头猜测这次访问会顺利进行,并将其翻译成英文。正如“习近平对法国总统的访问表示赞赏”。

对于他们目前的论文,研究人员展示了其从中文翻译成英语的两种语言(两种语言在字序上有很大差异)。 “原则上,它可以适用于任何语言对,”梁煌说。 “有关于所有其他语言的数据。我们还没有完成这些实验。“

显然,STACL可能会犯错误。如果法国总统的访问进展不顺利,习近平反而表示遗憾和沮丧,那么翻译就会有一个明显的错误。目前,它无法纠正错误。梁煌说: “人类译员会道歉,但我们目前的系统没有能力修改错误”。

但是,系统是可调节的,用户将能够在速度和准确度之间进行权衡。如果STACL被编程为具有更长的延迟 – 比原始文本落后5个字而不是落后3个字 – 它更有可能使事情正确。

通过在特定主题中训练它也可以使其更准确,以便它理解将出现在例如医学会议的演示中的可能句子。 “就像一个人类同声传译员一样,它需要在活动前做一些功课,”梁煌说。

梁煌表示,STACL将于11月1日在百度世界大会上进行演示,届时它将提供演讲的实时同声翻译。目的是最终将这种能力放入消费者的口袋中。百度之前已经展示了一个用于逐句翻译的原型消费设备,梁煌说他的团队计划将STACL整合到该小工具中。

目前,STACL致力于文本到文本的翻译和语音到文本的翻译。 为了使其对消费者设备有用,研究人员希望掌握语音到语音的翻译。 这将需要将语音合成集成到系统中。 当语音一次只合成几个单词,而不知道整个句子的结构时,使它听起来自然是一个挑战。

梁煌说,他的目标是让普通大众更容易获得即时翻译服务。 但他指出,STACL“并非打算取代人类口译员 – 特别是对于需要精确和一致翻译的高风险情况。”毕竟,没有人希望AI成为国际事件的中心,因为它错误地预测了习的赞赏或遗憾。