谷歌Translatotron人工智能翻译并模仿用户自己的声音

2021-11-09 09:01:10   编辑:东方雅梦
导读当谈到口语的实时翻译时,我们可能即将到达恐怖谷。令人惊讶的是,系统,尤其是谷歌的系统,现在能够即时翻译我们所说的内容,但几乎所有这

当谈到口语的实时翻译时,我们可能即将到达恐怖谷。令人惊讶的是,系统,尤其是谷歌的系统,现在能够即时翻译我们所说的内容,但几乎所有这些系统都用自己明显合成的声音说话。如果你听到自己说另一种你几乎不知道的语言,你会有什么感觉?由于 Translatotron,这就是谷歌翻译可能提供的神奇且几乎令人不安的未来。

Translatotron 不是变形金刚的新角色。这只是 Google 的 AI 研究人员给他们的端到端、语音到语音翻译模型起的绰号。EESSTM(尊重?)只是听起来既不朗朗上口,也不像舌头曲折。

Translatotron 即使在翻译后的语音中也能保留源说话者的声音,这实际上只是系统真实性质的结果。大多数翻译系统将工作分为三个部分。一个将语音转换为文本,另一个将该文本转换为另一种语言,而第三个将文本重新转换为语音,通常使用与原始说话者不同的声音。

这种级联系统已被证明是高效和实用的,并且是大多数翻译系统(包括 Google 的)的驱动力。然而,谷歌的人工智能研究人员认为,通过去除中间人,端到端系统实际上可以超越它。从字面上看,它跳过了首先将语音翻译成文本的部分。

Translatotron 在团队的测试中还没有超过传统的级联系统,但它证明了它至少是可行的。像任何机器学习模型一样,它可以随着时间的推移而改进。鉴于即使在翻译后的语音中也能保留说话者原始声音的优势,该领域的进一步研究可能会证明对谷歌未来的人工智能翻译系统是富有成效的。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章