VoiceraEVA人工智能模仿人类注意力突出重点

2021-11-15 14:37:57   编辑:祝友平
导读声控智能助手的普及,极大地推动了语音识别和自然语言处理(NLP)领域的发展。这反过来又改进了使用此类技术的其他产品,例如会议和采访中使

声控智能助手的普及,极大地推动了语音识别和自然语言处理(NLP)领域的发展。这反过来又改进了使用此类技术的其他产品,例如会议和采访中使用的转录引擎。但是,在涉及多人的会议中,简单地将有时难以理解的口语准确地转录成文本是一回事,而提取和突出重点是另一回事。Voicera 的会议助手 EVA 可以做到这两点,它的秘密武器是人工智能也就不足为奇了。具体来说,该公司现在向公众提供的 Progressive Attention AI。

如今,将口语转换为文本相对容易。只需向转录引擎提供一个音频文件,然后看着它吐出字母即可。如今,通过使用机器学习和人工智能,转录的准确性得到了提高。但是要真正确定转录中比其他部分更重要的部分,您需要真正注意所说的内容以及所说的方式。为此,您将需要一个双系统 AI。

事实证明,人类的大脑并没有单向思维。它的注意力实际上在两个层面上运作。第一层就像一个高速雷达,总是无偏见地扫描环境。当它捡到一些重要的东西时,它会切换到第二级,在那里注意力和大脑功能更专注于输入,而忽略其他刺激。大脑在这两个层次之间无缝、毫不费力地在瞬间切换,这是人工智能无法做到的。至少直到现在还没有。

AI 系统通常必须在这两个级别之间进行选择,即快速但较低的准确性和准确但耗时的处理。Voicera 的解决方案是实际使用两者。EVA 中的 Progressive Attention AI 实际上由两个系统组成,以模拟人类思维的工作方式。一个人总是在听,在寻找环境和声音的变化。另一种更深入、更专注、更准确,但仅在需要注意时才会发挥作用。喜欢在谈话的重要部分。

如果这个双系统 Progressive Attention AI 对你来说还不够 AI,那么 EVA 实际上还有更多。顺便说一下,Voicera 设置 EVA(Enterprise Voice AI 的缩写)来处理转录时,它实际上在同一个音频文件上使用了三个训练引擎。每个引擎专门针对特定场景,例如在具有大量背景噪音的会议上训练的引擎,在多扬声器上训练的引擎等。这称为集成学习,旨在提高输出的准确性。当引擎之间对特定声音翻译的单词存在分歧时,机器学习层充当仲裁者,要么选择在给定情况下具有更多专业知识的引擎,要么简单地选择三个引擎中的两个同意的输出之上。

这个多方面的 AI 系统不仅允许 EVA 准确地突出显示您可以稍后共享的抄本部分,它还充当一种冗余系统。您可以录制会议或对话,确信即使 Internet 连接中断,您仍会得到有用的成绩单。Voicera 将降低流式传输到其即时转录引擎的音频的比特率和质量,同时保留高质量版本,以便在您获得更好的连接时进行后续处理。

虽然 EVA 自然依赖机器学习来提高其准确性,但 Voicera 也希望用户为其提供一些帮助。用户在转录完成后所做的评论、注释和编辑对改进 AI 模型大有帮助。也就是说,它的移动应用程序仍然没有这种编辑能力,Voice 正在努力改变这一点。

考虑到当今通常快节奏的会议,过多的移动设备会分散您的注意力,而人们自然而然的注意力就会很短,因此可以随时掌握会议或采访中发生的所有对话。借助Voicera和 EVA,您可以依靠出色的人工智能为您记笔记,同时放下笔专注于真正重要的事情:出席并关注身边的人。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章