VoiceraEVA人工智能模仿人类注意力突出重点

2021-11-15 14:37:57 编辑：祝友平

导读声控智能助手的普及，极大地推动了语音识别和自然语言处理(NLP)领域的发展。这反过来又改进了使用此类技术的其他产品，例如会议和采访中使

声控智能助手的普及，极大地推动了语音识别和自然语言处理(NLP)领域的发展。这反过来又改进了使用此类技术的其他产品，例如会议和采访中使用的转录引擎。但是，在涉及多人的会议中，简单地将有时难以理解的口语准确地转录成文本是一回事，而提取和突出重点是另一回事。Voicera 的会议助手 EVA 可以做到这两点，它的秘密武器是人工智能也就不足为奇了。具体来说，该公司现在向公众提供的 Progressive Attention AI。

如今，将口语转换为文本相对容易。只需向转录引擎提供一个音频文件，然后看着它吐出字母即可。如今，通过使用机器学习和人工智能，转录的准确性得到了提高。但是要真正确定转录中比其他部分更重要的部分，您需要真正注意所说的内容以及所说的方式。为此，您将需要一个双系统 AI。

事实证明，人类的大脑并没有单向思维。它的注意力实际上在两个层面上运作。第一层就像一个高速雷达，总是无偏见地扫描环境。当它捡到一些重要的东西时，它会切换到第二级，在那里注意力和大脑功能更专注于输入，而忽略其他刺激。大脑在这两个层次之间无缝、毫不费力地在瞬间切换，这是人工智能无法做到的。至少直到现在还没有。

AI 系统通常必须在这两个级别之间进行选择，即快速但较低的准确性和准确但耗时的处理。Voicera 的解决方案是实际使用两者。EVA 中的 Progressive Attention AI 实际上由两个系统组成，以模拟人类思维的工作方式。一个人总是在听，在寻找环境和声音的变化。另一种更深入、更专注、更准确，但仅在需要注意时才会发挥作用。喜欢在谈话的重要部分。

如果这个双系统 Progressive Attention AI 对你来说还不够 AI，那么 EVA 实际上还有更多。顺便说一下，Voicera 设置 EVA(Enterprise Voice AI 的缩写)来处理转录时，它实际上在同一个音频文件上使用了三个训练引擎。每个引擎专门针对特定场景，例如在具有大量背景噪音的会议上训练的引擎，在多扬声器上训练的引擎等。这称为集成学习，旨在提高输出的准确性。当引擎之间对特定声音翻译的单词存在分歧时，机器学习层充当仲裁者，要么选择在给定情况下具有更多专业知识的引擎，要么简单地选择三个引擎中的两个同意的输出之上。

这个多方面的 AI 系统不仅允许 EVA 准确地突出显示您可以稍后共享的抄本部分，它还充当一种冗余系统。您可以录制会议或对话，确信即使 Internet 连接中断，您仍会得到有用的成绩单。Voicera 将降低流式传输到其即时转录引擎的音频的比特率和质量，同时保留高质量版本，以便在您获得更好的连接时进行后续处理。

虽然 EVA 自然依赖机器学习来提高其准确性，但 Voicera 也希望用户为其提供一些帮助。用户在转录完成后所做的评论、注释和编辑对改进 AI 模型大有帮助。也就是说，它的移动应用程序仍然没有这种编辑能力，Voice 正在努力改变这一点。

考虑到当今通常快节奏的会议，过多的移动设备会分散您的注意力，而人们自然而然的注意力就会很短，因此可以随时掌握会议或采访中发生的所有对话。借助Voicera和 EVA，您可以依靠出色的人工智能为您记笔记，同时放下笔专注于真正重要的事情：出席并关注身边的人。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇:VoiceraEVA会议人工智能助手进行了性别中立的改造

下一篇:VisorforOverwatch人工智能在比赛期间提供实时性能反馈

VoiceraEVA人工智能模仿人类注意力突出重点

猜你喜欢

最新文章