低功耗专用芯片可以使语音识别在电子产品中无处不在

2019-12-17 15:41:31
导读在10年前的笑话中,自动语音识别即将成为人们与他们的主要计算设备交互的主要手段。麻省理工学院的研究人员在期待着声控电子的时代,建立了一个专门用于自动语音识别的低功耗芯片。而运行语音识别软件的手机可能需要大约1瓦的功率,而新芯片需要在0.2到10毫瓦之间,这取决于它必须识别的字的数量。在一个现实世界的应用中,这可能转化为90%到99%的功率节省,这可以使得语音控制对于相对简单的电子设备是实用的。

在10年前的笑话中,自动语音识别即将成为人们与他们的主要计算设备交互的主要手段。

麻省理工学院的研究人员在期待着声控电子的时代,建立了一个专门用于自动语音识别的低功耗芯片。而运行语音识别软件的手机可能需要大约1瓦的功率,而新芯片需要在0.2到10毫瓦之间,这取决于它必须识别的字的数量。

在一个现实世界的应用中,这可能转化为90%到99%的功率节省,这可以使得语音控制对于相对简单的电子设备是实用的。其包括功率受限的设备,其必须从它们的环境中采集能量或者在电池充电之间进行几个月。这种设备构成了所谓的"物联网,"或IoT的技术支柱,它指的是车辆、设备、土木工程结构、制造设备和甚至牲畜很快会有传感器直接向联网的服务器报告信息,帮助维护和任务的协调。

"语音输入将成为许多可穿戴应用和智能设备的自然界面,"说,AnanthaChandrakasan是麻省理工学院电气工程和计算机科学教授的VannavarBush教授,该教授的小组开发了新芯片。"这些设备的小型化需要与触摸或键盘不同的接口。与在云中执行此操作相比,本地嵌入语音功能以节省系统能耗是至关重要的。"

"我不认为我们真的为特定的应用开发了这种技术,"增加了MichaelPrice,他在电气工程和计算机科学中领导了该芯片的设计,现在是芯片制造商模拟设备的工作。"我们曾试图将基础设施投入到位,以提供比以前技术更好的系统设计师的折衷,无论是软件还是硬件加速。"

位于麻省理工学院计算机科学与人工智能实验室的高级研究科学家Chandrakasan和JimGlass在上周在国际固态电路会议上发表的一篇论文中描述了这个新芯片。

睡眠者醒来

今天,像许多其他最新的人工智能系统一样,最好的语音识别器基于神经网络,简单信息处理器的虚拟网络大致建模在人脑上。许多新芯片的电路涉及尽可能有效地实现语音识别网络。

但是即使是最有效的语音识别系统也会很快耗尽设备的电池,如果它没有中断地运行。因此,芯片还包括一个更简单的"语音活动检测"电路,用于监控环境噪音,以确定它是否可能是语音。如果答案为“是”,则芯片将触发更大、更复杂的语音识别电路。

事实上,为了实验目的,研究人员“芯片”有三个不同的语音活动检测电路,具有不同的复杂度,因此,不同的功率需求。哪一个电路最有效的取决于上下文,但是在模拟宽范围的条件的测试中,这三个电路的最复杂导致整个系统的最大功率节省。尽管它消耗了几乎三倍的功率作为最简单的电路,它产生了更少的假阳性;更简单的电路通常通过简单地激活芯片的剩余部分而避免了它们的能量节省。

典型的神经网络由数千个处理的“节点”组成,这些“节点”只能简单的计算,但相互连接紧密。在通常用于语音识别的网络的类型中,节点被布置成层。语音数据被馈送到网络的底层,其节点处理并将它们传递给下一层的节点,其节点处理并将其传递到下一层,依此类推。顶层的输出指示语音数据表示特定语音的概率。

语音识别网络太大以至于无法安装在芯片的板载存储器中,这是一个问题,因为数据的去芯片比从本地存储中检索它的能量密集得多。因此,麻省理工学院的研究人员“设计专注于最小化芯片必须从芯片外存储器中取出的数据量。

带宽管理

神经网络的中间的节点可以从多个其它节点接收数据,并将数据传送到另一个节点。这两个12个连接中的每一个都有一个关联的"重量,",该数字表示在接收节点的计算中如何将数据发送到接收节点。最小化新芯片的存储器带宽的第一步是压缩与每个节点相关联的权重。只有在它们被带上芯片之后才对数据进行解压缩。

该芯片还利用了这样一个事实:随着语音识别,一波又一波的数据必须通过网络。输入的音频信号被分成10毫秒的增量,每个增量必须被单独评估。麻省理工学院的研究人员的芯片一次输入一个神经网络的节点,但它通过它传递32个连续的10毫秒增量的数据。

如果节点具有12个输出,则32将导致384个输出值,芯片在本地存储该输出值。当馈送到下一层节点时,它们中的每一个都必须与11个其他值耦合,等等。因此芯片最终需要相当大的板载存储器电路进行中间计算。但是它一次仅从片外存储器中取出一个压缩节点,从而保持其功率要求较低。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章