开发用于语音识别的低功耗芯片

麻省理工学院的研究人员建造了一种低功耗芯片，专门用于自动语音识别，它需要0.2到10毫瓦的功率，这取决于它必须识别的字数。

通过Larry Hardesty，麻省理工学院新闻办公室 2017年2月23日

自动语音识别在10年前还只是笑话，但现在它即将成为人们与主要计算设备交互的主要手段。

在语音控制电子时代到来之前，麻省理工学院的研究人员已经开发了一种用于自动语音识别的低功耗芯片。运行语音识别软件的手机可能需要约1瓦的功率，而这款新芯片需要0.2至10兆瓦的功率，这取决于它必须识别的字数。

在实际应用中，这可能会节省90%到99%的电力，这可能会使语音控制适用于相对简单的电子设备。这包括必须从环境中获取能量或电池充电间隔数月的电力受限设备。这些设备构成了所谓的物联网(IoT)的技术支柱。物联网指的是车辆、电器、土木工程结构、制造设备，甚至牲畜很快都会有传感器，直接向联网的服务器报告信息，帮助维护和协调任务。

“语音输入将成为许多可穿戴应用程序和智能设备的自然接口，”麻省理工学院Vannevar Bush电气工程和计算机科学教授Anantha Chandrakasan说，他的团队开发了这种新芯片。“这些设备的小型化需要一个不同于触摸或键盘的界面。与在云端执行操作相比，在本地嵌入语音功能以节省系统能耗至关重要。”

“我不认为我们开发这项技术是为了特定的应用，”迈克尔·普莱斯(Michael Price)说，他是麻省理工学院电气工程和计算机科学专业的研究生，领导了芯片的设计。“无论是软件加速还是硬件加速，我们试图将基础设施落实到位，为系统设计师提供比他们使用以前的技术更好的折衷方案。”

睡眠者醒来

如今，表现最好的语音识别器，就像许多其他最先进的人工智能系统一样，是基于神经网络的。神经网络是由简单信息处理器组成的虚拟网络，大致模仿了人脑。这种新芯片的大部分电路都与尽可能高效地实现语音识别网络有关。

即使是最节能的语音识别系统，如果不间断地运行，也会很快耗尽设备的电池。因此，该芯片还包括一个更简单的“语音活动检测”电路，可以监测环境噪声，以确定是否可能是语音。如果答案是肯定的，芯片就会启动更大、更复杂的语音识别电路。

事实上，出于实验目的，研究人员的芯片有三种不同的语音活动检测电路，它们的复杂程度不同，因此功耗也不同。哪种电路最节能取决于环境，但在模拟各种条件的测试中，三种电路中最复杂的电路为整个系统节省了最大的电力。尽管它消耗的功率几乎是最简单电路的三倍，但它产生的误报却少得多;简单的电路通常会通过虚假地激活芯片的其余部分来消耗掉它们所节省的能量。

一个典型的神经网络由数千个处理“节点”组成，它们只能进行简单的计算，但彼此紧密相连。在语音识别常用的网络类型中，节点被安排成层。语音数据被馈送到网络底层，底层的节点处理并传递给下一层的节点，下一层的节点处理并传递给下一层，以此类推。顶层的输出表示语音数据代表特定语音的概率。

语音识别网络太大，无法容纳在芯片的板载内存中，这是一个问题，因为从芯片外获取数据比从本地存储中检索数据要消耗更多的能源。麻省理工学院研究人员的设计专注于最小化芯片必须从片外存储器中检索的数据量。

带宽管理

神经网络中间的一个节点可能从其他十几个节点接收数据，并将数据传输给另外十几个节点。这24个连接中的每一个都有一个相关的“权重”，这是一个数字，表示通过它发送的数据应该在接收节点的计算中发挥多大的作用。最小化新芯片内存带宽的第一步是压缩与每个节点相关的权重。数据只有在被放入芯片后才会被解压缩。

该芯片还利用了这样一个事实:在语音识别中，一波又一波的数据必须通过网络。传入的音频信号被分成10毫秒的增量，每个增量必须单独评估。麻省理工学院研究人员的芯片一次只引入一个神经网络节点，但它将数据从32个连续的10毫秒增量中传递出来。

如果一个节点有12个输出，那么32个通道将产生384个输出值，芯片将这些输出值存储在本地。在向下一层节点馈送时，每一个值都必须与其他11个值耦合，依此类推。因此，该芯片最终需要一个相当大的板载存储电路来进行中间计算。但它一次只从片外存储器中取出一个压缩节点，从而保持低功耗。

麻省理工学院

www.mit.edu

-由克里斯·瓦夫拉编辑，制作编辑，控制工程， CFE传媒，cvavra@cfemedia.com．查看更多控制工程诊断和资产管理故事．

您是否具有本内容中提到的主题的经验和专业知识?你应该考虑为我们的CFE媒体编辑团队做出贡献，并获得你和你的公司应得的认可。点击在这里开始这个过程。

搜索产品，发现你所在行业的创新