利用光子学改进深度学习

一种新方法使用光学来加速智能扬声器和其他低功耗连接设备上的机器学习计算。

通过亚当Zewe 2022年11月7日
提供:Alex Sludds,麻省理工新闻

麻省理工学院的研究人员创造了一种直接在这些设备上计算的新方法,这大大降低了延迟。他们的技术将运行机器学习模型的内存密集型步骤转移到中央服务器,在中央服务器上,模型的组件被编码到光波上。该模型存储在数百英里外的数据中心,在那里计算出答案并发送到设备。

电波通过光纤传输到连接的设备,使大量数据通过网络以闪电般的速度传输。接收器然后使用一个简单的光学设备,利用这些光波携带的模型部分快速执行计算。

与其他方法相比,这项技术可以使能源效率提高一百倍以上。它还可以提高安全性,因为用户的数据不需要转移到中心位置进行计算。

这种方法可以使自动驾驶汽车实时做出决策,而所消耗的能量仅为目前耗电电脑所需能量的一小部分。它还可以让用户与智能家居设备进行无延迟的对话,通过蜂窝网络进行实时视频处理,甚至可以在距离地球数百万英里的宇宙飞船上实现高速图像分类。

“每次你想运行一个神经网络,你都必须运行程序,而你运行程序的速度取决于你从内存中输入程序的速度。我们的管道非常庞大——相当于每毫秒左右在互联网上发送一部完整的故事片长度的电影。这就是数据进入我们系统的速度。它可以计算得这么快,”资深作者Dirk Englund说,他是电气工程和计算机科学系(EECS)的副教授,也是麻省理工学院电子研究实验室的成员。

与Englund一起参与这篇论文的是主要作者和EECS研究生Alexander Sludds;EECS研究生Saumil Bandyopadhyay,研究科学家Ryan Hamerly,以及来自麻省理工学院林肯实验室和诺基亚公司的其他人。这项研究发表在科学

这张效果图展示了一种被称为智能收发器的新型硬件,它使用了硅光子学技术,极大地加快了运行机器学习模型的内存密集型步骤之一。这可以使边缘设备(如智能家居扬声器)执行计算,能源效率提高100多倍。提供:Alex Sludds,麻省理工新闻

这张效果图展示了一种被称为智能收发器的新型硬件,它使用了硅光子学技术,极大地加快了运行机器学习模型的内存密集型步骤之一。这可以使边缘设备(如智能家居扬声器)执行计算,能源效率提高100多倍。提供:Alex Sludds,麻省理工新闻

减轻内存负荷

神经网络是一种机器学习模型,它使用层层连接的节点(或神经元)来识别数据集中的模式并执行任务,如对图像进行分类或识别语音。但是这些模型可以包含数十亿个权重参数,这些参数是在处理输入数据时转换输入数据的数值。这些权重必须存储在内存中。同时,数据转换过程涉及数十亿次代数计算,需要大量的能量来执行。

Sludds说,从内存中获取数据(在这种情况下是神经网络的权重)并将它们移动到计算机进行实际计算的部分的过程是速度和能源效率的最大限制因素之一。

“所以我们的想法是,为什么我们不把所有繁重的工作——从内存中获取数十亿个权重的过程——从边缘设备中移开,把它放在我们有充足的电源和内存的地方,这让我们能够快速获取这些权重?”他说。

他们开发的神经网络架构Netcast包括在中央服务器中存储权重,该服务器连接到一种称为智能收发器的新型硬件。这种智能收发器是一个拇指大小的芯片,可以接收和传输数据,使用硅光子学技术,每秒从内存中获取数万亿的权重。

它以电信号的形式接收重量,并将它们印在光波上。由于重量数据被编码为比特(1和0),收发器通过切换激光来转换它们;激光打开表示1,关闭表示0。它将这些光波结合起来,然后定期通过光纤网络传输,这样客户端设备就不需要查询服务器来接收它们。

“光学是伟大的,因为有很多方法在光学中传输数据。例如,你可以把数据放在不同颜色的光上,这比电子设备能实现更高的数据吞吐量和更大的带宽。”Bandyopadhyay说。

每秒数万亿次计算

一旦光波到达客户端设备,一个简单的光学组件被称为宽带“Mach-Zehnder”调制器使用它们来执行超快速的模拟计算。这涉及到将来自设备的输入数据(例如传感器信息)编码到权重上。然后,它将每个波长发送到接收器,接收器检测光线并测量计算结果。

研究人员设计了一种方法,使用这种调制器每秒进行数万亿次乘法运算,这极大地提高了设备的计算速度,同时只使用很少的功率。

“为了让事情变得更快,你需要让它更节能。但这是一种权衡。我们已经建立了一个系统,可以在大约1毫瓦的功率下运行,但每秒仍能进行数万亿次乘法运算。在速度和能源效率方面,这都是一个数量级的增长。”

他们通过在连接他们实验室和麻省理工学院林肯实验室的86公里光纤上发送重量来测试这种架构。Netcast使机器学习具有很高的准确性——图像分类准确率为98.7%,数字识别准确率为98.8%——而且速度很快。

“我们必须做一些校准,但我惊讶于我们只需要做很少的工作就能达到如此高的精度。我们能够获得商业相关的准确性,”哈默利说。

展望未来,研究人员希望对智能收发芯片进行迭代,以实现更好的性能。他们还想将目前鞋盒大小的接收器缩小到一个芯片大小,这样就可以安装在像手机这样的智能设备上。

-由Chris Vavra编辑,网页内容经理,控制工程, CFE媒体与技术,cvavra@cfemedia.com


作者简介:Adam Zewe,麻省理工学院新闻办公室