观察神经网络

新技术有助于阐明在视觉数据上训练的神经网络的内部工作原理。

通过拉里Hardesty 2017年7月10日

神经网络通过分析大量训练数据来学习执行计算任务,它负责当今表现最好的人工智能系统,从语音识别系统到自动翻译,再到自动驾驶汽车。但是神经网络是黑盒子。一旦他们接受了培训,即使是他们的设计师也很少知道他们在做什么——他们在处理什么数据元素以及如何处理。

两年前,麻省理工学院计算机科学与人工智能实验室(CSAIL)的一组计算机视觉研究人员描述了一种方法,可以窥视神经网络的黑盒子,以识别视觉场景。这种方法提供了一些有趣的见解,但它需要将数据发送给通过亚马逊的Mechanical Turk众包服务招募的人类评审员。在今年的计算机视觉和模式识别会议上,CSAIL的研究人员将展示同一系统的全自动版本。之前的论文报告了对一种训练完成一项任务的神经网络的分析,而新论文报告了对四种训练完成20多项任务的神经网络的分析,包括识别场景和物体、为灰色图像着色和解决谜题。一些新的网络是如此之大,以至于在旧的方法下分析它们中的任何一个都将是昂贵的。

研究人员还在他们的网络上进行了几组实验,不仅揭示了几种计算机视觉和计算摄影算法的本质,而且还提供了一些关于人脑组织的证据。神经网络之所以被称为神经网络,是因为它们松散地类似于人类的神经系统,具有大量相当简单但密集连接的信息处理“节点”。像神经元一样,神经网络的节点从它们的邻居那里接收信息信号,然后要么“发射”——发出自己的信号——要么不发射。和神经元一样,一个节点的放电反应强度是不同的。

在这篇新论文和之前的论文中,麻省理工学院的研究人员都篡改了被训练来执行计算机视觉任务的神经网络,从而揭示了单个节点对不同输入图像的响应强度。然后,他们从每个节点中选择了10张引起最强烈反应的输入图像。在之前的论文中,研究人员将这些图像发送给通过Mechanical Turk招聘的工人,要求他们找出这些图像的共同点。在这篇新论文中,他们使用了计算机系统。“我们对1100个视觉概念进行了分类,比如绿色、漩涡状纹理、木质材料、人脸、自行车车轮或雪山顶,”麻省理工学院电气工程和计算机科学研究生、论文的两位第一作者之一大卫·鲍(David Bau)说。“我们利用了其他人开发的几个数据集,并将它们合并成一个广泛而密集的视觉概念数据集。它有很多很多标签,对于每个标签,我们知道哪个图像中的哪个像素对应这个标签。”

论文的其他作者是共同第一作者、研究生周伯雷;麻省理工学院电气工程和计算机科学教授安东尼奥·托拉尔巴;CSAIL首席研究科学家Aude Oliva;还有阿迪亚·科斯拉(Aditya Khosla),他在托拉尔巴的团队获得博士学位,现在是医疗计算公司PathAI的首席技术官。研究人员还知道哪些图像的哪些像素对应于给定网络节点的最强反应。今天的神经网络被组织成层。数据被送入最底层,由最底层处理并传递给下一层,以此类推。对于视觉数据,输入图像被分解成小块,每个块被馈送到一个单独的输入节点。对于他们网络中的一个高级节点的每一个强烈响应,研究人员都可以追踪到导致它的发射模式,从而确定它正在响应的特定图像像素。因为他们的系统可以频繁地识别对应于精确像素集群的标签,这些像素集群引起了给定节点的强烈响应,所以它可以非常具体地描述节点的行为。

研究人员将数据库中的视觉概念组织成一个层次结构。层次结构的每一层都包含了下一层的概念,从颜色开始,向上延伸到纹理、材料、部件、对象和场景。通常,神经网络的较低层会对较简单的视觉属性(如颜色和纹理)做出反应,而较高层则会对更复杂的属性做出反应。但这种层次结构也使研究人员能够量化网络训练执行不同任务时对不同视觉属性的重视程度。例如,一个训练为黑白图像着色的网络将其大部分节点用于识别纹理。另一个网络,当训练它在几帧视频中跟踪物体时,它的节点用于场景识别的比例高于训练它识别场景时的比例;在这种情况下,它的许多节点实际上专门用于对象检测。

研究人员的其中一项实验可以为神经科学中的一个棘手问题提供线索。一项将电极植入人脑以控制严重神经紊乱的研究似乎表明,大脑中的单个神经元会对特定的视觉刺激做出反应。这个假说最初被称为祖母神经元假说,最近一代神经科学家更熟悉的是詹妮弗-安妮斯顿神经元假说,因为他们发现一些神经病人的神经元似乎只对特定的好莱坞名人的描绘有反应。许多神经科学家对这种解释提出质疑。他们认为,移动的神经元群,而不是单个神经元,在大脑中固定了感觉辨别。因此,所谓的詹妮弗·安妮斯顿神经元只是众多神经元中的一个,它们对詹妮弗·安妮斯顿的图像做出反应。它可能是许多其他星座的一部分,它们会对尚未测试过的刺激做出反应。由于他们的新分析技术是完全自动化的,麻省理工学院的研究人员能够测试在经过训练的识别视觉场景的神经网络中是否会发生类似的事情。

除了识别被调优到特定视觉概念的单个网络节点外,他们还考虑了随机选择的节点组合。然而,节点组合比单个节点挑选出的视觉概念少得多——大约少80%。“在我看来,这表明神经网络实际上是在试图近似地获得祖母神经元,”Bau说。“他们并不是在到处抹黑祖母的形象。他们试图把它分配给一个神经元。正是这种结构的有趣暗示,大多数人都不相信它这么简单。”

麻省理工学院

www.mit.edu

-由Carly Marchal编辑,内容专家,CFE Media,cmarchal@cfemedia.com.查看更多控制工程信息管理制造IT故事