机器学习系统复制了人类神经学方面

麻省理工学院(MIT)的研究人员开发了一种人脑人脸识别机制的计算模型,该模型似乎捕捉到了以前模型遗漏的人类神经学方面,这可能对未来的机器学习项目有益。

通过Larry Hardesty,麻省理工学院新闻办公室 2016年12月15日

麻省理工学院的研究人员和他们的同事开发了一种新的人脑人脸识别机制的计算模型,该模型似乎捕捉到了以前的模型遗漏的人类神经学方面。

研究人员设计了一个机器学习系统来实现他们的模型,他们通过给它提供一系列样本图像来训练它识别特定的面孔。他们发现,经过训练的系统包括一个中间处理步骤,这个步骤代表了一张脸的旋转程度——比如,从中心旋转45度——但不是方向——向左或向右。

这个属性并不是系统内置的;它是在训练过程中自然而然产生的。但它复制了灵长类动物面部处理机制的一个实验观察特征。研究人员认为这表明他们的系统和大脑在做类似的事情。

“这并不能证明我们理解了发生了什么,”麻省理工学院的大脑和认知科学教授、大脑、思想和机器中心(CBMM)主任Tomaso Poggio说。CBMM是一个由美国国家科学基金会资助、总部位于麻省理工学院的多机构研究联盟。“模型是现实的一种漫画,尤其是在生物学中。所以,如果事情变得如此简单,我会感到惊讶。但我认为,这是强有力的证据,表明我们走在正确的道路上。”

研究人员的论文包括一个数学证明,他们使用的特定类型的机器学习系统,旨在提供波乔所说的“生物学上合理的”神经系统模型,将不可避免地产生对旋转角度无关的中介表示。

波吉奥也是麻省理工学院麦戈文大脑研究所的主要研究员,他是一篇描述新工作的论文的高级作者,这篇论文发表在《计算生物学》杂志上。与他一起撰写论文的还有CBMM和麦戈文研究所的其他几位成员:第一作者Joel Leibo,谷歌DeepMind的研究员,他在麻省理工学院获得了大脑和认知科学博士学位,Poggio是他的导师;麻省理工学院电气工程和计算机科学研究生廖千里(Qianli Liao);法比奥·安塞尔米(Fabio Anselmi)是麻省理工学院和意大利理工学院的合资企业IIT@MIT计算与统计学习实验室的博士后;以及洛克菲勒大学副教授Winrich Freiwald。

紧急属性

Poggio说,这篇论文很好地说明了我们在CBMM中想要做的事情,一方面是机器学习和计算机科学,另一方面是神经生理学,以及人类行为的各个方面。这不仅意味着大脑使用什么算法,还意味着大脑中实现这些算法的电路是什么。”

波乔一直认为,大脑必须对面部和其他物体产生“不变的”表征,即对物体在空间中的方向、它们与观察者的距离或它们在视野中的位置无关的表征。对人类和猴子大脑的磁共振扫描也表明了这一点,但在2010年,弗莱瓦尔德发表了一项研究,更详细地描述了猕猴面部识别机制的神经解剖学。

弗莱瓦尔德指出,来自猴子视神经的信息经过一系列大脑位置,每个位置对面部朝向的敏感度都比上一个低。第一个区域的神经元只会对特定的面部朝向做出反应;最后一个区域的神经元无论脸的方向如何都会被激发——这是一种不变的表征。

中间区域的神经元似乎是“镜像对称”的:也就是说,它们对面部旋转的角度很敏感,而不考虑方向。在第一个区域,如果一张脸向左旋转45度,一个神经元簇就会放电,如果脸向右旋转45度,另一个神经元簇就会放电。在最后一个区域,无论面部旋转30度、45度、90度,还是介于两者之间的任何位置,相同的神经元集群都会被激发。但在中间区域,如果脸向任何一个方向旋转45度,一个特定的神经元集群就会被激发,如果脸向任何一个方向旋转30度,另一个神经元集群就会被激发,等等。

这就是研究人员的机器学习系统再现的行为。“这不是一个试图解释镜像对称的模型,”波乔说。“这个模型试图解释不变性,在这个过程中,另一个性质突然出现了。”

神经训练

研究人员的机器学习系统是一个神经网络,之所以这么叫,是因为它大致接近人类大脑的结构。神经网络由非常简单的处理单元组成,这些处理单元被排列成层,这些层密集地连接到上面和下面层的处理单元或节点。数据被馈送到网络的底层,网络以某种方式处理数据,并将数据馈送到下一层,以此类推。在训练过程中,顶层的输出与一些分类标准相关联,例如,正确地确定给定的图像是否描绘了特定的人。

在早期的工作中,Poggio的团队训练神经网络产生不变表示,基本上是通过记忆少数人脸的代表方向集,Poggio称之为“模板”。当网络看到一张新面孔时,它会测量它与这些模板的区别。对于那些方向与新面孔相同的模板,这种差异将是最小的,并且当信息信号到达顶层时,它们相关节点的输出将最终主导信息信号。新人脸和存储人脸之间的测量差异为新人脸提供了一种识别签名。

在实验中,这种方法产生了不变的表征:无论朝向如何,人脸的特征都大致相同。但Poggio说,这种机制——记忆模板——在生物学上并不可信。

相反,新的网络使用了赫布规则的变体,在神经学文献中,赫布规则经常被描述为“一起放电的神经元连接在一起”。这意味着在训练过程中,随着节点之间连接的权重被调整以产生更准确的输出,与独立反应(或根本不反应)的节点相比,对特定刺激做出一致反应的节点最终对最终输出的贡献更大。

这种方法最终也产生了不变表示。但是网络的中间层也复制了灵长类动物大脑中间视觉处理区域的镜像对称反应。

麻省理工学院

www.mit.edu

-由克里斯·瓦夫拉编辑,制作编辑,控制工程, CFE传媒,cvavra@cfemedia.com.查看更多控制工程机器视觉故事