训练机器像人类一样学习

麻省理工学院的研究人员已经确定了一种属性，可以帮助计算机视觉模型以更稳定的方式学习表示视觉世界。

通过亚当Zewe 2023年5月23日

图片由布雷特·塞尔斯提供

机器学习见解

麻省理工学院的研究人员发现，一种特殊的训练方法可以帮助计算机视觉模型学习更多直观的直观表示。
研究人员发现，使用一种称为对抗性训练的技术，可以使视觉系统对图像中添加的微小错误反应较小，从而提高模型的感知直观性。

与人类不同，计算机视觉模型通常不会表现出感知的直观性，因此它们学会以一种高度不可预测的方式表示视觉信息。但如果机器学习模型具有这种能力，它可能使它们能够更好地估计物体或人的移动方式。

麻省理工学院的研究人员发现，一种特殊的训练方法可以帮助计算机视觉模型像人类一样学习更多直观的表征。训练包括向机器学习模型展示数百万个示例，以便它能够学习一项任务。

研究人员发现，使用一种称为对抗训练的技术来训练计算机视觉模型，使它们对图像中添加的微小错误反应较小，从而提高了模型的感知直观性。

研究小组还发现，知觉直线型受到训练模型执行任务的影响。训练用于执行抽象任务(如对图像进行分类)的模型，比那些训练用于执行更细粒度任务(如将图像中的每个像素分配给类别)的模型学习到更多直观的表示。

例如，模型中的节点具有表示“狗”的内部激活，这允许模型在看到任何狗的图像时检测到狗。当图像中有微小的变化时，感知上的直表示保留了更稳定的“狗”表示。这使它们更加健壮。

通过更好地理解计算机视觉中的感知直线性，研究人员希望能够发现一些见解，帮助他们开发出能够做出更准确预测的模型。例如，这种特性可能会提高自动驾驶汽车的安全性，这些汽车使用计算机视觉模型来预测行人、骑自行车的人和其他车辆的轨迹。

麻省理工学院博士后、一篇论文的合著者Vasha DuTell说:“这里的一个重要信息是，从生物系统(如人类视觉)中获得灵感，既可以让你了解某些事物为何以这样的方式工作，也可以激发出改进神经网络的想法。纸探索计算机视觉中的感知直线度。

加入DuTell论文的主要作者是Anne Harrington，电气工程和计算机科学系(EECS)的研究生;Ayush Tewari，博士后;研究生马克·汉密尔顿(Mark Hamilton);西蒙·斯坦特，编织星球研究经理;Ruth Rosenholtz，脑与认知科学系首席研究科学家，计算机科学与人工智能实验室(CSAIL)成员;资深作者William T. Freeman, Thomas and Gerd Perkins电气工程和计算机科学教授，CSAIL成员。这项研究将在国际学习表征会议上发表。

研究矫直

在阅读了纽约大学一个研究小组2019年发表的一篇关于人类感知直线性的论文后，杜特尔、哈林顿和他们的同事想知道这种特性是否也可能在计算机视觉模型中有用。

他们着手确定不同类型的计算机视觉模型是否使它们学习到的视觉表征变直。他们给每个模型提供一段视频的帧，然后检查其学习过程中不同阶段的表现。

如果模型的表示在视频的各个帧中以一种可预测的方式变化，那么该模型就是矫直的。最后，它的输出表示应该比输入表示更稳定。

“你可以把它想象成一条线，开始非常弯曲。一个拉直的模型可以从视频中提取曲线，并通过处理步骤将其拉直，”杜特尔解释说。

他们测试的大多数模型都没有伸直。在少数做到这一点的老鼠中，那些最有效地伸直身体的老鼠接受了分类任务的训练，这种训练方法被称为对抗性训练。

对抗性训练包括通过稍微改变每个像素来巧妙地修改图像。虽然人类不会注意到差异，但这些微小的变化可以欺骗机器，使其对图像进行错误分类。对抗性训练使模型更加健壮，因此它不会被这些操纵所欺骗。

哈林顿解释说，因为对抗性训练教会了模型对图像的微小变化做出更少的反应，这有助于它学习一种随着时间的推移更可预测的表征。

她说:“人们已经有了这种想法，即对抗性训练可能会帮助你让你的模型更像一个人，看到这种想法延伸到人们以前没有测试过的另一个属性上是很有趣的。”

但研究人员发现，经过对抗性训练的模型只有在接受广泛任务的训练时才能学会挺直身体，比如将整个图像分类。负责分割的模型——将图像中的每个像素标记为特定类别——即使经过对抗性训练也不会变直。

一致的分类

研究人员通过播放视频来测试这些图像分类模型。他们发现，学习了更多直观表征的模型倾向于更一致地正确分类视频中的物体。

杜特尔说:“对我来说，这些从未看过视频、从未接受过时间数据训练的对抗训练模型，仍然显示出一定程度的矫正能力，这令人惊讶。”

她说，研究人员并不确切知道对抗性训练过程中是什么使计算机视觉模型变得更直，但他们的结果表明，更强的训练方案会使模型变得更直。

在这项工作的基础上，研究人员希望利用他们所学到的知识来创建新的训练方案，明确地赋予模型这种属性。他们还想更深入地研究对抗性训练，以理解为什么这个过程可以帮助模型变直。

“从生物学的角度来看，对抗性训练不一定有意义。这不是人类理解世界的方式。关于为什么这种训练过程似乎能帮助模型更像人类，还有很多问题，”哈林顿说。

-编辑克里斯Vavra，网络内容经理，控制工程、CFE媒体与技术、cvavra@cfemedia.com．

您是否具有本内容中提到的主题的经验和专业知识?您应该考虑为我们的CFE媒体编辑团队做出贡献，并获得您和您的公司应得的认可。点击在这里开始这个过程。

亚当Zewe

作者简介:Adam Zewe，麻省理工学院新闻办公室

搜索产品并发现您所在行业的新创新