机器人通过预测和预见来学习操作新物体

加州大学伯克利分校(University of California, Berkeley)的研究人员正在开发视觉技术,使机器人能够想象自己的行动的未来,以操纵它们从未遇到过的物体。

通过格雷戈里·黑尔,ISSSource报道 2018年2月9日

机器人的使用仍在继续攀升,但新技术正在开发中,使它们能够想象未来的行动,从而弄清楚如何操作他们从未遇到过的物体。

这项技术可以帮助自动驾驶汽车预测未来道路上的事件,并在家庭中产生更智能的机器人助手。但首先,最初的原型专注于完全从自主游戏中学习简单的手动技能。

加州大学伯克利分校的研究人员说,使用这种被称为视觉预见的技术,机器人可以预测如果它们执行特定的动作序列,它们的摄像头会看到什么。

这些机器人的想象力目前很简单,只需对未来几秒钟进行预测,但它们足以让机器人想出如何在不干扰障碍物的情况下移动桌子上的物体。

机器人可以在没有人类帮助的情况下学习执行这些任务,也不需要事先了解物理、环境或物体是什么。这是因为视觉想象力完全是从无人看管和无人监督的探索中从头开始学习的,机器人在那里玩桌子上的物体。在这个游戏阶段之后,机器人建立了一个预测世界的模型,并可以使用这个模型来操作它以前没有见过的新物体。

伯克利电子工程与计算机科学系助理教授谢尔盖·莱文说:“就像我们可以想象我们的行为将如何移动环境中的物体一样,这种方法可以使机器人想象不同的行为将如何影响周围的世界。”他的实验室开发了这项技术。“这可以在复杂的现实情况下对高度灵活的技能进行智能规划。”

该系统的核心是基于卷积循环视频预测或动态神经平流(DNA)的深度学习技术。基于dna的模型根据机器人的动作预测图像中的像素如何从一帧移动到下一帧。最近对这类模型的改进,以及规划能力的极大改进,使得基于视频预测的机器人控制能够执行越来越复杂的任务,例如在障碍物周围滑动玩具和重新定位多个物体。

“在过去,机器人在人类主管的帮助和反馈下学习技能。这项工作令人兴奋的是,机器人可以完全靠自己学习一系列视觉物体操作技能,”莱文实验室的博士生、原始DNA模型的发明者切尔西·芬恩(Chelsea Finn)说。

利用这项新技术,机器人将物体推到桌子上,然后使用学习到的预测模型来选择将物体移动到所需位置的运动。机器人使用从原始摄像机观察中学习到的模型来教会自己如何避开障碍物,并在障碍物周围推动物体。

“人类在一生中通过与各种物体的数百万次互动来学习物体操作技能,而没有任何老师。我们已经证明,有可能建立一个机器人系统,它也可以利用大量自主收集的数据来学习广泛适用的操作技能,特别是物体推送技能,”Levine实验室的研究生Frederik Ebert说,他参与了这个项目。

由于通过视频预测的控制仅依赖于机器人可以自主收集的观察结果,例如通过相机图像,因此所得到的方法具有通用性和广泛适用性。传统的计算机视觉方法需要人类手动标记数千甚至数百万张图像,相比之下,构建视频预测模型只需要无注释的视频,机器人可以完全自主地收集这些视频。事实上,视频预测模型也已应用于从人类活动到驾驶的所有数据集,并取得了令人信服的结果。

莱文说,这项研究的目标是使机器人能够通过自主互动了解世界是如何运作的。“这个机器人的能力仍然有限,但它的技能是完全自动学习的,并允许它预测与物体的复杂物理相互作用,这是它从未见过的,通过建立在之前观察到的相互作用模式上。”

格雷戈里·黑尔是《工业安全与保安来源》(ISSSource.com),这是一个新闻资讯网站,内容涵盖制造业自动化领域的安全及保安事宜。本内容最初出现在ISSSource.com.ISSSource是CFE Media的内容合作伙伴。由CFE媒体制作编辑克里斯·瓦夫拉编辑,cvavra@cfemedia.com

在线额外

请看下面ISSSource的相关报道。

原始内容可以在www.isssource.com