教机器人操作柔软的物体

研究人员已经开发出一种技术,可以使机器人操纵像披萨面团这样黏糊糊的物体或像衣服这样柔软的材料。

通过亚当Zewe 2022年4月14日
麻省理工学院(MIT)

想象一下,一个披萨师傅正在揉一团面团。她可能会用抹刀把面团提到砧板上,然后用擀面杖把它压平成一个圆圈。听起来对人类来说很容易,但如果这个披萨制作者是一个机器人,就有点难了。

对于机器人来说,处理像面团这样可变形的物体是很棘手的,因为面团的形状可以以多种方式改变,很难用方程来表示。另外,用面团做出新的形状需要多个步骤和使用不同的工具。对于机器人来说,学习一项具有长步骤序列的操作任务(其中有许多可能的选择)尤其困难,因为学习通常是通过尝试和错误进行的。

麻省理工学院、卡内基梅隆大学和加州大学圣地亚哥分校的研究人员提出了一种更好的方法。他们为机器人操作系统创建了一个框架,该系统使用两阶段学习过程,这可以使机器人在很长一段时间内执行复杂的面团操作任务。“教师”算法会解决机器人完成任务所必须采取的每一步。然后,它训练一个“学生”机器学习模型,学习关于何时以及如何执行任务中所需的每项技能的抽象概念,比如使用擀面杖。有了这些知识,系统就会考虑如何执行技能来完成整个任务。

研究人员表示,这种被他们称为DiffSkill的方法可以在模拟中执行复杂的操作任务,比如切和铺面团,或者从切菜板周围收集面团,同时优于其他机器学习方法。

除了披萨制作之外,这种方法还可以应用于机器人需要操纵可变形物体的其他场合,比如为老年人或运动障碍者喂食、洗澡或穿衣的护理机器人。

“这种方法更接近我们人类计划行动的方式。当一个人做一项长期任务时,我们不会把所有的细节都写下来。计算机科学与人工智能实验室(CSAIL)的研究生李云珠(音译)说:“我们有一个更高级的计划器,它大致告诉我们各个阶段是什么,以及我们在这个过程中需要实现的一些中间目标,然后我们执行它们。”李云珠是一篇介绍DiffSkill的论文的作者。

李的共同作者包括第一作者,卡内基梅隆大学的研究生林星宇;加州大学圣地亚哥分校(University of California at San Diego)研究生黄志ao;麻省理工学院脑与认知科学系认知科学与计算保罗·e·牛顿职业发展教授、CSAIL成员Joshua B. Tenenbaum;CMU助理教授David Held;以及资深作者、麻省理工学院- ibm沃森人工智能实验室的研究科学家庄干。这项研究将在国际学习表征会议上发表。

学生和老师

DiffSkill框架中的“老师”是一种轨迹优化算法,可以解决短期任务,即对象的初始状态和目标位置非常接近。轨迹优化器在模拟现实世界物理的模拟器中工作(称为可微分物理模拟器,它将“Diff”放在“DiffSkill”中)。“教师”算法使用模拟器中的信息来学习面团在每个阶段必须如何移动,一次一个,然后输出这些轨迹。

然后是“学生”神经网络学会模仿老师的动作。作为输入,它使用两个相机图像,一个显示面团的当前状态,另一个显示任务结束时的面团。神经网络生成一个高级计划,以确定如何将不同的技能联系起来以达到目标。然后,它为每种技能生成特定的短期轨迹,并直接向工具发送命令。

研究人员使用这种技术进行了三种不同的模拟面团操作任务的实验。在一项任务中,机器人使用抹刀将面团提起砧板上,然后使用擀面杖将其压平。在另一种情况下,机器人用一个抓手从柜台上收集面团,把它放在抹刀上,然后转移到砧板上。在第三项任务中,机器人用刀将一堆面团切成两半,然后用夹具将每一块面团运送到不同的位置。

麻省理工学院和其他地方的研究人员已经创建了一个框架,可以使机器人有效地完成复杂的操作任务,如面团或布等可变形物体,这些物体需要许多工具,需要很长时间才能完成。麻省理工学院(MIT)

麻省理工学院和其他地方的研究人员已经创建了一个框架,可以使机器人有效地完成复杂的操作任务,如面团或布等可变形物体,这些物体需要许多工具,需要很长时间才能完成。麻省理工学院(MIT)

比其他人高出一筹

DiffSkill能够超越依赖强化学习的流行技术,强化学习是指机器人通过反复试验来学习任务。事实上,DiffSkill是唯一能够成功完成所有三个面团操作任务的方法。林说,有趣的是,研究人员发现,“学生”神经网络甚至能够胜过“老师”算法。

“我们的框架为机器人获得新技能提供了一种新颖的方式。这些技能可以连接起来解决更复杂的任务,这些任务超出了以前的机器人系统的能力,”林说。

因为他们的方法侧重于控制工具(刮刀、刀、擀面杖等),它可以应用于不同的机器人,但前提是它们使用研究人员定义的特定工具。未来,他们计划将工具的形状整合到“学生”网络的推理中,以便将其应用于其他设备。

研究人员打算通过使用3D数据作为输入来提高DiffSkill的性能,而不是使用难以从模拟世界转移到现实世界的图像。他们还希望使神经网络规划过程更高效,并收集更多样化的训练数据,以增强DiffSkill对新情况的泛化能力。从长远来看,他们希望将DiffSkill应用于更多样化的任务,包括布料操作。

-编辑克里斯Vavra,网络内容经理,控制工程、CFE媒体与技术、cvavra@cfemedia.com


作者简介:Adam Zewe,麻省理工学院新闻办公室