灵巧的机械手轻松地操作物体

无模型框架重新定位超过2000个不同的对象，手向上和向下，朝着更人性化的操作迈出了一步。看到视频。

通过雷切尔·戈登 2021年11月26日

提供:麻省理工学院CSAIL

一岁大的婴儿比机器人还要灵巧。当然，机器可以做的不仅仅是拿起和放下物体，但我们还没有完全复制探索或复杂灵巧操作的自然吸引力。

人工智能公司OpenAI尝试使用Dactyl(意为“手指”，来自希腊语“daktylos”)，用他们的人形机械手用软件解决魔方，这是向更通用的人工智能迈出的一步，也是远离常见的单一任务心态的一步。DeepMind创造了“RGB-Stacking这是一个基于视觉的系统，挑战机器人学习如何抓取物品并将它们堆叠起来。

麻省理工学院计算机科学与人工智能实验室(CSAIL)的科学家们一直在寻求让机器复制人类的能力，他们创造了一个更大的框架:一个可以重新定位2000多个不同物体的系统，机械手可以向上和向下。这种操作从杯子到金枪鱼罐头再到Cheez-It盒的任何东西的能力可以帮助手快速地以特定的方式和位置拾取和放置物体，甚至可以推广到看不见的物体。

这种灵巧的“手工”——通常仅限于单一的任务和直立的位置——可能是加快物流和制造的一种资产，有助于满足常见的需求，例如将物体打包到插槽中，或者灵活地操作更广泛的工具。该团队使用了一个模拟的、具有24个自由度的拟人化的手，并展示了该系统在未来可以转移到真正的机器人系统的证据。

麻省理工学院CSAIL博士生陈涛(Tao Chen)是麻省理工学院不可思议人工智能实验室的成员，也是该项目的首席研究员，他说:“在工业中，平行颚式夹具是最常用的，部分原因是它控制简单，但它在物理上无法处理我们日常生活中看到的许多工具。”“即使使用钳子也很困难，因为它不能灵活地前后移动一个手柄。我们的系统将允许多指手灵巧地操作这些工具，这为机器人应用开辟了一个新的领域。”

提供:麻省理工学院

由于需要控制大量的电机以及手指与物体之间的接触状态的频繁变化，这种“手持式”物体重新定位一直是机器人技术中具有挑战性的问题。这个模型有超过2000个对象，有很多东西需要学习。

当手朝下时，问题变得更加棘手。机器人不仅需要操纵物体，还需要绕过重力，这样它就不会掉下来。

研究小组发现，简单的方法可以解决复杂的问题。他们使用了一种无模型强化学习算法(意味着系统必须从与环境的交互中找出价值函数)，以及一种被称为“教师-学生”训练方法。

为了实现这一点，“教师”网络接受了关于物体和机器人的信息的训练，这些信息在模拟中很容易获得，但在现实世界中却不容易获得，比如指尖的位置或物体的速度。为了确保机器人能够在模拟之外工作，“老师”的知识被提炼成可以在现实世界中获得的观察结果，例如相机捕获的深度图像、物体姿态和机器人的关节位置。他们还使用了“重力课程”，机器人首先在零重力环境中学习技能，然后慢慢地使控制器适应正常的重力条件，当以这种速度处理事物时，确实提高了整体性能。

一个新的系统可以重新定位超过2000个不同的物体，机器人的手可以向上和向下。提供:麻省理工学院CSAIL

虽然看起来有悖直觉，但一个控制器(被称为机器人的大脑)可以在不知道形状的情况下重新定位大量它从未见过的物体。

“我们最初认为，在机器人操纵物体时推断形状的视觉感知算法将是主要的挑战，”麻省理工学院教授普尔吉特·阿格拉瓦尔说，他是该研究论文的作者之一。“相反，我们的研究结果表明，人们可以学习与形状无关的鲁棒控制策略。这表明视觉感知对操纵的重要性可能远不如我们习惯的思维，更简单的感知处理策略可能就足够了。”

许多小的圆形物体(苹果、网球、弹珠)，当手朝上或朝下重新调整方向时，成功率接近100%，而对于更复杂的物体，如勺子、螺丝刀或剪刀，成功率最低，这并不奇怪，接近30%。

除了将系统引入野外，由于成功率随物体形状而变化，该团队指出，在未来，根据物体形状训练模型可以提高性能。

-由Chris Vavra编辑，网页内容经理，控制工程， CFE媒体与技术，cvavra@cfemedia.com．

您是否具有本内容中提到的主题的经验和专业知识?你应该考虑为我们的CFE媒体编辑团队做出贡献，并获得你和你的公司应得的认可。点击在这里开始这个过程。

雷切尔·戈登

作者简介:Rachel Gordon，麻省理工CSAIL

搜索产品，发现你所在行业的创新