放牧的机器人

一种新系统结合了简单的控制程序,使机器人车队(或其他“多智能体系统”)能够以前所未有的方式协作。

通过Larry Hardesty,麻省理工学院新闻办公室 2014年2月12日

编写一个程序来控制一个自主机器人在一个通信链路不稳定的不确定环境中导航已经足够困难了;根据任务的不同,为多个机器人编写一个可能需要也可能不需要协同工作的程序就更难了。

因此,为“多智能体系统”设计控制程序的工程师——无论是机器人团队还是具有不同功能的设备网络——通常都将自己限制在特殊情况下,在这些情况下,可以假设有关环境的可靠信息,或者可以事先明确指定相对简单的协作任务。

今年5月,在自主代理和多代理系统国际会议上,来自麻省理工学院计算机科学和人工智能实验室(CSAIL)的研究人员将展示一个新系统,该系统将现有的控制程序拼接在一起,允许多代理系统以更复杂的方式协作。该系统将不确定性因素考虑在内——例如,通信链路中断的几率,或者某个特定算法不经意地将机器人引向死胡同——并自动围绕它制定计划。

对于小型协作任务,系统可以保证它的程序组合是最优的——考虑到环境的不确定性和程序本身的局限性,它将产生最好的可能结果。

研究人员与理查德·考克伯恩·麦克劳林航空航天学教授乔恩·豪(Jon How)和他的学生克里斯·梅诺(Chris Maynor)合作,目前正在模拟仓库应用程序中测试他们的系统,在该应用程序中,机器人团队将被要求从不确定的位置检索任意物体,并根据需要协作运输重物。模拟涉及iRobot Creates的小组可编程机器人,它们拥有与Roomba吸尘器相同的底盘。

合理的怀疑

“在(多智能体)系统中,一般来说,在现实世界中,它们很难有效地沟通,”CSAIL的博士后克里斯托弗·阿马托(Christopher Amato)说,他是这篇新论文的第一作者。“如果你有一个摄像头,摄像头不可能不断地将所有信息传输到所有其他摄像头。同样,机器人所处的网络也不完善,所以向其他机器人传递信息需要一定的时间,而且在某些情况下,它们可能无法在障碍物周围进行交流。”

阿马托说,代理商甚至可能不知道自己所在位置的完整信息。例如,它可能不知道它实际位于仓库的哪条通道。此外,他说:“当你试图做出决定时,对事情将如何发展存在一些不确定性。”“也许你试图向某个方向移动,但有风或车轮打滑,或者由于丢包而导致网络不确定性。因此,在现实世界中,由于所有这些通信噪音和对正在发生的事情的不确定性,很难做出决定。”

麻省理工学院的新系统由阿马托与松下计算机科学与工程教授莱斯利·凯尔布林(Leslie Kaelbling)和博士后乔治·科尼达里斯(George Konidaris)共同开发,需要三个输入。一种是一组低级控制算法——麻省理工学院的研究人员称之为“宏观行动”——它可以集体或单独地控制代理的行为。第二个是关于这些程序在特定环境中执行情况的一组统计数据。第三个是评估不同结果的方案:完成一项任务会产生很高的正估值,但消耗能量会产生负估值。

艰苦的学校

阿马托设想,只要让多智能体系统运行一段时间,无论是在现实世界中还是在模拟中,统计数据就可以自动收集。例如,在仓库应用程序中,机器人将被留下来执行各种宏操作,系统将收集结果数据。机器人试图在仓库内从A点移动到B点,有时可能会陷入死胡同,它们的通信带宽可能会在另一些时候下降;当机器人从B点移动到C点时,这些百分比可能会有所不同。

麻省理工学院系统接受这些输入,然后决定如何最好地结合宏观行动,以最大化系统的价值函数。它可能使用所有的宏操作;它可能只使用一个很小的子集。而且它可能会以人类设计师想不到的方式使用它们。

例如,假设每个机器人都有一小组彩灯,当它们的无线链路中断时,它可以用这些彩灯与对手进行通信。“通常情况是,程序员决定红灯意味着去这个房间帮助某人,绿灯意味着去那个房间帮助某人,”阿马托说。“在我们的例子中,我们可以说有三盏灯,算法会说出是否使用它们以及每种颜色的含义。”

- CFE传媒编辑。查看更多控制工程机器人的故事