通讯系统协助人机团队

麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员提出了一种机器人协作建模方法,可以更容易地设计使人类和机器人协同工作的系统。

通过拉里·哈德斯蒂,麻省理工学院新闻处 2016年3月11日

执行联合任务的自主机器人会不断向对方发送更新信息:“我穿过了一扇门,正在向右转90度。”“向前走了两英尺后,我遇到了一堵墙。我在向右转90度。”“前进了四英尺后,我遇到了一堵墙。”等等......

当然,在需要的时候,计算机会毫不费力地将这些信息归档。但如此密集的数据会让人发疯。

在上周末的人工智能发展协会年会上,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员提出了一种新的机器人协作建模方法,可以将通信需求减少60%。他们相信,他们的模型可以使设计人类和机器人协同工作的系统变得更容易,例如,在紧急反应小组中。

“我们还没有在人机团队中实施它,”该论文的两位作者之一、航空航天副教授朱莉·沙阿(Julie Shah)说。“但这是非常令人兴奋的,因为你可以想象:你刚刚减少了60%的沟通次数,而且这些其他的沟通对于团队中完成他们那部分任务的人来说可能不是真正必要的。”

这项工作还可能对不涉及人类的多机器人合作产生影响。通信消耗一些电力,这在电池供电的设备中总是需要考虑的,但在某些情况下,处理新信息的成本可能是更严重的资源消耗。

在多智能体系统中(计算机科学术语,指的是自主智能体之间的任何协作,无论是电子的还是其他方式),每个智能体都必须维护一个世界当前状态的模型,以及一个其他智能体所认为的世界状态的模型。如今,人们还期望代理将其模型准确的概率考虑在内。基于这些可能性,他们必须决定是否要改变自己的行为。

沟通成本

在某些情况下,一个机器人决定传播一条新信息,可能会迫使它的同伴更新他们的模型,并重新考虑所有这些可能性。如果信息无关紧要,广播它可能会导致严重的延迟,毫无意义。麻省理工学院研究人员的工作表明,在多智能体系统中,60%的通信可能是不必要的。

建模多智能体系统的方法称为分散式部分可观察马尔可夫决策过程(deco - pomdp)。A Dec-POMDP影响几种类型的不确定性;它不仅考虑一个主体对世界的看法是否正确以及它对同伴世界观的估计是否正确,它还考虑它所采取的任何行动是否会成功。例如,机器人可能计划向前移动20英尺,但发现侧风把它吹离了轨道。

deco - pomdp通常假定对代理将在其中运行的环境有一些先验知识。因为沙阿和航空航天研究生、这篇新论文的第一作者瓦伊巴夫·乌赫尔卡尔(Vaibhav Unhelkar)正在设计一个考虑应急响应应用的系统,所以他们无法做出这样的假设。紧急反应小组通常会进入不熟悉的环境,而紧急情况的性质可能会使最佳的先前信息过时。

然而,添加动态映射环境的需求使得计算多代理计划的问题非常耗时。因此,Shah和Unhelkar的系统忽略了行动有效性的不确定性,并假设代理人试图做任何事情,它都会做。

机器人平衡动作

当智能体获得一条新信息时——例如,穿过建筑物的一条给定通道被堵住了——它有三种选择:它可以忽略该信息;它可以使用它,但不能传播它;或者它可以使用它并传播它。

每一种选择都有好处,但也会带来成本。在Shah和Unhelkar的模型中,沟通是一种成本。但是,如果一个智能体将新信息整合到它自己的世界模型中,而不传播它,它也会产生成本,因为它的世界观变得更难以被同伴正确估计。对于智能体获得的每一条新信息,Shah和Unhelkar的系统都会基于智能体的世界模型、对同伴行为的期望以及更有效地完成共同目标的可能性,进行成本效益分析。

研究人员在300多个陌生环境下的救援任务计算机模拟中测试了他们的系统。他们的系统允许广泛交流的版本以2%到10%的速度完成了任务
比减少60%沟通的版本要高。

然而,在实验中,所有的代理都是电子的。沙阿说:“我愿意打赌的是,尽管我们必须等到进行了人体实验,但如果系统一直只是告诉人各种虚假的信息,那么人机团队将会惨败。”“对于人机团队来说,我认为这个算法将区分一个团队是能够有效运作,还是无法有效运作。”

在另一个独立的研究项目中,Shah的团队成员要求人类受试者团队执行类似的虚拟救援任务,就像计算机系统在新论文中报道的实验中所做的那样。利用机器学习算法,研究人员挖掘了人类交流模式的统计结果,可以将其纳入新模型,以更明确地适应人机团队。

麻省理工学院

www.mit.edu

- Chris Vavra编辑,制作编辑,控制工程, CFE传媒,cvavra@cfemedia.com.查看更多控制工程机器人的故事