在交叉训练之后,人类和机器人能更好地合作

角色互换提高了效率,也提高了机器人的信心和人类的信任。随着人类和机器人在日常工作中越来越多地合作,这一发展将至关重要。

通过海伦·奈特,麻省理工学院新闻办公室 2013年2月21日

花一天的时间站在别人的角度思考,可以帮助我们了解是什么让他们发挥作用。现在,同样的方法正被用于更好地理解人类和机器人,使他们能够作为一个团队一起工作。

在制造业中,机器人被越来越多地用于执行与人类更密切接触的任务。麻省理工学院航空航天学助理教授、计算机科学与人工智能实验室(CSAIL)互动机器人小组负责人朱莉·沙阿(Julie Shah)说,虽然人们已经做了大量工作来确保机器人和人类可以安全地并肩工作,但还需要付出更多努力来让机器人足够聪明,能够有效地与人合作。

“人不是机器人,他们不会每次都以同样的方式做事,”沙阿说。“因此,我们编程机器人每次以完全相同的方式执行任务的方式与我们需要它们做的事情之间存在不匹配,如果它们要与人类合作的话。”

现有的大多数关于如何让机器人成为更好的团队成员的研究都是基于互动奖励的概念,即每当机器人执行一项任务时,人类教练都会给出积极或消极的回应。

然而,军方进行的人体研究表明,简单地告诉人们他们在一项任务中做得好或不好,是一种非常低效的鼓励他们团队合作的方法。

因此,沙阿和博士生斯特凡诺斯·尼古拉迪斯(Stefanos Nikolaidis)开始研究,在训练人类方面表现良好的技术是否也适用于人类和机器人的混合团队。其中一种技术被称为交叉训练,让团队成员在给定的日子里交换角色。沙阿说:“这能让人们更好地了解自己的角色如何影响伴侣,以及伴侣的角色如何影响自己。”

在一篇将于3月在东京举行的人机交互国际会议上发表的论文中,Shah和Nikolaidis将展示他们在人和机器人混合小组中进行的实验结果,证明交叉训练是一种极其有效的团队建设工具。
为了让机器人参与交叉训练实验,两人首先必须设计一种新的算法,让设备从它们的角色交换经验中学习。因此,他们修改了现有的强化学习算法,使机器人不仅能从正奖励和负奖励中获取信息,还能从演示中获得信息。通过这种方式,通过观察它们的人类同伴转换角色来开展工作,机器人能够了解人类希望它们如何执行相同的任务。

然后,每个人-机器人团队在虚拟环境中执行模拟任务,其中一半团队使用传统的互动奖励方法,另一半团队使用在会话中途转换角色的交叉训练技术。一旦这些团队完成了虚拟训练课程,他们就会被要求在现实世界中执行任务,但这一次他们坚持自己指定的角色。
沙阿和尼古拉迪斯发现,与互动奖励团队相比,参加交叉训练的团队中,人类和机器人同时工作的时间(被称为同步运动)增加了71%。他们还发现,人类无所事事的时间减少了41%,比如等待机器人完成某一阶段的任务。

更重要的是,当这对搭档研究机器人本身时,他们发现,如果它们经过交叉训练,学习算法对它们的人类队友下一步可能做什么的不确定性水平要低得多——这是一种被称为熵水平的测量方法。

最后,在实验结束后的一份问卷调查中,交叉训练的人类参与者比单纯奖励组的参与者更有可能说机器人根据他们的喜好执行了任务,并且报告了对机器人队友更高的信任程度。尼古拉迪斯说:“这是第一个证据,表明当人类和机器人通过切换角色一起训练时,人与机器人的合作能力会得到提高,这种方式类似于有效的人类团队训练实践。”

沙阿认为,这种团队表现的改善可能是由于双方在交叉训练过程中更多地参与。沙阿说:“当人们通过奖励来训练机器人时,它是单向的:人们说‘好机器人’或说‘坏机器人’,这是一种非常单向的信息传递。”“但当你转换角色时,人能更好地适应机器人的能力,并了解它可能会做什么,因此我们认为,是人的适应能力导致了更好的团队表现。”

请参阅麻省理工学院关于机器人与人类互动的更多信息

麻省理工学院

web.mit.edu