赋予机器人社交技能

麻省理工学院研究人员开发的机器学习系统可以帮助机器人理解和执行某些社会互动。

通过亚当Zewe 2021年11月20日
提供:Chris Vavra, CFE媒体和技术

机器人可以在大学校园里送餐,也可以在高尔夫球场上一杆进洞,但即使是最复杂的机器人也无法进行对人类日常生活至关重要的基本社交互动。

麻省理工学院的研究人员现在已经将某些社会互动纳入机器人的框架中,使机器能够理解帮助或阻碍彼此意味着什么,并学会自己执行这些社会行为。在模拟环境中,一个机器人观察它的同伴,猜测它想要完成什么任务,然后根据自己的目标帮助或阻碍另一个机器人。

研究人员还表明,他们的模型创造了现实和可预测的社会互动。当他们向人类播放这些模拟机器人相互互动的视频时,人类观众大多同意模型中发生的社会行为类型。

让机器人展示社交技能可以使人与机器人的互动更顺畅、更积极。例如,辅助生活设施中的机器人可以利用这些能力帮助为老年人创造一个更有爱心的环境。这个新模型还可以让科学家定量地衡量社会互动,这可以帮助心理学家研究自闭症或分析抗抑郁药的效果。

“机器人很快就会生活在我们的世界里,它们真的需要学习如何用人类的方式与我们交流。他们需要明白什么时候该提供帮助,什么时候该看看自己能做些什么来防止事情发生。这是非常早期的工作,我们只是触及了表面,但我觉得这是第一次非常认真的尝试,以理解人类和机器的社交互动意味着什么,”麻省理工学院计算机科学与人工智能实验室(CSAIL)的首席研究科学家和InfoLab小组负责人、大脑、思想和机器中心(CBMM)的成员鲍里斯·卡茨说。

与Katz一起参与这篇论文的还有CSAIL的研究助理Ravi Tejwani;联合第一作者、CSAIL博士生郭燕玲;舒天民,脑与认知科学系博士后;以及CSAIL和CBMM的研究科学家、资深作者Andrei Barbu。这项研究将在11月的机器人学习会议上发表。

社会模拟

为了研究社会互动,研究人员创建了一个模拟环境,机器人在二维网格中移动时追求物理和社会目标。

物理目标与环境有关。例如,机器人的物理目标可能是导航到网格上某一点的一棵树上。社交目标包括猜测另一个机器人想要做什么,然后根据这个估计采取行动,比如帮助另一个机器人给树浇水。

研究人员使用他们的模型来确定机器人的物理目标是什么,它的社会目标是什么,以及它应该在多大程度上强调其中一个。机器人会因为它所采取的行动而获得奖励,使它更接近完成目标。如果一个机器人试图帮助它的同伴,它会调整自己的奖励以匹配另一个机器人的奖励;如果它试图阻碍,它会将奖励调整为相反的方向。规划器是一种决定机器人应该采取哪些行动的算法,它使用这种不断更新的奖励来指导机器人实现物理和社会目标的混合。

“我们为如何模拟两个代理之间的社会互动开辟了一个新的数学框架。如果你是一个机器人,你想去X位置,我是另一个机器人,我看到你想去X位置,我可以合作,帮助你更快地到达X位置。这可能意味着让X离你更近,找到另一个更好的X,或者采取你在X必须采取的任何行动。我们的公式允许计划发现“如何”;我们用数学的方式来定义社交互动的意义。”

将机器人的物理目标和社会目标结合起来,对于创造现实的互动非常重要,因为相互帮助的人类能够走多远是有限度的。巴布举例说,一个理性的人可能不会直接把钱包递给陌生人。

研究人员使用这个数学框架定义了三种类型的机器人。0级机器人只有物理目标,不能进行社交推理。1级机器人有物理和社会目标,但假设所有其他机器人都只有物理目标。1级机器人可以根据其他机器人的物理目标采取行动,比如帮助和阻碍。第2级机器人假设其他机器人都有社交和物理目标;这些机器人可以采取更复杂的行动,比如加入到一起帮忙。

评估模型

为了对比他们的模型与人类对社会互动的看法,他们创建了98个不同的场景,机器人分别处于0级、1级和2级。12个人观看了196个机器人互动的视频片段,然后被要求估计这些机器人的身体和社交目标。

在大多数情况下,他们的模型与人类对每一帧中发生的社会互动的想法一致。

“我们有长期的兴趣,既要为机器人建立计算模型,也要更深入地挖掘人类方面的问题。我们想从这些视频中找出人类用来理解社会互动的特征。我们能客观地测试一下你的社交能力吗?也许有一种方法可以教会人们认识到这些社会互动,并提高他们的能力。我们离这个目标还有很长的路要走,但即使只是能够有效地衡量社交互动,也是向前迈出的一大步。”

朝着更复杂的方向发展

研究人员正致力于开发一个具有3D代理的系统,该系统允许在一个环境中进行更多类型的交互,例如操纵家庭物品。他们还计划修改他们的模型,以包括行动可能失败的环境。

研究人员还希望在模型中加入一个基于神经网络的机器人规划器,它可以从经验中学习,并更快地执行。最后,他们希望进行一项实验,收集有关人类用来确定两个机器人是否正在进行社交互动的特征的数据。

Barbu说:“希望我们能有一个基准,让所有研究人员都能研究这些社交互动,并激发我们在物体和动作识别等其他领域看到的科学和工程进步。”

哈佛大学心理学系助理教授、计算、认知和发展实验室主任托默·乌尔曼(Tomer Ullman)没有参与这项研究,他说:“我认为这是对复杂而紧迫的挑战进行结构化推理的一个可爱应用。”“即使是年幼的婴儿似乎也能理解帮助和阻碍等社会互动,但我们还没有机器可以像人类那样灵活地执行这种推理。我相信,像这项研究中提出的模型,让行为者思考他人的回报,并在社会上计划如何最好地阻止或支持他们,是朝着正确方向迈出的良好一步。”

这项研究得到了大脑、思想和机器中心的支持;国家科学基金会;麻省理工学院CSAIL系统学习计划;麻省理工学院- ibm沃森人工智能实验室;DARPA成功团队人工社会智能项目;美国空军研究实验室;美国空军人工智能加速器;以及海军研究办公室。

-由Chris Vavra编辑,网页内容经理,控制工程, CFE媒体与技术,cvavra@cfemedia.com

原始内容可以在news.mit.edu


作者简介:Adam Zewe,麻省理工学院新闻办公室