技术帮助机器人找到前门

麻省理工学院的工程师和福特汽车公司一起开发了一种机器人导航方法,使机器人能够利用环境中的线索来规划到达目的地的路线,可以用一般的语义术语来描述,而不是地图上的坐标。

通过詹妮弗·楚 2019年11月9日

麻省理工学院的工程师和福特汽车公司一起开发了一种机器人导航方法,不需要事先绘制区域地图。相反,他们的方法使机器人能够利用环境中的线索来规划到达目的地的路线,这些路线可以用一般的语义术语来描述,比如“前门”或“车库”,而不是地图上的坐标。

例如,如果一个机器人被指示把一个包裹送到某人的前门,它可能会从路上开始,看到一条车道,它已经被训练识别为可能通向人行道,而人行道又可能通向前门。

这项新技术可以大大减少机器人在确定目标之前探索房屋的时间,而且它不依赖于特定住宅的地图。

麻省理工学院机械工程系的研究生迈克尔·埃弗雷特(Michael Everett)说:“我们不想为我们需要参观的每一栋建筑制作地图。”“有了这项技术,我们希望把机器人放在任何车道的尽头,让它找到一扇门。”

"对事物本质的感觉"

近年来,研究人员一直致力于将自然的语义语言引入机器人系统,训练机器人通过语义标签识别物体,这样它们就可以在视觉上把一扇门当作门来处理,而不仅仅是把它当作一个固体的矩形障碍物。

埃弗雷特说:“现在我们有能力让机器人实时感知事物。”

埃弗雷特、麻省理工学院航空航天学教授乔纳森·豪和福特汽车公司的贾斯汀·米勒正在使用类似的语义技术作为他们新导航方法的跳板,这种方法利用已有的算法,从视觉数据中提取特征,生成同一场景的新地图,以语义线索或上下文表示。

在他们的案例中,研究人员使用一种算法来构建机器人移动时的环境地图,使用每个物体的语义标签和深度图像。这种算法被称为语义同步定位和映射(SLAM)。

虽然其他语义算法已经使机器人能够识别和映射环境中的物体,但它们还没有允许机器人在导航新环境时立即做出决定,在通往语义目的地(如“前门”)的最有效路径上做出决定。

“以前,探索只是把一个机器人放下,说‘开始’,它就会四处移动,最终到达那里,但它会很慢,”How说。

去的成本

研究人员希望通过语义化、语境化的世界来加快机器人的路径规划。他们开发了一种新的“成本估算器”,这种算法可以将先前存在的SLAM算法创建的语义地图转换为第二张地图,代表任何给定位置接近目标的可能性。

埃弗雷特说:“这是受到图像到图像翻译的启发,你可以拍一张猫的照片,让它看起来像一只狗。”“同样的想法也发生在这里,你拿一张看起来像世界地图的图像,然后把它变成另一张看起来像世界地图的图像,但现在根据地图上不同的点与最终目标的距离来着色。”

这张地图是用灰度进行着色的,将较暗的区域表示为远离目标的位置,较亮的区域表示为靠近目标的区域。例如,在语义地图上标注为黄色的人行道,可能会被成本算法翻译成新地图上较暗的区域,而车道在接近前门时逐渐变亮——这是新地图上最亮的区域。

研究人员在必应地图的卫星图像上训练了这个新算法,这些图像包含了来自一个城市和三个郊区社区的77所房屋。该系统将语义地图转换为成本地图,并绘制出最有效的路径,沿着地图上较轻的区域到达最终目标。对于每张卫星图像,Everett为典型前院的上下文特征分配语义标签和颜色,例如灰色代表前门,蓝色代表车道,绿色代表树篱。

在这个训练过程中,团队还对每个图像应用了遮罩,以模拟机器人相机在穿过院子时可能拥有的部分视图。

How说:“我们方法的一部分技巧是(给系统)大量的局部图像。”“所以它真的必须弄清楚所有这些东西是如何相互关联的。这是让这个项目运转良好的部分原因。”

然后,研究人员在训练数据集之外的一个全新房屋图像的模拟中测试了他们的方法,首先使用先前存在的SLAM算法生成语义地图,然后应用他们新的成本估算器生成第二张地图,以及通往目标的路径,在这种情况下,是前门。

该团队的新技术发现,前门比传统的导航算法快189%,传统的导航算法不考虑上下文或语义,而是花费过多的步骤探索不太可能接近目标的区域。

埃弗雷特说,研究结果说明了机器人如何利用环境来有效地定位目标,即使是在不熟悉的、没有地图的环境中。

埃弗雷特说:“即使机器人把包裹送到一个它从未去过的地方,那里也可能有与它看到的其他地方相同的线索。”“所以世界的布局可能有点不同,但可能有一些共同点。”

麻省理工学院(MIT)

www.mit.edu

-副主编Chris Vavra编辑控制工程, CFE传媒,cvavra@cfemedia.com.查看更多控制工程机器人的故事


作者简介:麻省理工学院新闻处