更快地了解机器人技术以在混乱的人类环境中提供帮助
密歇根大学的研究人员朝着能够快速导航无法预测和混乱的空间的家庭机器人迈出了一步,该算法使机器感知环境的速度比以前的类似方法快了几个数量级。“机器人的感知能力是提供可以部署到人们家中的功能强大的辅助机器人的最大瓶颈之一,”计算机科学与工程专业的研究生,《科学机器人》上发表的论文的主要作者卡尔西克·戴辛格(Karthik Desingh)说。
“在有结构的工业环境中,机器人可以非常快速地完成诸如制造汽车之类的任务。但是我们生活在非结构化的环境中,我们希望机器人能够处理我们的混乱情况。”
从历史上看,机器人在护栏或笼子后方的结构化环境中可最有效地运行,以确保人员安全,并使机器人的工作区保持整洁有序。但是,在工作或家庭中,人的环境通常是各种状态的杂物:键盘上的文件,藏有汽车钥匙的袋子或藏有半开式橱柜的围裙。
团队的新算法称为“用于非参数置信度传播的请求消息传递”。在10分钟内,它可以计算出对物体的姿势(或位置和方向)的准确理解,其精确度达到以前的方法需要一个半小时以上。
团队通过Fetch机器人演示了这一点。他们证明了他们的算法可以正确地感知和使用一组抽屉,即使用毯子覆盖了一半,当抽屉半开时,或者机器人的手臂本身隐藏了抽屉的完整传感器视图时,也是如此。该算法还可以从简单的修整器扩展到具有多个复杂关节的对象。他们表明,机器人可以准确地感知自己的身体和抓臂。
“我们算法背后的概念,例如非参数信念传播,已经在计算机视觉中使用,并且在捕获我们世界的不确定性方面表现非常出色。但是这些模型对机器人的影响有限,因为它们在计算上非常昂贵,交互式机器人需要比实际更多的时间来完成日常任务,”计算机科学与工程学教授,密歇根大学核心教授Chad Jenkins说道。机器人学院。
先前的技术依赖于“推送消息传递”
非参数信念传播技术与类似的粒子消息传递技术于2003年首次发布。它们在计算机视觉方面非常有效,它试图通过图像和视频来全面了解场景。这是因为与机器人感知中涉及的三维场景相比,二维图像或视频所需的计算能力和时间更少。
这些较早的方法通过将场景转换成节点和边缘的图形模型来理解场景,这些节点和边缘表示对象的每个组件以及它们之间的关系。然后,算法在给定一组约束的情况下假设(或建立了)零部件的位置和方向。研究人员称这些信念为粒子,它们在各种概率范围内变化。
为了缩小最可能的位置和方向,这些组件利用“推送消息传递”在节点之间并向后发送可能的位置信息。然后将该位置信息与传感器数据进行比较。此过程需要进行多次迭代才能最终获得对场景的准确把握。
例如,给定一个带有三个抽屉的梳妆台,对象的每个组件(在这种情况下,每个抽屉和梳妆台本身)都将是一个节点。约束条件是抽屉必须在梳妆台内,并且抽屉横向移动而不是垂直移动。
将节点之间传递的信息与来自传感器的真实观察结果进行比较,例如2D图像和3D点云。通过迭代重复消息,直到信念和传感器数据之间达成一致为止。
新算法转向“拉消息”
为了简化对计算的需求,Desingh和密歇根州的团队利用了所谓的“拉式消息传递”。他们的方法将来回的,信息密集的消息变成了对象组件之间的简洁对话。
在该示例中,代替仅在从其他抽屉计算了信息之后梳妆台才将位置信息发送到抽屉,而是梳妆台首先与抽屉进行核对。它要求每个抽屉对自己的位置有自己的把握,然后为了准确性,将其与其他抽屉的信息进行权衡。就像推送方法一样,它通过迭代来收敛对场景的准确理解。
为了直接将他们的新方法与以前的方法进行比较,他们在一个简单的2D场景的圆形场景上对其进行了测试,其中四个矩形臂隐藏在相似的圆形和矩形的图案中。
以前的方法每次迭代需要20多分钟的处理时间才能传递消息,而该团队的新方法只用了不到2分钟的时间,并且随着置信度或质点数量的增加,这种改进将成倍地加快。
在这些试验中,他们的新算法进行了五次迭代,以实现抽屉和梳妆台位置估计的平均误差小于3.5英寸,或者当梳妆台被部分遮盖住时,位置估计的平均误差小于8英寸。毯子。
这与以前的方法相当,并且根据对象的大小,零件数量以及传感器可见的数量而有所不同。最重要的是,准确性的提高足以使机器人通过连续迭代成功地操纵对象。
Desingh说:“这仅仅是我们在机器人感知中进行信念传播的开始。” “我们希望将我们的工作扩展到多个对象,并在动作执行期间跟踪它们,即使机器人当前不在看一个对象也是如此。然后,机器人可以利用此功能持续观察世界,进行面向目标的操纵并成功完成任务。”