Press "Enter" to skip to content

伦敦大学学院的研究人员介绍了DSP-SLAM:一种具有深度形状先验知识的面向对象的SLAM

在人工智能(AI)的快速发展领域中,深度学习变得越来越受欢迎,并且进入到每个行业,使生活变得更加便利。SLAM(Simultaneous Localization and Mapping,同时定位与地图构建)是AI中的一个重要组成部分,它在机器人、无人驾驶汽车和增强现实系统中得到了革命性的进展。

SLAM涉及重建周围环境并同时估计移动相机的轨迹。SLAM具有一些令人难以置信的算法,能够精确估计相机轨迹并产生出色的几何重建。然而,仅凭几何表示无法为需要场景理解的更复杂任务提供重要的语义信息。

目前使用的语义SLAM系统对场景中物体的特定细节推理(例如数量、大小、形状或相对姿态)是一个挑战。在最近的研究中,伦敦大学学院(University College London)计算机科学系的研究团队引入了最新的面向对象SLAM系统,名为DSP-SLAM。

DSP-SLAM旨在构建一个全面而精确的联合地图;前景物体由密集的3D模型表示,而背景则由稀疏的地标点表示。该系统甚至可以很好地配合单目、双目或双目+LiDAR输入模态。

团队表示,DSP-SLAM的主要功能是接收由基于特征的SLAM系统产生的3D点云作为输入,并通过密集重建已经被识别的物体来增强其稀疏地图的能力。使用语义实例分割来检测物体,并使用类别特定的深度形状嵌入作为先验来估计这些物体的形状和姿态。

团队表示,DSP感知束调整是该系统的主要特点,因为它用于创建姿态图,实现相机姿态、物体位置和特征点的联合优化。通过使用这种策略,系统可以改进和优化场景的表示,同时考虑背景地标和前景物体。

该系统在多种输入模态(如单目、双目和双目+LiDAR)下以每秒10帧的速度运行,展示了令人印象深刻的性能。已经在多个数据集上对DSP-SLAM进行了测试,包括来自KITTI轨迹数据集的双目+LiDAR序列和来自Freiburg和Redwood-OS数据集的单目-RGB序列,以验证其功能。结果显示,即使在观测不完整的情况下,该系统能够产生出色的完整物体重建并保持一致的全局地图。

研究人员总结了主要贡献如下:

  1. DSP-SLAM将面向对象SLAM的语义映射丰富性与基于特征的相机跟踪的准确性相结合,通过使用稀疏特征点重建背景,与先前只表示物体的方法形成对比。
  1. DSP-SLAM在定量和定性方面都优于依赖于密集深度图像的方法,因为它使用仅RGB单目流而不是Node-SLAM,并且可以通过仅使用50个3D点来准确估计物体的形状。
  1. DSP-SLAM在对象形状和姿态估计方面,在定量和定性方面都优于基于先验的自动标记技术。
  1. KITTI轨迹数据集的实验结果显示,使用DSP-SLAM的联合束调整在轨迹估计方面优于ORB-SLAM2,尤其是在使用双目+LiDAR输入时。
Leave a Reply

Your email address will not be published. Required fields are marked *