FastTrack: GPU-Accelerated Tracking for Visual SLAM

📄 arXiv: 2509.10757v1 📥 PDF

作者: Kimia Khabiri, Parsa Hosseininejad, Shishir Gopinath, Karthik Dantu, Steven Y. Ko

分类: cs.RO, cs.DC

发布日期: 2025-09-13

备注: Accepted for presentation at IROS 2025, preprint


💡 一句话要点

FastTrack:利用GPU加速视觉SLAM的跟踪模块,提升实时性。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics) 支柱六:视频提取与匹配 (Video Extraction)

关键词: 视觉SLAM GPU加速 CUDA 立体视觉 特征匹配

📋 核心要点

  1. 视觉SLAM跟踪模块的计算瓶颈导致定位精度下降或跟踪失败。
  2. 利用GPU并行计算能力加速立体特征匹配和局部地图跟踪等耗时环节。
  3. 在ORB-SLAM3中集成CUDA优化,在EuRoC和TUM-VI数据集上验证了性能提升。

📝 摘要(中文)

视觉惯性SLAM系统的跟踪模块处理输入的图像帧和IMU数据,以估计帧相对于地图的位置。对于每个帧,及时完成跟踪非常重要,以避免较差的定位或跟踪丢失。因此,我们提出了一种新方法,该方法利用GPU计算能力来加速跟踪中耗时的组件,从而提高其性能。这些组件包括立体特征匹配和局部地图跟踪。我们使用CUDA在ORB-SLAM3跟踪过程中实现我们的设计。我们的评估表明,在使用著名的SLAM数据集EuRoC和TUM-VI时,在立体惯性模式下,桌面和Jetson Xavier NX板上的跟踪性能总体提高了高达2.8倍。

🔬 方法详解

问题定义:视觉SLAM系统中的跟踪模块需要实时处理图像和IMU数据,以估计相机位姿。然而,立体特征匹配和局部地图跟踪等步骤计算量大,容易成为系统瓶颈,导致跟踪延迟,进而影响定位精度甚至导致跟踪失败。现有方法难以充分利用硬件加速能力,限制了SLAM系统的实时性和鲁棒性。

核心思路:本论文的核心思路是利用GPU的并行计算能力加速跟踪模块中的关键耗时步骤。通过将计算密集型的立体特征匹配和局部地图跟踪等任务卸载到GPU上执行,可以显著降低CPU的负载,提高跟踪速度,从而提升SLAM系统的整体性能。

技术框架:该方法在ORB-SLAM3框架内实现,主要针对跟踪线程进行优化。首先,将立体图像的特征提取和匹配过程移植到GPU上,利用CUDA进行并行加速。其次,局部地图跟踪过程也通过CUDA进行优化,加速关键帧的搜索和位姿估计。优化后的跟踪模块与ORB-SLAM3的其余部分无缝集成,保持了系统的整体架构不变。

关键创新:该方法的关键创新在于将GPU加速应用于视觉SLAM跟踪模块中的多个关键步骤,而不仅仅是单个步骤。通过对立体特征匹配和局部地图跟踪进行协同优化,实现了整体性能的显著提升。此外,该方法在ORB-SLAM3框架内的实现,使其能够方便地应用于现有的SLAM系统。

关键设计:具体实现中,使用了CUDA编程模型,针对GPU的架构特点对算法进行了优化。例如,在立体特征匹配中,使用了共享内存来加速特征点之间的距离计算。在局部地图跟踪中,使用了并行搜索算法来加速关键帧的匹配。具体的参数设置和优化策略需要根据不同的GPU硬件平台进行调整。

📊 实验亮点

实验结果表明,在EuRoC和TUM-VI数据集上,该方法在立体惯性模式下,桌面平台和Jetson Xavier NX平台上的跟踪性能分别提升了高达2.8倍。这表明该方法能够有效地利用GPU加速,显著提高视觉SLAM系统的实时性。与未优化的ORB-SLAM3相比,该方法在保证定位精度的前提下,显著降低了跟踪延迟。

🎯 应用场景

该研究成果可广泛应用于需要实时视觉SLAM的机器人导航、增强现实、无人机等领域。通过提高SLAM系统的跟踪速度和精度,可以提升机器人的自主导航能力,改善AR/VR的用户体验,并扩展无人机的应用范围。未来,该方法可以进一步推广到其他SLAM系统和硬件平台,具有重要的实际应用价值。

📄 摘要(原文)

The tracking module of a visual-inertial SLAM system processes incoming image frames and IMU data to estimate the position of the frame in relation to the map. It is important for the tracking to complete in a timely manner for each frame to avoid poor localization or tracking loss. We therefore present a new approach which leverages GPU computing power to accelerate time-consuming components of tracking in order to improve its performance. These components include stereo feature matching and local map tracking. We implement our design inside the ORB-SLAM3 tracking process using CUDA. Our evaluation demonstrates an overall improvement in tracking performance of up to 2.8x on a desktop and Jetson Xavier NX board in stereo-inertial mode, using the well-known SLAM datasets EuRoC and TUM-VI.