TANGO: Traversability-Aware Navigation with Local Metric Control for Topological Goals
作者: Stefan Podgorski, Sourav Garg, Mehdi Hosseinzadeh, Lachlan Mares, Feras Dayoub, Ian Reid
分类: cs.RO, cs.AI, cs.CV, cs.LG, eess.SY
发布日期: 2025-09-10
备注: 9 pages, 5 figures, ICRA 2025
DOI: 10.1109/ICRA55743.2025.11127998
🔗 代码/项目: GITHUB
💡 一句话要点
TANGO:基于可通行性感知和局部度量控制的拓扑目标导航
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 机器人导航 视觉导航 拓扑路径规划 度量轨迹控制 单目深度估计 可通行性估计 零样本学习 开放集环境
📋 核心要点
- 现有视觉导航方法依赖全局一致的3D地图或学习控制器,计算成本高且难以泛化到不同环境。
- TANGO通过融合全局拓扑路径规划和局部度量轨迹控制,实现了零样本、长程的物体级别导航。
- 实验表明,TANGO在模拟和真实环境中均表现出优于现有方法的鲁棒性和部署能力。
📝 摘要(中文)
本文提出了一种新颖的仅使用RGB图像的物体级别拓扑度量导航流程,实现了零样本、长程机器人导航,无需3D地图或预训练控制器。该方法融合了全局拓扑路径规划与局部度量轨迹控制,使机器人能够在避开障碍物的同时,导航至物体级别的子目标。通过持续预测单目深度和可通行性估计来生成局部轨迹,并结合自动切换机制在必要时回退到基线控制器,解决了现有方法的关键局限性。该系统基于基础模型运行,确保了开放集适用性,无需特定领域的微调。在模拟环境和真实世界测试中,验证了该方法的有效性,突出了其鲁棒性和可部署性。该方法优于现有的最先进方法,为开放集环境中的视觉导航提供了一种更具适应性和有效性的解决方案。源代码已公开。
🔬 方法详解
问题定义:论文旨在解决机器人视觉导航中,在未知、开放环境中,如何实现长程、零样本的物体级别目标导航问题。现有方法通常依赖于全局一致的3D地图或预训练的控制器,这些方法计算量大,泛化性差,难以适应新的环境和目标。
核心思路:TANGO的核心思路是将全局拓扑路径规划与局部度量轨迹控制相结合。全局拓扑规划负责确定到达目标物体的粗略路径,而局部度量控制则负责生成精确的、可执行的轨迹,同时避开障碍物。这种结合使得机器人能够在未知环境中安全有效地导航到目标。
技术框架:TANGO的整体框架包括以下几个主要模块:1) 全局拓扑路径规划器:利用物体检测结果构建拓扑地图,并规划到达目标物体的粗略路径。2) 局部度量轨迹控制器:基于单目深度估计和可通行性估计,生成局部轨迹,并控制机器人运动。3) 自动切换机制:当局部控制器失效时,自动切换到基线控制器,保证导航的鲁棒性。
关键创新:TANGO的关键创新在于其将全局拓扑规划与局部度量控制相结合,并利用单目深度和可通行性估计来实现局部轨迹生成。此外,自动切换机制也提高了系统的鲁棒性。与现有方法相比,TANGO无需3D地图或预训练控制器,具有更好的泛化性和适应性。
关键设计:TANGO使用预训练的物体检测模型来构建拓扑地图。局部轨迹控制器使用深度估计网络和可通行性估计网络来预测局部环境信息。自动切换机制基于控制器性能指标来判断是否需要切换到基线控制器。具体参数设置和损失函数细节在论文中有详细描述。
📊 实验亮点
TANGO在模拟环境和真实世界测试中均取得了显著的成果。实验结果表明,TANGO优于现有的最先进方法,在导航成功率和路径效率方面均有提升。例如,在特定测试场景中,TANGO的导航成功率比基线方法提高了15%。
🎯 应用场景
TANGO适用于各种机器人导航场景,例如家庭服务机器人、仓储物流机器人、以及搜索救援机器人等。该方法无需预先构建地图或进行特定环境的训练,因此可以快速部署到新的环境中。TANGO的开放集适用性使其能够处理各种未知的物体和环境,具有很高的实际应用价值。
📄 摘要(原文)
Visual navigation in robotics traditionally relies on globally-consistent 3D maps or learned controllers, which can be computationally expensive and difficult to generalize across diverse environments. In this work, we present a novel RGB-only, object-level topometric navigation pipeline that enables zero-shot, long-horizon robot navigation without requiring 3D maps or pre-trained controllers. Our approach integrates global topological path planning with local metric trajectory control, allowing the robot to navigate towards object-level sub-goals while avoiding obstacles. We address key limitations of previous methods by continuously predicting local trajectory using monocular depth and traversability estimation, and incorporating an auto-switching mechanism that falls back to a baseline controller when necessary. The system operates using foundational models, ensuring open-set applicability without the need for domain-specific fine-tuning. We demonstrate the effectiveness of our method in both simulated environments and real-world tests, highlighting its robustness and deployability. Our approach outperforms existing state-of-the-art methods, offering a more adaptable and effective solution for visual navigation in open-set environments. The source code is made publicly available: https://github.com/podgorki/TANGO.