SaferPath: Hierarchical Visual Navigation with Learned Guidance and Safety-Constrained Control

📄 arXiv: 2603.01898v1 📥 PDF

作者: Lingjie Zhang, Zeyu Jiang, Changhao Chen

分类: cs.RO

发布日期: 2026-03-02

备注: ICRA 2026


💡 一句话要点

SaferPath:结合学习引导与安全约束控制的分层视觉导航框架

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 视觉导航 机器人 安全约束 模型预测控制 分层控制

📋 核心要点

  1. 端到端视觉导航方法在复杂环境中泛化性差,易发生碰撞,尤其是在拥挤的室内场景。
  2. SaferPath利用学习的引导信息,通过安全约束优化控制模块,生成安全可行的轨迹。
  3. 实验表明,SaferPath在复杂环境中显著提升了导航成功率,并减少了碰撞次数,优于现有方法。

📝 摘要(中文)

视觉导航是移动机器人的核心能力,然而,端到端学习方法在未见过的、杂乱的或狭窄的环境中泛化性和安全性方面常常遇到困难。这些限制在密集的室内环境中尤为明显,在这些环境中,碰撞的可能性很高,端到端模型经常失效。为了解决这个问题,我们提出了SaferPath,一个分层视觉导航框架,它利用现有端到端模型的学习引导,并通过安全约束的优化控制模块对其进行改进。SaferPath将视觉观察转换为可通行区域地图,并使用模型预测Stein变分进化策略(MP-SVES)优化引导轨迹,仅需几次迭代即可高效生成安全轨迹。改进后的轨迹由MPC控制器跟踪,确保在复杂环境中实现鲁棒导航。在具有未见障碍物、密集非结构化空间和狭窄走廊的场景中进行的大量实验表明,SaferPath始终提高成功率并减少碰撞,优于ViNT和NoMaD等代表性基线,并能够在具有挑战性的真实环境中实现安全导航。

🔬 方法详解

问题定义:现有端到端视觉导航方法在复杂、未知的室内环境中,容易发生碰撞,导航成功率低。尤其是在障碍物密集、空间狭窄的场景下,模型的泛化能力不足,难以保证机器人的安全。

核心思路:SaferPath的核心在于结合学习的先验知识和安全约束的优化控制。首先利用学习模型提供导航引导,然后通过优化控制模块,在保证安全的前提下,对引导轨迹进行修正,从而生成更安全、更可行的轨迹。这种分层结构能够有效利用学习模型的泛化能力,同时保证导航的安全性。

技术框架:SaferPath框架主要包含以下几个模块:1) 可通行区域地图构建:将视觉观测转换为可通行区域的表示。2) 学习引导模块:利用预训练的端到端模型生成初始导航轨迹。3) 安全约束优化模块:使用MP-SVES算法,在安全约束下优化初始轨迹,生成安全轨迹。4) MPC控制器:跟踪优化后的安全轨迹,实现鲁棒的导航。

关键创新:SaferPath的关键创新在于将学习的引导信息与安全约束的优化控制相结合。传统的端到端方法缺乏对安全性的显式建模,而SaferPath通过优化控制模块,能够显式地考虑安全约束,从而生成更安全的轨迹。此外,MP-SVES算法能够高效地在复杂环境中找到满足安全约束的优化轨迹。

关键设计:MP-SVES算法是关键。它是一种基于模型预测和Stein变分梯度下降的优化算法,用于在安全约束下优化轨迹。具体来说,它通过迭代地更新轨迹分布,使得轨迹逐渐满足安全约束,并逼近最优轨迹。损失函数包含轨迹长度、与目标点的距离以及安全约束项。MPC控制器采用常见的线性二次型调节器(LQR)设计,用于跟踪优化后的轨迹。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,SaferPath在具有未见障碍物、密集非结构化空间和狭窄走廊的场景中,显著提高了导航成功率并减少了碰撞次数。例如,在某些场景下,SaferPath的成功率比ViNT和NoMaD等基线方法提高了10%-20%,碰撞次数减少了50%以上。这些结果表明,SaferPath在复杂环境中具有更强的鲁棒性和安全性。

🎯 应用场景

SaferPath可应用于室内服务机器人、自动驾驶轮椅、仓储物流机器人等领域。该方法能够提高机器人在复杂环境中的导航安全性,降低碰撞风险,提升用户体验。未来,该技术有望扩展到更复杂的动态环境,实现更智能、更安全的机器人导航。

📄 摘要(原文)

Visual navigation is a core capability for mobile robots, yet end-to-end learning-based methods often struggle with generalization and safety in unseen, cluttered, or narrow environments. These limitations are especially pronounced in dense indoor settings, where collisions are likely and end-to-end models frequently fail. To address this, we propose SaferPath, a hierarchical visual navigation framework that leverages learned guidance from existing end-to-end models and refines it through a safety-constrained optimization-control module. SaferPath transforms visual observations into a traversable-area map and refines guidance trajectories using Model Predictive Stein Variational Evolution Strategy (MP-SVES), efficiently generating safe trajectories in only a few iterations. The refined trajectories are tracked by an MPC controller, ensuring robust navigation in complex environments. Extensive experiments in scenarios with unseen obstacles, dense unstructured spaces, and narrow corridors demonstrate that SaferPath consistently improves success rates and reduces collisions, outperforming representative baselines such as ViNT and NoMaD, and enabling safe navigation in challenging real-world settings.