Multi-Robot Trajectory Planning via Constrained Bayesian Optimization and Local Cost Map Learning with STL-Based Conflict Resolution

📄 arXiv: 2603.05767v1 📥 PDF

作者: Sourav Raxit, Abdullah Al Redwan Newaz, Jose Fuentes, Paulo Padrao, Ana Cavalcanti, Leonardo Bobadilla

分类: cs.RO

发布日期: 2026-03-06

备注: Accepted to ICRA 2026

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

提出基于约束贝叶斯优化和局部代价地图学习的多机器人轨迹规划方法,解决STL约束下的运动规划问题。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 多机器人系统 轨迹规划 信号时序逻辑 贝叶斯优化 冲突解决

📋 核心要点

  1. 现有精确多机器人运动规划方法可扩展性差,基于采样的方法效率低,难以满足复杂时序逻辑约束。
  2. 提出结合约束贝叶斯优化和STL推理的两阶段框架,单机器人使用cBOT规划器,多机器人使用STL-KCBS算法。
  3. 实验表明,该方法在轨迹效率和安全性方面优于现有方法,并在真实水面车辆实验中验证了鲁棒性。

📝 摘要(中文)

本文提出了一种在运动学约束下,满足信号时序逻辑(STL)规范的多机器人运动规划方法。精确方法面临可扩展性瓶颈和有限的适应性,而传统的基于采样的方法需要过多的样本来构建最优轨迹。我们提出了一个两阶段框架,将基于采样的在线学习与形式化的STL推理相结合。在单机器人层面,我们基于约束贝叶斯优化的树搜索(cBOT)规划器使用高斯过程作为替代模型来学习局部代价地图和可行性约束,从而以更少的样本生成更短的无碰撞轨迹。在多机器人层面,我们的STL增强的基于运动学的冲突搜索(STL-KCBS)算法将STL监控纳入冲突检测和解决,确保规范满足,同时保持可扩展性和概率完备性。基准测试表明,与现有方法相比,轨迹效率和安全性有所提高。使用自主水面车辆进行的真实世界实验验证了在不确定环境中的鲁棒性和实际适用性。STLcBOT规划器将作为开源软件包发布,真实世界和模拟实验的视频可在https://stlbot.github.io/上找到。

🔬 方法详解

问题定义:论文旨在解决多机器人系统在满足信号时序逻辑(STL)规范和运动学约束下的轨迹规划问题。现有方法,如精确方法,在处理大规模问题时面临可扩展性瓶颈;而传统的基于采样的方法,为了找到最优轨迹,需要大量的样本,效率较低。这些方法难以在复杂和不确定的环境中实现安全高效的运动规划。

核心思路:论文的核心思路是将基于采样的在线学习与形式化的STL推理相结合。单机器人层面,利用约束贝叶斯优化(cBO)学习局部代价地图和可行性约束,加速轨迹搜索。多机器人层面,通过STL监控增强冲突检测和解决,确保满足时序逻辑规范。这种结合既能提高规划效率,又能保证轨迹的安全性。

技术框架:该方法包含两个主要阶段:1) 单机器人轨迹规划:使用cBOT规划器,该规划器基于高斯过程学习局部代价地图,并利用约束贝叶斯优化进行树搜索,生成无碰撞轨迹。2) 多机器人冲突解决:使用STL-KCBS算法,该算法将STL监控集成到冲突检测和解决过程中,确保生成的轨迹满足STL规范。整体流程是先为每个机器人生成初始轨迹,然后通过STL-KCBS迭代地解决冲突,直到所有机器人轨迹都满足STL规范且无冲突。

关键创新:该方法的关键创新在于将约束贝叶斯优化与STL推理相结合。cBOT规划器通过学习局部代价地图,减少了采样次数,提高了单机器人轨迹规划的效率。STL-KCBS算法通过将STL监控融入冲突解决,确保了多机器人系统在复杂时序逻辑约束下的安全性。这种结合克服了传统方法在可扩展性、效率和安全性方面的局限性。

关键设计:cBOT规划器使用高斯过程作为替代模型来学习局部代价地图和可行性约束。高斯过程的核函数选择和超参数优化对学习效果至关重要。STL-KCBS算法的关键在于如何有效地将STL监控融入冲突检测和解决。具体来说,需要设计合适的STL监控器,能够实时评估轨迹是否满足STL规范,并根据监控结果调整冲突解决策略。此外,还需要考虑如何平衡规划效率和STL规范的满足程度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在轨迹效率和安全性方面优于现有方法。具体而言,与传统方法相比,该方法能够以更少的样本生成更短的无碰撞轨迹,并且能够更好地满足STL规范。在真实水面车辆实验中,该方法验证了其在不确定环境中的鲁棒性和实际适用性。

🎯 应用场景

该研究成果可应用于各种多机器人协作场景,例如:自主物流、智能仓储、搜救行动、环境监测、以及自动驾驶等。通过确保多机器人系统在复杂约束下安全高效地完成任务,该方法能够提高生产效率、降低运营成本,并提升任务的可靠性。

📄 摘要(原文)

We address multi-robot motion planning under Signal Temporal Logic (STL) specifications with kinodynamic constraints. Exact approaches face scalability bottlenecks and limited adaptability, while conventional sampling-based methods require excessive samples to construct optimal trajectories. We propose a two-stage framework integrating sampling-based online learning with formal STL reasoning. At the single-robot level, our constrained Bayesian Optimization-based Tree search (cBOT) planner uses a Gaussian process as a surrogate model to learn local cost maps and feasibility constraints, generating shorter collision-free trajectories with fewer samples. At the multi-robot level, our STL-enhanced Kinodynamic Conflict-Based Search (STL-KCBS) algorithm incorporates STL monitoring into conflict detection and resolution, ensuring specification satisfaction while maintaining scalability and probabilistic completeness. Benchmarking demonstrates improved trajectory efficiency and safety over existing methods. Real-world experiments with autonomous surface vehicles validate robustness and practical applicability in uncertain environments. The STLcBOT Planner will be released as an open-source package, and videos of real-world and simulated experiments are available at https://stlbot.github.io/.