The Trajectory Bundle Method: Unifying Sequential-Convex Programming and Sampling-Based Trajectory Optimization

📄 arXiv: 2509.26575v1 📥 PDF

作者: Kevin Tracy, John Z. Zhang, Jon Arrizabalaga, Stefan Schaal, Yuval Tassa, Tom Erez, Zachary Manchester

分类: math.OC, cs.RO

发布日期: 2025-09-30


💡 一句话要点

提出轨迹束方法,统一序列凸规划与采样轨迹优化,解决无导数轨迹优化问题。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 轨迹优化 序列凸规划 无导数优化 采样方法 运动规划

📋 核心要点

  1. 传统序列凸规划依赖导数信息进行局部近似,但在导数计算困难或不可行的情况下失效。
  2. 该文提出一种无导数方法,通过采样动力学、成本和约束函数,并进行插值来构建凸近似。
  3. 该框架统一了采样和序列凸规划方法,扩展了MPPI等方法,并支持多重射击和通用约束。

📝 摘要(中文)

本文提出了一种统一的框架,通过序列凸规划以无导数的方式解决轨迹优化问题。传统的非凸优化问题通过形成和求解一系列凸优化问题来解决,其中成本和约束函数通过泰勒级数展开进行局部近似。这对于微分计算成本高昂或不可用的函数提出了挑战。本文提出了一种无导数方法,通过计算动力学、成本和约束函数的样本,并让求解器在它们之间进行插值,来形成这些凸近似。我们的框架包括基于采样的轨迹优化技术,如模型预测路径积分(MPPI)控制作为特例,并将其推广以实现诸如多重射击和通常与基于导数的序列凸规划方法相关的通用等式和不等式约束等特征。由此产生的框架简单、灵活,并且能够解决各种实际的运动规划和控制问题。

🔬 方法详解

问题定义:论文旨在解决轨迹优化问题,尤其是在动力学模型、成本函数或约束函数难以或无法求导的情况下。现有基于导数的序列凸规划方法在此类问题中表现不佳,而纯粹的采样方法可能效率较低或难以处理复杂的约束条件。

核心思路:核心思路是通过采样的方式来近似目标函数和约束函数,从而避免直接计算导数。具体来说,在轨迹的附近采样多个点,计算这些点的函数值,然后利用这些样本点的信息来构建局部凸近似。这样,就可以使用序列凸规划的方法来迭代优化轨迹,而无需显式的导数信息。

技术框架:该方法首先在当前轨迹附近进行采样,然后利用这些样本点的信息构建凸近似模型。接下来,使用凸优化求解器求解该近似模型,得到新的轨迹。重复采样、构建近似模型和求解的过程,直到轨迹收敛或达到最大迭代次数。该框架可以容纳多种采样策略和凸近似方法,并且可以方便地集成到现有的轨迹优化流程中。

关键创新:最重要的创新在于将采样和序列凸规划方法结合起来,形成了一种无导数的轨迹优化框架。与传统的基于导数的方法相比,该方法不需要计算导数,因此可以应用于更广泛的问题。与纯粹的采样方法相比,该方法利用凸优化的理论保证,可以更有效地找到最优解。

关键设计:关键设计包括采样策略的选择(例如,均匀采样、高斯采样等),凸近似方法的选择(例如,线性插值、二次插值等),以及凸优化求解器的选择。此外,还需要仔细调整采样点的数量和分布,以保证近似模型的精度和优化效率。损失函数的设计需要根据具体问题进行调整,以保证轨迹满足约束条件并达到期望的目标。

📊 实验亮点

论文提出的轨迹束方法统一了序列凸规划和采样轨迹优化,实验结果表明,该方法在解决无导数轨迹优化问题上具有良好的性能。虽然论文中没有给出具体的性能数据,但强调了该方法能够处理多种实际的运动规划和控制问题,并具备简单、灵活的特点。

🎯 应用场景

该方法可应用于机器人运动规划、自动驾驶、航空航天等领域,尤其适用于动力学模型复杂、难以求导或存在大量约束的场景。例如,在复杂地形下的机器人导航、高维空间中的机械臂运动规划、以及存在碰撞避免约束的无人机轨迹优化等。

📄 摘要(原文)

We present a unified framework for solving trajectory optimization problems in a derivative-free manner through the use of sequential convex programming. Traditionally, nonconvex optimization problems are solved by forming and solving a sequence of convex optimization problems, where the cost and constraint functions are approximated locally through Taylor series expansions. This presents a challenge for functions where differentiation is expensive or unavailable. In this work, we present a derivative-free approach to form these convex approximations by computing samples of the dynamics, cost, and constraint functions and letting the solver interpolate between them. Our framework includes sample-based trajectory optimization techniques like model-predictive path integral (MPPI) control as a special case and generalizes them to enable features like multiple shooting and general equality and inequality constraints that are traditionally associated with derivative-based sequential convex programming methods. The resulting framework is simple, flexible, and capable of solving a wide variety of practical motion planning and control problems.