Stochastic Model Predictive Control with Online Risk Allocation and Feedback Gain Selection

📄 arXiv: 2604.04602 📥 PDF

作者: Filipe Marques Barbosa, Johan Löfberg

分类: eess.SY, math.OC

发布日期: 2026-04-07


💡 一句话要点

提出一种在线风险分配和反馈增益选择的随机模型预测控制方法。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 随机模型预测控制 机会约束 风险分配 混合整数锥优化 凸优化 路径规划 不确定性

📋 核心要点

  1. 现有随机模型预测控制方法在同时优化风险分配和反馈策略时,面临非凸优化难题,计算复杂度高。
  2. 该论文提出了一种新的方法,通过推导分离凸机会约束和预计算反馈律候选集,将问题转化为混合整数锥优化。
  3. 实验结果表明,该方法在路径规划应用中有效,能够处理一般机会约束,并利用现有优化软件高效求解。

📝 摘要(中文)

随机模型预测控制(SMPC)通过纳入机会约束来处理不确定性,从而提供约束满足的概率保证。然而,同时优化风险分配和反馈策略会导致难以处理的非凸问题。这归因于(i)机会约束的确定性对应部分中包含反馈律和风险分配的函数乘积,以及(ii)非凸高斯分位数(probit)函数的存在。现有方法依赖于非凸的两阶段优化。为了解决这个问题,我们推导了分离凸机会约束,并从一组预先计算的候选者中选择反馈律。probit函数的继承组合被替换为幂锥和指数锥可表示的近似。主要优点是该问题可以被公式化为混合整数锥优化问题,并可以使用现成的软件有效地解决。此外,所提出的公式适用于具有互斥分离和高斯变量乘积的一般机会约束。所提出的方法通过路径规划应用进行了验证。

🔬 方法详解

问题定义:随机模型预测控制(SMPC)旨在处理系统中的不确定性,并保证约束以一定的概率被满足。现有的SMPC方法在同时优化风险分配(即每个约束允许违反的概率)和反馈控制策略时,会遇到非凸优化问题,导致计算量巨大,难以求解。主要痛点在于机会约束的确定性等价形式中,存在反馈律和风险分配的函数乘积,以及高斯分位数(probit)函数的非凸性。

核心思路:该论文的核心思路是将原问题转化为一个混合整数锥优化问题,从而可以使用现成的优化软件高效求解。为了实现这一目标,论文采取了以下关键策略:1) 推导分离凸机会约束,避免直接处理复杂的函数乘积;2) 从预先计算的候选集中选择反馈律,而不是直接优化反馈律;3) 使用幂锥和指数锥可表示的近似来替代probit函数,将其转化为凸函数。

技术框架:该方法的技术框架主要包括以下几个步骤:1) 预先计算一组候选的反馈律;2) 将原机会约束转化为分离凸机会约束;3) 使用幂锥和指数锥近似替代probit函数;4) 将问题建模为混合整数锥优化问题;5) 使用现成的优化软件求解该问题。

关键创新:该论文的关键创新在于将原非凸的SMPC问题转化为一个混合整数锥优化问题,从而可以使用现成的优化软件高效求解。具体来说,通过推导分离凸机会约束,避免了直接处理复杂的函数乘积;通过从预先计算的候选集中选择反馈律,避免了直接优化反馈律;通过使用幂锥和指数锥近似替代probit函数,将其转化为凸函数。

关键设计:论文的关键设计包括:1) 分离凸机会约束的推导方法,需要仔细选择分离变量,以保证转化后的约束是凸的;2) 预计算反馈律候选集的方法,需要保证候选集能够覆盖足够的控制策略,同时避免计算量过大;3) 幂锥和指数锥近似的精度,需要在计算复杂度和近似精度之间进行权衡。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过路径规划应用验证了所提出的方法。结果表明,该方法能够有效地处理不确定性,并保证约束以一定的概率被满足。此外,该方法可以使用现成的优化软件高效求解,具有很强的实用性。具体的性能数据和对比基线在论文中进行了详细的展示。

🎯 应用场景

该研究成果可应用于各种需要在不确定环境下进行控制的场景,例如自动驾驶、机器人路径规划、供应链管理、金融风险控制等。通过提供概率性的约束满足保证,该方法可以提高系统的安全性和可靠性,降低风险。

📄 摘要(原文)

Stochastic Model Predictive Control addresses uncertainties by incorporating chance constraints that provide probabilistic guarantees of constraint satisfaction. However, simultaneously optimizing over the risk allocation and the feedback policies leads to intractable nonconvex problems. This is due to (i) products of functions involving the feedback law and risk allocation in the deterministic counterpart of the chance constraints, and (ii) the presence of the nonconvex Gaussian quantile (probit) function. Existing methods rely on two-stage optimization, which is nonconvex. To address this, we derive disjunctive convex chance constraints and select the feedback law from a set of precomputed candidates. The inherited compositions of the probit function are replaced with power- and exponential-cone representable approximations. The main advantage is that the problem can be formulated as a mixed-integer conic optimization problem and efficiently solved with off-the-shelf software. Moreover, the proposed formulations apply to general chance constraints with products of exclusive disjunctive and Gaussian variables. The proposed approaches are validated with a path-planning application.