Tractable Stochastic Hybrid Model Predictive Control using Gaussian Processes for Repetitive Tasks in Unseen Environments

📄 arXiv: 2508.18203v1 📥 PDF

作者: Leroy D'Souza, Yash Vardhan Pant, Sebastian Fischmeister

分类: eess.SY, math.OC

发布日期: 2025-08-25

备注: European Control Conference (ECC) 2025

DOI: 10.23919/ECC65951.2025.11186962


💡 一句话要点

提出可处理的随机混合模型预测控制以解决未知环境中的重复任务问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 残余动力学 迭代映射算法 混合整数非线性规划 动态环境 自主机器人 轨迹跟踪

📋 核心要点

  1. 现有模型预测控制方法在处理未知环境中的动态变化时,往往面临预测精度不足和计算复杂度高的问题。
  2. 本文提出了一种迭代映射算法,结合了时间变化的模式分布预测和可处理的MINLP近似方法,以提高控制性能。
  3. 实验结果显示,所提方法在性能上比传统MINLP提高了4-18%,并且计算速度提升可达250倍,控制器性能在多次迭代中提升最高可达3倍。

📝 摘要(中文)

提高动力学模型的预测精度对于获得良好的控制性能和安全性至关重要。本文提出了一种方法,通过学习未建模的残余动力学,结合基于第一性原理的名义模型,来改善模型预测控制器(MPC)的性能。我们开发了一种迭代映射算法,能够预测时间变化的模式分布,并提出了两种可处理的混合整数非线性规划(MINLP)近似方法,以与预测器结合解决整体控制问题。仿真结果表明,这些近似方法在性能上提高了4-18%,并且计算时间显著降低(最快可达250倍)。此外,提出的映射算法在轨迹跟踪控制任务中,即使模式分布随时间变化,也能在多次迭代中逐步提升控制器性能(最高可达3倍)。

🔬 方法详解

问题定义:本文旨在解决在未知环境中进行重复任务时,模型预测控制器(MPC)面临的动力学模型预测精度不足和计算复杂度高的问题。现有方法在处理环境变化时,往往需要解决复杂的混合整数非线性规划(MINLP),导致计算效率低下。

核心思路:论文提出了一种迭代映射算法,能够有效预测时间变化的模式分布,并结合两种可处理的MINLP近似方法,以简化控制问题的求解过程。这种设计旨在提高控制器的实时性能和适应性。

技术框架:整体架构包括三个主要模块:1) 动力学模型的建立与残余动力学的学习;2) 迭代映射算法用于预测模式分布;3) 通过近似方法解决控制问题。每个模块相互协作,形成闭环控制系统。

关键创新:最重要的技术创新在于提出了迭代映射算法和两种可处理的MINLP近似方法,这些方法显著降低了计算复杂度,并提高了控制性能。这与现有方法的本质区别在于,现有方法往往依赖于复杂的全局优化,而本文的方法则通过局部近似实现了更高效的控制。

关键设计:在参数设置上,本文对残余动力学模型进行了优化,采用了适应性调整的损失函数,以确保模型在不同环境下的稳定性和准确性。此外,网络结构设计上,结合了高效的特征提取模块,以提升模型的学习能力。

📊 实验亮点

实验结果表明,所提出的近似方法在性能上比传统的MINLP提高了4-18%,并且计算速度提升可达250倍。此外,映射算法在多次迭代中逐步提升控制器性能,最高提升幅度达到3倍,显示出其在动态环境中的有效性。

🎯 应用场景

该研究的潜在应用领域包括自主机器人、智能制造和无人驾驶等场景。在这些领域中,系统需要在动态和未知的环境中进行高效的任务执行,所提出的方法能够显著提升控制系统的适应性和实时性能,具有重要的实际价值和未来影响。

📄 摘要(原文)

Improving the predictive accuracy of a dynamics model is crucial to obtaining good control performance and safety from Model Predictive Controllers (MPC). One approach involves learning unmodelled (residual) dynamics, in addition to nominal models derived from first principles. Varying residual models across an environment manifest as modes of a piecewise residual (PWR) model that requires a) identifying how modes are distributed across the environment and b) solving a computationally intensive Mixed Integer Nonlinear Program (MINLP) problem for control. We develop an iterative mapping algorithm capable of predicting time-varying mode distributions. We then develop and solve two tractable approximations of the MINLP to combine with the predictor in closed-loop to solve the overall control problem. In simulation, we first demonstrate how the approximations improve performance by 4-18% in comparison to the MINLP while achieving significantly lower computation times (upto 250x faster). We then demonstrate how the proposed mapping algorithm incrementally improves controller performance (upto 3x) over multiple iterations of a trajectory tracking control task even when the mode distributions change over time.