Region of Attraction Estimation for Linear Quadratic Regulator, Linear and Robust Model Predictive Control on a Two-Wheeled Inverted Pendulum
作者: Lorenzo Fici, Dalim Wahby, Alvaro Detailleur, Matthieu Barreau, Guillaume Ducard
分类: eess.SY
发布日期: 2026-04-07
💡 一句话要点
针对两轮倒立摆,提出结合解析与蒙特卡洛的吸引域估计方法
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 吸引域估计 两轮倒立摆 线性二次调节器 模型预测控制 蒙特卡洛方法 李雅普诺夫稳定性 非线性控制 欠驱动系统
📋 核心要点
- 非线性欠驱动系统(如两轮倒立摆)的吸引域难以解析求解,现有方法要么过于保守,要么依赖纯经验模拟。
- 论文提出一种结合解析方法(李雅普诺夫不变集)和数据驱动方法(蒙特卡洛估计)的混合策略,更准确地估计吸引域。
- 实验表明,该方法在三种控制策略(LQR、MPC、CTMPC)下,既能提供形式保证的内部边界,又能进行经验表征。
📝 摘要(中文)
两轮倒立摆(TWIP)等非线性欠驱动系统具有有限的吸引域(RoA),它定义了闭环系统从哪些初始状态收敛到平衡点。非线性约束系统的RoA通常是非凸的,难以通过解析方法求解,需要数值或近似估计方法。本文研究了三种基于模型的控制策略下TWIP的RoA估计:饱和线性二次调节器(LQR)、线性模型预测控制(MPC)和约束收紧MPC(CTMPC)。首先,推导了一个基于李雅普诺夫的invariant set,它提供了RoA的一个有保证的内部近似。由于这个解析边界非常保守,因此采用基于蒙特卡洛的估计程序来获得RoA的更具代表性的近似,捕捉控制器在解析保证区域之外的行为。所提出的方法结合了解析保证和数据驱动的估计,既提供了形式上认证的内部边界,又提供了RoA的经验表征,为评估控制器性能提供了一种实用的方法,而无需仅仅依赖于保守的解析边界或纯粹的经验模拟。
🔬 方法详解
问题定义:论文旨在解决两轮倒立摆(TWIP)在不同控制策略下的吸引域(RoA)估计问题。现有方法,如纯解析方法(基于李雅普诺夫函数),通常过于保守,导致估计的RoA远小于实际值。而纯粹的经验模拟方法虽然可以获得更准确的RoA,但缺乏形式化的保证,无法确保系统的稳定性。
核心思路:论文的核心思路是将解析方法和数据驱动方法相结合。首先,利用李雅普诺夫理论推导出一个保守的RoA内部近似,提供形式化的稳定性保证。然后,利用蒙特卡洛方法对RoA进行采样和估计,从而获得更准确的RoA边界,并捕捉控制器在解析保证区域之外的行为。
技术框架:整体流程如下: 1. 解析RoA估计:基于李雅普诺夫函数,推导一个不变集,作为RoA的内部近似。 2. 蒙特卡洛RoA估计:在状态空间中随机采样初始状态,并模拟闭环系统的运行轨迹。如果轨迹收敛到平衡点,则认为该初始状态属于RoA。 3. RoA表征:将解析估计和蒙特卡洛估计的结果结合起来,既提供形式化的稳定性保证,又提供更准确的RoA边界。
关键创新:论文的关键创新在于结合了解析方法和数据驱动方法,克服了各自的局限性。解析方法提供形式化的稳定性保证,而数据驱动方法提供更准确的RoA估计。这种混合方法可以更全面地评估控制器性能,并为控制器设计提供指导。
关键设计: * 李雅普诺夫函数选择:选择合适的李雅普诺夫函数是获得有效解析RoA估计的关键。论文可能采用了二次型李雅普诺夫函数。 * 蒙特卡洛采样策略:采用均匀采样或重要性采样等策略,以提高蒙特卡洛估计的效率。 * 收敛判据:需要定义一个明确的收敛判据,以判断模拟轨迹是否收敛到平衡点。例如,可以设置状态变量的阈值,当所有状态变量都小于阈值时,认为轨迹收敛。
🖼️ 关键图片
📊 实验亮点
论文在三种控制策略(LQR、MPC、CTMPC)下进行了实验,验证了所提出方法的有效性。实验结果表明,蒙特卡洛估计能够显著扩大RoA的估计范围,与保守的解析估计相比,能够更准确地表征控制器的性能。具体性能数据(如RoA体积的增加百分比)未知,但定性地表明了该方法的优越性。
🎯 应用场景
该研究成果可应用于两轮倒立摆、机器人平衡控制、无人驾驶车辆等领域,提高系统的稳定性和安全性。通过更准确地估计吸引域,可以更好地设计控制器参数,扩大系统的稳定运行范围,并为安全关键应用提供保障。未来可扩展到更复杂的非线性欠驱动系统。
📄 摘要(原文)
Nonlinear underactuated systems such as two-wheeled inverted pendulums (TWIPs) exhibit a limited region of attraction (RoA), which defines the set of initial conditions from which the closed-loop system converges to the equilibrium. The RoA of nonlinear and constrained systems is generally nonconvex and analytically intractable, requiring numerical or approximate estimation methods. This work investigates the estimation of the RoA for a TWIP stabilized under three model-based control strategies: saturated linear quadratic regulator (LQR), linear model predictive control (MPC), and constraint tightening MPC (CTMPC). We first derive a Lyapunov-based invariant set that provides a certified inner approximation of the RoA. Since this analytical bound is highly conservative, a Monte Carlo-based estimation procedure is then employed to obtain a more representative approximation of the RoA, capturing how the controllers behave beyond the analytically guaranteed region. The proposed methodology combines analytical guarantees with data-driven estimation, providing both a formally certified inner bound and an empirical characterization of the RoA, offering a practical way to evaluate controller performance without relying solely on conservative analytical bounds or purely empirical simulation.