Approximate Dynamic Programming based Model Predictive Control of Nonlinear systems
作者: Keerthi Chacko, Midhun T. Augustine, S. Janardhanan, Deepak U. Patil, I. N. Kar
分类: eess.SY, math.OC
发布日期: 2023-12-10
💡 一句话要点
提出基于近似动态规划的MPC方法,用于非线性系统最优控制
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 近似动态规划 模型预测控制 非线性系统 最优控制 切换系统
📋 核心要点
- 非线性系统的最优控制问题计算复杂度高,传统方法难以满足实时性要求。
- 采用近似动态规划,将值函数近似为二次函数,降低计算复杂度。
- 实验表明,该方法在保证控制精度的前提下,显著减少了在线计算量。
📝 摘要(中文)
本文研究了离散时间非线性系统的最优控制问题,并提出了一种基于近似动态规划(ADP)的模型预测控制(MPC)方案,旨在最小化二次性能指标。在该方法中,值函数被近似为一个二次函数,其参数矩阵通过非线性系统的切换系统近似计算得到。该方法通过多阶段方案进一步改进,以提高控制精度,并扩展到包含状态约束。该MPC方案在一个多罐系统上进行了实验验证,该系统被建模为一个三阶非线性系统。实验结果表明,与非线性MPC方案相比,所提出的MPC方案显著减少了在线计算量。
🔬 方法详解
问题定义:论文旨在解决离散时间非线性系统的最优控制问题。现有非线性模型预测控制(NMPC)方法虽然能够处理非线性系统,但计算复杂度高,难以满足实时控制的需求,尤其是在模型较为复杂的情况下。
核心思路:论文的核心思路是利用近似动态规划(ADP)的思想,将复杂的值函数近似为一个简单的二次函数。通过这种近似,可以将原本复杂的优化问题转化为一个相对简单的二次规划问题,从而显著降低在线计算的负担。
技术框架:该方法首先对非线性系统进行切换系统近似。然后,利用该近似系统计算二次值函数的参数矩阵。接下来,基于该值函数设计模型预测控制器。为了提高控制精度,引入了多阶段方案。最后,扩展该方法以处理状态约束。整体流程包括:非线性系统建模 -> 切换系统近似 -> 值函数近似 -> MPC控制器设计 -> 多阶段改进 -> 状态约束处理。
关键创新:该方法最重要的创新点在于将近似动态规划与模型预测控制相结合,并利用切换系统近似来简化非线性系统的处理。与传统的NMPC方法相比,该方法避免了直接求解复杂的非线性优化问题,从而显著降低了计算复杂度。
关键设计:值函数被近似为二次函数,其形式为 V(x) = x'Px,其中 P 是一个对称正定矩阵。P 的计算基于切换系统近似。多阶段方案通过在每个预测步长内进行多次优化来提高控制精度。状态约束通过在优化问题中添加约束条件来处理。
📊 实验亮点
实验结果表明,所提出的MPC方案在多罐系统上取得了良好的控制效果。与传统的非线性MPC方案相比,该方案显著减少了在线计算量,使得实时控制成为可能。具体的性能数据(例如,计算时间减少的百分比、控制精度提高的幅度)未知,但摘要强调了计算量上的显著优势。
🎯 应用场景
该研究成果可应用于各种需要实时控制的非线性系统,例如化工过程控制、机器人控制、电力系统控制等。通过降低在线计算量,该方法使得复杂非线性系统的实时控制成为可能,具有重要的实际应用价值和潜在的经济效益。
📄 摘要(原文)
This paper studies the optimal control problem for discrete-time nonlinear systems and an approximate dynamic programming-based Model Predictive Control (MPC) scheme is proposed for minimizing a quadratic performance measure. In the proposed approach, the value function is approximated as a quadratic function for which the parametric matrix is computed using a switched system approximate of the nonlinear system. The approach is modified further using a multi-stage scheme to improve the control accuracy and an extension to incorporate state constraints. The MPC scheme is validated experimentally on a multi-tank system which is modeled as a third-order nonlinear system. The experimental results show the proposed MPC scheme results in significantly lesser online computation compared to the Nonlinear MPC scheme.