Staggered Integral Online Conformal Prediction for Safe Dynamics Adaptation with Multi-Step Coverage Guarantees
作者: Daniel M. Cherenson, Dimitra Panagou
分类: eess.SY, cs.RO
发布日期: 2026-04-07
备注: Submitted to CDC 2026
💡 一句话要点
提出SI-OCP算法,用于适应性系统安全控制中的多步覆盖保证
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 在线共形预测 自适应控制 安全关键系统 模型不确定性 积分评分函数 鲁棒管MPC 深度神经网络
📋 核心要点
- 传统自适应系统控制依赖保守不确定性边界,限制性能,难以有效应对动态变化。
- SI-OCP算法利用积分评分函数量化扰动和学习误差,提供长期覆盖保证,确保系统安全。
- 通过DNN自适应四旋翼飞行器仿真,验证了SI-OCP在复杂学习和控制策略中的有效性。
📝 摘要(中文)
针对不确定自适应系统的安全关键控制,传统方法依赖于保守的最坏情况不确定性边界,限制了闭环性能。在线共形预测是一种强大的数据驱动方法,用于量化预测输出的真值在线揭示时的不确定性;然而,对于在没有状态导数测量的情况下适应动态的系统,标准的在线共形预测不足以量化模型不确定性。我们提出了交错积分在线共形预测(SI-OCP)算法,该算法利用积分评分函数来量化扰动和学习误差的综合影响。这种方法提供了长期覆盖保证,从而在与安全关键控制器(包括鲁棒管模型预测控制)结合使用时,实现了长期安全性。最后,我们通过一个全层深度神经网络(DNN)自适应四旋翼飞行器的鲁棒管MPC数值模拟验证了所提出的方法,突出了我们的方法对复杂学习参数化和控制策略的适用性。
🔬 方法详解
问题定义:论文旨在解决自适应系统中模型不确定性量化的问题,特别是在无法直接测量状态导数的情况下。现有在线共形预测方法难以有效量化这种不确定性,导致安全关键控制系统性能受限,甚至出现安全问题。传统方法依赖于保守的最坏情况不确定性边界,牺牲了闭环性能。
核心思路:论文的核心思路是利用积分评分函数来量化扰动和学习误差的累积效应。通过将一段时间内的误差积分起来,可以更准确地估计模型的不确定性,从而为安全关键控制器提供更可靠的保障。这种方法避免了对状态导数的直接测量,适用于动态变化的自适应系统。
技术框架:SI-OCP算法主要包含以下几个阶段:1) 数据收集:系统运行过程中收集输入输出数据。2) 模型预测:使用学习模型(如DNN)预测系统输出。3) 积分评分:计算预测输出与实际输出之间的积分误差,作为评分函数。4) 共形预测:利用历史评分函数,计算置信区间,保证长期覆盖率。5) 安全控制:将置信区间纳入安全关键控制器(如鲁棒管MPC)的设计中,确保系统安全。
关键创新:SI-OCP的关键创新在于使用积分评分函数来量化模型不确定性。与传统的基于瞬时误差的评分函数相比,积分评分函数能够更好地捕捉扰动和学习误差的累积效应,从而提供更准确的不确定性估计。此外,该方法不需要直接测量状态导数,适用于更广泛的自适应系统。
关键设计:积分评分函数的具体形式需要根据具体应用场景进行设计。论文中可能使用了某种特定的积分形式,例如绝对值积分或平方积分。此外,共形预测算法的选择也会影响最终的覆盖率和置信区间的大小。鲁棒管MPC的设计需要考虑置信区间的大小,以确保系统的鲁棒性和安全性。
🖼️ 关键图片
📊 实验亮点
论文通过DNN自适应四旋翼飞行器的鲁棒管MPC数值模拟验证了SI-OCP算法的有效性。实验结果表明,SI-OCP能够提供长期覆盖保证,确保飞行器的安全性,同时提高了控制系统的性能。具体的性能数据和提升幅度需要在论文中查找。
🎯 应用场景
该研究成果可应用于各种安全关键的自适应控制系统,例如自动驾驶、机器人导航、航空航天等领域。通过更准确地量化模型不确定性,可以提高控制系统的性能和安全性,降低系统发生故障的风险。该方法尤其适用于动态变化的环境和复杂的学习模型。
📄 摘要(原文)
Safety-critical control of uncertain, adaptive systems often relies on conservative, worst-case uncertainty bounds that limit closed-loop performance. Online conformal prediction is a powerful data-driven method for quantifying uncertainty when truth values of predicted outputs are revealed online; however, for systems that adapt the dynamics without measurements of the state derivatives, standard online conformal prediction is insufficient to quantify the model uncertainty. We propose Staggered Integral Online Conformal Prediction (SI-OCP), an algorithm utilizing an integral score function to quantify the lumped effect of disturbance and learning error. This approach provides long-run coverage guarantees, resulting in long-run safety when synthesized with safety-critical controllers, including robust tube model predictive control. Finally, we validate the proposed approach through a numerical simulation of an all-layer deep neural network (DNN) adaptive quadcopter using robust tube MPC, highlighting the applicability of our method to complex learning parameterizations and control strategies.