Metriplectic Conditional Flow Matching for Dissipative Dynamics
作者: Ali Baheri, Lars Lindemann
分类: cs.LG, eess.SY
发布日期: 2025-09-23
💡 一句话要点
提出Metriplectic条件流匹配(MCFM)学习耗散动力学,保证能量衰减。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 耗散动力学 条件流匹配 神经替代模型 辛结构 能量守恒
📋 核心要点
- 现有神经替代模型在学习耗散动力学时,容易注入能量并导致长时程模拟不稳定,无法保证物理一致性。
- MCFM将保守-耗散分解显式地构建到向量场和采样器中,通过条件流匹配在短时程跃迁上训练,避免了长时程展开的梯度计算。
- 实验表明,MCFM在机械基准测试中,相图更接近真实值,能量增加事件显著减少,同时保持了良好的终端分布拟合性能。
📝 摘要(中文)
Metriplectic条件流匹配(MCFM)学习耗散动力学,且不违反第一性原理。神经替代模型常常注入能量并使长时程展开不稳定;MCFM将保守-耗散分解构建到向量场和结构保持采样器中。MCFM通过短时程跃迁上的条件流匹配进行训练,避免了长时程展开伴随。在推理中,Strang-prox方案交替进行辛更新和近端度量步骤,确保离散能量衰减;当存在可信能量时,可选的投影强制执行严格衰减。我们提供了连续和离散时间保证,将此参数化和采样器与守恒、单调耗散和稳定展开联系起来。在一个受控的机械基准测试中,MCFM产生了更接近真实值的相图,并且比同样具有表达能力的无约束神经流显著减少了能量增加和正能量率事件,同时匹配了终端分布拟合。
🔬 方法详解
问题定义:现有神经替代模型在学习耗散动力学时,常常无法保证能量的正确衰减,导致模型预测的轨迹偏离真实物理规律,尤其是在长时程模拟中,这种偏差会迅速累积,使得模型失效。现有方法缺乏对耗散过程的有效建模和约束,容易引入虚假的能量注入,从而破坏系统的稳定性。
核心思路:MCFM的核心思路是将耗散动力学分解为保守部分和耗散部分,并分别进行建模。保守部分通过辛结构保持更新来保证能量的守恒,耗散部分通过近端度量步骤来保证能量的衰减。通过这种方式,MCFM能够显式地控制能量的变化,从而保证模型的物理一致性和稳定性。
技术框架:MCFM的整体框架包括以下几个主要模块:1) 条件流匹配训练:使用短时程跃迁数据训练神经向量场,学习系统的动力学规律。2) Strang-prox方案:在推理阶段,使用Strang-prox方案交替进行辛更新和近端度量步骤,模拟系统的演化过程。3) 能量投影(可选):当存在可信能量信息时,使用能量投影来强制执行严格的能量衰减。
关键创新:MCFM的关键创新在于将保守-耗散分解显式地引入到神经动力学模型的构建中。通过辛结构保持更新和近端度量步骤,MCFM能够保证能量的守恒和衰减,从而避免了虚假能量注入的问题。此外,MCFM还提供了连续和离散时间保证,将参数化和采样器与守恒、单调耗散和稳定展开联系起来。
关键设计:MCFM的关键设计包括:1) 使用条件流匹配损失函数进行训练,鼓励模型学习真实的动力学规律。2) 使用Strang-prox方案进行推理,保证能量的守恒和衰减。3) 设计合适的近端度量算子,控制能量衰减的速度和幅度。4) 可选的能量投影步骤,利用可信能量信息来进一步约束模型的输出。
📊 实验亮点
MCFM在受控机械基准测试中表现出色,相较于无约束神经流,MCFM生成的相图更接近真实值,能量增加事件显著减少。具体而言,MCFM在保证终端分布拟合的同时,显著降低了能量增加和正能量率事件的发生频率,验证了其在保证物理一致性方面的优势。
🎯 应用场景
MCFM在机械系统建模、机器人控制、分子动力学模拟等领域具有广泛的应用前景。它可以用于构建高精度、高稳定性的神经替代模型,从而加速仿真过程,提高控制性能,并为科学研究提供新的工具。例如,在机器人控制中,MCFM可以用于学习机器人的动力学模型,从而实现更精确的运动控制和更强的鲁棒性。
📄 摘要(原文)
Metriplectic conditional flow matching (MCFM) learns dissipative dynamics without violating first principles. Neural surrogates often inject energy and destabilize long-horizon rollouts; MCFM instead builds the conservative-dissipative split into both the vector field and a structure preserving sampler. MCFM trains via conditional flow matching on short transitions, avoiding long rollout adjoints. In inference, a Strang-prox scheme alternates a symplectic update with a proximal metric step, ensuring discrete energy decay; an optional projection enforces strict decay when a trusted energy is available. We provide continuous and discrete time guarantees linking this parameterization and sampler to conservation, monotonic dissipation, and stable rollouts. On a controlled mechanical benchmark, MCFM yields phase portraits closer to ground truth and markedly fewer energy-increase and positive energy rate events than an equally expressive unconstrained neural flow, while matching terminal distributional fit.