Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference

📄 arXiv: 2312.05910v5 📥 PDF

作者: Zhidi Lin, Yiyong Sun, Feng Yin, Alexandre Hoang Thiéry

分类: cs.LG, eess.SP, stat.ML

发布日期: 2023-12-10 (更新: 2024-07-22)

备注: Gaussian process, state-space model, ensemble Kalman filter, online learning, variational inference


💡 一句话要点

提出EnKF辅助的GPSSM非平均场在线推断方法,解决传统变分推断的难题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 高斯过程状态空间模型 变分推断 集成卡尔曼滤波 非平均场 在线学习

📋 核心要点

  1. 现有GPSSM的变分推断方法在非平均场假设下,面临训练成本高、推断精度低、难以在线应用等挑战。
  2. 论文将集成卡尔曼滤波(EnKF)融入非平均场变分推断框架,近似潜在状态后验,避免了复杂参数化,并实现了ELBO的闭式解。
  3. 实验结果表明,该EnKF辅助的在线算法在学习和推断性能上优于现有方法,并在数据拟合和模型正则化之间取得了平衡。

📝 摘要(中文)

高斯过程状态空间模型(GPSSM)是一类通用的数据驱动的非线性动态系统模型。然而,GPSSM中大量潜在变量的存在给现有的变分推断方法带来了尚未解决的问题,特别是在更实际的非平均场(NMF)假设下,包括大量的训练工作、降低的推断精度以及在线应用的不可行性等。本文通过将成熟的基于模型的滤波技术——集成卡尔曼滤波(EnKF)引入到NMF变分推断框架中,以近似潜在状态的后验分布,从而应对这些挑战。EnKF与GPSSM的这种新颖结合不仅消除了学习变分分布中对大量参数化的需求,而且实现了证据下界(ELBO)的可解释的闭式近似。此外,由于通过EnKF实现的参数精简,新的GPSSM模型可以很容易地适应在线学习应用。我们证明了由此产生的EnKF辅助在线算法通过确保数据拟合精度,同时结合模型正则化以减轻过拟合,从而体现了有原则的目标函数。我们还为所提出的算法提供了详细的分析和新的见解。在各种真实和合成数据集上的全面评估证实,与现有方法相比,我们的EnKF辅助变分推断算法具有卓越的学习和推断性能。

🔬 方法详解

问题定义:论文旨在解决高斯过程状态空间模型(GPSSM)在非平均场(NMF)假设下,使用变分推断进行学习时遇到的困难。现有方法需要大量的参数化,导致训练成本高昂,推断精度下降,并且难以应用于在线学习场景。这些问题源于GPSSM中存在的大量潜在变量,使得直接应用传统的变分推断变得不切实际。

核心思路:论文的核心思路是将集成卡尔曼滤波(EnKF)引入到NMF变分推断框架中。EnKF是一种成熟的基于模型的滤波技术,可以有效地近似潜在状态的后验分布。通过结合EnKF,可以避免对变分分布进行复杂的参数化,从而降低计算成本并提高推断效率。此外,EnKF还能够提供ELBO的闭式近似,使得模型更加易于理解和优化。

技术框架:整体框架包括以下几个主要步骤:首先,使用GPSSM对动态系统进行建模。然后,利用EnKF来近似潜在状态的后验分布。接着,基于EnKF的近似结果,计算ELBO的闭式解。最后,通过优化ELBO来学习GPSSM的参数。该框架特别适用于在线学习场景,因为EnKF可以以增量方式更新潜在状态的估计。

关键创新:最重要的技术创新点是将EnKF与GPSSM的NMF变分推断相结合。这种结合克服了传统变分推断方法在处理GPSSM时遇到的参数化难题,并实现了ELBO的闭式近似。与现有方法相比,该方法不仅降低了计算成本,还提高了推断精度,并且能够应用于在线学习场景。

关键设计:关键设计包括:(1) 使用EnKF来近似潜在状态的后验分布,避免了对变分分布进行复杂的参数化。(2) 推导ELBO的闭式解,使得模型更加易于优化。(3) 设计在线学习算法,能够以增量方式更新模型参数。(4) 通过模型正则化来减轻过拟合,确保数据拟合精度。

📊 实验亮点

实验结果表明,该EnKF辅助的变分推断算法在多个真实和合成数据集上均优于现有方法。具体而言,在某些数据集上,该方法能够显著降低预测误差,并提高模型的泛化能力。此外,该方法还能够有效地处理在线学习场景,并实现实时的模型更新和预测。

🎯 应用场景

该研究成果可广泛应用于需要对非线性动态系统进行建模和预测的领域,例如机器人控制、金融时间序列分析、环境监测、生物信号处理等。通过提高GPSSM的推断效率和精度,该方法能够帮助研究人员更好地理解和预测复杂系统的行为,并为实际应用提供更可靠的决策支持。

📄 摘要(原文)

The Gaussian process state-space models (GPSSMs) represent a versatile class of data-driven nonlinear dynamical system models. However, the presence of numerous latent variables in GPSSM incurs unresolved issues for existing variational inference approaches, particularly under the more realistic non-mean-field (NMF) assumption, including extensive training effort, compromised inference accuracy, and infeasibility for online applications, among others. In this paper, we tackle these challenges by incorporating the ensemble Kalman filter (EnKF), a well-established model-based filtering technique, into the NMF variational inference framework to approximate the posterior distribution of the latent states. This novel marriage between EnKF and GPSSM not only eliminates the need for extensive parameterization in learning variational distributions, but also enables an interpretable, closed-form approximation of the evidence lower bound (ELBO). Moreover, owing to the streamlined parameterization via the EnKF, the new GPSSM model can be easily accommodated in online learning applications. We demonstrate that the resulting EnKF-aided online algorithm embodies a principled objective function by ensuring data-fitting accuracy while incorporating model regularizations to mitigate overfitting. We also provide detailed analysis and fresh insights for the proposed algorithms. Comprehensive evaluation across diverse real and synthetic datasets corroborates the superior learning and inference performance of our EnKF-aided variational inference algorithms compared to existing methods.