Estimating Clinical Lab Test Result Trajectories from PPG using Physiological Foundation Model and Patient-Aware State Space Model -- a UNIPHY+ Approach
作者: Minxiao Wang, Runze Yan, Carol Li, Saurabh Kataria, Xiao Hu, Matthew Clark, Timothy Ruchti, Timothy G. Buchman, Sivasubramanium V Bhavani, Randall J. Lee
分类: cs.LG, cs.AI
发布日期: 2025-09-19
💡 一句话要点
UNIPHY+Lab:利用PPG和生理基础模型预测ICU患者的连续生化指标
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: PPG信号处理 生理信号预测 时间序列建模 Mamba模型 重症监护 多任务学习 患者个性化 非侵入式监测
📋 核心要点
- 临床生化指标对于诊断至关重要,但传统检测方式具有侵入性和间歇性,难以实时反映患者状态。
- UNIPHY+Lab结合PPG基础模型和患者感知Mamba模型,实现从PPG信号连续预测个体化的生化指标。
- 实验结果表明,该方法在预测关键实验室指标上优于LSTM等基线方法,为非侵入式监测提供可能。
📝 摘要(中文)
临床实验室测试为诊断和治疗提供重要的生化测量,但受到间歇性和侵入性采样的限制。相比之下,光电容积脉搏波(PPG)是重症监护病房(ICU)中一种非侵入性的连续记录信号,反映了心血管动力学,可以作为潜在生理变化的代理。我们提出了UNIPHY+Lab,该框架结合了用于局部波形编码的大规模PPG基础模型和用于长程时间建模的患者感知Mamba模型。我们的架构解决了三个挑战:(1)捕获实验室值的扩展时间趋势,(2)通过FiLM调制的初始状态来解释患者特定的基线变化,以及(3)对相互关联的生物标志物执行多任务估计。我们在两个ICU数据集上评估了我们的方法,用于预测五个关键的实验室测试。结果表明,在大多数估计目标中,MAE、RMSE和$R^2$方面都比LSTM和前向填充基线有显著改进。这项工作证明了通过常规PPG监测进行连续、个性化实验室值估计的可行性,为重症监护中的非侵入性生化监测提供了一条途径。
🔬 方法详解
问题定义:论文旨在解决ICU中临床生化指标的连续监测问题。现有方法依赖于间歇性的血液采样,无法提供实时的生理状态变化信息。利用PPG信号预测生化指标面临的挑战包括:PPG信号的复杂性、个体差异以及实验室指标之间的时间依赖性。
核心思路:论文的核心思路是利用大规模PPG数据训练的基础模型提取PPG信号的局部特征,然后使用患者感知的Mamba模型学习长程时间依赖关系,并结合FiLM调制来适应个体差异。这种方法旨在克服传统方法无法捕捉长时间序列依赖和个体差异的局限性。
技术框架:UNIPHY+Lab框架包含以下主要模块:(1)PPG基础模型:用于提取PPG信号的局部波形特征。(2)患者感知Mamba模型:用于建模实验室值的长期时间趋势,并使用FiLM层来整合患者特定的信息。(3)多任务学习:同时预测多个相关的实验室指标,以利用它们之间的依赖关系。整体流程是:输入PPG信号和患者信息,通过PPG基础模型提取特征,然后输入到患者感知Mamba模型中进行预测,最后输出多个实验室指标的估计值。
关键创新:该论文的关键创新在于:(1)将大规模PPG基础模型与Mamba模型相结合,有效提取PPG信号的特征并建模长程时间依赖关系。(2)引入患者感知机制,通过FiLM调制来适应个体差异。(3)采用多任务学习框架,同时预测多个相关的实验室指标,提高预测精度。与现有方法相比,该方法能够更好地捕捉PPG信号的复杂性和个体差异,从而实现更准确的生化指标预测。
关键设计:PPG基础模型使用了预训练的UNIPHY模型,Mamba模型是一种基于选择机制的状态空间模型,能够有效地处理长序列数据。FiLM层用于将患者特定的信息(如年龄、性别等)融入到Mamba模型的初始状态中。损失函数采用了MAE、RMSE和R^2的加权组合,以平衡不同指标的预测精度。
📊 实验亮点
实验结果表明,UNIPHY+Lab在预测五个关键实验室指标(包括乳酸、钾、肌酐等)方面,相较于LSTM和前向填充等基线方法,在MAE、RMSE和R^2等指标上均有显著提升。例如,在某些指标上,MAE降低了10%以上,R^2提高了0.1以上,证明了该方法的有效性。
🎯 应用场景
该研究成果可应用于重症监护病房,实现对患者生化指标的连续、非侵入式监测,有助于医生及时发现病情变化,优化治疗方案。此外,该技术还可扩展到其他需要连续生理监测的场景,如远程医疗、运动健康等,具有广阔的应用前景。
📄 摘要(原文)
Clinical laboratory tests provide essential biochemical measurements for diagnosis and treatment, but are limited by intermittent and invasive sampling. In contrast, photoplethysmogram (PPG) is a non-invasive, continuously recorded signal in intensive care units (ICUs) that reflects cardiovascular dynamics and can serve as a proxy for latent physiological changes. We propose UNIPHY+Lab, a framework that combines a large-scale PPG foundation model for local waveform encoding with a patient-aware Mamba model for long-range temporal modeling. Our architecture addresses three challenges: (1) capturing extended temporal trends in laboratory values, (2) accounting for patient-specific baseline variation via FiLM-modulated initial states, and (3) performing multi-task estimation for interrelated biomarkers. We evaluate our method on the two ICU datasets for predicting the five key laboratory tests. The results show substantial improvements over the LSTM and carry-forward baselines in MAE, RMSE, and $R^2$ among most of the estimation targets. This work demonstrates the feasibility of continuous, personalized lab value estimation from routine PPG monitoring, offering a pathway toward non-invasive biochemical surveillance in critical care.