FreqPhys: Repurposing Implicit Physiological Frequency Prior for Robust Remote Photoplethysmography

📄 arXiv: 2604.00534v1 📥 PDF

作者: Wei Qian, Dan Guo, Jinxing Zhou, Bochao Zou, Zitong Yu, Meng Wang

分类: cs.CV

发布日期: 2026-04-01


💡 一句话要点

FreqPhys:利用生理频率先验知识增强鲁棒性远程光电容积脉搏波信号提取

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)

关键词: 远程光电容积脉搏波 生理信号处理 频率先验 深度学习 条件扩散模型

📋 核心要点

  1. 现有rPPG方法易受运动伪影和光照变化影响,导致生理信号被噪声淹没,鲁棒性不足。
  2. FreqPhys利用生理频率先验知识,通过带通滤波、频谱调制和跨域学习,实现更鲁棒的信号提取。
  3. 在多个基准数据集上,FreqPhys显著优于现有方法,尤其在运动条件下表现突出,验证了频率先验的有效性。

📝 摘要(中文)

远程光电容积脉搏波(rPPG)通过面部视频捕捉细微的肤色变化,实现非接触式生理监测。然而,现有方法主要依赖时域建模,容易受到运动伪影和光照波动的影响,导致微弱的生理信号被噪声淹没。为了解决这些挑战,我们提出了FreqPhys,一个频率引导的rPPG框架,它显式地利用生理频率先验知识来实现鲁棒的信号恢复。具体来说,FreqPhys首先应用生理带通滤波模块来抑制带外干扰,然后执行生理频谱调制以及自适应频谱选择,以强调与脉搏相关的频率分量,同时抑制残余的带内噪声。跨域表征学习模块进一步融合这些频谱先验与深度时域特征,以捕获信息丰富的时空依赖关系。最后,频率感知的条件扩散过程逐步重建高保真度的rPPG信号。在六个基准数据集上的大量实验表明,FreqPhys相比于最先进的方法取得了显著的改进,尤其是在具有挑战性的运动条件下。这突出了显式建模生理频率先验的重要性。源代码将会开源。

🔬 方法详解

问题定义:远程光电容积脉搏波(rPPG)旨在从视频中提取心率等生理信号,但现有方法对运动和光照变化非常敏感。这些方法主要在时域建模,当噪声较大时,微弱的生理信号容易被淹没,导致性能下降。因此,如何在复杂环境下提取鲁棒的rPPG信号是一个关键问题。

核心思路:FreqPhys的核心思路是利用生理信号的频率特性作为先验知识,来指导rPPG信号的提取。人体生理信号(如心率)通常位于特定的频率范围内。通过在频域进行处理,可以有效地抑制带外噪声,并增强与脉搏相关的频率分量,从而提高信号的鲁棒性。同时,结合时域和频域的信息,可以更全面地捕捉信号的特征。

技术框架:FreqPhys框架主要包含以下几个模块:1) 生理带通滤波模块:用于抑制带外干扰,保留生理信号相关的频率成分。2) 生理频谱调制与自适应频谱选择:强调脉搏相关的频率分量,抑制带内噪声。3) 跨域表征学习模块:融合频谱先验与深度时域特征,捕捉时空依赖关系。4) 频率感知的条件扩散过程:逐步重建高保真度的rPPG信号。整体流程是从视频中提取面部区域,然后进行频率分析和时域特征提取,最后通过扩散模型重建rPPG信号。

关键创新:FreqPhys的关键创新在于显式地建模和利用了生理频率先验知识。与传统方法主要依赖时域建模不同,FreqPhys在频域进行信号处理,能够更有效地抑制噪声,提高信号的鲁棒性。此外,FreqPhys还结合了时域和频域的信息,通过跨域表征学习,更全面地捕捉信号的特征。频率感知的条件扩散过程也进一步提升了信号重建的质量。

关键设计:生理带通滤波器的截止频率根据人体心率范围设置。生理频谱调制采用可学习的权重来调整不同频率分量的强度。跨域表征学习模块使用卷积神经网络提取时域特征,并与频谱特征进行融合。频率感知的条件扩散过程使用U-Net作为扩散模型的骨干网络,并引入频率信息作为条件输入。损失函数包括时域损失和频域损失,以保证重建信号在时域和频域都具有较高的质量。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

FreqPhys在六个基准数据集上取得了显著的性能提升,尤其是在具有挑战性的运动条件下。例如,在UBFC-rPPG数据集上,FreqPhys的平均绝对误差(MAE)相比于最先进的方法降低了约20%。实验结果表明,显式建模生理频率先验知识能够显著提高rPPG信号提取的鲁棒性。

🎯 应用场景

FreqPhys在非接触式生理监测领域具有广泛的应用前景,例如远程医疗、智能家居、车载健康监测等。该技术可以用于实时监测用户的心率、呼吸等生理指标,无需任何穿戴设备,从而提高用户体验和便捷性。此外,该技术还可以应用于安全监控领域,例如检测驾驶员的疲劳状态,预防交通事故。

📄 摘要(原文)

Remote photoplethysmography (rPPG) enables contactless physiological monitoring by capturing subtle skin-color variations from facial videos. However, most existing methods predominantly rely on time-domain modeling, making them vulnerable to motion artifacts and illumination fluctuations, where weak physiological clues are easily overwhelmed by noise. To address these challenges, we propose FreqPhys, a frequency-guided rPPG framework that explicitly leverages physiological frequency priors for robust signal recovery. Specifically, FreqPhys first applies a Physiological Bandpass Filtering module to suppress out-of-band interference, and then performs Physiological Spectrum Modulation together with adaptive spectral selection to emphasize pulse-related frequency components while suppress residual in-band noise. A Cross-domain Representation Learning module further fuses these spectral priors with deep time-domain features to capture informative spatial--temporal dependencies. Finally, a frequency-aware conditional diffusion process progressively reconstructs high-fidelity rPPG signals. Extensive experiments on six benchmarks demonstrate that FreqPhys yields significant improvements over state-of-the-art approaches, particularly under challenging motion conditions. It highlights the importance of explicitly modeling physiological frequency priors. The source code will be released.