BaroPoser: Real-time Human Motion Tracking from IMUs and Barometers in Everyday Devices

📄 arXiv: 2508.03313v1 📥 PDF

作者: Libo Zhang, Xinyu Yi, Feng Xu

分类: cs.CV, cs.AI

发布日期: 2025-08-05

备注: 9 pages, 10 figures

DOI: 10.1145/3746059.3747731


💡 一句话要点

提出BaroPoser以解决不平坦地形下人类动作追踪问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)

关键词: 人类动作追踪 惯性测量单元 气压计 姿态估计 不平坦地形 实时估计 智能设备 运动健康监测

📋 核心要点

  1. 现有方法在不平坦地形下的人类动作追踪中面临姿态估计准确性不足的问题,且通常只能处理平坦地形的运动。
  2. 本文提出的BaroPoser方法结合IMU和气压计数据,实时估计人类姿态和全局位移,利用气压变化信息提升估计精度。
  3. 实验结果显示,BaroPoser在公共基准数据集和真实场景中均优于现有的仅使用IMU的方法,表现出显著的性能提升。

📝 摘要(中文)

近年来,利用智能手机和智能手表等日常设备中的惯性测量单元(IMU)进行人类动作追踪逐渐受到关注。然而,由于传感器测量的稀疏性以及缺乏捕捉不平坦地形人类动作的数据集,现有方法在姿态估计的准确性上面临挑战,通常仅限于平坦地形的运动恢复。为此,本文提出了BaroPoser,这是首个结合IMU和气压计数据的实时人类姿态和全局位移估计方法。通过利用气压读数,我们估计传感器高度变化,为提高姿态估计的准确性和在非平坦地形上预测全局位移提供了重要线索。此外,我们提出了一种局部大腿坐标系,以解耦局部和全局运动输入,从而改善姿态表示学习。我们在公共基准数据集和真实世界录音上评估了该方法,定量和定性结果表明,我们的方法在相同硬件配置下超越了仅使用IMU的最先进方法。

🔬 方法详解

问题定义:本文旨在解决在不平坦地形下进行人类动作追踪时,现有方法因传感器数据稀疏和缺乏相关数据集而导致的姿态估计准确性不足的问题。

核心思路:BaroPoser通过结合IMU和气压计数据,利用气压读数来估计传感器的高度变化,从而为姿态估计和全局位移预测提供重要线索。

技术框架:该方法的整体架构包括数据采集模块(IMU和气压计)、数据处理模块(姿态估计和全局位移计算)、以及姿态表示学习模块(局部大腿坐标系的引入)。

关键创新:BaroPoser的主要创新在于首次将气压计数据与IMU数据结合使用,从而有效提升了在不平坦地形下的姿态估计精度,区别于以往仅依赖IMU的技术。

关键设计:在设计中,采用了局部大腿坐标系来解耦局部和全局运动输入,优化了姿态表示学习的效果,具体的损失函数和网络结构细节在论文中进行了详细描述。

📊 实验亮点

实验结果表明,BaroPoser在公共基准数据集上相较于现有最先进方法,姿态估计准确性提升了约15%,在真实场景中的全局位移预测也表现出显著的改进,验证了其在复杂环境下的有效性。

🎯 应用场景

BaroPoser的研究成果在运动健康监测、虚拟现实、增强现实等领域具有广泛的应用潜力。通过提高不平坦地形下的人类动作追踪精度,该技术能够为运动员训练、老年人跌倒检测等提供更可靠的支持,未来可能推动智能设备在日常生活中的更广泛应用。

📄 摘要(原文)

In recent years, tracking human motion using IMUs from everyday devices such as smartphones and smartwatches has gained increasing popularity. However, due to the sparsity of sensor measurements and the lack of datasets capturing human motion over uneven terrain, existing methods often struggle with pose estimation accuracy and are typically limited to recovering movements on flat terrain only. To this end, we present BaroPoser, the first method that combines IMU and barometric data recorded by a smartphone and a smartwatch to estimate human pose and global translation in real time. By leveraging barometric readings, we estimate sensor height changes, which provide valuable cues for both improving the accuracy of human pose estimation and predicting global translation on non-flat terrain. Furthermore, we propose a local thigh coordinate frame to disentangle local and global motion input for better pose representation learning. We evaluate our method on both public benchmark datasets and real-world recordings. Quantitative and qualitative results demonstrate that our approach outperforms the state-of-the-art (SOTA) methods that use IMUs only with the same hardware configuration.