X-IONet: Cross-Platform Inertial Odometry Network with Dual-Stage Attention

📄 arXiv: 2511.08277v1 📥 PDF

作者: Dehan Shen, Changhao Chen

分类: cs.RO, cs.LG

发布日期: 2025-11-11


💡 一句话要点

X-IONet:基于双阶段注意力的跨平台惯性里程计网络,提升行人和四足机器人导航精度。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知 (Perception & SLAM)

关键词: 惯性里程计 跨平台学习 双阶段注意力 行人导航 四足机器人 扩展卡尔曼滤波 运动估计

📋 核心要点

  1. 现有基于学习的惯性里程计在行人导航中表现出色,但应用于运动模式差异大的四足机器人时性能显著下降。
  2. X-IONet通过平台分类的专家选择模块和双阶段注意力网络,分别处理不同平台的运动特性,提升跨平台适应性。
  3. 实验表明,X-IONet在行人和四足机器人数据集上均取得了显著的性能提升,验证了其有效性和鲁棒性。

📝 摘要(中文)

本文提出了一种名为X-IONet的跨平台惯性里程计框架,该框架仅使用单个惯性测量单元(IMU)。X-IONet包含一个基于规则的专家选择模块,用于对运动平台进行分类,并将IMU序列路由到特定于平台的专家网络。位移预测网络采用双阶段注意力架构,联合建模长程时间依赖性和轴间相关性,从而实现精确的运动表示。该网络输出位移和相关的不确定性,并通过扩展卡尔曼滤波器(EKF)进一步融合,以实现鲁棒的状态估计。在公共行人数据集和自收集的四足机器人数据集上的大量实验表明,X-IONet实现了最先进的性能,在行人数据上将绝对轨迹误差(ATE)降低了14.3%,相对轨迹误差(RTE)降低了11.4%,在四足机器人数据上分别降低了52.8%和41.3%。这些结果突出了X-IONet在提高人类和腿式机器人平台上的精确和鲁棒的惯性导航方面的有效性。

🔬 方法详解

问题定义:现有基于学习的惯性里程计方法在行人导航任务上取得了显著进展,但当应用于运动模式与行人差异较大的四足机器人时,性能会急剧下降。这是因为行人和四足机器人的运动模式具有显著差异,导致模型难以泛化。因此,如何设计一种能够适应不同运动平台,并保持较高精度的惯性里程计方法是一个关键问题。

核心思路:X-IONet的核心思路是利用平台特定的专家网络来处理不同平台的运动数据。通过一个基于规则的专家选择模块,将IMU数据路由到相应的专家网络进行处理。此外,采用双阶段注意力机制来建模长程时间依赖性和轴间相关性,从而更准确地表示运动状态。

技术框架:X-IONet的整体框架包括三个主要模块:1) 平台分类模块:使用基于规则的专家选择模块,根据IMU数据特征将运动平台分类为行人或四足机器人。2) 位移预测网络:采用双阶段注意力架构,包括时间注意力模块和轴间注意力模块,用于预测位移和不确定性。3) 状态估计模块:使用扩展卡尔曼滤波器(EKF)融合位移预测和不确定性,以实现鲁棒的状态估计。

关键创新:X-IONet的关键创新在于其跨平台适应性和双阶段注意力机制。传统的惯性里程计方法通常针对特定平台进行优化,难以泛化到其他平台。X-IONet通过平台分类和专家网络,实现了跨平台适应性。双阶段注意力机制能够同时建模长程时间依赖性和轴间相关性,从而更准确地表示运动状态,优于传统的单阶段注意力机制。

关键设计:平台分类模块使用基于规则的分类器,根据IMU数据的统计特征(如加速度和角速度的方差)来区分行人和四足机器人。位移预测网络使用Transformer结构,时间注意力模块关注不同时间步之间的依赖关系,轴间注意力模块关注不同轴之间的相关性。损失函数包括位移预测损失和不确定性损失,用于优化网络参数。EKF使用预测的位移和不确定性来更新状态估计。

📊 实验亮点

X-IONet在行人数据集上将ATE降低了14.3%,RTE降低了11.4%,在四足机器人数据集上分别降低了52.8%和41.3%。这些结果表明,X-IONet在跨平台惯性里程计任务上取得了显著的性能提升,优于现有的方法。尤其是在四足机器人数据集上的大幅提升,验证了X-IONet在处理复杂运动模式方面的优势。

🎯 应用场景

X-IONet具有广泛的应用前景,可用于行人导航、机器人导航、增强现实、虚拟现实等领域。尤其是在需要高精度和鲁棒性的场景下,如室内导航、复杂环境下的机器人自主导航等,X-IONet能够提供更可靠的定位信息。未来,该技术有望应用于智能穿戴设备、移动机器人、无人机等产品中,提升用户体验和设备性能。

📄 摘要(原文)

Learning-based inertial odometry has achieved remarkable progress in pedestrian navigation. However, extending these methods to quadruped robots remains challenging due to their distinct and highly dynamic motion patterns. Models that perform well on pedestrian data often experience severe degradation when deployed on legged platforms. To tackle this challenge, we introduce X-IONet, a cross-platform inertial odometry framework that operates solely using a single Inertial Measurement Unit (IMU). X-IONet incorporates a rule-based expert selection module to classify motion platforms and route IMU sequences to platform-specific expert networks. The displacement prediction network features a dual-stage attention architecture that jointly models long-range temporal dependencies and inter-axis correlations, enabling accurate motion representation. It outputs both displacement and associated uncertainty, which are further fused through an Extended Kalman Filter (EKF) for robust state estimation. Extensive experiments on public pedestrian datasets and a self-collected quadruped robot dataset demonstrate that X-IONet achieves state-of-the-art performance, reducing Absolute Trajectory Error (ATE) by 14.3% and Relative Trajectory Error (RTE) by 11.4% on pedestrian data, and by 52.8% and 41.3% on quadruped robot data. These results highlight the effectiveness of X-IONet in advancing accurate and robust inertial navigation across both human and legged robot platforms.