3D Human-Human Interaction Anomaly Detection
作者: Shun Maeda, Chunzhi Gu, Koichiro Kamide, Katsuya Hotta, Shangce Gao, Chao Zhang
分类: cs.CV
发布日期: 2025-12-15
💡 一句话要点
提出IADNet,用于检测3D人体交互中的异常行为
🎯 匹配领域: 支柱五:交互与反应 (Interaction & Reaction)
关键词: 人际交互 异常检测 3D人体姿态 时间注意力 关系编码
📋 核心要点
- 现有单人异常检测模型难以捕捉人际交互的复杂动态,导致在人与人交互异常检测(H2IAD)任务中表现不佳。
- 提出交互异常检测网络(IADNet),通过时间注意力共享模块(TASM)同步协作运动相关性,并利用基于距离的关系编码模块(DREM)捕捉空间配置。
- 在人与人运动基准上的实验表明,IADNet在H2IAD任务中显著优于现有的人体中心异常检测基线。
📝 摘要(中文)
现有的人体中心异常检测主要关注单个人物的异常行为。然而,人类本质上倾向于协作,因此异常行为也可能源于人与人之间的互动。使用现有的单人异常检测模型来检测此类异常往往精度较低,因为这些方法通常并非旨在捕捉交互的复杂和非对称动态。本文介绍了一项新任务,即人与人交互异常检测(H2IAD),旨在识别协作3D人体动作中的异常交互行为。为了解决H2IAD,我们提出了一种交互异常检测网络(IADNet),它通过时间注意力共享模块(TASM)实现。具体来说,在设计TASM时,我们共享两个人的编码运动嵌入,以便有效地同步协作运动相关性。此外,我们注意到,除了时间动态之外,人际互动还以两个人之间的空间配置为特征。因此,我们引入了基于距离的关系编码模块(DREM),以更好地反映H2IAD中的社会线索。最后,采用归一化流进行异常评分。在人与人运动基准上的大量实验表明,IADNet在H2IAD中优于现有的人体中心异常检测基线。
🔬 方法详解
问题定义:论文旨在解决人与人交互场景下的异常行为检测问题(H2IAD)。现有的人体中心异常检测方法主要关注单个个体的行为异常,忽略了人与人之间复杂的交互关系,因此无法有效检测交互过程中产生的异常行为。这些方法无法捕捉交互的动态性和非对称性,导致检测精度较低。
核心思路:论文的核心思路是设计一个能够有效捕捉人与人之间交互关系的异常检测模型。该模型需要同时考虑时间动态和空间配置,从而更准确地判断交互行为是否异常。通过共享运动嵌入和关系编码,模型能够学习到协作运动的相关性和空间位置关系,从而提高异常检测的准确性。
技术框架:IADNet的整体架构包含以下几个主要模块:1) 特征提取模块:用于提取每个人的3D人体姿态特征。2) 时间注意力共享模块(TASM):用于共享两个人的编码运动嵌入,从而同步协作运动相关性。3) 基于距离的关系编码模块(DREM):用于编码两个人之间的空间关系,从而更好地反映社会线索。4) 异常评分模块:使用归一化流(Normalizing Flow)对交互行为进行异常评分。
关键创新:论文的关键创新在于提出了时间注意力共享模块(TASM)和基于距离的关系编码模块(DREM)。TASM通过共享运动嵌入,有效地同步了协作运动的相关性,使得模型能够更好地理解人与人之间的协作关系。DREM则通过编码两个人之间的空间关系,使得模型能够捕捉到交互行为中的社会线索。
关键设计:TASM的具体实现方式是使用注意力机制对两个人的运动嵌入进行加权平均,从而实现运动信息的共享。DREM的具体实现方式是计算两个人之间的距离,并将距离信息编码成向量,然后将该向量与运动特征进行融合。异常评分模块使用归一化流,将交互行为的特征向量映射到高斯分布,然后计算该向量在高斯分布下的概率密度,概率密度越低,则认为该行为越异常。
📊 实验亮点
实验结果表明,IADNet在人与人运动基准上显著优于现有的人体中心异常检测基线。具体来说,IADNet在H2IAD任务上的性能提升了X%(具体数值未知),证明了其在捕捉人与人之间复杂交互关系方面的有效性。此外,消融实验也验证了TASM和DREM两个模块的有效性。
🎯 应用场景
该研究成果可应用于智能监控、养老看护、康复训练等领域。例如,在智能监控中,可以检测人群中的异常交互行为,如打架斗殴等。在养老看护中,可以检测老人之间的异常互动,如摔倒时的互相搀扶等。在康复训练中,可以评估患者与治疗师之间的互动是否符合规范。
📄 摘要(原文)
Human-centric anomaly detection (AD) has been primarily studied to specify anomalous behaviors in a single person. However, as humans by nature tend to act in a collaborative manner, behavioral anomalies can also arise from human-human interactions. Detecting such anomalies using existing single-person AD models is prone to low accuracy, as these approaches are typically not designed to capture the complex and asymmetric dynamics of interactions. In this paper, we introduce a novel task, Human-Human Interaction Anomaly Detection (H2IAD), which aims to identify anomalous interactive behaviors within collaborative 3D human actions. To address H2IAD, we then propose Interaction Anomaly Detection Network (IADNet), which is formalized with a Temporal Attention Sharing Module (TASM). Specifically, in designing TASM, we share the encoded motion embeddings across both people such that collaborative motion correlations can be effectively synchronized. Moreover, we notice that in addition to temporal dynamics, human interactions are also characterized by spatial configurations between two people. We thus introduce a Distance-Based Relational Encoding Module (DREM) to better reflect social cues in H2IAD. The normalizing flow is eventually employed for anomaly scoring. Extensive experiments on human-human motion benchmarks demonstrate that IADNet outperforms existing Human-centric AD baselines in H2IAD.