Improving Anomaly Detection with Foundation-Model Synthesis and Wavelet-Domain Attention
作者: Wensheng Wu, Zheming Lu, Ziqian Lu, Zewei He, Xuecheng Sun, Zhao Wang, Jungong Han, Yunlong Yu
分类: cs.CV
发布日期: 2026-03-03
💡 一句话要点
提出基于基础模型合成和Wavelet域注意力的异常检测方法,提升工业异常检测性能。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 异常检测 基础模型 数据合成 Wavelet变换 注意力机制 工业质检 频域分析
📋 核心要点
- 工业异常检测面临异常样本稀缺和真实异常复杂性的挑战,现有方法难以有效应对。
- 论文提出FMAS流程,利用基础模型合成逼真异常样本,并引入WDAM模块增强异常特征提取。
- 实验表明,WDAM作为即插即用模块,在MVTec AD和VisA数据集上显著提升了异常检测性能。
📝 摘要(中文)
本文提出了一种基于基础模型的异常合成流程(FMAS),该流程无需微调或特定类别的训练,即可生成高度逼真的异常样本,从而解决工业异常检测中异常样本稀缺和真实异常复杂性的问题。此外,受异常在频域中具有独特特征的启发,我们引入了Wavelet域注意力模块(WDAM),该模块利用自适应子带处理来增强异常特征的提取。FMAS和WDAM的结合显著提高了异常检测的灵敏度,同时保持了计算效率。在MVTec AD和VisA数据集上的综合实验表明,WDAM作为一个即插即用模块,相对于现有基线实现了显著的性能提升。
🔬 方法详解
问题定义:工业异常检测任务中,异常样本通常非常稀缺,且真实场景下的异常类型复杂多样,这使得传统的监督学习方法难以有效训练。现有方法往往依赖于大量正常样本进行训练,但对于未知的异常样本泛化能力较弱。因此,如何利用有限的正常样本,提升模型对各种异常的检测能力,是该论文要解决的核心问题。
核心思路:论文的核心思路是双重的。首先,通过基础模型合成逼真的异常样本,从而扩充训练数据集,缓解异常样本稀缺的问题。其次,利用Wavelet变换将图像分解到频域,并设计注意力机制,使模型能够更加关注异常在频域上的独特特征,从而提升异常检测的灵敏度。
技术框架:整体框架包含两个主要部分:FMAS(Foundation Model-based Anomaly Synthesis)和WDAM(Wavelet Domain Attention Module)。FMAS负责生成异常样本,WDAM则嵌入到异常检测模型中,用于增强特征提取。具体流程是:首先,利用FMAS生成包含异常的图像;然后,将这些图像与正常图像一起用于训练异常检测模型,该模型集成了WDAM模块。在测试阶段,输入图像经过训练好的模型,输出异常分数,用于判断是否存在异常。
关键创新:论文的关键创新在于:1) 提出了基于基础模型的异常合成流程FMAS,无需微调或特定类别训练即可生成逼真异常样本;2) 引入了Wavelet域注意力模块WDAM,利用频域信息增强异常特征提取。与现有方法相比,FMAS能够更有效地生成多样化的异常样本,WDAM能够更准确地捕捉异常的频域特征。
关键设计:FMAS的关键设计在于利用预训练的基础模型(具体使用哪个基础模型未知)的生成能力,通过某种方式(具体方法未知)将异常信息注入到正常图像中,从而生成异常样本。WDAM的关键设计在于:首先,使用Wavelet变换将图像分解为不同的子带;然后,对每个子带应用注意力机制,学习不同子带的重要性;最后,将加权后的子带特征融合,得到最终的特征表示。具体的Wavelet变换类型和注意力机制类型未知。
🖼️ 关键图片
📊 实验亮点
实验结果表明,WDAM作为一个即插即用模块,在MVTec AD和VisA数据集上实现了显著的性能提升。具体提升幅度未知,但强调了WDAM的有效性和通用性。FMAS的有效性也得到了验证,通过合成异常样本,可以显著提高异常检测模型的性能。
🎯 应用场景
该研究成果可广泛应用于工业质检、医疗影像分析、安全监控等领域。通过合成异常样本和增强异常特征提取,可以提高异常检测的准确性和鲁棒性,从而减少误判和漏判,降低生产成本,保障产品质量,提升医疗诊断效率,增强安全防范能力。未来,该方法有望扩展到其他领域,例如金融欺诈检测、网络安全等。
📄 摘要(原文)
Industrial anomaly detection faces significant challenges due to the scarcity of anomalous samples and the complexity of real-world anomalies. In this paper, we propose a foundation model-based anomaly synthesis pipeline (FMAS) that generates highly realistic anomalous samples without fine-tuning or class-specific training. Motivated by the distinct frequency-domain characteristics of anomalies, we introduce aWavelet Domain Attention Module (WDAM), which exploits adaptive sub-band processing to enhance anomaly feature extraction. The combination of FMAS and WDAM significantly improves anomaly detection sensitivity while maintaining computational efficiency. Comprehensive experiments on MVTec AD and VisA datasets demonstrate that WDAM, as a plug-and-play module, achieves substantial performance gains against existing baselines.