DeltaDeno: Zero-Shot Anomaly Generation via Delta-Denoising Attribution

📄 arXiv: 2511.16920v1 📥 PDF

作者: Chaoran Xu, Chengkan Lv, Qiyu Chen, Yunkang Cao, Feng Zhang, Zhengtao Zhang

分类: cs.CV

发布日期: 2025-11-21


💡 一句话要点

DeltaDeno:提出一种基于Delta去噪归因的零样本异常生成方法。

🎯 匹配领域: 支柱三:空间感知 (Perception & SLAM)

关键词: 异常生成 零样本学习 扩散模型 去噪归因 图像修复

📋 核心要点

  1. 现有异常生成方法依赖少量异常样本微调,易过拟合类别先验,无法应对无异常样本场景。
  2. DeltaDeno通过对比两个扩散分支的去噪过程,定位并编辑缺陷,无需训练,实现零样本异常生成。
  3. 实验表明,DeltaDeno生成的异常具有真实感,并在下游异常检测任务中取得了显著的性能提升。

📝 摘要(中文)

异常生成通常被视为使用异常样本进行少量样本微调,这与驱动生成任务的稀缺性相矛盾,并且容易过度拟合类别先验。我们解决的是没有真实异常样本或训练可用的情况。我们提出Delta去噪(DeltaDeno),这是一种无需训练的零样本异常生成方法,它通过在共享调度下由最小提示对驱动的两个扩散分支对比来定位和编辑缺陷。通过将每步去噪增量累积到特定于图像的定位图中,我们获得一个掩码,以在后续扩散步骤中引导潜在的修复,并在生成逼真的局部缺陷的同时保留周围的上下文。为了提高稳定性和控制力,DeltaDeno执行令牌级别的提示细化,以对齐共享内容并加强异常令牌,并应用限制在预测区域中异常令牌的空间注意力偏差。在公共数据集上的实验表明,DeltaDeno在下游检测性能方面实现了出色的生成、真实感和一致的增益。代码将会公开。

🔬 方法详解

问题定义:现有的异常生成方法通常需要少量异常样本进行微调,这与异常检测任务中异常样本稀缺的假设相悖。此外,微调容易导致模型过度拟合已知的异常类型,泛化能力不足。因此,如何在没有异常样本的情况下生成逼真的异常,是一个亟待解决的问题。

核心思路:DeltaDeno的核心思路是通过对比两个扩散模型的去噪过程,来定位并生成异常。具体来说,模型使用一对最小化的提示(一个包含正常信息,一个包含异常信息)驱动两个扩散分支,通过分析两个分支在每一步去噪过程中的差异(Delta),来确定图像中可能存在异常的区域。这种方法无需训练,能够避免对特定异常类型的过度拟合。

技术框架:DeltaDeno的整体框架包含以下几个主要模块:1) 扩散模型分支:使用两个独立的扩散模型分支,分别以正常提示和异常提示作为输入。2) Delta去噪归因:计算两个分支在每一步去噪过程中的差异(Delta),并将其累积成一个图像特定的定位图,用于指示潜在的异常区域。3) 潜在修复:使用定位图作为掩码,引导后续扩散步骤中的潜在修复,从而在指定区域生成异常,同时保持周围环境的上下文信息。4) 提示细化:对提示进行令牌级别的细化,以对齐共享内容并加强异常令牌,提高生成异常的稳定性和控制力。

关键创新:DeltaDeno最重要的创新点在于其零样本的异常生成能力。与传统的基于微调的方法不同,DeltaDeno无需任何异常样本的训练,而是通过对比两个扩散分支的去噪过程来定位和生成异常。这种方法能够更好地应对异常样本稀缺的场景,并具有更强的泛化能力。

关键设计:DeltaDeno的关键设计包括:1) 使用最小化的提示对,以更精确地控制异常的生成。2) 累积每步去噪增量,以获得更准确的异常定位图。3) 使用定位图引导潜在修复,以生成逼真的局部缺陷。4) 应用空间注意力偏差,限制异常令牌在预测区域内的影响。

📊 实验亮点

DeltaDeno在多个公开数据集上进行了实验,结果表明,该方法能够生成高质量的异常样本,并在下游异常检测任务中取得了显著的性能提升。例如,在MVTec AD数据集上,使用DeltaDeno生成的异常样本训练的异常检测模型,其检测性能优于使用其他生成方法训练的模型,并且与使用真实异常样本训练的模型性能相当。

🎯 应用场景

DeltaDeno在工业质检、医疗影像分析、安全监控等领域具有广泛的应用前景。例如,在工业质检中,可以利用DeltaDeno生成各种缺陷样本,用于训练和评估缺陷检测模型。在医疗影像分析中,可以生成罕见疾病的影像,辅助医生进行诊断。在安全监控中,可以生成异常事件的场景,提高监控系统的鲁棒性。

📄 摘要(原文)

Anomaly generation is often framed as few-shot fine-tuning with anomalous samples, which contradicts the scarcity that motivates generation and tends to overfit category priors. We tackle the setting where no real anomaly samples or training are available. We propose Delta-Denoising (DeltaDeno), a training-free zero-shot anomaly generation method that localizes and edits defects by contrasting two diffusion branches driven by a minimal prompt pair under a shared schedule. By accumulating per-step denoising deltas into an image-specific localization map, we obtain a mask to guide the latent inpainting during later diffusion steps and preserve the surrounding context while generating realistic local defects. To improve stability and control, DeltaDeno performs token-level prompt refinement that aligns shared content and strengthens anomaly tokens, and applies a spatial attention bias restricted to anomaly tokens in the predicted region. Experiments on public datasets show that DeltaDeno achieves great generation, realism and consistent gains in downstream detection performance. Code will be made publicly available.