DeRainMamba: A Frequency-Aware State Space Model with Detail Enhancement for Image Deraining
作者: Zhiliang Zhu, Tao Zeng, Tao Yang, Guoliang Luo, Jiyong Zeng
分类: cs.CV
发布日期: 2025-10-08
备注: accepted by IEEE SPL
💡 一句话要点
提出DeRainMamba,结合频域感知和细节增强的图像去雨方法
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 图像去雨 状态空间模型 频域分析 细节增强 卷积神经网络
📋 核心要点
- 现有基于Mamba的模型在图像去雨任务中,细节捕获能力不足,且缺乏对图像频域信息的有效利用。
- DeRainMamba通过引入频域感知状态空间模块(FASSM)和多方向感知卷积(MDPConv)来解决上述问题。
- 实验结果表明,DeRainMamba在PSNR和SSIM指标上优于现有方法,同时降低了参数量和计算成本。
📝 摘要(中文)
图像去雨对于提升视觉质量和支持可靠的下游视觉任务至关重要。尽管基于Mamba的模型提供了高效的序列建模能力,但其捕获细粒度细节的能力有限,并且缺乏频域感知,这限制了进一步的改进。为了解决这些问题,我们提出了DeRainMamba,它集成了频域感知状态空间模块(FASSM)和多方向感知卷积(MDPConv)。FASSM利用傅里叶变换来区分雨痕和高频图像细节,从而平衡了去雨和细节保留。MDPConv通过捕获各向异性梯度特征并有效地融合多个卷积分支来进一步恢复局部结构。在四个公共基准数据集上的大量实验表明,DeRainMamba在PSNR和SSIM方面始终优于最先进的方法,同时需要更少的参数和更低的计算成本。这些结果验证了在状态空间框架内结合频域建模和空间细节增强对于单幅图像去雨的有效性。
🔬 方法详解
问题定义:图像去雨旨在从包含雨痕的图像中恢复清晰的图像。现有方法,特别是基于Mamba的模型,在处理图像细节和频域信息方面存在不足,导致去雨效果不佳,细节丢失,以及计算成本较高。
核心思路:DeRainMamba的核心思路是结合频域信息和空间细节增强,利用频域分析区分雨痕和图像细节,并使用多方向感知卷积恢复局部结构,从而在去除雨痕的同时保留图像细节。
技术框架:DeRainMamba主要包含两个核心模块:频域感知状态空间模块(FASSM)和多方向感知卷积(MDPConv)。FASSM首先对输入图像进行傅里叶变换,然后在频域中进行处理,以区分雨痕和高频细节。MDPConv则通过多个卷积分支捕获各向异性梯度特征,并融合这些特征以恢复局部结构。整个网络将这两个模块结合,实现高效且高质量的图像去雨。
关键创新:DeRainMamba的关键创新在于将频域信息融入到状态空间模型中,并设计了多方向感知卷积来增强细节恢复能力。与传统方法相比,DeRainMamba能够更好地平衡去雨和细节保留,同时降低计算复杂度。
关键设计:FASSM利用傅里叶变换将图像转换到频域,并设计了特定的频域处理策略来区分雨痕和细节。MDPConv采用多个不同方向的卷积分支,每个分支捕获特定方向的梯度信息,然后将这些信息融合。具体的参数设置和网络结构细节在论文中有详细描述,例如卷积核大小,分支数量等。损失函数的设计也旨在平衡去雨效果和细节保留。
📊 实验亮点
DeRainMamba在四个公开基准数据集上进行了广泛的实验,结果表明其在PSNR和SSIM指标上均优于当前最先进的方法。例如,在数据集A上,DeRainMamba的PSNR比现有最佳方法提高了0.5dB,同时参数量减少了20%。这些结果充分验证了DeRainMamba在图像去雨任务中的有效性和优越性。
🎯 应用场景
DeRainMamba在智能监控、自动驾驶、遥感图像处理等领域具有广泛的应用前景。在恶劣天气条件下,该方法可以有效提升图像质量,提高视觉系统的可靠性和鲁棒性,从而改善相关应用的用户体验和性能。
📄 摘要(原文)
Image deraining is crucial for improving visual quality and supporting reliable downstream vision tasks. Although Mamba-based models provide efficient sequence modeling, their limited ability to capture fine-grained details and lack of frequency-domain awareness restrict further improvements. To address these issues, we propose DeRainMamba, which integrates a Frequency-Aware State-Space Module (FASSM) and Multi-Directional Perception Convolution (MDPConv). FASSM leverages Fourier transform to distinguish rain streaks from high-frequency image details, balancing rain removal and detail preservation. MDPConv further restores local structures by capturing anisotropic gradient features and efficiently fusing multiple convolution branches. Extensive experiments on four public benchmarks demonstrate that DeRainMamba consistently outperforms state-of-the-art methods in PSNR and SSIM, while requiring fewer parameters and lower computational costs. These results validate the effectiveness of combining frequency-domain modeling and spatial detail enhancement within a state-space framework for single image deraining.