DB-MSMUNet:Dual Branch Multi-scale Mamba UNet for Pancreatic CT Scans Segmentation

📄 arXiv: 2601.04676v1 📥 PDF

作者: Qiu Guan, Zhiqiang Yang, Dezhang Ye, Yang Chen, Xinli Xu, Ying Tang

分类: cs.CV

发布日期: 2026-01-08


💡 一句话要点

提出DB-MSMUNet,用于胰腺CT扫描分割,提升分割精度和边缘保持能力。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 胰腺分割 CT图像 深度学习 Mamba模型 UNet 双分支解码器 多尺度特征 医学图像分割

📋 核心要点

  1. 胰腺CT图像分割面临组织对比度低、边界模糊、形状不规则和小病灶等挑战,影响诊断精度。
  2. DB-MSMUNet采用双分支解码器和多尺度Mamba模块,增强全局上下文建模、局部变形适应和边缘细节捕捉。
  3. 实验结果表明,DB-MSMUNet在三个数据集上均优于现有方法,显著提升了分割精度和边缘保持能力。

📝 摘要(中文)

胰腺及其病灶在CT扫描中的精确分割对于胰腺癌的精确诊断和治疗至关重要。然而,由于与周围器官的组织对比度低、解剖边界模糊、器官形状不规则以及病灶尺寸小等多种因素,这仍然是一项极具挑战性的任务。为了解决这些问题,我们提出了一种新的编码器-解码器架构DB-MSMUNet(双分支多尺度Mamba UNet),专门用于稳健的胰腺分割。编码器使用多尺度Mamba模块(MSMM)构建,该模块结合了可变形卷积和多尺度状态空间建模,以增强全局上下文建模和局部变形适应。该网络采用双解码器设计:边缘解码器引入边缘增强路径(EEP)以显式捕获边界线索并细化模糊轮廓,而区域解码器结合多层解码器(MLD)以通过利用多尺度深度语义特征来保留精细细节并准确重建小病灶。此外,在两个解码器的多个尺度上添加了辅助深度监督(ADS)头,提供更准确的梯度反馈,并进一步增强多尺度特征的判别能力。我们在三个数据集上进行了广泛的实验:NIH胰腺数据集、MSD数据集以及合作医院提供的临床胰腺肿瘤数据集。DB-MSMUNet实现了89.47%、87.59%和89.02%的Dice相似系数,在分割精度、边缘保持和跨不同数据集的鲁棒性方面优于大多数现有的最先进方法。这些结果证明了所提出的方法在实际胰腺CT分割任务中的有效性和泛化性。

🔬 方法详解

问题定义:胰腺CT图像分割旨在精确识别和分割胰腺及其病灶区域。现有方法在处理低对比度、模糊边界、不规则形状和小尺寸病灶时表现不佳,导致分割精度下降,影响后续的诊断和治疗计划。现有方法难以同时兼顾全局上下文信息和局部细节特征,边缘分割精度有待提高。

核心思路:DB-MSMUNet的核心思路是利用双分支解码器分别处理区域和边缘信息,并结合多尺度Mamba模块增强特征提取能力。通过边缘增强路径(EEP)显式地捕获边界线索,利用多层解码器(MLD)保留精细细节,从而提高分割精度和边缘保持能力。Mamba模块能够有效地建模长距离依赖关系,提升全局上下文建模能力。

技术框架:DB-MSMUNet采用编码器-解码器架构。编码器由多尺度Mamba模块(MSMM)构成,用于提取多尺度特征。解码器分为两个分支:边缘解码器和区域解码器。边缘解码器包含边缘增强路径(EEP),用于捕获边界信息;区域解码器包含多层解码器(MLD),用于重建精细细节。此外,网络还引入了辅助深度监督(ADS)头,以提供更准确的梯度反馈。

关键创新:DB-MSMUNet的关键创新在于以下几点:1) 提出了多尺度Mamba模块(MSMM),结合可变形卷积和多尺度状态空间建模,增强了全局上下文建模和局部变形适应能力。2) 采用了双解码器设计,分别处理区域和边缘信息,提高了分割精度和边缘保持能力。3) 引入了辅助深度监督(ADS)头,提供更准确的梯度反馈,增强了多尺度特征的判别能力。

关键设计:多尺度Mamba模块(MSMM)通过不同尺度的状态空间模型捕捉不同尺度的特征信息。边缘增强路径(EEP)使用卷积操作提取边缘特征,并将其与解码器特征融合。多层解码器(MLD)利用多尺度深度语义特征重建精细细节。辅助深度监督(ADS)头在多个尺度上提供梯度反馈,损失函数包括Dice损失和交叉熵损失。

📊 实验亮点

DB-MSMUNet在NIH Pancreas数据集、MSD数据集和临床胰腺肿瘤数据集上分别取得了89.47%、87.59%和89.02%的Dice相似系数,显著优于现有方法。与现有技术相比,该方法在分割精度、边缘保持和跨数据集的鲁棒性方面均有显著提升,证明了其在实际应用中的有效性。

🎯 应用场景

该研究成果可应用于胰腺癌的计算机辅助诊断和治疗计划。通过精确分割胰腺及其病灶,医生可以更准确地评估肿瘤的大小、位置和侵犯范围,从而制定更有效的治疗方案。此外,该技术还可以用于胰腺疾病的早期筛查和风险评估。

📄 摘要(原文)

Accurate segmentation of the pancreas and its lesions in CT scans is crucial for the precise diagnosis and treatment of pancreatic cancer. However, it remains a highly challenging task due to several factors such as low tissue contrast with surrounding organs, blurry anatomical boundaries, irregular organ shapes, and the small size of lesions. To tackle these issues, we propose DB-MSMUNet (Dual-Branch Multi-scale Mamba UNet), a novel encoder-decoder architecture designed specifically for robust pancreatic segmentation. The encoder is constructed using a Multi-scale Mamba Module (MSMM), which combines deformable convolutions and multi-scale state space modeling to enhance both global context modeling and local deformation adaptation. The network employs a dual-decoder design: the edge decoder introduces an Edge Enhancement Path (EEP) to explicitly capture boundary cues and refine fuzzy contours, while the area decoder incorporates a Multi-layer Decoder (MLD) to preserve fine-grained details and accurately reconstruct small lesions by leveraging multi-scale deep semantic features. Furthermore, Auxiliary Deep Supervision (ADS) heads are added at multiple scales to both decoders, providing more accurate gradient feedback and further enhancing the discriminative capability of multi-scale features. We conduct extensive experiments on three datasets: the NIH Pancreas dataset, the MSD dataset, and a clinical pancreatic tumor dataset provided by collaborating hospitals. DB-MSMUNet achieves Dice Similarity Coefficients of 89.47%, 87.59%, and 89.02%, respectively, outperforming most existing state-of-the-art methods in terms of segmentation accuracy, edge preservation, and robustness across different datasets. These results demonstrate the effectiveness and generalizability of the proposed method for real-world pancreatic CT segmentation tasks.