Stethoscope-guided Supervised Contrastive Learning for Cross-domain Adaptation on Respiratory Sound Classification

📄 arXiv: 2312.09603v1 📥 PDF

作者: June-Woo Kim, Sangmin Bae, Won-Yang Cho, Byungjo Lee, Ho-Young Jung

分类: cs.SD, cs.LG, eess.AS

发布日期: 2023-12-15

备注: accepted to ICASSP 2024


💡 一句话要点

提出听诊器引导的监督对比学习,解决呼吸音分类中的跨域适应问题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 呼吸音分类 跨域适应 监督对比学习 听诊器 领域不变特征

📋 核心要点

  1. 现有呼吸音分类方法受限于数据稀缺和听诊器差异引入的领域偏差,导致模型泛化能力不足。
  2. 论文提出听诊器引导的监督对比学习,旨在减轻领域差异,提升模型对不同听诊器记录的呼吸音的区分能力。
  3. 实验结果表明,该方法在ICBHI数据集上取得了显著提升,ICBHI评分提高了2.16%。

📝 摘要(中文)

由于可用数据稀缺,肺部声音分类的性能提升仍然面临挑战。此外,呼吸音样本来自各种电子听诊器,这可能会给训练后的模型带来偏差。当测试数据集或实际场景中出现显著的分布偏移时,性能会大幅下降。为了解决这个问题,我们引入了跨域适应技术,将知识从源域迁移到不同的目标域。特别地,通过将不同的听诊器类型视为独立的域,我们提出了一种新的听诊器引导的监督对比学习方法。该方法可以减轻任何与域相关的差异,从而使模型能够区分听诊器记录变化引起的呼吸音差异。在ICBHI数据集上的实验结果表明,该方法能有效降低域依赖性,并实现了61.71%的ICBHI评分,比基线提高了2.16%。

🔬 方法详解

问题定义:论文旨在解决呼吸音分类中,由于不同听诊器设备造成的领域差异问题。现有方法在面对来自不同听诊器的数据时,性能会显著下降,因为模型容易受到特定听诊器设备特征的影响,而无法泛化到其他设备。

核心思路:核心思路是将不同类型的听诊器视为不同的领域,利用监督对比学习,使模型学习到与听诊器类型无关的、更具泛化能力的呼吸音特征表示。通过拉近同一呼吸音类别在不同听诊器下的特征距离,同时推远不同类别呼吸音的特征距离,从而减小领域差异。

技术框架:整体框架包含一个特征提取器和一个分类器。首先,使用特征提取器将呼吸音数据转换为特征向量。然后,利用听诊器类型信息,通过监督对比学习损失函数,优化特征提取器,使得来自同一呼吸音类别但不同听诊器的特征向量在特征空间中更加接近。最后,使用分类器对提取的特征进行分类。

关键创新:关键创新在于将监督对比学习与听诊器类型信息相结合,显式地减少了不同听诊器之间的领域差异。传统的对比学习方法通常只关注样本之间的相似性,而忽略了领域信息。该方法通过引入听诊器类型作为监督信号,使得模型能够更好地学习到领域不变的特征表示。

关键设计:关键设计包括:1) 使用预训练的卷积神经网络作为特征提取器;2) 设计了基于听诊器类型的监督对比学习损失函数,该损失函数鼓励同一呼吸音类别在不同听诊器下的特征向量更加接近,同时推远不同类别呼吸音的特征向量;3) 实验中,使用了ICBHI数据集,并将数据集按照听诊器类型进行划分,以模拟不同的领域。

📊 实验亮点

实验结果表明,提出的听诊器引导的监督对比学习方法在ICBHI数据集上取得了显著的性能提升,ICBHI评分达到了61.71%,相比基线方法提高了2.16%。这一结果验证了该方法在减少领域依赖性和提高呼吸音分类准确性方面的有效性。

🎯 应用场景

该研究成果可应用于远程医疗、智能诊断等领域,通过消除不同听诊器设备造成的差异,提高呼吸音分类的准确性和可靠性。这有助于医生更准确地诊断呼吸系统疾病,尤其是在资源有限或缺乏专业医生的地区,具有重要的实际应用价值和潜在的社会效益。

📄 摘要(原文)

Despite the remarkable advances in deep learning technology, achieving satisfactory performance in lung sound classification remains a challenge due to the scarcity of available data. Moreover, the respiratory sound samples are collected from a variety of electronic stethoscopes, which could potentially introduce biases into the trained models. When a significant distribution shift occurs within the test dataset or in a practical scenario, it can substantially decrease the performance. To tackle this issue, we introduce cross-domain adaptation techniques, which transfer the knowledge from a source domain to a distinct target domain. In particular, by considering different stethoscope types as individual domains, we propose a novel stethoscope-guided supervised contrastive learning approach. This method can mitigate any domain-related disparities and thus enables the model to distinguish respiratory sounds of the recording variation of the stethoscope. The experimental results on the ICBHI dataset demonstrate that the proposed methods are effective in reducing the domain dependency and achieving the ICBHI Score of 61.71%, which is a significant improvement of 2.16% over the baseline.