Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors
作者: Ya Zhou, Zhaohong Sun, Tianxiang Hao, Xiangjie Li
分类: stat.AP, cs.AI, cs.LG, stat.ME, stat.ML
发布日期: 2026-03-03
💡 一句话要点
提出基于可解释 ECG 基础模型预测器的广义加性模型,用于心血管疾病检测。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 心电图分析 结构性心脏病检测 广义加性模型 可解释人工智能 深度学习 特征工程 临床诊断
📋 核心要点
- 现有基于AI的心电图SHD检测方法是黑盒模型,缺乏可解释性,限制了临床应用。
- 提出一种可解释的框架,将临床有意义的ECG基础模型预测器集成到广义加性模型中,实现透明风险归因。
- 实验表明,该方法在AUROC、AUPRC和F1得分上优于现有深度学习基线,且仅用30%数据即可达到更好性能。
📝 摘要(中文)
结构性心脏病(SHD)是一种常见疾病,但许多病例未被诊断,早期检测常受限于超声心动图(ECHO)的高成本和可及性。最近的研究表明,基于人工智能(AI)的心电图(ECG)分析可以检测SHD,提供了一种可扩展的替代方案。然而,现有方法是完全的黑盒模型,限制了解释性和临床应用。为了应对这些挑战,我们提出了一种可解释且有效的框架,该框架将临床上有意义的ECG基础模型预测器集成到广义加性模型中,从而在保持强大预测性能的同时实现透明的风险归因。在使用超过80,000个ECG-ECHO对的EchoNext基准测试中,该方法相对于最新的最先进深度学习基线,在AUROC中实现了+0.98%的相对改进,在AUPRC中实现了+1.01%的相对改进,在F1得分中实现了+1.41%的相对改进,即使仅使用30%的训练数据,也能获得略微更好的性能。亚组分析证实了在异构人群中的稳健性能,并且估计的逐条函数提供了对传统ECG诊断风险与SHD之间关系的可解释的见解。这项工作展示了经典统计建模和现代AI之间的一种互补范例,为基于ECG的可解释、高性能和临床可操作的SHD筛查提供了一条途径。
🔬 方法详解
问题定义:论文旨在解决结构性心脏病(SHD)的早期检测问题,现有基于心电图(ECG)的深度学习方法虽然有效,但缺乏可解释性,难以在临床上广泛应用。医生无法理解模型做出诊断的依据,导致信任度低,阻碍了实际应用。
核心思路:论文的核心思路是将深度学习提取的特征与传统的统计建模方法相结合,利用深度学习模型作为特征提取器,提取具有临床意义的ECG特征,然后使用可解释的广义加性模型(GAM)进行预测。这样既能保持深度学习的预测性能,又能提供模型的可解释性。
技术框架:整体框架包含两个主要阶段:1) 使用预训练的ECG基础模型(如EchoNext中使用的模型)提取ECG特征,这些特征代表了临床上已知的与心脏疾病相关的指标。2) 将这些特征输入到广义加性模型(GAM)中,GAM通过学习每个特征与SHD风险之间的关系,进行最终的预测。GAM能够提供每个特征对预测结果的贡献度,从而实现可解释性。
关键创新:最重要的创新点在于将深度学习的特征提取能力与广义加性模型的可解释性相结合。与完全依赖深度学习的黑盒模型不同,该方法能够解释每个ECG特征对SHD风险的影响,为医生提供有价值的诊断信息。此外,该方法在数据量较少的情况下也能取得较好的性能,降低了对大规模数据集的依赖。
关键设计:论文使用了预训练的ECG基础模型来提取特征,这些特征是临床医生熟悉的ECG指标。广义加性模型使用了样条函数来拟合每个特征与SHD风险之间的关系,从而能够捕捉非线性关系。论文还进行了亚组分析,以验证模型在不同人群中的鲁棒性。损失函数和网络结构沿用了EchoNext基准中的设置,重点在于如何利用这些预训练模型提取的特征,并将其融入到可解释的GAM模型中。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在EchoNext基准测试中,相对于最先进的深度学习基线,AUROC提升了0.98%,AUPRC提升了1.01%,F1得分提升了1.41%。更重要的是,即使仅使用30%的训练数据,该方法也能获得略微更好的性能,表明其具有较好的数据效率。亚组分析也验证了模型在不同人群中的鲁棒性。
🎯 应用场景
该研究成果可应用于大规模SHD筛查,尤其是在资源有限的地区,通过低成本的心电图设备和AI辅助诊断,实现早期检测和干预。该方法的可解释性有助于医生理解诊断结果,提高信任度,促进临床应用。未来,该方法可扩展到其他心血管疾病的诊断,并与其他临床数据结合,提供更全面的诊断信息。
📄 摘要(原文)
Structural heart disease (SHD) is a prevalent condition with many undiagnosed cases, and early detection is often limited by the high cost and accessibility constraints of echocardiography (ECHO). Recent studies show that artificial intelligence (AI)-based analysis of electrocardiograms (ECGs) can detect SHD, offering a scalable alternative. However, existing methods are fully black-box models, limiting interpretability and clinical adoption. To address these challenges, we propose an interpretable and effective framework that integrates clinically meaningful ECG foundation-model predictors within a generalized additive model, enabling transparent risk attribution while maintaining strong predictive performance. Using the EchoNext benchmark of over 80,000 ECG-ECHO pairs, the method demonstrates relative improvements of +0.98% in AUROC, +1.01% in AUPRC, and +1.41% in F1 score over the latest state-of-the-art deep-learning baseline, while achieving slightly better performance even with only 30% of the training data. Subgroup analyses confirm robust performance across heterogeneous populations, and the estimated entry-wise functions provide interpretable insights into the relationships between risks of traditional ECG diagnoses and SHD. This work illustrates a complementary paradigm between classical statistical modeling and modern AI, offering a pathway to interpretable, high-performing, and clinically actionable ECG-based SHD screening.