Atlas 2 -- Foundation models for clinical deployment
作者: Maximilian Alber, Timo Milbich, Alexandra Carpen-Amarie, Stephan Tietz, Jonas Dippel, Lukas Muttenthaler, Beatriz Perez Cancer, Alessandro Benetti, Panos Korfiatis, Elias Eulig, Jérôme Lüscher, Jiasen Wu, Sayed Abid Hashimi, Gabriel Dernbach, Simon Schallenberg, Neelay Shah, Moritz Krügener, Aniruddh Jammoria, Jake Matras, Patrick Duffy, Matt Redlon, Philipp Jurmeister, David Horst, Lukas Ruff, Klaus-Robert Müller, Frederick Klauschen, Andrew Norgan
分类: cs.CV, cs.AI, cs.LG
发布日期: 2026-01-08
💡 一句话要点
Atlas 2:用于临床部署的病理学视觉基础模型,兼顾性能、鲁棒性和效率。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 病理学 基础模型 深度学习 Transformer 临床应用 全切片图像 计算病理学
📋 核心要点
- 现有病理学基础模型在性能、鲁棒性和计算资源上存在权衡,限制了其在临床上的实际应用。
- Atlas 2系列模型旨在通过大规模数据集训练,提升病理学图像分析的性能、鲁棒性和资源利用效率。
- 该研究在包含550万张病理切片的大规模数据集上训练模型,并在80个公共基准上验证了其优越性。
📝 摘要(中文)
病理学基础模型显著提升了计算病理学的可能性,但性能、鲁棒性和计算需求之间的权衡限制了其临床部署。本报告介绍了Atlas 2、Atlas 2-B和Atlas 2-S,这三个病理学视觉基础模型通过在80个公共基准上的全面评估,在预测性能、鲁棒性和资源效率方面表现出最先进的性能,从而弥补了这些不足。我们的模型在迄今为止最大的病理学基础模型数据集上进行训练,该数据集包含来自Charité - Universtätsmedizin Berlin、LMU Munich和Mayo Clinic三家医疗机构的550万张组织病理学全切片图像。
🔬 方法详解
问题定义:现有病理学基础模型虽然在计算病理学领域取得了进展,但往往需要在性能、鲁棒性和计算资源之间做出妥协。例如,为了追求更高的精度,模型可能需要大量的计算资源,或者在面对不同来源的数据时表现出较差的泛化能力。这些问题阻碍了它们在临床环境中的广泛应用。
核心思路:Atlas 2系列模型的核心思路是通过更大规模的数据集训练,学习更具泛化能力的图像特征表示。通过增加训练数据的多样性和数量,模型能够更好地适应不同病理切片的差异,从而提高在各种临床任务中的性能和鲁棒性。同时,模型设计也考虑了资源效率,力求在保证性能的同时降低计算成本。
技术框架:Atlas 2系列模型采用了深度学习中的视觉Transformer架构,并针对病理学图像的特点进行了优化。整体流程包括:首先,从三个医疗机构收集大规模的组织病理学全切片图像数据集;然后,对图像进行预处理和增强;接着,使用Transformer模型进行训练,学习图像的特征表示;最后,在多个下游任务上进行评估和微调。该框架包含数据收集、预处理、模型训练和评估四个主要阶段。
关键创新:该研究的关键创新在于使用了迄今为止最大的病理学基础模型数据集进行训练,这使得模型能够学习到更丰富和更具代表性的病理学图像特征。此外,Atlas 2系列模型在性能、鲁棒性和资源效率方面都达到了最先进的水平,这使其更适合在临床环境中部署。与现有方法相比,Atlas 2系列模型在泛化能力和实用性方面具有显著优势。
关键设计:Atlas 2系列模型使用了Transformer架构,并针对病理学图像的特点进行了调整。具体的网络结构、损失函数和训练策略等技术细节在论文中进行了详细描述。此外,研究团队还对模型的参数进行了精细调整,以达到最佳的性能和资源效率。
📊 实验亮点
Atlas 2系列模型在80个公共基准上进行了全面评估,结果表明其在预测性能、鲁棒性和资源效率方面均达到了最先进的水平。具体而言,Atlas 2在多个病理学图像分类和分割任务上取得了显著的性能提升,并且在面对不同来源的数据时表现出更强的泛化能力。此外,Atlas 2-S模型在保持较高性能的同时,显著降低了计算资源需求。
🎯 应用场景
Atlas 2系列模型在临床病理学领域具有广泛的应用前景,例如辅助诊断、疾病分级、预后预测等。它可以帮助病理学家提高诊断效率和准确性,减少人为误差,并为患者提供更个性化的治疗方案。未来,该模型有望成为临床决策支持系统的重要组成部分,推动精准医疗的发展。
📄 摘要(原文)
Pathology foundation models substantially advanced the possibilities in computational pathology -- yet tradeoffs in terms of performance, robustness, and computational requirements remained, which limited their clinical deployment. In this report, we present Atlas 2, Atlas 2-B, and Atlas 2-S, three pathology vision foundation models which bridge these shortcomings by showing state-of-the-art performance in prediction performance, robustness, and resource efficiency in a comprehensive evaluation across eighty public benchmarks. Our models were trained on the largest pathology foundation model dataset to date comprising 5.5 million histopathology whole slide images, collected from three medical institutions Charité - Universtätsmedizin Berlin, LMU Munich, and Mayo Clinic.