EXAONE Path 2.5: Pathology Foundation Model with Multi-Omics Alignment

📄 arXiv: 2512.14019v1 📥 PDF

作者: Juseung Yun, Sunwoo Yu, Sumin Ha, Jonghyun Kim, Janghyeon Lee, Jongseong Jang, Soonyoung Lee

分类: cs.LG, q-bio.QM

发布日期: 2025-12-16


💡 一句话要点

EXAONE Path 2.5:多组学对齐的病理学基础模型,用于更全面的肿瘤生物学理解

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 病理学 多模态学习 组学数据 肿瘤生物学 对比学习 位置编码 精准肿瘤学

📋 核心要点

  1. 现有病理学模型主要依赖图像信息,忽略了基因组学等其他生物层面的信息,限制了对肿瘤生物学的全面理解。
  2. EXAONE Path 2.5通过多模态融合,联合建模组织学、基因组学、表观基因组学和转录组学数据,构建更全面的患者表征。
  3. 该模型在Patho-Bench上达到SOTA性能,并在内部临床数据集上表现出更高的适应性,验证了多模态融合的有效性。

📝 摘要(中文)

癌症进展源于多个生物层面的相互作用,特别是形态学之外以及图像模型无法捕捉的分子层面。为了捕捉更广泛的生物图景,我们提出了EXAONE Path 2.5,一个病理学基础模型,它联合建模组织学、基因组学、表观基因组学和转录组学模态,产生一个综合的患者表征,更全面地反映肿瘤生物学。我们的方法包含三个关键组成部分:(1)多模态SigLIP损失,支持跨异构模态的所有成对对比学习;(2)片段感知旋转位置编码(F-RoPE)模块,在WSI中保留空间结构和组织片段拓扑;(3)WSI和RNA-seq的领域专用内部基础模型,为稳健的多模态对齐提供生物学基础的嵌入。我们在两个互补的基准上评估了EXAONE Path 2.5,一个是内部真实临床数据集,另一个是涵盖80个任务的Patho-Bench基准。我们的框架展示了高数据和参数效率,在Patho-Bench上实现了与最先进的基础模型相当的性能,同时在内部临床环境中表现出最高的适应性。这些结果突出了生物信息多模态设计的价值,并强调了用于下一代精准肿瘤学的整合基因型到表型建模的潜力。

🔬 方法详解

问题定义:现有病理学基础模型主要依赖于组织病理学图像,忽略了基因组学、表观基因组学和转录组学等其他重要的生物信息。这导致模型无法全面理解肿瘤的复杂生物学机制,限制了其在精准肿瘤学中的应用。现有方法难以有效地整合这些异构数据,并从中学习到有意义的关联。

核心思路:EXAONE Path 2.5的核心思路是通过多模态学习,将组织病理学图像与基因组学、表观基因组学和转录组学数据进行有效整合,从而构建一个更全面的肿瘤生物学表征。这种多模态融合能够捕捉不同生物层面的相互作用,揭示肿瘤进展的潜在机制。这样设计的原因在于,癌症的发生发展是多因素共同作用的结果,单一模态的信息无法提供完整的图景。

技术框架:EXAONE Path 2.5的技术框架主要包含三个关键模块:1) 多模态SigLIP损失:用于跨异构模态进行所有成对的对比学习,促进不同模态之间的信息对齐。2) 片段感知旋转位置编码(F-RoPE):用于在全切片图像(WSI)中保留空间结构和组织片段的拓扑关系,提高模型对空间信息的利用能力。3) 领域专用内部基础模型:分别为WSI和RNA-seq设计,提供生物学基础的嵌入,增强多模态对齐的鲁棒性。整体流程是先分别对不同模态的数据进行预处理和特征提取,然后通过多模态SigLIP损失进行对齐和融合,最终得到一个综合的患者表征。

关键创新:该论文的关键创新在于多模态融合策略和F-RoPE模块的设计。多模态融合策略通过SigLIP损失实现了跨异构模态的有效对齐,而F-RoPE模块则能够更好地保留WSI中的空间信息。与现有方法相比,EXAONE Path 2.5能够更全面地捕捉肿瘤的生物学特征,并提高模型在临床应用中的适应性。

关键设计:在多模态SigLIP损失中,作者采用了对比学习的方法,通过最大化正样本对之间的相似性,最小化负样本对之间的相似性,从而实现不同模态之间的信息对齐。F-RoPE模块则通过引入旋转位置编码,能够更好地保留WSI中的空间结构和组织片段的拓扑关系。此外,作者还针对WSI和RNA-seq设计了领域专用的内部基础模型,以提供生物学基础的嵌入。

📊 实验亮点

EXAONE Path 2.5在Patho-Bench基准测试中达到了与最先进的基础模型相当的性能,同时在内部临床数据集上表现出更高的适应性。这表明该模型在实际临床应用中具有更强的泛化能力和鲁棒性。此外,该模型还具有高数据和参数效率,能够在有限的数据集上取得良好的性能。

🎯 应用场景

EXAONE Path 2.5在精准肿瘤学领域具有广泛的应用前景,可用于癌症诊断、预后预测、治疗方案选择和药物研发。通过整合多组学数据,该模型能够更全面地理解肿瘤的生物学特征,从而为临床决策提供更准确的依据。未来,该模型有望应用于个性化治疗方案的制定,提高癌症治疗的有效性和患者的生存率。

📄 摘要(原文)

Cancer progression arises from interactions across multiple biological layers, especially beyond morphological and across molecular layers that remain invisible to image-only models. To capture this broader biological landscape, we present EXAONE Path 2.5, a pathology foundation model that jointly models histologic, genomic, epigenetic and transcriptomic modalities, producing an integrated patient representation that reflects tumor biology more comprehensively. Our approach incorporates three key components: (1) multimodal SigLIP loss enabling all-pairwise contrastive learning across heterogeneous modalities, (2) a fragment-aware rotary positional encoding (F-RoPE) module that preserves spatial structure and tissue-fragment topology in WSI, and (3) domain-specialized internal foundation models for both WSI and RNA-seq to provide biologically grounded embeddings for robust multimodal alignment. We evaluate EXAONE Path 2.5 against six leading pathology foundation models across two complementary benchmarks: an internal real-world clinical dataset and the Patho-Bench benchmark covering 80 tasks. Our framework demonstrates high data and parameter efficiency, achieving on-par performance with state-of-the-art foundation models on Patho-Bench while exhibiting the highest adaptability in the internal clinical setting. These results highlight the value of biologically informed multimodal design and underscore the potential of integrated genotype-to-phenotype modeling for next-generation precision oncology.