MedCoRAG: Interpretable Hepatology Diagnosis via Hybrid Evidence Retrieval and Multispecialty Consensus

📄 arXiv: 2603.05129v1 📥 PDF

作者: Zheng Li, Jiayi Xu, Zhikai Hu, Hechang Chen, Lele Cong, Yunyun Wang, Shuchao Pang

分类: cs.AI, cs.MA

发布日期: 2026-03-05


💡 一句话要点

MedCoRAG:通过混合证据检索和多学科共识实现可解释的肝病诊断

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 肝病诊断 检索增强生成 多智能体协作 知识图谱 临床指南

📋 核心要点

  1. 现有AI临床诊断方法缺乏透明度、结构化推理和可部署性,难以满足实际临床需求。
  2. MedCoRAG通过混合检索UMLS知识图谱和临床指南,并结合多智能体协作推理,生成可解释的诊断。
  3. 在MIMIC-IV肝病病例上的实验表明,MedCoRAG在诊断性能和推理可解释性方面优于现有方法。

📝 摘要(中文)

准确且可解释的肝病诊断至关重要,但在实际临床环境中仍然具有挑战性。现有的临床诊断AI方法通常缺乏透明度、结构化推理和可部署性。最近的研究利用了大型语言模型(LLM)、检索增强生成(RAG)和多智能体协作。然而,这些方法通常从单一来源检索证据,并且无法支持基于结构化临床数据的迭代式、角色专业化审议。为了解决这个问题,我们提出了MedCoRAG(即医学协作RAG),这是一个端到端框架,它从标准化的异常发现中生成诊断假设,并通过联合检索和修剪UMLS知识图谱路径和临床指南来构建患者特定的证据包。然后,它执行多智能体协作推理:路由器智能体根据病例复杂性动态地调度专家智能体;这些智能体迭代地推理证据并在需要时触发有针对性的重新检索,而通用智能体将所有审议综合成可追溯的共识诊断,从而模拟多学科会诊。来自MIMIC-IV的肝病病例的实验结果表明,MedCoRAG在诊断性能和推理可解释性方面均优于现有方法和闭源模型。

🔬 方法详解

问题定义:论文旨在解决现有AI肝病诊断方法缺乏透明度和可解释性的问题。现有方法通常依赖于单一数据源,无法进行结构化的推理和多学科的协作,导致诊断结果难以理解和信任。此外,现有方法在实际临床部署方面也存在挑战。

核心思路:论文的核心思路是利用检索增强生成(RAG)框架,结合UMLS知识图谱和临床指南,构建患者特定的证据包。然后,通过多智能体协作推理,模拟多学科会诊的过程,从而生成可解释的诊断结果。这种方法旨在提高诊断的准确性和可信度,并促进实际临床应用。

技术框架:MedCoRAG框架包含以下主要模块:1) 诊断假设生成:从标准化的异常发现中生成初步的诊断假设。2) 证据包构建:联合检索和修剪UMLS知识图谱路径和临床指南,构建患者特定的证据包。3) 多智能体协作推理:路由器智能体根据病例复杂性动态地调度专家智能体,这些智能体迭代地推理证据并在需要时触发有针对性的重新检索。通用智能体将所有审议综合成可追溯的共识诊断。

关键创新:该论文的关键创新在于:1) 混合证据检索:同时利用UMLS知识图谱和临床指南,提供更全面和可靠的证据支持。2) 多智能体协作推理:模拟多学科会诊的过程,提高诊断的准确性和可解释性。3) 动态智能体调度:路由器智能体根据病例复杂性动态地调度专家智能体,提高推理效率。

关键设计:论文中关于参数设置、损失函数和网络结构的具体技术细节未详细描述,属于未知信息。但整体框架的设计强调了证据检索的全面性和推理过程的协作性,旨在提高诊断的准确性和可解释性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

MedCoRAG在MIMIC-IV肝病病例上的实验结果表明,其在诊断性能和推理可解释性方面均优于现有方法和闭源模型。具体的性能数据和提升幅度在摘要中未明确给出,属于未知信息,但整体结果表明MedCoRAG具有显著的优势。

🎯 应用场景

MedCoRAG具有广泛的应用前景,可用于辅助医生进行肝病诊断,提高诊断效率和准确性。该框架还可以应用于其他疾病的诊断,促进医疗人工智能的发展。此外,MedCoRAG的可解释性使其能够用于医学教育和培训,帮助医学生理解诊断过程和推理逻辑。

📄 摘要(原文)

Diagnosing hepatic diseases accurately and interpretably is critical, yet it remains challenging in real-world clinical settings. Existing AI approaches for clinical diagnosis often lack transparency, structured reasoning, and deployability. Recent efforts have leveraged large language models (LLMs), retrieval-augmented generation (RAG), and multi-agent collaboration. However, these approaches typically retrieve evidence from a single source and fail to support iterative, role-specialized deliberation grounded in structured clinical data. To address this, we propose MedCoRAG (i.e., Medical Collaborative RAG), an end-to-end framework that generates diagnostic hypotheses from standardized abnormal findings and constructs a patient-specific evidence package by jointly retrieving and pruning UMLS knowledge graph paths and clinical guidelines. It then performs Multi-Agent Collaborative Reasoning: a Router Agent dynamically dispatches Specialist Agents based on case complexity; these agents iteratively reason over the evidence and trigger targeted re-retrievals when needed, while a Generalist Agent synthesizes all deliberations into a traceable consensus diagnosis that emulates multidisciplinary consultation. Experimental results on hepatic disease cases from MIMIC-IV show that MedCoRAG outperforms existing methods and closed-source models in both diagnostic performance and reasoning interpretability.