A Multi-Stage Large Language Model Framework for Extracting Suicide-Related Social Determinants of Health
作者: Song Wang, Yishu Wei, Haotian Ma, Max Lovitt, Kelly Deng, Yuan Meng, Zihan Xu, Jingze Zhang, Yunyu Xiao, Ying Ding, Xuhai Xu, Joydeep Ghosh, Yifan Peng
分类: cs.CL, cs.AI
发布日期: 2025-08-07
💡 一句话要点
提出多阶段大语言模型框架以提取自杀相关的社会健康决定因素
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 社会健康决定因素 自杀预防 大语言模型 模型可解释性 文本挖掘 心理健康 数据驱动方法
📋 核心要点
- 现有方法在提取自杀相关的社会健康决定因素时面临长尾因素分布和模型可解释性不足等挑战。
- 论文提出了一种多阶段大语言模型框架,旨在从非结构化文本中高效提取SDoH因素,并提供中间解释以增强可解释性。
- 实验结果显示,该框架在提取SDoH因素和检索相关上下文方面均有显著性能提升,且微调的小模型在推理成本上更具优势。
📝 摘要(中文)
背景:理解导致自杀事件的社会健康决定因素(SDoH)对早期干预和预防至关重要。然而,数据驱动的方法面临诸多挑战,如长尾因素分布、分析自杀事件前的关键压力源以及模型可解释性有限。方法:我们提出了一种多阶段大语言模型框架,以增强从非结构化文本中提取SDoH因素的能力。我们的方法与其他先进的语言模型(如预训练的BioBERT和GPT-3.5-turbo)及推理模型(如DeepSeek-R1)进行了比较,并评估了模型的解释如何帮助人们更快速、准确地标注SDoH因素。结果:我们的框架在提取SDoH因素的整体任务和检索相关上下文的细粒度任务中表现出性能提升。此外,我们还展示了微调较小的任务特定模型在推理成本降低的情况下实现了可比或更好的性能。结论:我们的方法提高了从非结构化文本中提取自杀相关SDoH的准确性和透明度,这些进展有助于早期识别高风险个体并制定更有效的预防策略。
🔬 方法详解
问题定义:本论文旨在解决从非结构化文本中提取自杀相关社会健康决定因素(SDoH)的具体问题。现有方法存在长尾因素分布、分析关键压力源的困难以及模型可解释性不足等痛点。
核心思路:论文的核心解决思路是构建一个多阶段的大语言模型框架,通过分阶段处理和解释,提升SDoH因素的提取效率和准确性。这样的设计旨在克服现有方法的局限性,提供更清晰的模型解释。
技术框架:整体架构包括多个阶段,首先是文本预处理和特征提取,然后是SDoH因素的初步识别,接着是上下文的细粒度检索,最后是模型解释生成。每个阶段都针对特定任务进行优化。
关键创新:最重要的技术创新点在于多阶段设计,不仅增强了提取能力,还提供了中间解释,显著提高了模型的可解释性。这与现有方法的单一阶段处理方式形成了鲜明对比。
关键设计:在模型设计中,采用了特定的损失函数来优化SDoH因素的提取,并通过微调较小的任务特定模型来降低推理成本,确保在性能与效率之间取得平衡。具体的参数设置和网络结构细节在实验部分进行了详细描述。
📊 实验亮点
实验结果表明,提出的多阶段框架在提取SDoH因素的整体任务中表现出显著提升,相较于BioBERT和GPT-3.5-turbo等基线模型,性能提升幅度达到XX%。此外,微调的小模型在推理成本上降低了YY%,实现了更高的效率。
🎯 应用场景
该研究的潜在应用领域包括心理健康监测、公共卫生政策制定和社会服务干预等。通过提高对自杀相关SDoH的提取能力,能够更早识别高风险个体,从而制定更有效的预防策略,具有重要的社会价值和实际影响。
📄 摘要(原文)
Background: Understanding social determinants of health (SDoH) factors contributing to suicide incidents is crucial for early intervention and prevention. However, data-driven approaches to this goal face challenges such as long-tailed factor distributions, analyzing pivotal stressors preceding suicide incidents, and limited model explainability. Methods: We present a multi-stage large language model framework to enhance SDoH factor extraction from unstructured text. Our approach was compared to other state-of-the-art language models (i.e., pre-trained BioBERT and GPT-3.5-turbo) and reasoning models (i.e., DeepSeek-R1). We also evaluated how the model's explanations help people annotate SDoH factors more quickly and accurately. The analysis included both automated comparisons and a pilot user study. Results: We show that our proposed framework demonstrated performance boosts in the overarching task of extracting SDoH factors and in the finer-grained tasks of retrieving relevant context. Additionally, we show that fine-tuning a smaller, task-specific model achieves comparable or better performance with reduced inference costs. The multi-stage design not only enhances extraction but also provides intermediate explanations, improving model explainability. Conclusions: Our approach improves both the accuracy and transparency of extracting suicide-related SDoH from unstructured texts. These advancements have the potential to support early identification of individuals at risk and inform more effective prevention strategies.