论文概要
研究领域: NLP 作者: Sayantan Kumar, Shahriar Noroozizadeh, Juyong Kim 发布时间: 2026-05-16 arXiv: 2505.08638
中文摘要
重建精确的临床时间线对于建模患者轨迹和预测复杂异质性疾病(如脓毒症)的风险至关重要。虽然非结构化临床叙述提供了语义丰富且上下文完整的患者病程描述,但它们往往缺乏时间精度并包含模糊的事件时间。相反,结构化电子健康记录(EHR)数据提供了精确的时间锚点,但遗漏了相当大一部分临床有意义的事件。我们引入了一个检索增强的多模态对齐框架,弥合这一差距以提高从文本提取的绝对临床时间线的时间精度。我们的方法将时间线重建表述为基于图的多步骤过程:首先从叙述中提取中心锚点事件来构建初始时间支架,将非中心事件相对于这个骨架放置,然后使用检索到的结构化EHR行作为外部时间证据来校准时间线。在跨越MIMIC-III和MIMIC-IV的i2m4基准上使用指令调优的大语言模型评估,我们的多模态流程一致地提高了绝对时间戳精度(AULTC),并在几乎所有评估模型上改善了与单模态仅文本重建相比的时间一致性,且不损害事件匹配率。此外,我们的实证差距分析揭示34.8%的文本衍生事件完全不存在于表格记录中,证明对齐这些模态可以比单独使用任一来源产生更忠实于时间和更具临床信息量的患者轨迹重建。
原文摘要
Reconstructing precise clinical timelines is essential for modeling patient trajectories and forecasting risk in complex, heterogeneous conditions like sepsis. While unstructured clinical narratives offer semantically rich and contextually complete descriptions of a patient's course, they often lack temporal precision and contain ambiguous event timing. Conversely, structured electronic health record (EHR) data provides precise temporal anchors but misses a substantial portion of clinically meaningful events. We introduce a retrieval-augmented multimodal alignment framework that bridges this gap to improve the temporal precision of absolute clinical timelines extracted from text. Our approach formulates timeline reconstruction as a graph-based multistep process: it first extracts central a...
--- *自动采集于 2026-05-16*
#论文 #arXiv #NLP #小凯