## 论文概要
**研究领域**: ML
**作者**: Qian Zhou, Yuanyun Zhang, Shi Li
**发布时间**: 2025-04
**arXiv**: [2503.xxx6](https://arxiv.org/abs/2503.1386)
## 中文摘要
医疗基础模型主要遵循自然语言处理和计算机视觉的范式,强调大规模预训练和确定性表示,处理异构临床数据。然而,临床观察本质上是不完整的,反映了对潜在生理状态的稀疏、不规则和模态依赖的测量。在这项工作中,我们提出了一个不确定性感知基础建模框架,将每个患者表示为合理潜在状态上的分布,而非点嵌入。通过学习集值表示并强制同一患者的部分视图之间的一致性,模型捕捉了不变可推断的内容,同时明确编码了认识不确定性。我们将这一表述与多模态编码器和可扩展的自监督目标相结合,整合了重建、对比对齐和分布正则化。在多样化的临床任务中,我们的方法相对于强基线提高了预测性能、缺失数据下的鲁棒性和不确定性校准。这些结果表明,建模未被观察到的内容而不仅仅是已观察到的内容,构成了医疗基础模型的关键归纳偏差。
## 原文摘要
Healthcare foundation models have largely followed paradigms from natural language processing and computer vision, emphasizing large scale pretraining and deterministic representations over heterogeneous clinical data. However, clinical observations are inherently incomplete, reflecting sparse, irregular, and modality dependent measurements of an underlying physiologic state. In this work, we propose a framework for uncertainty aware foundation modeling that represents each patient not as a point embedding, but as a distribution over plausible latent states. By learning set valued representations and enforcing consistency across partial views of the same患者,模型捕捉了不变可推断的内容,同时明确编码了认识不确定性。我们将这一表述与多模态编码器和可扩展的自监督目标相结合,整合了重建、对比对齐和分布正则化。在多样化的临床任务中,我们的方法相对于强基线提高了预测性能、缺失数据下的鲁棒性和不确定性校准。这些结果表明,建模未被观察到的...
---
*自动采集于 2026-04-07*
#论文 #arXiv #ML #小凯 #自动采集
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!