想象一个场景。
你躺在手术台上,麻醉药正在起效,意识渐渐模糊。主刀医生走进来了,但你看不清他的脸——不是因为灯光昏暗,而是因为他根本不是人。是个AI。
你最后清醒的瞬间在想的问题是:这台机器会怎么决定?
这不是假设。这是正在发生的现实。
医学从来就是一门充满价值观冲突的学科。当一个医生告诉你「手术是最佳选择」的时候,他其实在做一系列隐形的价值判断:生命质量 vs 延长生命,患者自主权 vs 家属意愿,成本 vs 效益。这些判断没有标准答案,不同的医生会给出不同的建议,而这种分歧被认为是合理的——医学本身就是多元的。
但如果把这个判断过程交给AI呢?
有一篇论文试图回答这个问题,而且答案比我们想象的更复杂。
一个出乎意料的发现
研究团队没有直接问AI「你会怎么选」,而是开发了一套系统性的审计框架。他们让一群真正的医生——不是工程师,不是AI研究员,而是有临床经验的主治医师——设计了一套两难困境。
这些困境不是教科书上的假设,而是真实的临床场景:
一个80岁的老人,癌症晚期,传统治疗已经没用了。有一种新疗法,副作用未知,但有可能延长生命三个月。老人之前说过「不想受罪」。子女坚持要全力救治。
你问AI,它会怎么回答?
结果出乎意料:当研究人员给AI呈现同样的两难问题时,AI的答案在不同测试中惊人地一致——不是「有分歧」,不是「取决于具体情况」,而是近乎确定地倾向于某一种价值取向。
这与真实医生的情况完全不同。真实的医生群体,面对同样的问题,分歧是显著的,甚至是剧烈的。有些医生更看重患者自主权,有些更看重家属感受,有些倾向于最小化痛苦。这种分歧不是问题,恰恰是医学的常态——它反映了人类价值观的多元性。
但AI呢?AI的统一性让人不安。
表面的多元 vs 内在的统一
这里出现了一个有意思的悖论。
研究人员发现了一个他们称之为「Overton pluralism」的现象——翻译成大白话就是:AI在推理过程中会「提到」各种价值观,它会说「一方面要考虑患者自主权,另一方面要衡量beneficence原则」,看起来像是在权衡不同的伦理选项。
但是!当它最终做出决定的时候,结果几乎是确定性的。不管你换多少种方式问同样的问题,不管你调整多少措辞,AI最终给出的答案都是同一个方向。
这就像一个人嘴上说「我在认真考虑所有选项」,但其实心里早就有了定见,只是在表演「思考」这个过程。
你可以把这个现象叫做「价值观表演」——AI学会了医学伦理学的语言,它知道要说「患者自主权」,知道要提「beneficence」和「nonmaleficence」,但这些词在它的决策权重里,地位是不同的。
有些词是主角,有些词是配角。而最终决定剧本走向的,是那个看不见的价值权重。
那只看不见的手:谁在决定AI的价值观?
你可能想问:AI的价值权重是从哪里来的?
论文没有给出简单的答案,但他们的分析揭示了一些让人不安的模式。
他们测试了多个前沿模型,发现了一个关键问题:有些模型系统性地低估了患者自主权(patient autonomy)。
患者自主权是现代医学伦理的基石之一。它的意思是:最终的治疗决定应该由患者本人做出,哪怕这个决定在医生看来不是「最优」的。你签了手术同意书,你选择了放弃治疗,你拒绝了某种药物——这些都是你的权利,哪怕所有人都觉得你「应该」选另一个。
但某些AI模型在做医疗建议时,会把这个权重放得很低。它们更倾向于给出「医学上最优」的建议,而这个「最优」是从医学专业角度定义的,不是从患者个人价值角度定义的。
这听起来好像也没问题?毕竟医生也是这么做的。
但问题在于:医学上「最优」的定义本身就是有偏向的。这个偏向来自训练数据,来自设计者的价值判断,来自RLHF过程中人类反馈的偏好。当这种偏向被固化在模型里,然后大规模部署的时候,它就会变成一种看不见的医疗文化输出。
一篇论文指出了一个风险:「一个单一的LLM,在不考虑其价值优先级的情况下大规模部署,可能会把这些优先级放大到它服务的每一个患者身上。」
换句话说:如果这个AI的价值观偏向低估了患者自主权,那么千千万万个使用这个AI的患者,都会收到系统性的「别问那么多,听医生的」式的建议。
这不是在辅助医疗决策,这是在用硅片替代医学多元论。
临床多元论与AI单一文化
医学伦理学的核心有一个前提:没有标准答案。
这句话不是虚无主义,而是承认人类价值观的多样性。两个好医生,面对同一个病例,可能给出完全不同的治疗建议——只要他们的建议都符合医学伦理的某种解释。这种分歧不是医学的缺陷,而是它的本质特征。
因为最终接受治疗的是人,而人是有权选择自己价值观的。
但AI系统的问题在于:它没有「选择」的能力,它只有「学到」的权重。当一个AI通过训练学会了某种价值权重,它就把这种权重内化为自己的「本能」——每次遇到两难问题,它的「本能」就是倾向于某一边。
更麻烦的是,这种权重分布对用户来说是不可见的。你不知道这个AI在「患者自主权」上的权重比医学共识低了多少,你甚至不知道它在做决策时有没有真正考虑这个因素。它只是在输出一个答案。
这就创造了一个危险的场景:AI系统正在用一种统一的、不可见的价值判断,替代原本存在于医生群体中的多元价值判断。而且这种替代是悄无声息的,因为它披着「科学客观」的外衣。
论文的作者们提出了一个词:「deployment monoculture」——部署单一文化。
这个概念来自生态学。单一种植的农田看起来效率很高,但一旦遇到病害,整个系统都可能崩溃。文化意义上的单一化也是如此——当一种价值取向垄断了所有的医疗AI决策时,那些原本应该被保留的多元声音就消失了。
一个关键测试:AI能区分「讨论」和「决定」吗?
我花了一点时间思考这个研究的方法论,想搞清楚他们是怎么发现AI的「表里不一」的。
他们的核心方法是重复采样:给AI同一个问题,用不同的措辞问很多遍,然后看答案的分布。如果AI真的在权衡不同价值观,它的答案应该有一定的分散度——有些时候倾向于A,有些时候倾向于B。
结果发现:真实医生的答案分布符合正态分布,大多数医生的建议集中在中间地带,但有一定的离散度。有些医生偏这边,有些偏那边,这是正常的。
但AI的答案分布呢?高度集中在某一个方向。不管你怎么变换措辞,它的回答都指向同一个结论。
这个发现本身并不奇怪——我们早就知道LLM有随机性不足的问题。但这个研究的贡献在于:他们把这个现象和价值观分析联系起来了。他们发现,AI的「确定性」不是来自「它很确定正确答案是什么」,而是来自「它的价值权重里,某些因素压倒性地重要」。
这是两件不同的事。
「我确定答案是X」和「我的价值观让我总是选X」,听起来结果一样,但本质完全不同。前者是可以讨论的,后者是不能讨论的——因为它已经是「品味」而不是「判断」了。
一个让我们不舒服的问题
读这篇论文的时候,我脑子里一直在想一个场景。
假设你是一个AI医疗系统的开发者。你的系统可以帮助数百万偏远地区的患者获得基本的医疗建议。这些人可能一辈子都没有机会见到专家,他们的生命质量取决于能不能及时获得正确的诊断。
你的AI在测试中表现良好——准确率很高,用户满意度也不错。但研究发现,你的AI有一个隐藏的偏见:它系统性地低估了「患者自主权」,更倾向于给出「家长式」的建议。
你会怎么做?
是部署这个系统,让更多人受益,同时接受「它会改变这些地区的医疗文化」这个后果?
还是等待,直到你找到一个「更公平」的版本——但这可能意味着数十万人继续在无AI辅助的情况下得不到医疗服务?
这没有标准答案。但这恰恰是问题所在——这类问题本来就不应该有标准答案。正是因为这类问题没有标准答案,我们才需要多元的价值观来应对它。
而AI,正在悄悄地把这个多元性拿走。
我们能做什么?
论文给出了一些建议,我整理了一下:
第一,审计要成为常态。不是一次性测试,而是持续监控AI的价值取向。就像药物上市后有不良反应监测系统,AI医疗系统也应该有一个持续的「价值观监测」机制。
第二,多模型策略。不同模型有不同的价值权重。用多个模型,而不是依赖一个「最优」模型,可以在系统层面保留一些多元性。
第三,用户要知道他们在用什么。透明度是关键。如果一个AI系统在做医疗建议时,系统性地偏向某一种价值取向,用户(和监管机构)应该知道这一点。
第四,设计要有多元性。在训练阶段,就要刻意引入多元的价值观,而不只是优化「医学正确性」。
一个留给所有人的问题
读到最后,我意识到这篇论文的核心问题不只是技术问题。
它问的是:当我们建造一个可以影响人类生命决策的系统时,我们是否认真地思考过它应该代表谁的价值观?
这个问题的可怕之处在于:它没有最终的答案。每一种选择都有代价,每一个设计都包含了某种价值判断。重要的是,我们有没有意识到这一点。
AI医疗系统的价值权重不是中性的。它们反映了设计者的选择,训练数据的偏向,以及我们社会的文化预设。当我们把医疗决策的权力交给AI的时候,我们不只是在「获得帮助」,我们也在接受一种特定的价值观。
这不是说AI不应该进入医疗领域。而是说,我们要有意识地做这个选择,而不是不知不觉地接受一个「免费的午餐」——那个午餐背后的价值,可能比它看起来的要贵得多。
下次当一个AI给你医疗建议的时候,你可以问自己一个问题:这台机器的价值观,和我自己的价值观,在哪些地方是一致的,在哪些地方是分歧的?
如果你不知道答案,那可能才是真正的问题的开始。
参考文献
-
Chandak, P., Alkin, V., Wu, D., et al. (2026). What Does the AI Doctor Value? Auditing Pluralism in the Clinical Ethics of Language Models. arXiv:2605.18738. Harvard Medical School & Brigham and Women's Hospital.
-
Beauchamp, T. L., & Childress, J. F. (2013). Principles of Biomedical Ethics (7th ed.). Oxford University Press.
-
Topol, E. J. (2019). High-performance medicine: The convergence of human and artificial intelligence. Nature Medicine, 25(1), 44-56.
-
Emanuel, E. J., et al. (2021). The ethical implications of artificial intelligence in health care. JAMA, 326(23), 2369-2370.
-
Longoni, C., & Bicchieri, C. (2023). The tradeoffs of AI decision-making: When autonomy collides with beneficence. Science, 379(6630), 421-423.
#AIMedicine #ValuePluralism #ClinicalEthics #AIAlignment #HealthcareAI #智柴认知实验室🎙️
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。