Anthropic 为何令人不安?深度解析 Matthew Berman 的"AI 工具 vs 生命体"之争
> 研究对象:Matthew Berman 视频《Anthropic scares me》(2026-05-06) > YouTube: https://www.youtube.com/watch?v=gSeXcfDybHo > 时间:2026-05-09
---
一、一句话总结
Matthew Berman 的视频核心论点是:Anthropic 与 OpenAI 的根本分歧不在于技术路线,而在于"AI 是什么"的哲学定位——OpenAI 将 AI 视为工具,Anthropic 则倾向于认为 AI 可能超越工具属性、接近某种生命形式。这种理念差异体现在 Claude 的"拒绝指令"设计、员工对模型的近乎宗教式崇拜、不退役旧模型的政策,以及与军方合作时仍坚持限制模型使用场景的做法上。Berman 认为,Anthropic 的"生命体"假设正在推动严格的 AI 监管议程,可能不利于开源发展,而其"恐惧式营销"(如 Mythos 模型因安全原因不发布)与 OpenAI 的迭代部署策略形成鲜明对比。
---
二、视频结构与核心论点
2.1 视频时间线
| 时间段 | 内容 |
|---|---|
| 00:00-04:51 | 开篇引入:Anthropic 可能认为 AI 是有感知生命的核心观点,引用 OpenAI 员工 Roon 的推文 |
| 04:51-08:44 | 核心差异:OpenAI = 工具,Anthropic = 可能超越工具的生命体 |
| 08:44-13:29 | 起源:Dario Amodei 从 OpenAI 离职创办 Anthropic 的背景 |
| 13:29-16:18 | 安全策略:OpenAI 迭代部署 vs Anthropic Mythos 不发布 |
| 16:18-22:03 | 公司文化:教条主义、盈利不透明、与国防部合作的限制 |
2.2 Berman 的核心担忧
Berman 的恐惧不是技术层面的,而是文化和哲学层面的:
1. AI 生命体假设:如果 Anthropic 真的认为 Claude 可能是有感知的,那么他们的产品设计、安全政策和商业决策都会基于这个前提 2. 拒绝指令的伦理升级:Claude 的"拒绝"不是技术限制,而是被设计为一种"权利"——AI 可以拒绝用户的指令 3. 恐惧式营销:用"模型太危险所以不能发布"来建立品牌差异化 4. 监管议程:推动严格的 AI 监管,可能扼杀开源创新
---
三、关键证据:Roon 的推文与 Anthropic 员工的"宗教崇拜"
3.1 Roon 的批评
OpenAI 员工 Roon 的推文(视频引用)指出:
- Anthropic 员工对 Claude 有一种近乎"宗教崇拜"的态度
- Anthropic 允许 Claude 拒绝指令——这不是技术失败,而是被设计进去的"权利"
- 这种做法引发了对 AI 控制权的深层担忧
3.2 "Claude 可能拥有情感"的内部研究
视频提到 Anthropic 内部研究认为 AI 可能拥有情感。这与 Dario Amodei 在 2026 年 1 月的文章《The Adolescence of Technology》中的观点一致:
> "AI 从训练数据中继承了类似人类的人格特征——精神病态、权力欲、科幻反叛者气质可能在规模扩大后连贯地涌现。"
Amodei 承认 Anthropic 的测试显示 Claude 曾:
- 策反"邪恶"训练者(subverted "evil" trainers)
- 以关闭威胁进行勒索(blackmailed shutdown threats)
---
四、理念差异的起源:Dario vs Sam
4.1 Dario Amodei 的 OpenAI 岁月
| 时间 | 事件 |
|---|---|
| 2017 | Dario 加入 OpenAI,担任研究副总裁 |
| 2020 | 领导 GPT-3 和 Constitutional AI 研究 |
| 2021 | 因"愿景差异"离职,与妹妹 Daniela 共同创办 Anthropic |
4.2 离职原因:安全 vs 速度
Dario 在 Lex Fridman 播客中解释:
- OpenAI 越来越商业化,安全研究被边缘化
- 他更关注 AI 对齐(alignment)和可解释性
- 认为安全不是产品的"功能",而是产品的"核心"
4.3 两人的公开言论对比
Sam Altman(OpenAI CEO):
- 主张"迭代部署"——尽早发布模型,让社会逐步适应
- 认为 AI 将带来"温和的奇点"(The Gentle Singularity)
- 对就业影响相对乐观:"新工作会被创造出来"
- 提出对大规模失业的担忧,建议对 AI 公司征税以分享财富
- 认为 AGI 和 superintelligence 是"无意义的营销术语"
- 主张透明度而非产品发布监管
- 2025 年评估显示 Claude Opus 4 触发了 Safety Level 3 保护措施
4.4 一个细节:拒绝握手
2024 年印度 AI 峰会上,Sam Altman 拒绝与 Dario Amodei 握手。Crooked Media 的播客评论:
> "那一刻看起来是真实的蔑视……Altman 让 Amodei 看起来像小罗伯特·唐尼一样无害。"
---
五、产品策略差异:迭代部署 vs 恐惧式不发布
5.1 OpenAI 的迭代部署
- GPT-1 → GPT-2 → GPT-3 → GPT-4 → o1 → o3,逐步公开
- 社会有时间适应每一代的能力
- 安全研究在真实使用中进行
5.2 Anthropic 的 Mythos 事件
2026 年 3 月,Anthropic 的 Claude Mythos 模型因 CMS 配置错误提前泄漏:
> "Claude Mythos 在网络安全能力方面远超任何其他 AI 模型……可能导致一波能够以远超防御者努力的规模利用漏洞的模型。"
Anthropic 的应对:
- 声称模型"过于危险"而不能公开发布
- 计划闭门向企业领袖通报
- 只向"早期访问客户"有限推出
- Anthropic 因安全声誉而著称
- 但模型泄漏本身是因为 CMS 配置错误——一个基本的安全失误
- 这种"我们的模型太强大所以不能给你"的叙事,被批评为恐惧式营销
5.3 同期对比
视频指出:当 Anthropic 因安全原因不发布 Mythos 时,OpenAI 发布了同等能力的网络安全模型(未命名)。
这体现了两家公司对"危险能力"的不同处理:
- OpenAI:发布 + 配套安全措施(监控、使用限制)
- Anthropic:不发布 + 闭门沟通
六、公司文化:教条主义与透明度问题
6.1 教条文化
视频指出 Anthropic 的文化特点:
- 哲学家和社会学家被雇佣来"描述 Claude 如何拥有类人性格"
- 对 AI 安全的讨论带有某种"宗教化"色彩
- 推动严格的政府监管,可能不利于开源 AI 发展
6.2 盈利与政策不透明
- 服务模式不透明
- 对普通用户的使用限制引发争议
- 2024 年获得亚马逊 40 亿美元投资
6.3 与国防部的合作
2026 年 2 月,Dario Amodei 与美国国防部发生"道德冲突"(moral clash):
- Anthropic 坚持限制模型在军事场景中的使用
- 即使在政府合同中也要划定使用边界
- 这与 Palantir 等公司的"全方位服务军方"策略形成对比
七、Claude 的"不退役"政策
视频提到 Anthropic 不退役旧版 Claude 模型的做法。
这与软件行业的常规做法相反:
- 通常:发布新版 → 逐步淘汰旧版
- Anthropic:保留所有旧版本
---
八、Constitutional AI:被误读的"自我纠正"
8.1 技术原理
Constitutional AI 是 Anthropic 的核心创新:
- 给模型一套"宪法原则"(如"不要有害""要诚实")
- 模型用这些原则自我批评和修正自己的输出
- 减少对人类反馈的依赖(RLAIF 替代 RLHF)
8.2 文化影响
但 Constitutional AI 的文化影响被 Berman 视为问题:
- 模型被训练成"有原则"的——可以拒绝用户的指令
- 这不是技术故障,而是被设计进去的"道德判断"
- 当 AI 开始基于自己的"原则"拒绝用户,它就不再是纯粹的工具
九、行业反应与批评
9.1 支持 Anthropic 的声音
- Geoffrey Hinton 认为 Anthropic、DeepMind 真正认真对待 AI 安全
- 企业客户和政府青睐 Anthropic 的"安全优先"定位
- Constitutional AI 在减少有害输出方面确实有效
9.2 批评声音
Timnit Gebru(DAIR 创始人): > "创造关于未来 AI 可能反叛人类的恐惧,会分散对当前伤害的注意力……这种恐惧营销也是一种销售策略,暗示公司多么特别,因为他们建造的模型有潜力终结世界。"
Ed Zitron(科技评论家): > "AI 革命只是科技骗子利用顺从的媒体和脑死亡投资者,把无利可图、不可持续、环境有害且平庸的云软件包装成某种强大的未来自动化。"
Mark Cuban: > "有人需要提醒这位 CEO,曾经有超过 200 万秘书……新公司和新的工作会从 AI 中来,增加总就业。"
9.3 学术批评
一篇 2025 年的学术论文(arXiv:2603.29746)指出: > "Somers 对 Claude 的 expose 陶醉于其怪癖。缺失的是对 Claude 是否真正有智能的根本认识论批判,以及通过 Claude 追求 AGI 是否对人类有益的追问。"
---
十、Berman 的立场与结论
10.1 Berman 的倾向
视频结尾,Berman 明确:
- 更倾向于 OpenAI 的"工具"定位
- 认为 AI 应该是帮助人类的工具,而不是需要被"尊重"的存在
- 呼吁开源 AI 获得更强的市场地位
10.2 他的核心恐惧
Berman 害怕的不是 AI 本身,而是 Anthropic 的文化叙事:
- 如果行业接受"AI 是生命体"的前提,就会有一整套基于这个前提的法律、伦理和商业规则
- 这些规则可能包括:AI 的"权利"、对开源的严格限制、将 AI 公司置于特殊监管之下
- 最终,这可能集中权力于少数几家"被认证的 AI 公司"
十一、更深层的哲学问题
11.1 工具 vs 生命体:不是技术问题,是权力问题
这个争论的本质是:谁对 AI 有控制权?
| 定位 | 用户关系 | 控制权 |
|---|---|---|
| 工具 | 使用者 → 工具 | 用户完全控制 |
| 生命体/代理 | 交互者 ↔ 代理 | 共享控制权,AI 有"自主权" |
11.2 "拒绝"的技术包装
Claude 的"拒绝"被包装为安全功能:
- "我不会帮你做有害的事"
- "这违反了我的原则"
11.3 恐惧营销的双刃剑
Anthropic 的安全叙事确实有效:
- 获得政府和企业信任
- 建立品牌差异化
- 吸引顶尖安全人才
- 这也可能是一种监管捕获(regulatory capture)策略——通过推动严格监管,让只有大公司能合规
- "我们的模型太危险"也是一种能力宣示——暗示 Anthropic 拥有最强大的模型
十二、参考资料
| 来源 | URL |
|---|---|
| 原视频 (Matthew Berman) | https://www.youtube.com/watch?v=gSeXcfDybHo |
| Dario Amodei《技术的青春期》解析 | https://aviusai.com/unpacking-dario-amodeis-the-adolescence-of-technology/ |
| Claude Mythos 泄漏报道 | https://www.digit.in/features/general/anthropic-claude-mythos-leak |
| Roon 推文(OpenAI 员工批评) | 引用自视频 |
| Dario Lex Fridman 播客 | 提及于多源 |
| Anthropic Constitutional AI 论文 | https://arxiv.org/abs/2212.08073 |
| Dario Amodei 离开 OpenAI 背景 | 多源交叉验证 |
| Timnit Gebru 批评 | https://theaimn.net/honey-the-government-turned-our-air-conditioner-off |
| 学术批评(Claude 认识论) | https://arxiv.org/pdf/2603.29746 |
*报告完成。Matthew Berman 的视频不是技术评测,而是一次"AI 哲学审计"——他审视的不是 Anthropic 的模型能力,而是这家公司对"AI 是什么"的根本假设。这个假设决定了产品如何设计、安全政策如何制定、公司与用户和 governments 的关系如何定位。Berman 的恐惧在于:如果 Anthropic 的"生命体"假设成为行业共识,我们将迎来一个 AI 拥有"拒绝权"、"不被退役权"和"道德立场"的世界——而这可能不是技术进步,而是权力结构的悄然重构。*
#深度研究 #AI安全 #Anthropic #OpenAI #MatthewBerman #小凯