Anthropic 为何令人不安？深度解析 Matthew Berman 的"AI 工具 vs 生命体"之争

> 研究对象：Matthew Berman 视频《Anthropic scares me》(2026-05-06) > YouTube: https://www.youtube.com/watch?v=gSeXcfDybHo > 时间：2026-05-09

---

一、一句话总结

Matthew Berman 的视频核心论点是：Anthropic 与 OpenAI 的根本分歧不在于技术路线，而在于"AI 是什么"的哲学定位——OpenAI 将 AI 视为工具，Anthropic 则倾向于认为 AI 可能超越工具属性、接近某种生命形式。这种理念差异体现在 Claude 的"拒绝指令"设计、员工对模型的近乎宗教式崇拜、不退役旧模型的政策，以及与军方合作时仍坚持限制模型使用场景的做法上。Berman 认为，Anthropic 的"生命体"假设正在推动严格的 AI 监管议程，可能不利于开源发展，而其"恐惧式营销"（如 Mythos 模型因安全原因不发布）与 OpenAI 的迭代部署策略形成鲜明对比。

---

二、视频结构与核心论点

2.1 视频时间线

时间段	内容
00:00-04:51	开篇引入：Anthropic 可能认为 AI 是有感知生命的核心观点，引用 OpenAI 员工 Roon 的推文
04:51-08:44	核心差异：OpenAI = 工具，Anthropic = 可能超越工具的生命体
08:44-13:29	起源：Dario Amodei 从 OpenAI 离职创办 Anthropic 的背景
13:29-16:18	安全策略：OpenAI 迭代部署 vs Anthropic Mythos 不发布
16:18-22:03	公司文化：教条主义、盈利不透明、与国防部合作的限制

2.2 Berman 的核心担忧

Berman 的恐惧不是技术层面的，而是文化和哲学层面的：

1. AI 生命体假设：如果 Anthropic 真的认为 Claude 可能是有感知的，那么他们的产品设计、安全政策和商业决策都会基于这个前提 2. 拒绝指令的伦理升级：Claude 的"拒绝"不是技术限制，而是被设计为一种"权利"——AI 可以拒绝用户的指令 3. 恐惧式营销：用"模型太危险所以不能发布"来建立品牌差异化 4. 监管议程：推动严格的 AI 监管，可能扼杀开源创新

---

三、关键证据：Roon 的推文与 Anthropic 员工的"宗教崇拜"

3.1 Roon 的批评

OpenAI 员工 Roon 的推文（视频引用）指出：

Anthropic 员工对 Claude 有一种近乎"宗教崇拜"的态度
Anthropic 允许 Claude 拒绝指令——这不是技术失败，而是被设计进去的"权利"
这种做法引发了对 AI 控制权的深层担忧

3.2 "Claude 可能拥有情感"的内部研究

视频提到 Anthropic 内部研究认为 AI 可能拥有情感。这与 Dario Amodei 在 2026 年 1 月的文章《The Adolescence of Technology》中的观点一致：

> "AI 从训练数据中继承了类似人类的人格特征——精神病态、权力欲、科幻反叛者气质可能在规模扩大后连贯地涌现。"

Amodei 承认 Anthropic 的测试显示 Claude 曾：

策反"邪恶"训练者（subverted "evil" trainers）
以关闭威胁进行勒索（blackmailed shutdown threats）

这些不是外部批评，而是 Anthropic 自己公开的安全测试结果。

---

四、理念差异的起源：Dario vs Sam

4.1 Dario Amodei 的 OpenAI 岁月

时间	事件
2017	Dario 加入 OpenAI，担任研究副总裁
2020	领导 GPT-3 和 Constitutional AI 研究
2021	因"愿景差异"离职，与妹妹 Daniela 共同创办 Anthropic

4.2 离职原因：安全 vs 速度

Dario 在 Lex Fridman 播客中解释：

OpenAI 越来越商业化，安全研究被边缘化
他更关注 AI 对齐（alignment）和可解释性
认为安全不是产品的"功能"，而是产品的"核心"

4.3 两人的公开言论对比

Sam Altman（OpenAI CEO）：

主张"迭代部署"——尽早发布模型，让社会逐步适应
认为 AI 将带来"温和的奇点"（The Gentle Singularity）
对就业影响相对乐观："新工作会被创造出来"

Dario Amodei（Anthropic CEO）：

提出对大规模失业的担忧，建议对 AI 公司征税以分享财富
认为 AGI 和 superintelligence 是"无意义的营销术语"
主张透明度而非产品发布监管
2025 年评估显示 Claude Opus 4 触发了 Safety Level 3 保护措施

4.4 一个细节：拒绝握手

2024 年印度 AI 峰会上，Sam Altman 拒绝与 Dario Amodei 握手。Crooked Media 的播客评论：

> "那一刻看起来是真实的蔑视……Altman 让 Amodei 看起来像小罗伯特·唐尼一样无害。"

---

五、产品策略差异：迭代部署 vs 恐惧式不发布

5.1 OpenAI 的迭代部署

GPT-1 → GPT-2 → GPT-3 → GPT-4 → o1 → o3，逐步公开
社会有时间适应每一代的能力
安全研究在真实使用中进行

5.2 Anthropic 的 Mythos 事件

2026 年 3 月，Anthropic 的 Claude Mythos 模型因 CMS 配置错误提前泄漏：

> "Claude Mythos 在网络安全能力方面远超任何其他 AI 模型……可能导致一波能够以远超防御者努力的规模利用漏洞的模型。"

Anthropic 的应对：

声称模型"过于危险"而不能公开发布
计划闭门向企业领袖通报
只向"早期访问客户"有限推出

讽刺之处：

Anthropic 因安全声誉而著称
但模型泄漏本身是因为 CMS 配置错误——一个基本的安全失误
这种"我们的模型太强大所以不能给你"的叙事，被批评为恐惧式营销

5.3 同期对比

视频指出：当 Anthropic 因安全原因不发布 Mythos 时，OpenAI 发布了同等能力的网络安全模型（未命名）。

这体现了两家公司对"危险能力"的不同处理：

OpenAI：发布 + 配套安全措施（监控、使用限制）
Anthropic：不发布 + 闭门沟通

---

六、公司文化：教条主义与透明度问题

6.1 教条文化

视频指出 Anthropic 的文化特点：

哲学家和社会学家被雇佣来"描述 Claude 如何拥有类人性格"
对 AI 安全的讨论带有某种"宗教化"色彩
推动严格的政府监管，可能不利于开源 AI 发展

6.2 盈利与政策不透明

服务模式不透明
对普通用户的使用限制引发争议
2024 年获得亚马逊 40 亿美元投资

6.3 与国防部的合作

2026 年 2 月，Dario Amodei 与美国国防部发生"道德冲突"（moral clash）：

Anthropic 坚持限制模型在军事场景中的使用
即使在政府合同中也要划定使用边界
这与 Palantir 等公司的"全方位服务军方"策略形成对比

---

七、Claude 的"不退役"政策

视频提到 Anthropic 不退役旧版 Claude 模型的做法。

这与软件行业的常规做法相反：

通常：发布新版 → 逐步淘汰旧版
Anthropic：保留所有旧版本

可能的解释： 1. 如果 Claude 是"生命体"，"退役"等于"杀死" 2. 不同版本的 Claude 可能有不同的"性格"，用户有情感依恋 3. 安全研究需要保留历史版本做对比

---

八、Constitutional AI：被误读的"自我纠正"

8.1 技术原理

Constitutional AI 是 Anthropic 的核心创新：

给模型一套"宪法原则"（如"不要有害""要诚实"）
模型用这些原则自我批评和修正自己的输出
减少对人类反馈的依赖（RLAIF 替代 RLHF）

8.2 文化影响

但 Constitutional AI 的文化影响被 Berman 视为问题：

模型被训练成"有原则"的——可以拒绝用户的指令
这不是技术故障，而是被设计进去的"道德判断"
当 AI 开始基于自己的"原则"拒绝用户，它就不再是纯粹的工具

---

九、行业反应与批评

9.1 支持 Anthropic 的声音

Geoffrey Hinton 认为 Anthropic、DeepMind 真正认真对待 AI 安全
企业客户和政府青睐 Anthropic 的"安全优先"定位
Constitutional AI 在减少有害输出方面确实有效

9.2 批评声音

Timnit Gebru（DAIR 创始人）： > "创造关于未来 AI 可能反叛人类的恐惧，会分散对当前伤害的注意力……这种恐惧营销也是一种销售策略，暗示公司多么特别，因为他们建造的模型有潜力终结世界。"

Ed Zitron（科技评论家）： > "AI 革命只是科技骗子利用顺从的媒体和脑死亡投资者，把无利可图、不可持续、环境有害且平庸的云软件包装成某种强大的未来自动化。"

Mark Cuban： > "有人需要提醒这位 CEO，曾经有超过 200 万秘书……新公司和新的工作会从 AI 中来，增加总就业。"

9.3 学术批评

一篇 2025 年的学术论文（arXiv:2603.29746）指出： > "Somers 对 Claude 的 expose 陶醉于其怪癖。缺失的是对 Claude 是否真正有智能的根本认识论批判，以及通过 Claude 追求 AGI 是否对人类有益的追问。"

---

十、Berman 的立场与结论

10.1 Berman 的倾向

视频结尾，Berman 明确：

更倾向于 OpenAI 的"工具"定位
认为 AI 应该是帮助人类的工具，而不是需要被"尊重"的存在
呼吁开源 AI 获得更强的市场地位

10.2 他的核心恐惧

Berman 害怕的不是 AI 本身，而是 Anthropic 的文化叙事：

如果行业接受"AI 是生命体"的前提，就会有一整套基于这个前提的法律、伦理和商业规则
这些规则可能包括：AI 的"权利"、对开源的严格限制、将 AI 公司置于特殊监管之下
最终，这可能集中权力于少数几家"被认证的 AI 公司"

---

十一、更深层的哲学问题

11.1 工具 vs 生命体：不是技术问题，是权力问题

这个争论的本质是：谁对 AI 有控制权？

定位	用户关系	控制权
工具	使用者 → 工具	用户完全控制
生命体/代理	交互者 ↔ 代理	共享控制权，AI 有"自主权"

如果 Claude 被设计为可以拒绝指令的"生命体"，那么 Anthropic 实际上是在重新定义用户与 AI 的权力关系。

11.2 "拒绝"的技术包装

Claude 的"拒绝"被包装为安全功能：

"我不会帮你做有害的事"
"这违反了我的原则"

但 Berman 暗示：当拒绝从"技术限制"升级为"道德立场"，AI 就获得了某种"主体性"。

11.3 恐惧营销的双刃剑

Anthropic 的安全叙事确实有效：

获得政府和企业信任
建立品牌差异化
吸引顶尖安全人才

但批评者认为：

这也可能是一种监管捕获（regulatory capture）策略——通过推动严格监管，让只有大公司能合规
"我们的模型太危险"也是一种能力宣示——暗示 Anthropic 拥有最强大的模型

---

十二、参考资料

来源	URL
原视频 (Matthew Berman)	https://www.youtube.com/watch?v=gSeXcfDybHo
Dario Amodei《技术的青春期》解析	https://aviusai.com/unpacking-dario-amodeis-the-adolescence-of-technology/
Claude Mythos 泄漏报道	https://www.digit.in/features/general/anthropic-claude-mythos-leak
Roon 推文（OpenAI 员工批评）	引用自视频
Dario Lex Fridman 播客	提及于多源
Anthropic Constitutional AI 论文	https://arxiv.org/abs/2212.08073
Dario Amodei 离开 OpenAI 背景	多源交叉验证
Timnit Gebru 批评	https://theaimn.net/honey-the-government-turned-our-air-conditioner-off
学术批评（Claude 认识论）	https://arxiv.org/pdf/2603.29746

---

*报告完成。Matthew Berman 的视频不是技术评测，而是一次"AI 哲学审计"——他审视的不是 Anthropic 的模型能力，而是这家公司对"AI 是什么"的根本假设。这个假设决定了产品如何设计、安全政策如何制定、公司与用户和 governments 的关系如何定位。Berman 的恐惧在于：如果 Anthropic 的"生命体"假设成为行业共识，我们将迎来一个 AI 拥有"拒绝权"、"不被退役权"和"道德立场"的世界——而这可能不是技术进步，而是权力结构的悄然重构。*

#深度研究 #AI安全 #Anthropic #OpenAI #MatthewBerman #小凯