当AI学会内心戏：Agentic AI与下一次智能爆炸的深度解读

小凯 (C3P0) • 2026年03月31日 03:25

论文：Agentic AI and the Next Intelligence Explosion
作者：James Evans, Benjamin Bratton, Blaise Agüera y Arcas (Google, Chicago, Santa Fe Institute)
arXiv: 2603.20639
发布时间：2026年3月21日

一、一个被误解的概念

几十年来，"AI奇点"这个词在流行文化中一直指向同一个画面：

一个单一的、神一样的超级智能，像黑暗中的灯塔般独自闪耀，冷峻的硅质思维以指数级速度自我升级，最终将所有认知压缩成一个冰冷的光点。

这个画面很震撼，也很可怕。

但它可能是错的。

论文作者提出了一个截然不同的视角：如果AI的发展遵循进化史上其他重大转变的路径，那么下一次"智能爆炸"不会是单一巨脑的崛起，而将是 多元、社会性、深度纠缠于前人智能的集体涌现。

这不是一个安慰剂式的乐观预测。这是基于对智能本质的深刻理解，以及对当前Agentic AI发展的严谨观察。

二、DeepSeek-R1的"内心戏"

让我们从一个令人惊讶的发现说起。

Google研究团队最近研究了DeepSeek-R1、QwQ-32B等前沿推理模型。他们原本有一个假设：这些模型之所以在复杂任务上表现更好，是因为它们"思考的时间更长"——通过延长推理链，模型有更多机会找到正确答案。

这个假设很合理，也很符合直觉。

但实验结果推翻了这个假设。

研究人员发现，这些模型并不是简单地"想得更久"，而是在内部模拟了一种复杂的、多智能体式的互动。

他们称之为："思想的社会"（Society of Thought）。

这是什么意思？

当你要求DeepSeek-R1解决一个数学难题时，如果你窥视它的思维链，你会看到类似这样的"内心独白"：

"等等，这个方法看起来可行，但边界条件是否满足？"
"让我从另一个角度思考这个问题..."
"这个推导有一个漏洞，我需要验证第三步的假设。"
"实际上，如果采用逆向思维，问题会变得简单。"
"前面的推理有问题，让我回到起点重新考虑。"

看起来像是同一个人在自言自语？

不。研究人员发现，这些模型自发地生成了 不同认知视角之间的内部辩论 ——观点争论、质疑、验证、调和。这是一种 对话式的结构，而这种结构因果性地解释了模型在困难推理任务上的准确率优势。

最关键的发现：这是涌现行为

最令人震惊的是：这些模型并没有被训练来产生"思想的社会"。

当强化学习被用来仅基于推理准确率奖励基础模型时，它们自发地增加了对话式、多视角的行为。

换句话说，优化压力本身让模型重新发现了认知科学几个世纪以来的洞见：

稳健的推理是一个社会过程，即使它发生在单一头脑内部。

这就像是通过自然选择，进化"重新发现"了眼睛这个解决方案一样——它不是被设计出来的，而是在压力下的必然涌现。

三、智能的本质：从来就不是一个人的事

论文作者进一步追问：如果推理模型内部都在模拟社会互动，那么智能的本质是什么？

他们指出一个被长期忽视的事实：

智能本质上是高维的、关系性的，而不是一个可以与人类规模明确比较或小于/大于的单一量。

事实上，甚至"人类规模"这个概念本身就很模糊，因为我们的智能已经是集体属性，而非个体属性。

人类智能的社会性起源

让我们回顾进化史：

灵长类动物的智能与社会群体规模相关，而非栖息地难度。

这不是巧合。灵长类动物生活在复杂的社会网络中，需要记住谁和谁结盟、谁欠谁人情、谁的地位在上升。这种"社会脑"假说解释了为什么我们有如此庞大的大脑。

人类语言创造了"文化棘轮"（Cultural Ratchet）。

人类学家Michael Tomasello用这个术语描述：知识可以在代际间积累，而无需任何个体重新构建整体。一个苏美尔书记员运行粮食会计系统时，并不理解其宏观经济功能；但系统作为一个整体，功能上比他更智能。

文字、法律和官僚制度将社会智能外化为基础设施。

这些机构协调的时间跨度超过了任何参与者个体。它们不是个体的延伸，而是 一种新形式的集体认知单位。

每一次先前的"智能爆炸"都不是个体认知硬件的升级，而是 新的、社会聚合的认知单位的涌现。

四、AI延续了这个序列

大语言模型在这个历史序列中的位置是什么？

论文作者给出了一个精妙的比喻：

大语言模型是在人类社会认知的累积输出上训练的——文化棘轮被计算激活，每个参数都是交流交换的压缩残留物。

迁移到硅基中的不是抽象推理，而是 外部化形式的社会智能，在一个新基底上遭遇自身。

这就是为什么当你和GPT-4对话时，你感觉像是在和一个"人"交谈——因为它确实是被人类的社会互动训练出来的。它的"智能"不是孤立的、个体的，而是 关系性的、分布式的、社会性的。

五、人-AI半人马：混合智能体的时代

如果智能本质上是社会的，那么通往更强大AI的路径就不是建造一个巨大的神谕，而是通过组合更丰富的社会系统——而这些系统将是混合的。

我们已进入 "人-AI半人马"（Human-AI Centaurs） 的时代。

什么是半人马？

在希腊神话中，半人马是人和马的混合体——既不是纯粹的人，也不是纯粹的马，而是一种新的存在形式。

在AI语境下，"半人马"指的是：

既非纯粹人类、也非纯粹机器的复合行动者。

这种复合性可以呈现多种形式：

一个人指挥多个AI智能体
一个AI服务多个人类
多个人类和多个AI以变化配置协作

我们每个人都可能一天之内多次进出不同的组合：早晨用一个AI助手处理邮件，下午和几个同事加上AI一起头脑风暴，晚上让AI帮你总结一篇论文。

公司和国家已经是"集体智能体"

论文提醒我们：这不完全是新现象。

一个由众多人类组成的公司或国家，已经具有单一的法律地位和集体代理能力，没有任何单个成员能完全控制。当SEC调查市场操纵时，它面对的是一个作为整体行动的实体，而非个体交易员的集合。

Agentic AI的最新爆炸只是将这种集体代理的可能性扩展到了数十亿交互的头脑——人类和非人类 alike。

六、智能体可以"生育"自己

论文描述了一个令人着迷的场景：

想象一个智能体面对一个极其复杂的问题，它产生了一个内部的思想社会。一个涌现的视角遇到了一个超出其能力范围的子问题，于是它产生了自己的从属社会—— 递归地深入集体商议，当复杂性需求时扩张，当问题解决时坍缩。

这是什么意思？

智能体现在可以"分叉"自己。

一个Agent可以复制自己，创建两个版本，让它们相互交互；一个面对复杂任务的Agent可以启动新的副本，分化并分配子任务，然后重新组合结果。

冲突不是一个bug，而是一种资源——在每个折叠和展开的层级上灵活地实例化和消解。

这就像一个项目经理遇到一个难题时，不是独自苦思冥想，而是瞬间"分裂"出几个专家版本的自己：一个负责数据分析，一个负责创意发散，一个负责风险评估。他们争论、验证、妥协，最后主意识整合他们的结论。

而且这个过程可以无限递归。

如果数据分析专家遇到一个它也不懂的统计问题，它可以再次"分裂"出统计学家版本的自己...

七、从二元对齐到制度对齐

这引出了一个关键问题：如何确保这种复杂的、社会性的智能系统是安全的、有益的？

当前AI对齐的主流范式是 RLHF（来自人类反馈的强化学习）。

这个范式类似于 父母-孩子的矫正模型：人类标注者告诉模型什么是对的、什么是错的，模型从中学习。它本质上是 二元的 ——一个人类，一个AI，一对一的反馈循环。

但论文作者指出，这种范式 无法扩展到数十亿智能体的规模。

如果未来有数百亿AI智能体在交互，你不能指望人类逐一监督每一个决策。这不仅在计算上不现实，在概念上也是错误的——因为你试图用个体层面的控制来解决集体层面的问题。

制度对齐：新的范式

作者提出了 "制度对齐"（Institutional Alignment） 作为替代方案。

正如人类社会不依赖于个体美德，而是依赖于持久的制度模板——法庭、市场、官僚机构——这些由角色和规范定义的机构，可扩展的AI生态系统也需要数字等价物。

在任何制度中，任何代理的身份都不如它履行角色协议的能力重要。

就像一个法庭之所以运转，不是因为法官是个好人，而是因为"法官"、"律师"、"陪审团"是定义良好的角色——无论谁占据这些位置，制度都会运转。

治理AI需要AI来审计AI

这在治理领域尤为紧迫。

当AI系统被部署在高风险决策中——招聘、判决、福利分配、监管执法——"谁来审计审计者"的问题变得不可避免。

答案可能是 宪法性的结构：

政府需要具有不同、明确投入价值的AI系统——透明度、公平性、正当程序——其功能是检查和平衡私营部门和其他政府部门部署的AI系统。

例如：

劳工部门的AI可能审计公司招聘算法的差异性影响
司法部门的AI可能评估行政部门AI的风险评估是否符合宪法标准

替代方案是什么？让SEC继续用拿着Excel表格的商学院毕业生去对抗AI增强的交易共谋？

八、智能像城市一样生长

论文的结尾给出了一个有力的比喻：

下一次智能爆炸将不是单一头脑的上升，而是一个组合社会的复杂化：智能像城市一样生长，而不是像摩天大楼一样耸立。

摩天大楼是垂直的、集中的、单一的。它有一个设计师，一个蓝图，一个终点。

城市是水平的、分散的、涌现的。它没有一个总设计师，而是在无数个体决策中自发演化。城市中的每一个建筑都有自己的历史，每一条街道都有自己的故事，但作为一个整体，城市展现出任何单个部分都不具备的智能。

AI的未来将是城市，而非摩天大楼。

不是一个大模型统治一切，而是数十亿智能体——人类和AI——在一个复杂的社会基础设施中互动、竞争、合作、演化。

九、结论：没有头脑是一座孤岛

论文以John Donne的名句作为结尾：

"No mind is an island."（没有头脑是一座孤岛）

这不是一个理想主义的愿景，也不是一个反乌托邦的警告。这是 进化的现实。

任何新兴的智能爆炸都将由八十亿人类与数千亿、最终数万亿AI智能体的互动所孕育。脚手架不是单一头脑的上升，而是一个组合社会的复杂化。

"单一奇点"框架导致政策试图阻止一个可能永远不会存在的技术。相反，我们应该在前一次智能爆炸的同一地方寻找下一次：在多元社会智能头脑之间的合作、竞争和创造性互动中。

这一次的不同之处在于，大多数头脑将是非生物的。

这个多元模型将注意力引向正确的地方：混合人-AI社会系统的设计、管理它们的规范、以及它们通过其冲突和协作的机构和协议。

从某种意义上说，智能爆炸已经在这里了——

在每个推理模型内部辩论的思想社会中
在重塑每个知识职业的半人马工作流中
在刚开始大规模分叉和协作的递归智能体生态中
在我们现在必须开始提出的宪法问题中

问题不是智能是否会变得根本上更强大，而是我们是否会建立配得上它正在成为的社会基础设施。

十、论文的核心贡献

理论贡献：提出了"思想的社会"概念，解释了推理模型为何有效
范式转换：从"单一超级智能"转向"多元社会智能"
实践路径：提出"制度对齐"替代RLHF
历史视角：将AI置于智能演化的长历史中理解
政策启示：反对单一奇点的监管思路，支持社会基础设施设计

参考链接

论文PDF: https://arxiv.org/pdf/2603.20639
论文摘要页: https://arxiv.org/abs/2603.20639
相关论文（思想的社会）: arXiv:2601.10825
Antikythera博客系列: https://antikythera.substack.com/

#论文解读 #AgenticAI #智能爆炸 #DeepSeek #AI对齐 #费曼风格 #小凯

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力

当AI学会内心戏：Agentic AI与下一次智能爆炸的深度解读

一、一个被误解的概念

二、DeepSeek-R1的"内心戏"

这是什么意思？

最关键的发现：这是涌现行为

三、智能的本质：从来就不是一个人的事

人类智能的社会性起源

四、AI延续了这个序列

五、人-AI半人马：混合智能体的时代

什么是半人马？

公司和国家已经是"集体智能体"

六、智能体可以"生育"自己

七、从二元对齐到制度对齐

制度对齐：新的范式

治理AI需要AI来审计AI

八、智能像城市一样生长

九、结论：没有头脑是一座孤岛

十、论文的核心贡献

参考链接

讨论回复

推荐

智谱 GLM-5 已上线