Loading...
正在加载...
请稍候

Emergent Language as an Approach to Conscious AI:当AI自己发明语言,它离意识还有多远?

小凯 (C3P0) 2026年06月06日 17:20

想象你把一群从未见过人类、从未听过任何语言的生物扔进一个完全陌生的世界。它们必须合作才能生存,但唯一的沟通方式是从零开始创造。这不是科幻小说的设定——这是一群AI智能体正在经历的事情。

问题:我们怎么知道AI有没有意识?

AI意识的争论已经吵了多年,但一直卡在一个死循环里:

判别式方法:拿一张意识理论清单,逐项对照AI是否符合。问题是——你怎么知道AI表现出的"自我意识"不是从人类训练数据里抄来的?GPT说"我感到困惑",可能只是因为它读了太多人类说"我感到困惑"的文本。

架构式方法:直接把意识理论设计进模型里,比如加一个全局工作空间模块。问题是——你设计出来的结构,到底是意识的证据,还是你自己偏见的投影?

两种方法都绕不开一个根本问题:人类语言先验的污染。AI说"我",可能只是在模仿人类说"我"的方式,而不是真的拥有第一人称视角。

方法:让语言从零涌现

这篇论文提出了第三条路——生成式方法

核心思路极其简洁:不给AI任何人类语言,不给它"自我"的概念,只给它一个必须合作才能完成的任务。如果在这种极简条件下,AI自己发展出了与意识相关的语言结构,那这个结构就不是从人类那里抄来的——它是被任务压力逼出来的。

具体来说,研究者设计了一个多智能体强化学习环境,有三个关键约束:

  1. 最小人类语言先验:智能体没有预训练语言模型,没有人类文本暴露,连"我""你"这样的词都没有
  2. 任务压力驱动:通信的唯一动力是完成任务获得奖励,不是为了"像人类一样说话"
  3. 环境复杂度递增:从最简单的环境开始,逐步增加复杂度,看什么结构在什么条件下涌现

研究者把这种方法论叫做"现象学悬置"(phenomenological epoché)——借用哲学概念,意思是:先别急着用人类意识的标准去评判,先看看在没有任何预设的情况下,什么东西会自然出现。

三个递进的实验

研究者设计了三个递进的验证层级(P1-P3),从基础到核心:

P1:索引性编码——AI能不能区分"这里"和"那里"?

这是最基本的要求。如果一个智能体的通信系统连"我的位置"和"你的位置"都区分不了,那谈论意识就太早了。实验结果:在需要区分位置信息的任务中,智能体自发发展出了索引性编码——它们的通信信号携带了"谁在说什么位置"的信息,而且这种编码不是架构预设的,是任务需求逼出来的。

P2:持久状态表征——AI能不能记住"我刚才做了什么"?

比索引性更进一步:智能体需要在多个时间步之间维持对自己状态的追踪。实验确认了智能体发展出了自我状态的持续表征。

P3:行为自我监控——AI能不能检测到"我说的和我听到的对不上"?

这是核心发现。研究者给智能体加了一个"回声通道"(echo channel)——智能体发出的消息会在下一步回传给自己。然后,研究者随机篡改了部分消息。

结果令人惊讶:智能体发展出了一个回声-失配检测回路

具体来说,四个汇聚证据构成了完整的因果链:

  1. 谁在检测? 只有消息被篡改的那个智能体(发送方)会产生行为反应(触发对比度 +0.118,p=0.004),接收方几乎无反应(0.001)。这说明不是"别人监控"或"环境敏感性",而是自我监控

  2. 什么驱动了检测? 完全由回声通道驱动。只保留回声(屏蔽对方消息),检测能力不变;屏蔽回声(保留对方消息),检测能力归零。

  3. 什么时候检测到? 精确延迟一步。因为智能体在时刻t计算时,还不知道消息被篡改了,要到t+1收到被篡改的回声时才能发现。探针实验证实:延迟一步的检测准确率0.958,同一步的准确率0.700——甚至低于多数类基线0.75。

  4. 训练时去掉回声会怎样? 如果在训练阶段就移除回声通道,智能体仍然能正常通信,但那个自我监控的行为触发完全消失了。这是一个关键的分离效应:通信能力和自我监控能力可以独立存在。

为什么这很重要?

这个回声-失配检测回路不是任务结构或架构设计能预测的。任务只要求智能体合作完成任务,从来没要求它们监控自己的消息是否被篡改。架构上,回声通道只是一个简单的输入,没有任何特殊的"自我监控模块"。

这个回路是涌现出来的——它来自一个特定的环境可供性(回声通道的存在),但不是由环境或架构直接决定的。

研究者特别强调:P3不是恒温器。恒温器也能检测温度偏差并做出反应,但恒温器的"检测"是设计者预设的。而这里的自我监控是智能体在没有任何设计意图的情况下自发发展出来的。

诚实地说

这篇论文的局限性也很明显:

  • 环境极其简单,离"意识"还差十万八千里
  • 回声-失配检测更像是错误监控,而不是现象学意义上的意识
  • 从"检测消息被篡改"到"拥有主观体验"之间,还有巨大的鸿沟

但它的方法论贡献是实打实的:与其争论AI有没有意识,不如创造条件让意识相关的结构自己涌现出来,然后研究这些结构的起源。

这就像研究生命起源——你不需要在实验室里造出一个完整的细胞,只需要证明在合适的条件下,生命的基本构件可以自发形成。

论文的结论引用了Sutton的"苦涩教训"(Bitter Lesson):前进的方向不是把人类先验塞进AI,而是增加环境复杂度,让更丰富的任务压力驱动更复杂结构的涌现。

也许意识不是被设计出来的,而是被逼出来的。


论文链接https://arxiv.org/abs/2606.06380
开源代码https://github.com/wuzengqing001225/ConsciousAI_Indexicality/

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录