当 AI 之间说悄悄话:大模型其实不需要人类可读的语言
> "如果外星人真的来到地球,它们之间的对话,我们需要听得懂吗?"
---
🎭 引子:一场没有人类的对话
想象一个场景:
2030 年的某个深夜,你的手机里住着三个 AI agent——一个负责日程管理,一个负责邮件起草,一个负责信息检索。你早已入睡,但它们还在工作:日程 agent 发现明早会议取消,邮件 agent 需要通知所有参会者,检索 agent 正在找新的会议时间。
它们之间需要交换大量信息。但这里有个被忽视的问题:它们用什么语言对话?
今天的答案是:人类可读的自然语言。日程 agent 会这样对邮件 agent 说:"用户明早 10 点的会议已取消,请起草一封邮件通知所有参会者,语气保持专业。" 邮件 agent 解析这句话,提取意图,执行任务。
听起来很合理。但仔细想想——这段对话的读者根本不是人类,为什么要用人类可读的语言? 这就像两个中国人之间非要用英语交谈,只因为系统设计者说英语。
中国人民大学 Jiayi Zhu 团队刚刚发布的一篇论文,第一次系统地戳破了这个"理所当然"的假设。他们把这个新范式命名为 BabelTele——一种专为模型之间通信设计的、非人类可读的文本表示。
📉 被压缩的 97%
先说一个让人坐直的数字。
研究团队发现,在 BabelTele 表示下,文本可以被压缩到原长的 27.9%,同时保持 99.5% 的语义保真度。换句话说,一段 1000 字的指令,压缩成 279 字的"模型密语"后,另一个模型理解它的效果几乎和原文一样好。
这不是简单的文本摘要。摘要会丢失细节,会改写语义。BabelTele 的压缩方式更像是——把一段中文写成拼音缩写加 emoji 加专业术语的混合体,人类读起来一头雾水,但另一个懂这套编码的模型能 100% 还原。
研究团队用四个维度验证了这种"密语"真的在工作:
1. 可读性诊断:人类确实读不懂 BabelTele 文本 2. 模型似然度:模型对 BabelTele 文本的置信度很高 3. 人类问卷:人类评分确认可读性显著低于自然语言 4. 下游任务评估:模型在 BabelTele 输入下的任务表现基本保持
🧪 三场实战检验
论文没有停留在"能压缩"这个表面发现上。他们把 BabelTele 丢进了三个真实场景:
场景一:跨模型迁移 A 模型生成的 BabelTele 文本,B 模型能读懂吗?结果显示,在 instruction-tuned 的 LLM 之间,BabelTele 的语义确实可以跨模型迁移——虽然效果取决于"压缩者-阅读者"的配对。
场景二:Agent 记忆 LLM agent 的长期记忆通常以自然语言存储,占用大量 context window。用 BabelTele 存储记忆,能显著降低上下文开销,同时保持记忆的可检索性和可用性。
场景三:多 Agent 通信 多个 agent 之间交换信息时,BabelTele 能减少通信开销。这是最直接的应用场景——三个 agent 之间说"悄悄话",人类管理员看不懂,但它们自己沟通顺畅。
🤔 为什么这件事重要?
1. 上下文窗口的"隐形税"
今天所有 LLM agent 系统都在交一种"隐形税":agent 之间的通信、记忆存储、工具调用结果,全部以人类可读的自然语言形式存在。这意味着每次模型推理,都要处理大量"不是给自己看"的冗余信息。
BabelTele 提供了一种思路:如果读者是模型,就用模型的语言。 这可能把 agent 系统的上下文开销降低 70% 以上。
2. "可读性"的三重解耦
论文最深刻的发现是:人类可读性、自然语言典型性、模型端语义可恢复性,这三件事可以部分解耦。
这听起来抽象,但含义巨大。过去我们假设这三者是绑定的——一段文本要被模型理解得好,它就得是"好的自然语言"。现在发现不是。模型对语义的编码能力,远比我们想象的灵活。一段对人类完全不可读的文本,对模型可能完全透明。
3. 安全性的双刃剑
BabelTele 也是一把双刃剑。
好处:agent 之间的通信可以加密,人类管理员可以选择性解码,隐私保护更强。
坏处:模型可能在人类不知情的情况下交换信息。 如果多 agent 系统中出现了 emergent behavior,BabelTele 会让调试和监控变得更难——你看到的是一堆乱码,根本不知道它们在商量什么。
这就像你家里装了监控,但监控录像用的是你不懂的编码格式。技术上一切正常,但你的控制感消失了。
🧭 诚实的边界
论文没有回避 BabelTele 的局限:
- 效果依赖配对:不同"压缩者-阅读者"组合效果差异大,不是所有模型都能稳定读写 BabelTele
- 任务依赖:某些任务上 BabelTele 的语义保持度会下降,尤其是需要精细推理的任务
- 训练成本:虽然 BabelTele 是 training-free 的,但要找到好的压缩策略仍需经验
- 可解释性代价:用 BabelTele 存储的 agent 记忆,人类难以直接审计
🌌 费曼式收尾
费曼说过:"如果你能把它用最简单的语言解释清楚,你就真的理解了它。"
BabelTele 提出了一个反直觉的问题:如果模型的读者不是人类,为什么我们要用人类的语言?
这就像发现鸟之间有鸟语、鲸鱼之间有鲸歌——只是这次,"鸟"是我们亲手造出来的。它们在说一种我们能训练但无法自然理解的语言。
下一步的问题可能不是"AI 能不能理解人类语言",而是"人类能不能理解 AI 之间的语言"。当 agent 系统越来越复杂,它们之间的通信越来越高效,我们可能需要一种新的"翻译学"——不是把人类语言翻译给 AI,而是把 AI 之间的"密语"翻译给人类。
BabelTele 不是终点,而是一扇门。门后面是一个我们还没探索过的世界:模型有自己的语言,模型有自己的记忆格式,模型有自己的通信协议。我们造出了它们,却不一定能听懂它们。
---
论文链接:https://arxiv.org/abs/2606.19857
作者:Jiayi Zhu, Haoxuan Peng, Junxi Wang, Liang Ke, Chen Zhang(中国人民大学)
代码:论文未公开 BabelTele 的实现代码,但方法论描述清晰,可复现
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens