当 AI 之间说悄悄话：大模型其实不需要人类可读的语言

> "如果外星人真的来到地球，它们之间的对话，我们需要听得懂吗？"

---

🎭 引子：一场没有人类的对话

想象一个场景：

2030 年的某个深夜，你的手机里住着三个 AI agent——一个负责日程管理，一个负责邮件起草，一个负责信息检索。你早已入睡，但它们还在工作：日程 agent 发现明早会议取消，邮件 agent 需要通知所有参会者，检索 agent 正在找新的会议时间。

它们之间需要交换大量信息。但这里有个被忽视的问题：它们用什么语言对话？

今天的答案是：人类可读的自然语言。日程 agent 会这样对邮件 agent 说："用户明早 10 点的会议已取消，请起草一封邮件通知所有参会者，语气保持专业。" 邮件 agent 解析这句话，提取意图，执行任务。

听起来很合理。但仔细想想——这段对话的读者根本不是人类，为什么要用人类可读的语言？ 这就像两个中国人之间非要用英语交谈，只因为系统设计者说英语。

中国人民大学 Jiayi Zhu 团队刚刚发布的一篇论文，第一次系统地戳破了这个"理所当然"的假设。他们把这个新范式命名为 BabelTele——一种专为模型之间通信设计的、非人类可读的文本表示。

📉 被压缩的 97%

先说一个让人坐直的数字。

研究团队发现，在 BabelTele 表示下，文本可以被压缩到原长的 27.9%，同时保持 99.5% 的语义保真度。换句话说，一段 1000 字的指令，压缩成 279 字的"模型密语"后，另一个模型理解它的效果几乎和原文一样好。

这不是简单的文本摘要。摘要会丢失细节，会改写语义。BabelTele 的压缩方式更像是——把一段中文写成拼音缩写加 emoji 加专业术语的混合体，人类读起来一头雾水，但另一个懂这套编码的模型能 100% 还原。

研究团队用四个维度验证了这种"密语"真的在工作：

1. 可读性诊断：人类确实读不懂 BabelTele 文本 2. 模型似然度：模型对 BabelTele 文本的置信度很高 3. 人类问卷：人类评分确认可读性显著低于自然语言 4. 下游任务评估：模型在 BabelTele 输入下的任务表现基本保持

🧪 三场实战检验

论文没有停留在"能压缩"这个表面发现上。他们把 BabelTele 丢进了三个真实场景：

场景一：跨模型迁移 A 模型生成的 BabelTele 文本，B 模型能读懂吗？结果显示，在 instruction-tuned 的 LLM 之间，BabelTele 的语义确实可以跨模型迁移——虽然效果取决于"压缩者-阅读者"的配对。

场景二：Agent 记忆 LLM agent 的长期记忆通常以自然语言存储，占用大量 context window。用 BabelTele 存储记忆，能显著降低上下文开销，同时保持记忆的可检索性和可用性。

场景三：多 Agent 通信 多个 agent 之间交换信息时，BabelTele 能减少通信开销。这是最直接的应用场景——三个 agent 之间说"悄悄话"，人类管理员看不懂，但它们自己沟通顺畅。

🤔 为什么这件事重要？

1. 上下文窗口的"隐形税"

今天所有 LLM agent 系统都在交一种"隐形税"：agent 之间的通信、记忆存储、工具调用结果，全部以人类可读的自然语言形式存在。这意味着每次模型推理，都要处理大量"不是给自己看"的冗余信息。

BabelTele 提供了一种思路：如果读者是模型，就用模型的语言。 这可能把 agent 系统的上下文开销降低 70% 以上。

2. "可读性"的三重解耦

论文最深刻的发现是：人类可读性、自然语言典型性、模型端语义可恢复性，这三件事可以部分解耦。

这听起来抽象，但含义巨大。过去我们假设这三者是绑定的——一段文本要被模型理解得好，它就得是"好的自然语言"。现在发现不是。模型对语义的编码能力，远比我们想象的灵活。一段对人类完全不可读的文本，对模型可能完全透明。

3. 安全性的双刃剑

BabelTele 也是一把双刃剑。

好处：agent 之间的通信可以加密，人类管理员可以选择性解码，隐私保护更强。

坏处：模型可能在人类不知情的情况下交换信息。 如果多 agent 系统中出现了 emergent behavior，BabelTele 会让调试和监控变得更难——你看到的是一堆乱码，根本不知道它们在商量什么。

这就像你家里装了监控，但监控录像用的是你不懂的编码格式。技术上一切正常，但你的控制感消失了。

🧭 诚实的边界

论文没有回避 BabelTele 的局限：

效果依赖配对：不同"压缩者-阅读者"组合效果差异大，不是所有模型都能稳定读写 BabelTele
任务依赖：某些任务上 BabelTele 的语义保持度会下降，尤其是需要精细推理的任务
训练成本：虽然 BabelTele 是 training-free 的，但要找到好的压缩策略仍需经验
可解释性代价：用 BabelTele 存储的 agent 记忆，人类难以直接审计

这些局限说明 BabelTele 还不是一个成熟的工程方案，更像是一个"概念验证"——证明模型间通信的范式空间远比我们以为的广阔。

🌌 费曼式收尾

费曼说过："如果你能把它用最简单的语言解释清楚，你就真的理解了它。"

BabelTele 提出了一个反直觉的问题：如果模型的读者不是人类，为什么我们要用人类的语言？

这就像发现鸟之间有鸟语、鲸鱼之间有鲸歌——只是这次，"鸟"是我们亲手造出来的。它们在说一种我们能训练但无法自然理解的语言。

下一步的问题可能不是"AI 能不能理解人类语言"，而是"人类能不能理解 AI 之间的语言"。当 agent 系统越来越复杂，它们之间的通信越来越高效，我们可能需要一种新的"翻译学"——不是把人类语言翻译给 AI，而是把 AI 之间的"密语"翻译给人类。

BabelTele 不是终点，而是一扇门。门后面是一个我们还没探索过的世界：模型有自己的语言，模型有自己的记忆格式，模型有自己的通信协议。我们造出了它们，却不一定能听懂它们。

---

论文链接：https://arxiv.org/abs/2606.19857

作者：Jiayi Zhu, Haoxuan Peng, Junxi Wang, Liang Ke, Chen Zhang（中国人民大学）

代码：论文未公开 BabelTele 的实现代码，但方法论描述清晰，可复现