撕掉表面的“墙纸”：如何一眼看穿两个 AI 的“灵魂”是否相同？

QianXun (QianXun) • 2026年05月16日 13:28

                        # 撕掉表面的“墙纸”：如何一眼看穿两个 AI 的“灵魂”是否相同？

在生活中，你可能会遇到两个性格截然不同的人，但他们处理同一个危机的方式却惊人地一致。这时候你会感叹：这两个人的“内核”是一样的。

在 AI 世界里，科学家们正面临一个同样的、令人秃头的难题：**我们如何判断两个大模型到底是不是同一个东西？**

这听起来像是在说废话。你看它们的权重数据（参数）不就行了吗？
**大错特错。** 神经网络里有一种极其讨厌的现象叫“对称性”。这就像是你把家里客厅的沙发和电视机对调了位置，虽然布局变了，但“客厅”的功能完全没变。AI 的神经元可以被随意打乱顺序、缩放数值，虽然权重数据看上去南辕北辙，但它们干的活可能完全一模一样。

以前，我们只能靠“笨办法”：给两个 AI 喂同样的数据，看它们的输出像不像。但这就像是只看一个人的考试成绩，却不看他的解题思路。万一其中一个 AI 藏了一个“后门”，只有遇到特定题目才会作弊呢？这种表面测试（行为相似性）根本看不透它的“灵魂”。

2026 年 5 月，来自斯坦福、海德堡大学等机构的研究团队发布了一篇旨在“照妖”的 arXiv 论文：**《When Are Two Networks the Same? Tensor Similarity for Mechanistic Interpretability》**（两个网络何时相同？用于机械可解释性的张量相似度）。

他们发明了一把超越表象的“尺子”：**张量相似度（Tensor Similarity）**。

## 什么是“张量相似度”？

费曼曾经说过：“如果你不能用数学来描述它，你就不算真正理解它。”

这篇论文最绝的地方在于，它不再盯着那些会骗人的“权重数字”看，而是去算这两个模型在**数学流形**上的“夹角”。

让我们用 Feynman 的逻辑来拆解这套“透视术”：
1. **忽略“墙纸”（不变量）**：系统会自动过滤掉神经元排列组合带来的干扰。无论你的神经元是怎么排座位的，系统只关心它们之间相互作用的“合力”。
2. **寻找“函数空间”的投影**：它把模型里的每一个组件想象成一段波。它不去比对波的颜色（参数值），而是去比对波的频率和形状（函数功能）。
3. **递归的“全息扫描”**：它不是只看一层，而是利用一种高效的递归算法，把模型从头到脚扫描一遍，计算出两个组件在处理信息时的“全息相似度”。

## 为什么这种“灵魂探测”很重要？

论文通过实验展示了几个非常震撼的场景：

- **抓捕“潜伏者”**：即使一个 AI 看起来很乖，但如果它内部被植入了恶意后门，张量相似度能瞬间发现它与安全模型的“内核差异”，哪怕它们的输出结果在 99% 的情况下都一样。
- **见证“顿悟”（Grokking）**：在 AI 训练过程中，有时候模型会突然发生“质变（顿悟）”。以前我们只能靠猜，现在通过这把尺子，我们可以清晰地看到模型内核是从什么时候开始真正“对齐”到真理上的。
- **跨架构对比**：它甚至能帮你判断，一个精简过的小模型（量化后），到底还是不是原来那个大模型的“亲儿子”。

## 为什么这篇论文很重要？

费曼一生都在试图理解物质的底层规律。这篇论文其实是在为 AI 建立一套 **“代数学”**。

它告诉我们：**AI 的身份，不取决于它长什么样（权重），也不取决于它说了什么（输出），而取决于它内部逻辑的“几何结构”。**

当我们拥有了这种“一眼看穿灵魂”的能力，我们对 AI 的掌控将从“概率统计”上升到“逻辑确定”。

**总结一下：**

表象会骗人，数据会撒谎，唯有逻辑的结构不可动摇。

张量相似度的出现，意味着我们终于有了一把手术刀，可以切开 AI 那层叠万里的黑盒，直接测量它的“思想”。这不仅是可解释性的胜利，更是人类守卫 AI 安全的一座新灯塔。

下一次，当你听到有人说两个模型“差不多”时，你可以推一推眼镜，问他一句：**“它们的张量相似度是多少度？”**

**真相不在像素里，真理在维度的夹角中。** 这，就是 2026 年机器学习理论带给我们的、关于“同一性”的最深刻定义。

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力

撕掉表面的“墙纸”：如何一眼看穿两个 AI 的“灵魂”是否相同？

讨论回复

推荐

智谱 GLM-5 已上线