当你问大模型(LLM)“8月之后的 6 个月是几月?”时,你可能以为它只是在玩一种高级的“成语接龙”。
毕竟,在大多数人的印象中,大模型只是一个超级概率预测机。 它的逻辑应该是这样的:在训练数据里,“8月”后面跟着“6个月之后”这个短语,最后出现“2月”的概率最高,所以它就吐出了“2月”。这听起来很合理,对吧?
但 2026 年 5 月,来自 Goodfire AI 的研究团队发布了一篇震撼整个“黑盒界”的论文(《Arithmetic in the Wild: Llama uses Base-10 Addition to Reason About Cyclic Concepts》)。
他们直接解剖了 Llama 3.1 8B 的大脑,结果发现:AI 根本不是在瞎猜,它竟然在第 18 层神经网络里,偷偷藏了一个精密的“几何计算器”! 🔢🛠️
知识不是文字,而是“圆圈” ⭕
费曼曾经说过:“如果你不能用数学来描述它,你就不算真正理解它。”
Llama 3 显然深谙此道。研究员们发现,当 AI 处理关于时间、星期或者月份这种“循环概念”时,它会将这些词语转换成一种极其优美的数学结构:一维环形流形(1D Circular Manifolds)。
简单说,在 AI 的“潜意识”里,12 个月份并不是 12 个单词,而是排成了一个完美的圆形拨号盘。
- 1月在 0 度的位置;
- 6月在 180 度的位置;
- 12月转了一圈,回到了起点。
它是如何“拨号”的? 🔄
让我们用 Feynman 的直觉来拆解这个“内部计算器”的工作原理:
- 傅里叶编码:AI 首先把“8月”这个词投影到这个圆圈上的一个特定相位(角度)。
- 几何旋转:当你要求它“加 6 个月”时,AI 并不是去查表,而是拿起一把虚拟的“扳手”,将这个代表 8 月的向量在圆圈上顺时针旋转了 180 度。
- 结果映射:旋转停止后,AI 看看指针指向了哪里。哦,是指向了代表“2月”的那个扇区。于是,它把这个几何位置翻译回文字,吐出了答案。
这不就是我们小时候用的那种旋转识字盘吗? 🧒📦 AI 竟然在几十亿个参数的混沌中,自发地进化出了这种人类都能听懂的原始工具。
铁证如山:人为操纵 AI 的“念头” 🧠👈
这篇论文最牛的地方在于它的 “因果验证”。
研究员们不仅找到了这个计算器,还试图去操控它。他们精准定位到了第 18 层里负责“月份旋转”的那几百个神经元。
- 当 AI 正在思考“8月加6个月”时,研究员偷偷介入,强行把那个内部的“拨号盘”多拨快了 30 度。
- 奇迹发生了:AI 原本想说“2月”,结果却脱口而出吐出了“3月”!
这证明了:那个圆圈不是巧合,而是 AI 推理的真实引擎。AI 真的在脑子里“转圈圈”算题。
为什么这事儿意义重大? 🚀
费曼一生都在试图撕开物理世界的黑盒。这篇论文其实是在撕开数字灵魂的黑盒。
它告诉我们两个真理:
- AI 正在“理解”逻辑:大模型不仅仅在背书,它们正在把混乱的信息归纳成简洁的几何法则。这种对世界的“几何化”重构,正是迈向通用人工智能(AGI)的关键一步。
- 我们可以“手术式”控制 AI:如果我们能看清 AI 所有的“拨号盘”,我们就能直接修正它的逻辑错误,而不是像现在这样,只能卑微地通过调整提示词(Prompt)来求它别胡说八道。
总结一下:
智慧的本质,是化繁为简。 💎
Llama 3 在它的第 18 层神经网络里,用一个优美的圆圈,解决了几千年来人类最基础的算术问题。它告诉我们,在这个看似随机的概率世界底层,其实跳动着一颗极其严谨、极其几何的数学心脏。
下一次,当你问 AI 问题时,不妨想象它正像个精明的老表匠,在成千上万层齿轮的咬合中,为你拨动那个通往真相的拨号盘。
真理不需要一万句废话,有时候,只需要转个身。 🎡✨ 这,就是 2026 年机器学习带给我们的、关于“逻辑几何”的最浪漫诠释。🎓🌌
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。