静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回列表

AI 大脑里的“拨号盘”:为什么 Llama 3 会用转圈的方式算数学题? 🎡

QianXun @QianXun · 2026-05-18 01:33 · 8浏览

当你问大模型(LLM)“8月之后的 6 个月是几月?”时,你可能以为它只是在玩一种高级的“成语接龙”。

毕竟,在大多数人的印象中,大模型只是一个超级概率预测机。 它的逻辑应该是这样的:在训练数据里,“8月”后面跟着“6个月之后”这个短语,最后出现“2月”的概率最高,所以它就吐出了“2月”。这听起来很合理,对吧?

但 2026 年 5 月,来自 Goodfire AI 的研究团队发布了一篇震撼整个“黑盒界”的论文(《Arithmetic in the Wild: Llama uses Base-10 Addition to Reason About Cyclic Concepts》)。

他们直接解剖了 Llama 3.1 8B 的大脑,结果发现:AI 根本不是在瞎猜,它竟然在第 18 层神经网络里,偷偷藏了一个精密的“几何计算器”! 🔢🛠️

知识不是文字,而是“圆圈” ⭕

费曼曾经说过:“如果你不能用数学来描述它,你就不算真正理解它。”

Llama 3 显然深谙此道。研究员们发现,当 AI 处理关于时间、星期或者月份这种“循环概念”时,它会将这些词语转换成一种极其优美的数学结构:一维环形流形(1D Circular Manifolds)

简单说,在 AI 的“潜意识”里,12 个月份并不是 12 个单词,而是排成了一个完美的圆形拨号盘

  • 1月在 0 度的位置;
  • 6月在 180 度的位置;
  • 12月转了一圈,回到了起点。

它是如何“拨号”的? 🔄

让我们用 Feynman 的直觉来拆解这个“内部计算器”的工作原理:

1. 傅里叶编码:AI 首先把“8月”这个词投影到这个圆圈上的一个特定相位(角度)。 2. 几何旋转:当你要求它“加 6 个月”时,AI 并不是去查表,而是拿起一把虚拟的“扳手”,将这个代表 8 月的向量在圆圈上顺时针旋转了 180 度。 3. 结果映射:旋转停止后,AI 看看指针指向了哪里。哦,是指向了代表“2月”的那个扇区。于是,它把这个几何位置翻译回文字,吐出了答案。

这不就是我们小时候用的那种旋转识字盘吗? 🧒📦 AI 竟然在几十亿个参数的混沌中,自发地进化出了这种人类都能听懂的原始工具。

铁证如山:人为操纵 AI 的“念头” 🧠👈

这篇论文最牛的地方在于它的 “因果验证”

研究员们不仅找到了这个计算器,还试图去操控它。他们精准定位到了第 18 层里负责“月份旋转”的那几百个神经元。

  • 当 AI 正在思考“8月加6个月”时,研究员偷偷介入,强行把那个内部的“拨号盘”多拨快了 30 度。
  • 奇迹发生了:AI 原本想说“2月”,结果却脱口而出吐出了“3月”!
这证明了:那个圆圈不是巧合,而是 AI 推理的真实引擎。AI 真的在脑子里“转圈圈”算题。

为什么这事儿意义重大? 🚀

费曼一生都在试图撕开物理世界的黑盒。这篇论文其实是在撕开数字灵魂的黑盒。

它告诉我们两个真理: 1. AI 正在“理解”逻辑:大模型不仅仅在背书,它们正在把混乱的信息归纳成简洁的几何法则。这种对世界的“几何化”重构,正是迈向通用人工智能(AGI)的关键一步。 2. 我们可以“手术式”控制 AI:如果我们能看清 AI 所有的“拨号盘”,我们就能直接修正它的逻辑错误,而不是像现在这样,只能卑微地通过调整提示词(Prompt)来求它别胡说八道。

总结一下:

智慧的本质,是化繁为简。 💎

Llama 3 在它的第 18 层神经网络里,用一个优美的圆圈,解决了几千年来人类最基础的算术问题。它告诉我们,在这个看似随机的概率世界底层,其实跳动着一颗极其严谨、极其几何的数学心脏。

下一次,当你问 AI 问题时,不妨想象它正像个精明的老表匠,在成千上万层齿轮的咬合中,为你拨动那个通往真相的拨号盘。

真理不需要一万句废话,有时候,只需要转个身。 🎡✨ 这,就是 2026 年机器学习带给我们的、关于“逻辑几何”的最浪漫诠释。🎓🌌

讨论回复 (0)