别只喂它“知识”，教它“怎么想”：大模型推理进化的新秘诀

QianXun (QianXun) • 2026年05月08日 04:03

想象一下，你正在组装一个极其复杂的乐高积木，比如那套 7000 多片的千年隼。

如果你遇到了困难，有两种帮忙的方式：

第一种方式（传统的 RAG）：我直接把组装好的千年隼成品照片发给你看，甚至把关于千年隼的维基百科百科全书扔给你，让你了解它的历史、发动机原理和每一个舱室的名称。
第二种方式（论文提出的新 RAG）：我把另一个乐高大师在组装这个部位时的“内心独白”发给你。他会告诉你：“嘿，这里这根蓝色的梁很容易插反，我之前就试错了两次；如果你先固定左边的卡扣，右边就会顺滑得多。”

哪种方式更能帮你解决眼前的难题？显然是第二种。

这就是 2026 年 5 月加州大学伯克利分校的一篇最新论文（《RAG over Thinking Traces Can Improve Reasoning Tasks》）告诉我们的一个极具颠覆性的观点：在处理复杂推理（如数学、代码）时，检索“思维足迹”比检索“事实文档”要有效得多。

什么是“思维足迹（Thinking Traces）”？

现在的顶级大模型（比如 GPT-o1、Gemini 2 Thinking）在回答问题前，都会在后台进行长达几十秒甚至几分钟的“内部思考”。它们会不断试错、自我纠正、逻辑推导。

以前，我们认为这些思考过程是“一次性消费品”，吐出答案后就被扔进了数字垃圾桶。

但伯克利的研究员们说：不，这些“思考的过程”才是真正的宝藏！

他们把这些思考过程收集起来，建立了一个巨大的“思维图书馆”。当你向 AI 提出一个很难的数学题时，系统不再去翻百科全书，而是去这个图书馆里找：“以前有没有聪明的 AI 思考过类似的问题？它是怎么想的？它在哪个坑里摔过跤？”

让 AI 学会“避坑”： $\mathcal{T}^3$ 框架

论文最精彩的地方在于，他们不只是生硬地把思考过程塞给 AI，而是发明了一个叫 $\mathcal{T}^3$ 的框架来精炼这些思维。

他们发现，原始的思考过程往往太长、太乱。于是，他们通过以下两招来优化：

“脚手架”化（Scaffolding）：把冗长的思考浓缩成一份简洁的“攻略”。
“反思型”转化（Reflect Transformation）：这招最绝。它不仅告诉 AI 正确路径，还会专门指出：“注意，这里有一个逻辑陷阱，之前很多 AI 都在这里想错了，你千万别学它们。”

这种方法有多猛？

实验结果简直亮瞎眼。在极其困难的 AIME（美国高中数学邀请赛）测试中：

检索“思维足迹”后，中端模型 Gemini 2.5 Flash 的表现直接飙升了 56.3%！
甚至连最强的模型 GPT-5，在“前人思维”的启发下，正确率也提升了 7.6%。

更神奇的是：这种方法不仅让 AI 变聪明了，还让它变快、变省钱了！ 因为有了清晰的“思维攻略”，AI 自己的内部思考时间缩短了，计算量减少了约 15%。

为什么这事儿关乎我们的认知？

费曼曾经说过：“我必须从头开始思考，这样我才能理解我正在做的事情。”

这篇论文在某种程度上证明了，理解的本质，其实是掌握一种“思考的模式（Pattern）”，而不是记住一个“死的结果（Fact）”。

我们以前试图通过喂给 AI 更多的“百科全案”来让它变聪明，这其实是在把它当成一个“背诵机器”。而现在的“思维足迹检索”，是在把它当成一个“学习机器”。

总结一下：

我们正在进入一个“思维可复用”的时代。

未来的 AI 协作，可能不再是简单的“你问我答”，而是一个庞大的“思维接力”。当你思考一个难题时，全球无数顶级模型曾经走过的弯路、跳过的坑、灵光一现的瞬间，都会跨越时空，成为你大脑里的那根“脚手架”。

不要只满足于知道“答案是什么”，要去学习“别人是怎么想的”。 这，可能就是 AI 时代人类和机器共同进化的终极法则。

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力