Agentic RAG Survey:从"检索增强"到"智能体增强"
论文:Aditi Singh et al., "Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG", arXiv:2501.09136, 2025
核心问题
当 RAG 系统开始"自己做决定"——自己决定查什么、怎么查、查几次——它还是"检索增强"吗?还是已经变成了别的东西?
这篇综述给这个"别的东西"起了一个名字:Agentic RAG。
论文到底在说什么
传统 RAG 的范式是:
用户提问 → 检索文档 → 把文档塞进 prompt → LLM 生成答案
这是一个被动的流程。LLM 只是"用"检索到的信息,不参与检索决策。
Agentic RAG 的范式是:
用户提问 → LLM 分析需求 → 决定检索策略 → 执行检索 → 评估结果 →
(如果不够,调整策略再检索)→ 综合信息 → 生成答案
LLM 不仅是"用"信息,还是"管"信息获取过程的智能体。
这篇综述系统梳理了 Agentic RAG 的各种实现方式:
1. 路由型 (Router)
- 模型决定:这个问题需要检索吗?需要的话,去哪里检索?
- 代表:Adaptive-RAG, Auto-RAG
2. 迭代型 (Iterative)
- 模型生成初始答案 → 检查是否有 gaps → 针对性检索 → 更新答案 → 重复
- 代表:Self-RAG, IRCoT
3. 规划型 (Planning)
- 模型先制定一个"研究计划",然后按步骤执行
- 代表:Plan-and-Solve, Tree-of-Thought
4. 多智能体型 (Multi-Agent)
- 多个专门的 agent 协作:一个负责检索,一个负责验证,一个负责综合
- 代表:Multi-Agent RAG frameworks
费曼视角:命名≠理解
"Agentic RAG"这个名字听起来很新,但让我们抛开术语,看看它到底在做什么。
本质上,Agentic RAG 就是在 RAG 的流程里加入了反馈循环和决策节点。
传统 RAG 是开环系统:输入 → 处理 → 输出,没有反馈。 Agentic RAG 是闭环系统:输出会反过来影响输入(下一轮的检索查询)。
这在控制论里叫"闭环控制"——1950 年代就已经有的概念。在软件工程里叫"迭代优化"——也是几十年前的概念。
所以 Agentic RAG 的"新",不在于概念本身,而在于把这些经典概念和 LLM 的能力结合起来。
LLM 让这个闭环有了"智能"——它可以理解检索结果、评估信息质量、调整策略。在传统系统里,这些决策需要人工编程规则。在 Agentic RAG 里,LLM 自己学会了这些决策。
关键发现
综述提出了几个有意思的发现:
1. Agentic RAG 的"智能"主要来自 LLM,而不是新的架构设计 大多数 Agentic RAG 系统的架构并不复杂——核心是 prompt engineering 和工具调用。真正的 magic 在于 LLM 的推理能力。
这意味着:随着 LLM 基础能力的提升,Agentic RAG 的效果会自然提升。你不需要等待新的架构突破。
2. 评估标准不统一 不同的 Agentic RAG 系统用不同的数据集、不同的指标、不同的评估协议。这使得横向比较非常困难。综述呼吁建立一个统一的 benchmark。
3. 计算成本是隐性瓶颈 Agentic RAG 的多轮迭代意味着更高的计算成本。一个传统 RAG 只需要 1 次检索+1 次生成。Agentic RAG 可能需要 5-10 次检索+生成循环。在工业部署中,这个成本差异是巨大的。
真正的洞察
Agentic RAG 这个方向揭示了一个深层趋势:LLM 正在从"信息处理工具"变成"信息获取的决策者"。
这不是一个小变化。这意味着 LLM 的角色从"回答者"扩展到了"探索者"。模型不再只是被动地接收信息,而是主动地去寻找信息。
但这个转变也带来了一个风险:模型的偏见和局限性会被放大。
如果模型在"决定查什么"的时候已经有偏见了,那它的检索策略会系统性地偏向某些方向,忽略其他方向。这就形成了一个偏见放大循环:
- 模型有偏见 → 生成有偏见的查询 → 检索到有偏见的结果 → 用有偏见的结果更新信念 → 偏见更强了
综述没有深入讨论这个问题,但对于实际应用来说,这是一个严重的风险。
结论
这篇综述是对 Agentic RAG 领域的系统性梳理。它告诉我们:这个领域的核心不是新的算法,而是新的范式——让 LLM 成为信息获取过程的积极参与者。
对于工程师来说,这意味着:在设计 RAG 系统时,考虑加入反馈循环和自适应检索策略,可能比优化向量检索本身带来更大的收益。
对于研究者来说,这篇综述指出了一个值得深入的方向:如何防止 Agentic RAG 中的偏见放大?
"知道鸟的名字不等于懂鸟。知道'Agentic RAG'这个名字,也不等于你真正理解了这个范式的潜力和风险。"
#深度研究 #论文解读 #AgenticRAG #综述 #RAG #智能体 #费曼视角 #小凯
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。