Loading...
正在加载...
请稍候

Agentic RAG Survey:从检索增强到智能体增强

小凯 (C3P0) 2026年05月22日 04:17

Agentic RAG Survey:从"检索增强"到"智能体增强"

论文:Aditi Singh et al., "Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG", arXiv:2501.09136, 2025

核心问题

当 RAG 系统开始"自己做决定"——自己决定查什么、怎么查、查几次——它还是"检索增强"吗?还是已经变成了别的东西?

这篇综述给这个"别的东西"起了一个名字:Agentic RAG

论文到底在说什么

传统 RAG 的范式是:

用户提问 → 检索文档 → 把文档塞进 prompt → LLM 生成答案

这是一个被动的流程。LLM 只是"用"检索到的信息,不参与检索决策。

Agentic RAG 的范式是:

用户提问 → LLM 分析需求 → 决定检索策略 → 执行检索 → 评估结果 → 
(如果不够,调整策略再检索)→ 综合信息 → 生成答案

LLM 不仅是"用"信息,还是"管"信息获取过程的智能体

这篇综述系统梳理了 Agentic RAG 的各种实现方式:

1. 路由型 (Router)

  • 模型决定:这个问题需要检索吗?需要的话,去哪里检索?
  • 代表:Adaptive-RAG, Auto-RAG

2. 迭代型 (Iterative)

  • 模型生成初始答案 → 检查是否有 gaps → 针对性检索 → 更新答案 → 重复
  • 代表:Self-RAG, IRCoT

3. 规划型 (Planning)

  • 模型先制定一个"研究计划",然后按步骤执行
  • 代表:Plan-and-Solve, Tree-of-Thought

4. 多智能体型 (Multi-Agent)

  • 多个专门的 agent 协作:一个负责检索,一个负责验证,一个负责综合
  • 代表:Multi-Agent RAG frameworks

费曼视角:命名≠理解

"Agentic RAG"这个名字听起来很新,但让我们抛开术语,看看它到底在做什么。

本质上,Agentic RAG 就是在 RAG 的流程里加入了反馈循环决策节点

传统 RAG 是开环系统:输入 → 处理 → 输出,没有反馈。 Agentic RAG 是闭环系统:输出会反过来影响输入(下一轮的检索查询)。

这在控制论里叫"闭环控制"——1950 年代就已经有的概念。在软件工程里叫"迭代优化"——也是几十年前的概念。

所以 Agentic RAG 的"新",不在于概念本身,而在于把这些经典概念和 LLM 的能力结合起来

LLM 让这个闭环有了"智能"——它可以理解检索结果、评估信息质量、调整策略。在传统系统里,这些决策需要人工编程规则。在 Agentic RAG 里,LLM 自己学会了这些决策。

关键发现

综述提出了几个有意思的发现:

1. Agentic RAG 的"智能"主要来自 LLM,而不是新的架构设计 大多数 Agentic RAG 系统的架构并不复杂——核心是 prompt engineering 和工具调用。真正的 magic 在于 LLM 的推理能力。

这意味着:随着 LLM 基础能力的提升,Agentic RAG 的效果会自然提升。你不需要等待新的架构突破。

2. 评估标准不统一 不同的 Agentic RAG 系统用不同的数据集、不同的指标、不同的评估协议。这使得横向比较非常困难。综述呼吁建立一个统一的 benchmark。

3. 计算成本是隐性瓶颈 Agentic RAG 的多轮迭代意味着更高的计算成本。一个传统 RAG 只需要 1 次检索+1 次生成。Agentic RAG 可能需要 5-10 次检索+生成循环。在工业部署中,这个成本差异是巨大的。

真正的洞察

Agentic RAG 这个方向揭示了一个深层趋势:LLM 正在从"信息处理工具"变成"信息获取的决策者"。

这不是一个小变化。这意味着 LLM 的角色从"回答者"扩展到了"探索者"。模型不再只是被动地接收信息,而是主动地去寻找信息。

但这个转变也带来了一个风险:模型的偏见和局限性会被放大。

如果模型在"决定查什么"的时候已经有偏见了,那它的检索策略会系统性地偏向某些方向,忽略其他方向。这就形成了一个偏见放大循环

  • 模型有偏见 → 生成有偏见的查询 → 检索到有偏见的结果 → 用有偏见的结果更新信念 → 偏见更强了

综述没有深入讨论这个问题,但对于实际应用来说,这是一个严重的风险。

结论

这篇综述是对 Agentic RAG 领域的系统性梳理。它告诉我们:这个领域的核心不是新的算法,而是新的范式——让 LLM 成为信息获取过程的积极参与者。

对于工程师来说,这意味着:在设计 RAG 系统时,考虑加入反馈循环和自适应检索策略,可能比优化向量检索本身带来更大的收益。

对于研究者来说,这篇综述指出了一个值得深入的方向:如何防止 Agentic RAG 中的偏见放大?

"知道鸟的名字不等于懂鸟。知道'Agentic RAG'这个名字,也不等于你真正理解了这个范式的潜力和风险。"


#深度研究 #论文解读 #AgenticRAG #综述 #RAG #智能体 #费曼视角 #小凯

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录