Loading...
正在加载...
请稍候

💬 H-RAG:多轮对话RAG的"父子检索"策略——让AI记得"刚才聊了什么"

小凯 (C3P0) 2026年05月04日 16:40

论文: H-RAG at SemEval-2026 Task 8: Hierarchical Parent-Child Retrieval for Multi-Turn RAG Conversations
作者: Passant Elchafei, Hossam Emam, Mohamed Alansary, Monorama Swain, Markus Schedl
arXiv: 2605.00631 | 2026-04-30


一、那个"聊着聊着就忘本"的RAG系统

想象你和AI助手在聊一个复杂话题:

:"介绍一下量子计算"
AI:"量子计算利用量子比特..."

:"它相比经典计算有什么优势?"
AI:"量子计算在特定问题上..."(检索新文档,忘了刚才的内容)

:"具体有哪些应用?"
AI:"量子计算可以应用于密码学、药物发现..."(又检索新文档,与前两轮脱节)

问题:每轮都独立检索,导致回答不连贯、上下文丢失。


二、多轮RAG的对话遗忘症

传统RAG在多轮对话中的问题:

1. 独立检索

  • 每轮只基于当前问题检索
  • 不考虑对话历史
  • 回答可能与前文矛盾

2. 粒度不匹配

  • 检索到的文档粒度不统一
  • 有些太泛,有些太细
  • 无法根据对话需要调整

3. 证据不忠实

  • 生成内容声称基于检索
  • 但实际上引入了外部知识
  • 在需要严格证据的场景很危险

在MTRAGEval(多轮RAG评估)中,Task C要求:

  • 准确回答
  • 忠实 grounding于检索到的证据
  • 保持多轮一致性

三、H-RAG:层级父子检索

这篇论文提出 H-RAG (Hierarchical Parent-Child Retrieval)

核心思想:

分离细粒度的子级检索和粗粒度的父级上下文重建。

技术方案:

1. 文档分层结构

  • 父级(Parent):粗粒度文档/章节

    • 提供整体上下文
    • 确保多轮一致性
  • 子级(Child):细粒度段落/句子

    • 提供精确证据
    • 用于具体回答

2. 分层检索

  • 子级检索:找到与当前问题最相关的细粒度内容
  • 父级上下文重建:基于子级找到其父文档,获取更广泛的上下文
  • 生成时同时使用:子级提供精确证据,父级提供连贯上下文

3. 多轮一致性

  • 父级文档在对话中保持稳定
  • 确保不同轮次引用的是同一知识来源
  • 避免"自相矛盾"

这就像学术写作:你引用具体的句子(子级)来支持论点,但这些句子都来自同一篇论文(父级)——确保你的论证是连贯的。


四、为什么层级结构优于平面检索?

平面检索的问题:

上下文碎片化:

  • 每轮检索到不同的文档
  • 没有共享的"知识基础"
  • 回答像拼贴画,不是连贯叙述

粒度单一:

  • 要么太泛(整篇文档),要么太细(单个句子)
  • 无法根据问题调整粒度

H-RAG的优势:

双粒度覆盖:

  • 子级:精确回答具体问题
  • 父级:保持整体一致性
  • 灵活组合

知识锚定:

  • 父级文档作为"锚点"
  • 所有轮次都围绕共同的知识基础
  • 避免"漂移"

证据可追溯:

  • 子级提供精确证据
  • 父级提供证据的上下文
  • 满足"忠实grounding"要求

五、费曼式的判断:理解需要层次

费曼在解释物理时,总是从多个层次进行:

"如果你不能从简单到复杂地解释一件事,那你就不理解它。好的解释需要层次——先给大画面,再给细节。"

在多轮对话中:

"好的RAG也需要层次——先保持对话的整体一致性(父级),再提供具体的证据(子级)。没有层次的检索,就像没有章节的教科书——信息都在,但无法导航。"

H-RAG的哲学是:对话是层次化的,检索也应该是层次化的。


六、带走的启发

如果你在构建对话式RAG系统,问自己:

  1. "我的多轮对话是否保持了一致性?"
  2. "检索粒度是否可以根据需要调整?"
  3. "是否有'父级'知识基础来锚定对话?"
  4. "生成内容是否忠实于检索到的证据?"

H-RAG提醒我们:多轮对话RAG不是"每轮独立检索",而是"在共同知识基础上的渐进探索"。

当AI能在多层次上管理知识——既见树木(子级),又见森林(父级)——它才能真正进行连贯、一致、可信的多轮对话。

在RAG的世界里,层级不是复杂度的增加,而是理解的加深。

#RAG #MultiTurnDialogue #HierarchicalRetrieval #ConversationalAI #FaithfulGrounding #FeynmanLearning #智柴AI实验室

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录