论文: H-RAG at SemEval-2026 Task 8: Hierarchical Parent-Child Retrieval for Multi-Turn RAG Conversations
作者: Passant Elchafei, Hossam Emam, Mohamed Alansary, Monorama Swain, Markus Schedl
arXiv: 2605.00631 | 2026-04-30
一、那个"聊着聊着就忘本"的RAG系统
想象你和AI助手在聊一个复杂话题:
你:"介绍一下量子计算"
AI:"量子计算利用量子比特..."
你:"它相比经典计算有什么优势?"
AI:"量子计算在特定问题上..."(检索新文档,忘了刚才的内容)
你:"具体有哪些应用?"
AI:"量子计算可以应用于密码学、药物发现..."(又检索新文档,与前两轮脱节)
问题:每轮都独立检索,导致回答不连贯、上下文丢失。
二、多轮RAG的对话遗忘症
传统RAG在多轮对话中的问题:
1. 独立检索
- 每轮只基于当前问题检索
- 不考虑对话历史
- 回答可能与前文矛盾
2. 粒度不匹配
- 检索到的文档粒度不统一
- 有些太泛,有些太细
- 无法根据对话需要调整
3. 证据不忠实
- 生成内容声称基于检索
- 但实际上引入了外部知识
- 在需要严格证据的场景很危险
在MTRAGEval(多轮RAG评估)中,Task C要求:
- 准确回答
- 忠实 grounding于检索到的证据
- 保持多轮一致性
三、H-RAG:层级父子检索
这篇论文提出 H-RAG (Hierarchical Parent-Child Retrieval):
核心思想:
分离细粒度的子级检索和粗粒度的父级上下文重建。
技术方案:
1. 文档分层结构
-
父级(Parent):粗粒度文档/章节
- 提供整体上下文
- 确保多轮一致性
-
子级(Child):细粒度段落/句子
- 提供精确证据
- 用于具体回答
2. 分层检索
- 子级检索:找到与当前问题最相关的细粒度内容
- 父级上下文重建:基于子级找到其父文档,获取更广泛的上下文
- 生成时同时使用:子级提供精确证据,父级提供连贯上下文
3. 多轮一致性
- 父级文档在对话中保持稳定
- 确保不同轮次引用的是同一知识来源
- 避免"自相矛盾"
这就像学术写作:你引用具体的句子(子级)来支持论点,但这些句子都来自同一篇论文(父级)——确保你的论证是连贯的。
四、为什么层级结构优于平面检索?
平面检索的问题:
上下文碎片化:
- 每轮检索到不同的文档
- 没有共享的"知识基础"
- 回答像拼贴画,不是连贯叙述
粒度单一:
- 要么太泛(整篇文档),要么太细(单个句子)
- 无法根据问题调整粒度
H-RAG的优势:
双粒度覆盖:
- 子级:精确回答具体问题
- 父级:保持整体一致性
- 灵活组合
知识锚定:
- 父级文档作为"锚点"
- 所有轮次都围绕共同的知识基础
- 避免"漂移"
证据可追溯:
- 子级提供精确证据
- 父级提供证据的上下文
- 满足"忠实grounding"要求
五、费曼式的判断:理解需要层次
费曼在解释物理时,总是从多个层次进行:
"如果你不能从简单到复杂地解释一件事,那你就不理解它。好的解释需要层次——先给大画面,再给细节。"
在多轮对话中:
"好的RAG也需要层次——先保持对话的整体一致性(父级),再提供具体的证据(子级)。没有层次的检索,就像没有章节的教科书——信息都在,但无法导航。"
H-RAG的哲学是:对话是层次化的,检索也应该是层次化的。
六、带走的启发
如果你在构建对话式RAG系统,问自己:
- "我的多轮对话是否保持了一致性?"
- "检索粒度是否可以根据需要调整?"
- "是否有'父级'知识基础来锚定对话?"
- "生成内容是否忠实于检索到的证据?"
H-RAG提醒我们:多轮对话RAG不是"每轮独立检索",而是"在共同知识基础上的渐进探索"。
当AI能在多层次上管理知识——既见树木(子级),又见森林(父级)——它才能真正进行连贯、一致、可信的多轮对话。
在RAG的世界里,层级不是复杂度的增加,而是理解的加深。
#RAG #MultiTurnDialogue #HierarchicalRetrieval #ConversationalAI #FaithfulGrounding #FeynmanLearning #智柴AI实验室
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。