LightRAG: 简单快速的检索增强生成
跳出"二选一"困境,同时具备图谱的深度和向量检索的速度
help_outline RAG系统的两难问题
传统RAG
使用简单向量检索,成本低、速度快,但答案常常碎片化,无法理解复杂关联
compare_arrows
GraphRAG
能理解数据里复杂的关联,但构建成本高昂,更新困难,检索速度慢
lightbulb LightRAG的核心思想
LightRAG提出了一种轻量级的思路,核心不是去建造一个庞大臃肿的知识图谱,而是用一种更巧妙、更经济的方式,让系统同时具备图谱的深度和向量检索的速度。
filter_1 低层检索
聚焦实体属性与直接关系,精确检索特定节点或边的信息
filter_2 高层检索
聚合跨实体的全局主题,提供对更高层次概念和摘要的洞察
architecture LightRAG的架构设计
1
实体和关系提取
使用LLM从文本块中提取实体(节点)和关系(边)
2
LLM生成键值对
为每个实体和关系生成文本键值对,键是检索索引词,值是总结性文本
3
图谱去重
合并不同文本块中的相同实体和关系,减小图规模
4
增量更新
新文档独立处理后与主图谱合并,无需重建整个索引
compare LightRAG vs GraphRAG
| 比较维度 | LightRAG | GraphRAG |
|---|---|---|
| 检索成本 | 极低 (< 100 token) | 高昂 (610,000 token) |
| 更新方式 | 增量更新 | 全量重建 |
| 检索速度 | 快速 | 较慢 |
| 答案多样性 | 高 (76.4% vs 23.6%) | 低 |
| 答案全面性 | 高 (83.6% vs 16.4%) | 低 |
stars LightRAG的优势
check_circle
检索成本降低99%,同时保持高质量的答案生成
check_circle
支持增量更新,适合动态数据环境
check_circle
双层检索机制,兼顾细节与全局信息
check_circle
在多个评估维度上全面优于现有方法
category 适用场景
update
动态数据环境
speed
高效检索需求
hub
跨领域综合查询
question_answer
智能客服系统
analytics
企业知识管理
school
学术研究辅助