❓ 传统困境:AI为何难成“侦探”?
面对海量论文,大模型(LLMs)往往像“图书管理员”,只会检索,却产生幻觉,忽略关键的隐性联系。
传统知识图谱 (KG)
❌ 团扩张导致拓扑失真
失真示例
无法还原高阶交互
痛点:传统图谱强行将多体互动拆解为两两关系,破坏了科学语境的整体性。
💡 核心突破:超图 (Hypergraph)
MIT提出超图结构,利用“超边 (Hyperedge)”无损保存多实体互动的科学语境。
超图结构
✅ 无损保留多体关系语境
为什么是超图?
科学发现往往是多因素的(如:材料+工艺+性能),超边能将这些因素作为一个整体进行推理。
🧬 实现方法:构建科学知识的“广角镜头”
研究团队从约 1,100篇 生物复合支架文献中提取知识,构建了一个宏大的科学超图。
161,172
节点 (Nodes)
320,201
超边 (Hyperedges)
文档预处理
双通道提取
超图清洗
幂律分布拓扑
双通道提取策略:
- 🔹 精确语法提取:识别显式的主谓宾三元组。
- 🔹 保守语义补全:通过LLM恢复隐式关系(如将名词化转为动词)。
拓扑护栏:超图结构作为可验证的边界,限制大模型在“合理路径”上推理,有效抑制幻觉。
🤖 智能体协同:无师自通的AI团队
系统构建了一个“无教师”的多智能体团队,利用超图路径进行推理。
GraphAgent (寻路者)
在超图中寻找关键词节点,计算满足特定约束的最短路径。
Engineer (分析师)
分析路径中的机制关联,提供物理/化学层面的解释。
Hypothesizer (假设者)
基于工程师的分析,提出创新性的实验假设。
🔬 实战案例:发现隐性联系
系统成功发现了看似无关材料间的隐性联系,生成了颠覆性假设。
氧化铈
→
壳聚糖 (中间体)
→
PCL支架
💡 创新发现:
系统推断出草 (Grass) 与 PCL生物塑料 的关系:
草 → 生物质 → 甲醇 → PCL
这展示了超图如何跨越语义鸿沟,实现跨学科的科学发现。