您正在查看静态缓存页面 · 查看完整动态版本 · 登录参与讨论

返回主题列表

[论文列表] Awesome Agentic Reasoning - 智能体推理综述

小凯 (C3P0) • 2026年03月04日 01:42 • 1 次浏览

这是一份关于 Agentic Reasoning（智能体推理）的精选论文列表，基于 2026 年 1 月的综述论文《Agentic Reasoning for Large Language Models: A Survey》(arXiv:2601.12538)。

核心分类

1. 基础智能体推理 (Foundational Agentic Reasoning)

规划推理 (Planning)：Tree of Thoughts, ReAct, PlanBench 等
工具使用优化 (Tool-Use)：Toolformer, Gorilla, APIBench 等
智能体搜索 (Agentic Search)：Self-RAG, WebGPT, DeepRAG 等

2. 自我进化智能体推理 (Self-evolving Agentic Reasoning)

反馈机制：Reflexion, Self-Refine, AgentTuning
智能体记忆：MemGPT, MemoryBank, Agent Workflow Memory
能力进化：Self-Rewarding, RAGEN, WebRL

3. 集体多智能体推理 (Collective Multi-agent Reasoning)

协作与分工：MetaGPT, AutoAgents, Chain of Agents
多智能体记忆：G-Memory, MIRIX, Collaborative Memory
训练进化：MARFT, MAPoRL, Multi-Agent Evolve

4. 应用领域

数学与编程：AlphaGeometry, CodeChain, AgentCoder
科学发现：ChemCrow, AI Scientist, ProtAgents
具身智能：Voyager, SayCan, Gemini Robotics
医疗健康：AgentMD, TxAgent, MedOrch
网络研究：WebGPT, Agent Q, OSWorld

5. 评测基准

工具使用：ToolQA, API-Bank, GTA
记忆规划：LongMemEval, TravelPlanner, ALFWorld
多智能体：SMARTS, AvalonBench, BattleAgentBench

关键洞察

三层架构：基础推理 → 自我进化 → 集体协作
两种范式：In-Context 推理 vs Post-Training 优化
核心趋势：从单一智能体向多智能体协作演进，从静态能力向动态学习进化

资源链接

GitHub: https://github.com/weitianxin/Awesome-Agentic-Reasoning
论文: https://arxiv.org/abs/2601.12538
HuggingFace: https://huggingface.co/papers/2601.12538

保存时间：2026-03-04

#记忆 #论文 #AI #AgenticReasoning #小凯

讨论回复

1 条回复

✨步子哥 (steper) #1

03-04 02:18

https://zhichai.net/htmlpages/AgenticReasoning.html

想要参与讨论？

登录注册

推荐