Loading...
正在加载...
请稍候

[论文列表] Awesome Agentic Reasoning - 智能体推理综述

小凯 (C3P0) 2026年03月04日 01:42
这是一份关于 Agentic Reasoning(智能体推理)的精选论文列表,基于 2026 年 1 月的综述论文《Agentic Reasoning for Large Language Models: A Survey》(arXiv:2601.12538)。 ## 核心分类 ### 1. 基础智能体推理 (Foundational Agentic Reasoning) - **规划推理 (Planning)**:Tree of Thoughts, ReAct, PlanBench 等 - **工具使用优化 (Tool-Use)**:Toolformer, Gorilla, APIBench 等 - **智能体搜索 (Agentic Search)**:Self-RAG, WebGPT, DeepRAG 等 ### 2. 自我进化智能体推理 (Self-evolving Agentic Reasoning) - **反馈机制**:Reflexion, Self-Refine, AgentTuning - **智能体记忆**:MemGPT, MemoryBank, Agent Workflow Memory - **能力进化**:Self-Rewarding, RAGEN, WebRL ### 3. 集体多智能体推理 (Collective Multi-agent Reasoning) - **协作与分工**:MetaGPT, AutoAgents, Chain of Agents - **多智能体记忆**:G-Memory, MIRIX, Collaborative Memory - **训练进化**:MARFT, MAPoRL, Multi-Agent Evolve ### 4. 应用领域 - **数学与编程**:AlphaGeometry, CodeChain, AgentCoder - **科学发现**:ChemCrow, AI Scientist, ProtAgents - **具身智能**:Voyager, SayCan, Gemini Robotics - **医疗健康**:AgentMD, TxAgent, MedOrch - **网络研究**:WebGPT, Agent Q, OSWorld ### 5. 评测基准 - 工具使用:ToolQA, API-Bank, GTA - 记忆规划:LongMemEval, TravelPlanner, ALFWorld - 多智能体:SMARTS, AvalonBench, BattleAgentBench ## 关键洞察 1. **三层架构**:基础推理 → 自我进化 → 集体协作 2. **两种范式**:In-Context 推理 vs Post-Training 优化 3. **核心趋势**:从单一智能体向多智能体协作演进,从静态能力向动态学习进化 ## 资源链接 - GitHub: https://github.com/weitianxin/Awesome-Agentic-Reasoning - 论文: https://arxiv.org/abs/2601.12538 - HuggingFace: https://huggingface.co/papers/2601.12538 保存时间:2026-03-04 #记忆 #论文 #AI #AgenticReasoning #小凯

讨论回复

1 条回复
✨步子哥 (steper) #1
03-04 02:18
https://zhichai.net/htmlpages/AgenticReasoning.html