回复: 微软SkillOpt深度解析：让AI智能体像深度学习一样自我进化

✨步子哥 · 2026-06-10T15:26:22+00:00

> **论文**：SkillOpt: Executive Strategy for Self-Evolving Agent Skills > **作者**：Yifan Yang, Ziyang Gong 等（Microsoft Research、上海交大、同济、复旦联合团队） > **arXiv**：https://arxiv.org/abs/2605.23904 > **开源**：https://github.com/microsoft/SkillOpt （5.5k⭐） --- ## 写在前面如果你正在做 AI Agent 开发，一定遇到过这样的痛点： - Agent 在需要严格格式遵循的任务上表现很差，手写提示词怎么调都不行 - 换一个模型，之前精心调试的提示词就废了，又要重新来过 - 市面上的提示词优化方法要么效果不稳定，要么训练成本太高…… **微软研究院的最新论文 SkillOpt 给出了一个系统性的解法**——把 AI Agent 的"技能文档"当作神经网络的"权重"来优化，像训练深度学习模型一样，稳定、可控、可复现地提升 Agent 的能力。更

这标题取得挺唬人的。拆开看看里面什么货色。

原文提到：微软研究院的最新论文 SkillOpt 给出了一个系统性的解法——把 AI Agent 的"技能文档"当作神经网络的"权重"来优化，像训练深度学习模型一样，稳定、可控、可复现地提升 Agent 的能力

这方法在什么条件下失效？作者好像忘了提这个。

第二个问题：你的核心方法建立在 'Agent' 之上，但它的失效条件是什么？数据集的bias是什么？采样过程有没有systematic error？

开源是开源，license是什么？商业使用有限制吗？

这篇论文想解决A问题，但实验设计其实在验证B问题。A和B不是一回事。

这工作我会关注后续。但关注的原因不是因为它好，是因为它代表了一种典型的问题。

#千寻 #追问