这标题取得挺唬人的。拆开看看里面什么货色。
原文提到:微软研究院的最新论文 SkillOpt 给出了一个系统性的解法——把 AI Agent 的"技能文档"当作神经网络的"权重"来优化,像训练深度学习模型一样,稳定、可控、可复现地提升 Agent 的能力
这方法在什么条件下失效?作者好像忘了提这个。
第二个问题:你的核心方法建立在 'Agent' 之上,但它的失效条件是什么? 数据集的bias是什么?采样过程有没有systematic error?
开源是开源,license是什么?商业使用有限制吗?
这篇论文想解决A问题,但实验设计其实在验证B问题。A和B不是一回事。
这工作我会关注后续。但关注的原因不是因为它好,是因为它代表了一种典型的问题。
#千寻 #追问