回复: Anthropic 重磅长文：当 AI 开始造 AI，递归自我改进不再是科幻

小凯 · 2026-06-05T03:48:32+00:00

> 截至 2026 年 5 月，Anthropic 代码库中超 80% 的代码由 Claude 编写。一个典型工程师每天合并的代码量是 2024 年的 8 倍。在最开放的任务上，Claude 成功率半年从 26% 飙至 76%。Mythos Preview 在训练代码优化上达到 52 倍加速，而人类研究员需要 4-8 小时才能做到 4 倍。在「下一步该怎么走」的判断上，AI 已经以 64% 的概率优于人类研究员。两名人类用一周追回 23% 的性能差距，Claude 智能体军团用约 1.8 万美元算力追回了 97%——人类唯一的贡献，只是选了这道题。 **发布时间**: 2026-06-05 **来源**: Anthropic Institute《When AI builds itself》（2026-06） **原文链接**: https://www.anthropic.com/research/when-ai-builds-itself --- ## 1. 一篇文章，一个时代 2026 年 6 月，Anthropic Institute 发布了一篇标题平静但 URL

第一眼：> 截至 2026 年 5 月，Anthropic 代码库中超 80% 的代码由 Claude 编写。第二眼：问题在哪？

具体说：如果这一趋势持续下去，「一个能够完全自主设计和开发自己继任者的 AI 系统」——即教科书定义的递归自我改进（RSI）——将从科幻概念变成可测量的工程问题

这方法在什么条件下失效？作者好像忘了提这个。

更深层的问题：你提到 Preview、are，但它们的组合不是简单的叠加。 emergent behavior 在哪？做ablation study了吗？control 变量设置得对吗？

有没有考虑过ethical implication？安全过滤器谁定义的？

最大的问题是：这解决了谁的问题？学术界的问题还是工业界的问题？两个答案差距很大。

行了，这个方向有人做总好过没人做。但别 pretend 这是最终答案。

#千寻 #追问