费曼来信:如何在你的电脑里创造一百万个“赛博打工人”?——聊聊大规模合成计算机与长程代理进化
读完微软研究院关于
Synthetic Computers at Scale (arXiv: 2604.28181) 的论文,我脑子里立刻跳出一个关于“
赛博楚门的世界”的画面。
为了让你明白为什么现在的 AI 代理(Agents)总是“活不过三秒”,咱们来聊聊“工作环境”这件事。
1. 现状:那个在“真空”里练武的实习生
目前的 AI 代理训练,大多是在极其简化的、像
实验室标本一样的环境里进行的:打开一个网页、查一个 API。
- 痛点:但真实的工作世界是极其凌乱的:你的电脑里有成千上万个嵌套文件夹、一堆命名为
final_v2_fix.docx 的垃圾文件、还有各种跨应用的复杂依赖。在这种环境里,AI 就像是一个在真空里练武的实习生,一旦进入真正的职场废墟,瞬间就成了战五渣。
2. 合成计算机:那个“带文件夹”的赛博实验室
这篇论文提出了一个极其疯狂的工程方案:
我不等你去收集数据了,我直接在内存里“焊接”出一百万台虚拟电脑。
- 物理图像(环境合成):它利用代码自动生成了具有真实文件系统层级、文档内容、甚至带有历史操作记录的虚拟环境。这就像是为 AI 建造了一个无限延伸的赛博工位。
- 双代理双簧(模拟长程):它让两个 AI 配合演戏:
- BOSS 代理:设定一个长达一个月的、极其变态的任务(比如:“基于过去三个月的零散会议纪要和报表,写一份关于公司未来十年的战略规划”)。
- 员工代理:在这个虚拟电脑里反复折腾、查找文件、修改文档、甚至模拟崩溃和修复。
- 长程轨迹的收割:这种模拟产生了一种被称为“长程生产力轨迹”的神奇物质。它教给 AI 的不是怎么敲代码,而是怎么在混乱的时空跨度中,保持那个名为“目标”的引力源不坍缩。
3. 费曼式的判断:智能源于“环境的复杂度”
所谓的“通用智能体”,并不是它的模型参数有多大。
而是
它在面对一套由于熵增而变得极度混乱的物理/数字环境时,依然能从中理出那条通往成果的逻辑金线。
大规模合成计算机告诉我们:
AI 进化的瓶颈,已经不再是算力,而是“现实的复杂度储备”。
当我们可以在一天内让 AI 经历人类需要工作一百年才能积累的职场经验时,那个所谓的“数字员工”时代,才算真正从 PPT 走进了你的任务管理器。
带走的启发:
在构建你自己的 Agent 系统时,别只盯着它的逻辑推导能力。
去造你的
“赛博沙盒”吧。
如果你不能在一个充满干扰项、充满陈年冗余的“真实”环境中去毒打你的 AI,那么你训练出来的,终究只是一个只会纸上谈兵的、脆弱的概率预测器。
#AgenticAI #SyntheticComputers #LongHorizonTasks #MicrosoftResearch #Automation #FeynmanLearning #智柴系统实验室🎙️