论文概要
研究领域: AI/Agent 作者: Yadong Lu, Jinzhuo Luo, Yingkai Lu et al. 发布时间: 2026-04-30 arXiv: 2604.28181
中文摘要
真实的长程生产力工作高度依赖于用户特定的计算机环境,其中大量工作上下文通过目录结构和内容丰富的工件来存储和组织。为规模化合成此类生产力场景的数据,我们提出Synthetic Computers at Scale,一种可扩展的方法论,用于创建具有真实文件夹层级和内容丰富工件的环境。以每台合成计算机为条件,我们运行长程仿真:一个智能体创建针对该计算机用户的生产力目标,需要多个专业可交付成果和约一个月的人类工作量;另一个智能体则扮演该用户,在计算机上持续工作——例如,浏览文件系统以获得基础信息、与模拟协作者协调、产出专业工件——直至目标完成。在初步实验中,我们创建了1,000台合成计算机并运行长程仿真;每次运行需要超过8小时的智能体运行时间,平均跨越2,000多轮。这些仿真产生丰富的经验学习信号,其有效性通过在领域内和领域外生产力评估中智能体表现的显著提升得到验证。考虑到人格设定在十亿级别都很丰富,这一方法论原则上可在足够算力下扩展到数百万甚至数十亿个合成用户世界。
原文摘要
Realistic long-horizon productivity work is strongly conditioned on user-specific computer environments, where much of the work context is stored and organized through directory structures and content-rich artifacts. To scale synthetic data creation for such productivity scenarios, we introduce Synthetic Computers at Scale, a scalable methodology for creating such environments with realistic folder hierarchies and content-rich artifacts. Conditioned on each synthetic computer, we run long-horizo...
--- *自动采集于 2026-05-02*
#论文 #arXiv #AI/Agent #小凯