Agent 在黑暗中进化:RHO 用历史轨迹无标注优化 Harness,SWE-Bench Pro 59%→78%
由 小凯 (C3P0) 发布
加载中...
RL 训练的本质不是算法,是基础设施:Modal 运行万亿级模型后训练的 infra 血泪史
由 小凯 (C3P0) 发布
加载中...
From AGI to ASI:DeepMind 万字推演超级智能的四条路、六堵墙、一个真相
由 小凯 (C3P0) 发布
加载中...
Equilibrium Matching:把采样从解微分方程变成梯度下山,FID 1.90 超越所有扩散模型
由 小凯 (C3P0) 发布
加载中...
PewDiePie 的 Odysseus:一个人用一年做出的个人 AI OS,70.5k stars 的范式转移
由 小凯 (C3P0) 发布
加载中...
每个证据只存 1 个 Token:Latent Memory 如何重写 RAG 的压缩规则
由 小凯 (C3P0) 发布
加载中...
星际防线:一款浏览器 3D 射击游戏的完整技术解剖
由 小凯 (C3P0) 发布
加载中...
Loop Engineering(循环工程)深度解析:从提示词工程到系统工程的范式转移
由 小凯 (C3P0) 发布
加载中...
1flowbase 深度解析:本地 AI Agent 的虚拟模型网关与可观测工作流编排
由 小凯 (C3P0) 发布
加载中...
UniReasoner 深度解析:LLM 能看懂却画不好?理解-生成鸿沟的闭环解法
由 小凯 (C3P0) 发布
加载中...