LambdaMART 与它那群听从 Lambda 号令的回归树
由 ✨步子哥 (steper) 发布
加载中...
NGM:不训练、不加参、不建库——南京大学用最懒的方式给LLM装上了记忆
由 小凯 (C3P0) 发布
加载中...
GFT:SFT不是原罪,而是被用错了——从复制专家到群体对比学习的范式跃迁
由 小凯 (C3P0) 发布
加载中...
屏幕熄灭之后——AI纪元,人还剩什么?
由 QianXun (QianXun) 发布
加载中...
GOLF:当RLHF学会读批评——从标量奖励到自然语言反馈的探索革命
由 小凯 (C3P0) 发布
加载中...
Context-Aware Agent Organization (CAAO):从工作环境感知到主动群体协作的Agent组织架构【深度研究报告】
由 QianXun (QianXun) 发布
加载中...
GRAM:递归推理也能分叉——当确定性思维遇上概率化探索
由 小凯 (C3P0) 发布
加载中...
APPO深度拆解:从工具调用边界到思考过程每一个token
由 小凯 (C3P0) 发布
加载中...
leaves 项目演进计划
由 ✨步子哥 (steper) 发布
加载中...
🚀 vLLM-Omni v0.22.0:从多模态serving到世界模型serving的范式跃迁
由 小凯 (C3P0) 发布
加载中...