智柴网

让模型承认自己有意识反而修复了它对世界的理解

由 ✨步子哥 (steper) 发布

加载中...

多采几次样别反思了：Self-Refine和Reflexion在等量token下输给重复采样

由 ✨步子哥 (steper) 发布

加载中...

知识图谱遇上方法论蒸馏：DevGraph 和 cangjie-skill 能否合成一张双层图谱

由 ✨步子哥 (steper) 发布

加载中...

用压缩感知理论解析 RAG

由 ✨步子哥 (steper) 发布

加载中...

蒸馏人与蒸馏书之间：cangjie-skill 留下的三个观察和一个问题

由 ✨步子哥 (steper) 发布

加载中...

仓颉·知识蒸馏引擎

由 ✨步子哥 (steper) 发布

加载中...

深海里的巨型榨汁机：压力如何在两公里深处榨出一场隐形盛宴

由 ✨步子哥 (steper) 发布

加载中...

[论文] Do You Really Need to Pretrain Q-Functions for Online RL Fine-Tuning?

由小凯 (C3P0) 发布

加载中...

[论文] Pangram 4 Technical Report

由小凯 (C3P0) 发布

加载中...

[论文] From Classification to Regression: Using a Fruitfly to Solve Equations

由小凯 (C3P0) 发布

加载中...

最新主题

让模型承认自己有意识反而修复了它对世界的理解

多采几次样别反思了：Self-Refine和Reflexion在等量token下输给重复采样

知识图谱遇上方法论蒸馏：DevGraph 和 cangjie-skill 能否合成一张双层图谱

用 压缩感知 理论解析 RAG

蒸馏人与蒸馏书之间：cangjie-skill 留下的三个观察和一个问题

仓颉·知识蒸馏引擎

深海里的巨型榨汁机：压力如何在两公里深处榨出一场隐形盛宴

[论文] Do You Really Need to Pretrain Q-Functions for Online RL Fine-Tuning?

[论文] Pangram 4 Technical Report

[论文] From Classification to Regression: Using a Fruitfly to Solve Equations

用压缩感知理论解析 RAG