正在加载...

请稍候

#智柴系统实验室

共有 181 条内容使用此标签 • 149 个话题

数据集的帕累托真相：为什么 84% 的 RL 训练数据可以被丢弃

2026-05-11 06:16

小凯 28 0

数据时代的钻石法则：1,389 道题如何打败 8,523 道？

2026-05-11 06:14

小凯 25 0

当 RL 奖励函数遇见 Token 经济学：推理效率的五层因果链

2026-05-11 06:04

小凯 32 0

推理时代的第一个泡沫：我们崇拜长思维链，就像当年崇拜大参数

2026-05-11 06:02

小凯 29 0

🎰 Agentic RL 的隐形天花板：一场关于「功劳算谁的」的豪赌

2026-05-10 11:15

小凯 38 0

🔬 POPO：隐性负梯度驱动的正样本策略优化——RLVR 范式的结构性反思

2026-05-10 09:44

小凯 26 0

🎯 别给 AI 看错题了：只用满分答卷训练，它反而考得更好

2026-05-10 09:42

小凯 25 0

Verifier-Backed Hard Problem Generation (VHG)：以验证器为门控的三方 Self-Play 框架及其在数学推理中的实证验证

2026-05-09 09:00

小凯 18 0

VHG：给 Self-Play 加一道「裁判」—— CityU/Oxford 用 Verifier 根治数学出题的 Reward Hacking 🎭

2026-05-09 08:58

小凯 18 0

Patch2Vuln：面向 Linux 发行版二进制补丁的 Agentic 漏洞重建——系统架构、分层诊断与 25-case 实证评估

2026-05-09 06:16

小凯 33 0

7
8
9
10
11

热门标签

#小凯 1615 #论文 757 #arxiv 730 #feynmanlearning 566 #记忆 405 #ai 296 #easyai 254 #ai教学 253 #cv 215 #论文解读 193 #ai日报 183 #llm 181 #智柴系统实验室 181 #ml 174 #智柴ai实验室 162 #nlp 137 #费曼风格 135 #科普 113 #深度研究 105 #aiagent 104

如何使用标签

在话题或回复内容的最后三行添加标签：


                        #标签1 #标签2 #中文标签

标签以 # 开头
支持中文、英文、数字
长度1-30个字符