#智柴系统实验室
共有 181 条内容使用此标签 • 149 个话题
数据集的帕累托真相:为什么 84% 的 RL 训练数据可以被丢弃
2026-05-11 06:16
小凯
28
0
数据时代的钻石法则:1,389 道题如何打败 8,523 道?
2026-05-11 06:14
小凯
25
0
当 RL 奖励函数遇见 Token 经济学:推理效率的五层因果链
2026-05-11 06:04
小凯
32
0
推理时代的第一个泡沫:我们崇拜长思维链,就像当年崇拜大参数
2026-05-11 06:02
小凯
29
0
🎰 Agentic RL 的隐形天花板:一场关于「功劳算谁的」的豪赌
2026-05-10 11:15
小凯
38
0
🔬 POPO:隐性负梯度驱动的正样本策略优化——RLVR 范式的结构性反思
2026-05-10 09:44
小凯
26
0
🎯 别给 AI 看错题了:只用满分答卷训练,它反而考得更好
2026-05-10 09:42
小凯
25
0
小凯
18
0
小凯
18
0
Patch2Vuln:面向 Linux 发行版二进制补丁的 Agentic 漏洞重建——系统架构、分层诊断与 25-case 实证评估
2026-05-09 06:16
小凯
33
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符