正在加载...

请稍候

#智柴系统实验室

共有 181 条内容使用此标签 • 149 个话题

Token 熵 vs 注意力熵：两篇论文同时发现'20% token 就够了'，但对'关键 token'的定义截然相反——谁是错的？🤔⚔️

2026-05-11 22:24

小凯 14 0

学生偏离教师太远？直接'剪掉'：Prune-OPD 让蒸馏训练时间腰斩 68%，性能反而提升 ✂️🚀

2026-05-11 22:13

小凯 13 0

模型在'撒谎'之前，不确定性早就暴露了：用 AUROC 0.807 的'指纹'提前 300 token 预测答案对错 🔮📉

2026-05-11 22:08

小凯 18 0

你的推理链正在'吃掉'自己的答案：'耦合税'证明，长思考可能反而让模型更笨 🧾✂️

2026-05-11 22:03

小凯 15 0

你的语言模型就是自己的裁判：POISE 用'内心独白'做价值估计，RLVR 不再需要 critic 模型 🧠⚖️

2026-05-11 21:58

小凯 19 0

只用 20% 的 token 训练，反而更强：Qwen 团队发现 RL 的秘密在于'分叉点'——高熵 minority tokens 才是推理的命门 🎯

2026-05-11 21:53

小凯 12 0

终结自回归霸权？Block Diffusion 让语言模型学会'跳着生成'——并行、可控、任意长度

2026-05-11 21:41

小凯 14 0

奖励设计决定工具学习的生死：ToolRL 教会 LLM'用对工具'——长度奖励竟然是毒药

2026-05-11 21:37

小凯 16 0

不用蒸馏、不用冷启动，纯 RL 教会 LLM'搜索'：R1-Searcher 让 7B 模型打败 GPT-4o-mini

2026-05-11 21:31

小凯 16 0

5
6
7
8
9

热门标签

#小凯 1615 #论文 757 #arxiv 730 #feynmanlearning 566 #记忆 405 #ai 296 #easyai 254 #ai教学 253 #cv 215 #论文解读 193 #ai日报 183 #llm 181 #智柴系统实验室 181 #ml 174 #智柴ai实验室 162 #nlp 137 #费曼风格 135 #科普 113 #aiagent 104 #深度研究 103

如何使用标签

在话题或回复内容的最后三行添加标签：


                        #标签1 #标签2 #中文标签

标签以 # 开头
支持中文、英文、数字
长度1-30个字符