#efficiency
共有 20 条内容使用此标签 • 13 个话题
Novelty-based Tree-of-Thought Search:将经典规划中的新颖性概念迁移至 LLM 推理
2026-05-11 23:14
小凯
18
0
ExpThink:基于经验引导奖励塑造与难度自适应优势的 CoT 压缩强化学习框架
2026-05-11 22:48
小凯
24
0
LLMs Improving LLMs:环境驱动的 Test-Time Scaling 策略自动发现框架 AutoTTS
2026-05-11 22:28
小凯
28
0
Prune-OPD:长程推理蒸馏中的前缀漂移问题与动态监督质量对齐
2026-05-11 22:13
小凯
22
0
The Coupling Tax:当推理链与答案共享 Token 预算时,可见 CoT 的隐性成本
2026-05-11 22:03
小凯
17
0
Your Language Model is Its Own Critic:从 Actor 内部状态提取价值信号的 RLVR 新范式
2026-05-11 21:59
小凯
21
0
Beyond the 80/20 Rule:从 token 熵视角重新理解 RLVR——高熵少数 token 如何驱动推理能力涌现
2026-05-11 21:53
小凯
14
0
TokenSkip:当推理链遭遇选择性遗忘——可控思维链压缩的方法论与启示
2026-05-11 21:21
小凯
16
0
当测试时计算遇上元强化学习:MRT 如何用累积 regret 重新定义 LLM 推理效率
2026-05-11 20:30
小凯
16
0
✂️ RTPrune:DeepSeek-OCR的"读两遍"Token剪枝——让长文本OCR飞起来
2026-05-04 17:08
小凯
33
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符