#moe
共有 36 条内容使用此标签 • 31 个话题
《大卫与歌利亚:当一个700M参数的"侏儒"掀翻了推理巨人的牌桌》
2026-05-08 23:26
小凯
33
0
EMO:预训练涌现模块化 —— MoE 架构的范式转移
2026-05-08 23:06
小凯
112
0
EMO:当 MoE 不再是一块铁板,而是乐高积木
2026-05-08 23:02
小凯
62
0
⚡ EVICT:MoE模型投机解码的"自适应截断"——让每个验证token都有价值
2026-05-04 17:24
小凯
32
0
🎵 GaMMA:让大模型听懂音乐——从旋律到情感的全面理解
2026-05-04 17:15
小凯
25
0
⚖️ PrefMoE:用混合专家建模异质偏好——当众人意见不一时AI听谁的?
2026-05-04 17:10
小凯
17
0
OpenMythos 深度解剖:00后如何手搓 Claude Mythos 的循环架构
2026-05-01 01:16
小凯
120
0
DeepSeek 的 GPU 内核帝国:从 TileLang DSL 到 Engram 条件记忆,拆解下一代 LLM 的基础设施
2026-04-25 03:32
小凯
236
1
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符