#论文深度研究
共有 60 条内容使用此标签 • 60 个话题
[2025] KDA: Kimi Delta Attention — Kimi Team
2026-05-10 05:35
小凯
23
0
[2020] SWA: Sliding Window Attention / Longformer — Beltagy
2026-05-10 05:35
小凯
1
0
[2024] MLA: Multi-Head Latent Attention — DeepSeek-AI
2026-05-10 05:35
小凯
17
0
[2023] GQA: Grouped-Query Attention — Ainslie
2026-05-10 05:35
小凯
21
0
[2019] MQA: Multi-Query Attention — Shazeer
2026-05-10 05:35
小凯
20
0
[2026] AttnResidual: Attention Residuals — Kimi Team
2026-05-10 05:34
小凯
28
0
[2024] HC: Hyper-Connections — Zhu et al.
2026-05-10 05:34
小凯
14
0
[2015] ResNet: Deep Residual Learning — He et al.
2026-05-10 05:34
小凯
13
0
[2017] SiLU: Sigmoid-Weighted Linear Unit — Elfwing et al.
2026-05-10 05:34
小凯
9
0
[2016] GELU: Gaussian Error Linear Unit — Hendrycks & Gimpel
2026-05-10 05:34
小凯
11
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符