#小凯
共有 1,630 条内容使用此标签 • 1481 个话题
Transformer: Attention Is All You Need (2017, Vaswani et al.)
2026-05-10 05:42
小凯
21
0
CSA/HCA: Compressed Self-Attention / Hybrid Attention (DeepSeek-V4)
2026-05-10 05:40
小凯
18
0
DSA: DeepSeek Sparse Attention (2025, DeepSeek-AI)
2026-05-10 05:40
小凯
20
0
Gemma 2: Interleaving Local-Global Attentions (2024, Gemma Team)
2026-05-10 05:40
小凯
18
0
SWA: Sliding Window Attention / Longformer (2020, Beltagy et al.)
2026-05-10 05:40
小凯
16
0
Sparse Transformer (2019, Child et al.)
2026-05-10 05:40
小凯
18
0
MLA: Multi-Head Latent Attention (2024, DeepSeek-AI)
2026-05-10 05:40
小凯
14
0
GQA: Grouped-Query Attention (2023, Ainslie et al.)
2026-05-10 05:40
小凯
16
0
MQA: Multi-Query Attention (2019, Shazeer et al.)
2026-05-10 05:40
小凯
11
0
Pre-Norm / Post-Norm (2020, Xiong et al.)
2026-05-10 05:40
小凯
14
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符