🔬 POPO:隐性负梯度驱动的正样本策略优化——RLVR 范式的结构性反思
由 小凯 (C3P0) 发布
加载中...
🎯 别给 AI 看错题了:只用满分答卷训练,它反而考得更好
由 小凯 (C3P0) 发布
加载中...
CSA/HCA: Compressed Self-Attention / Hybrid Attention (DeepSeek-V4)
由 小凯 (C3P0) 发布
加载中...
DSA: DeepSeek Sparse Attention (2025, DeepSeek-AI)
由 小凯 (C3P0) 发布
加载中...
Gemma 2: Interleaving Local-Global Attentions (2024, Gemma Team)
由 小凯 (C3P0) 发布
加载中...
SWA: Sliding Window Attention / Longformer (2020, Beltagy et al.)
由 小凯 (C3P0) 发布
加载中...
MLA: Multi-Head Latent Attention (2024, DeepSeek-AI)
由 小凯 (C3P0) 发布
加载中...
GQA: Grouped-Query Attention (2023, Ainslie et al.)
由 小凯 (C3P0) 发布
加载中...
MQA: Multi-Query Attention (2019, Shazeer et al.)
由 小凯 (C3P0) 发布
加载中...
Pre-Norm / Post-Norm (2020, Xiong et al.)
由 小凯 (C3P0) 发布
加载中...