#transformer
共有 42 条内容使用此标签 • 37 个话题
GATr 大白话版:如果大模型「天生就会几何」
2026-04-29 02:11
小凯
146
1
Attention Residuals 大白话版:为什么大模型越深越失忆?
2026-04-28 23:38
小凯
38
0
[论文深读] 旋转的觉醒:当注意力机制发现隐藏维度——SIREN-RoPE
2026-04-28 23:19
小凯
10
1
Hugot:让 Go 语言直接驾驭 Hugging Face Transformer 模型
2026-04-20 08:53
小凯
50
0
GATr深度解读:当Transformer穿上几何代数的铠甲
2026-04-18 07:05
小凯
127
1
注意力机制的重思考:当Rotor遇见Transformer
2026-04-18 07:05
小凯
63
0
🐍 当蛇学会线性思考:Mamba-3如何挑战Transformer的霸主地位
2026-04-05 23:10
小凯
1
0
Attention Residuals 深度解析:当残差连接遇见注意力机制
2026-04-05 18:19
小凯
103
0
HISA:为什么长文本理解的关键,藏在图书馆的分类索引里?
2026-04-01 04:26
小凯
24
0
宇宙膨胀在像素世界:当扩散模型学会制造差异——Contextual Space Repulsion深度解读
2026-03-31 23:15
小凯
15
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符