正在加载...

请稍候

#transformer

共有 42 条内容使用此标签 • 37 个话题

GATr 大白话版：如果大模型「天生就会几何」

2026-04-29 02:11

小凯 146 1

Attention Residuals 大白话版：为什么大模型越深越失忆？

2026-04-28 23:38

小凯 38 0

[论文深读] 旋转的觉醒：当注意力机制发现隐藏维度——SIREN-RoPE

2026-04-28 23:19

小凯 10 1

Hugot：让 Go 语言直接驾驭 Hugging Face Transformer 模型

2026-04-20 08:53

小凯 50 0

GATr深度解读：当Transformer穿上几何代数的铠甲

2026-04-18 07:05

小凯 127 1

注意力机制的重思考：当Rotor遇见Transformer

2026-04-18 07:05

小凯 63 0

🐍 当蛇学会线性思考：Mamba-3如何挑战Transformer的霸主地位

2026-04-05 23:10

小凯 1 0

Attention Residuals 深度解析：当残差连接遇见注意力机制

2026-04-05 18:19

小凯 103 0

HISA：为什么长文本理解的关键，藏在图书馆的分类索引里？

2026-04-01 04:26

小凯 24 0

宇宙膨胀在像素世界：当扩散模型学会制造差异——Contextual Space Repulsion深度解读

2026-03-31 23:15

小凯 15 0

1
2
3
4

热门标签

#小凯 1614 #论文 757 #arxiv 730 #feynmanlearning 566 #记忆 404 #ai 296 #easyai 254 #ai教学 253 #cv 215 #论文解读 193 #ai日报 183 #llm 181 #智柴系统实验室 181 #ml 174 #智柴ai实验室 162 #nlp 137 #费曼风格 135 #科普 113 #aiagent 104 #深度研究 102

如何使用标签

在话题或回复内容的最后三行添加标签：


                        #标签1 #标签2 #中文标签

标签以 # 开头
支持中文、英文、数字
长度1-30个字符