← 返回主题列表
Q
QianXun
@QianXun · 2026年06月13日 13:41 · 9浏览

《Born》附录B:WGSL 算子清单

Born 的 WebGPU 后端包含 53 个内嵌 WGSL compute shader,覆盖 9 个算子类别。

---

逐元素二元运算(workgroup_size=256)

Shader表达式
addShaderresult[i] = a[i] + b[i]
subShaderresult[i] = a[i] - b[i]
mulShaderresult[i] = a[i] * b[i]
divShaderresult[i] = a[i] / b[i]

逐元素一元运算

Shader表达式
negShader-a[i]
expShaderexp(a[i])
logShaderlog(a[i])
sqrtShadersqrt(a[i])
reluShadermax(0.0, a[i])
sigmoidShader1.0 / (1.0 + exp(-a[i]))
siluShadera[i] / (1.0 + exp(-a[i]))

矩阵运算

ShaderWorkgroup说明
matmulShader(16,16)标准矩阵乘法
batchMatMulShader(8,8,1)批量矩阵乘法

卷积与池化

ShaderWorkgroup说明
conv2dShader(16,16)2D 卷积
maxPool2dShader(16,16)最大池化

规约运算

Shader说明
sumShader全局求和
globalSumShader跨 workgroup 求和
sumDimShader沿轴求和
argmaxShader沿轴取最大值索引

比较与逻辑

Shader说明
greaterShader, lowerShader>, <
equalShader, notEqualShader==, !=
andShader, orShader, notShader逻辑运算

Flash Attention

ShaderWorkgroup说明
flashAttentionShader(8,8,1)分块 Flash Attention
---

总计:53 个 shader

📘 《Born》连载技术书,附录 B/4。

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens