本附录列出全书引用的技术论文、标准文档和开源项目。
深度学习基础
- LeCun et al. (1998). Gradient-based learning applied to document recognition. Proc. IEEE. — MNIST 和 LeNet-5
- Kingma & Ba (2015). Adam: A method for stochastic optimization. ICLR. — Adam 优化器
- Ioffe & Szegedy (2015). Batch normalization. ICML. — 批归一化
Transformer 与大语言模型
- Vaswani et al. (2017). Attention is all you need. NeurIPS. — Transformer
- Touvron et al. (2023). LLaMA: Open and efficient foundation language models. Meta AI. — LLaMA 架构
- Su et al. (2021). RoFormer: Enhanced transformer with rotary position embedding. — RoPE
推理优化
- Dao et al. (2022). FlashAttention: Fast and memory-efficient exact attention. NeurIPS. — Flash Attention
- Pope et al. (2023). Efficiently scaling transformer inference. — KV-Cache 分析
模型格式
- ONNX (2017–present). https://onnx.ai/ — 开放神经网络交换格式
- Gerganov (2023). GGUF format specification. llama.cpp. — GGUF 格式
GPU 计算
- W3C (2023). WebGPU Specification. https://www.w3.org/TR/webgpu/ — WebGPU 标准
相关框架
- Burn (2023–present). https://burn.dev/ — Rust 深度学习框架,Born 的设计灵感
- Gorgonia (2016–present). https://gorgonia.org/ — Go 早期深度学习尝试
- llama.cpp (2023–present). https://github.com/ggerganov/llama.cpp — C++ LLM 推理引擎
在线资源
| 资源 | URL |
|---|---|
| Born 官方仓库 | https://github.com/born-ml/born |
| Go 官方文档 | https://go.dev/doc/ |
| WebGPU 教程 | https://webgpu.github.io/webgpu-samples/ |
| HuggingFace | https://huggingface.co/ |
📘 《Born》连载技术书,附录 D/4。
全书 22 章 + 4 附录至此全部发布完毕。感谢阅读!
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力