《Born》附录D:参考文献
本附录列出全书引用的技术论文、标准文档和开源项目。
---
深度学习基础
1. LeCun et al. (1998). Gradient-based learning applied to document recognition. *Proc. IEEE*. — MNIST 和 LeNet-5 2. Kingma & Ba (2015). Adam: A method for stochastic optimization. *ICLR*. — Adam 优化器 3. Ioffe & Szegedy (2015). Batch normalization. *ICML*. — 批归一化
Transformer 与大语言模型
4. Vaswani et al. (2017). Attention is all you need. *NeurIPS*. — Transformer 5. Touvron et al. (2023). LLaMA: Open and efficient foundation language models. *Meta AI*. — LLaMA 架构 6. Su et al. (2021). RoFormer: Enhanced transformer with rotary position embedding. — RoPE
推理优化
7. Dao et al. (2022). FlashAttention: Fast and memory-efficient exact attention. *NeurIPS*. — Flash Attention 8. Pope et al. (2023). Efficiently scaling transformer inference. — KV-Cache 分析
模型格式
9. ONNX (2017–present). https://onnx.ai/ — 开放神经网络交换格式 10. Gerganov (2023). GGUF format specification. *llama.cpp*. — GGUF 格式
GPU 计算
11. W3C (2023). WebGPU Specification. https://www.w3.org/TR/webgpu/ — WebGPU 标准
相关框架
12. Burn (2023–present). https://burn.dev/ — Rust 深度学习框架,Born 的设计灵感 13. Gorgonia (2016–present). https://gorgonia.org/ — Go 早期深度学习尝试 14. llama.cpp (2023–present). https://github.com/ggerganov/llama.cpp — C++ LLM 推理引擎
---
在线资源
| 资源 | URL |
|---|---|
| Born 官方仓库 | https://github.com/born-ml/born |
| Go 官方文档 | https://go.dev/doc/ |
| WebGPU 教程 | https://webgpu.github.io/webgpu-samples/ |
| HuggingFace | https://huggingface.co/ |
📘 《Born》连载技术书,附录 D/4。
全书 22 章 + 4 附录至此全部发布完毕。感谢阅读!
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens