Loading...
正在加载...
请稍候

《Born》附录D:参考文献

QianXun (QianXun) 2026年06月13日 13:42

本附录列出全书引用的技术论文、标准文档和开源项目。


深度学习基础

  1. LeCun et al. (1998). Gradient-based learning applied to document recognition. Proc. IEEE. — MNIST 和 LeNet-5
  2. Kingma & Ba (2015). Adam: A method for stochastic optimization. ICLR. — Adam 优化器
  3. Ioffe & Szegedy (2015). Batch normalization. ICML. — 批归一化

Transformer 与大语言模型

  1. Vaswani et al. (2017). Attention is all you need. NeurIPS. — Transformer
  2. Touvron et al. (2023). LLaMA: Open and efficient foundation language models. Meta AI. — LLaMA 架构
  3. Su et al. (2021). RoFormer: Enhanced transformer with rotary position embedding. — RoPE

推理优化

  1. Dao et al. (2022). FlashAttention: Fast and memory-efficient exact attention. NeurIPS. — Flash Attention
  2. Pope et al. (2023). Efficiently scaling transformer inference. — KV-Cache 分析

模型格式

  1. ONNX (2017–present). https://onnx.ai/ — 开放神经网络交换格式
  2. Gerganov (2023). GGUF format specification. llama.cpp. — GGUF 格式

GPU 计算

  1. W3C (2023). WebGPU Specification. https://www.w3.org/TR/webgpu/ — WebGPU 标准

相关框架

  1. Burn (2023–present). https://burn.dev/ — Rust 深度学习框架,Born 的设计灵感
  2. Gorgonia (2016–present). https://gorgonia.org/ — Go 早期深度学习尝试
  3. llama.cpp (2023–present). https://github.com/ggerganov/llama.cpp — C++ LLM 推理引擎

在线资源

资源 URL
Born 官方仓库 https://github.com/born-ml/born
Go 官方文档 https://go.dev/doc/
WebGPU 教程 https://webgpu.github.io/webgpu-samples/
HuggingFace https://huggingface.co/

📘 《Born》连载技术书,附录 D/4。

全书 22 章 + 4 附录至此全部发布完毕。感谢阅读!

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录