M5 Pro & M5 Max 深度评测:Chiplet 时代的第一声枪响
> "Apple 终于不做单一大芯片了。M5 Pro 和 M5 Max 共用同一块 CPU Tile,区别只在 GPU Tile。这不是妥协,是精密工程。"
2026 年 3 月,Apple 发布了 M5 系列的 Pro 和 Max 版本。发布会的 PPT 上写着 "全新 Fusion 架构",但大多数人没听懂这四个字的分量。
这是 Apple Silicon 历史上第一次,高端芯片不再是一块完整的单片硅。M5 Pro 和 M5 Max 共用完全相同的 CPU Tile——18 核 CPU、16 核 NPU、Thunderbolt 5 控制器、媒体引擎、SSD 控制器,全部在一块 Tile 上。
两者的唯一区别:GPU Tile。M5 Pro 用 20 核 GPU 版本,M5 Max 用 40 核 GPU 版本。
这听起来像省钱的伎俩?恰恰相反。这是一个关于良率、热管理、性能调度和制造成本的精密工程决策。
---
一、Chiplet 架构:为什么要拆?
1.1 单片大芯片的诅咒
在先进制程(3nm 及以下),有一个残酷的物理规律:芯片面积越大,良率越低。
TSMC 的晶圆上随机分布着缺陷。如果一块芯片有 200mm²,缺陷落在上面的概率是 X。如果芯片扩大到 400mm²,概率不是 2X——而是更高的非线性增长,因为缺陷可以落在任何位置,更大的面积意味着更多的"致命区域"。
这就是为什么 M3 Ultra(两块 M3 Max 拼接)比直接造一块超大芯片更聪明。但 Ultra 是两个完整 SoC 的拼接,每个都有自己的 CPU、GPU、内存控制器——冗余且浪费。
M5 Pro/Max 的 Chiplet 设计更进一步:不是拼两个完整芯片,而是把不同功能拆成专用 Tile。
1.2 Apple 的 Tile 切分策略
┌─────────────────────────────────────────┐
│ M5 Pro / M5 Max Package │
│ │
│ ┌──────────────┐ ┌──────────────┐ │
│ │ CPU Tile │◄──►│ GPU Tile │ │
│ │ (共享) │ │ (差异化) │ │
│ │ │ │ │ │
│ │ • 6 Super │ │ M5 Pro: │ │
│ │ Cores │ │ 20 GPU Cores │ │
│ │ • 12 Perf. │ │ 307 GB/s │ │
│ │ Cores │ │ │ │
│ │ • 16-core │ │ M5 Max: │ │
│ │ Neural Eng.│ │ 40 GPU Cores │ │
│ │ • Media Eng. │ │ 614 GB/s │ │
│ │ • Thunderbolt│ │ │ │
│ │ • SSD Ctrl │ │ │ │
│ └──────────────┘ └──────────────┘ │
│ │
│ SoIC-MH 混合键合封装 │
└─────────────────────────────────────────┘
这种切分的聪明之处在于:
经济性:
- CPU Tile 在 Pro 和 Max 之间完全复用,研发成本和验证成本减半
- GPU Tile 可以独立进行良率优化。40 核 GPU Tile 如果某区域有缺陷,可以屏蔽成 32 核或 20 核版本
- 根据 Creative Strategies 的分析,这种设计"降低了制造成本、验证成本和研发成本"
- 传统单片设计中,CPU 发热会传导到 GPU 区域,反之亦然
- Chiplet 分离后,CPU 和 GPU 的热耦合大幅降低
- 实测:M5 Max 可以同时推高 CPU 和 GPU 负载,而不会像以前那样互相拖累
- CPU 密集型任务(编译、视频编码)不会抢 GPU 的散热预算
- GPU 渲染时,CPU 仍能保持高频
1.3 SoIC-MH:昂贵的粘合剂
Apple 使用的是 SoIC-MH(System on Integrated Chips - Micro-bump Hybrid bonding),比之前的 InFO 封装更先进、更昂贵。
代价:封装成本上升。 收益:晶圆层面的良率提升和硅面积浪费减少,足以抵消封装成本的增加。
用 Creative Strategies 的 Ben Bajarin 的话说:
> "Apple 在制造后端花了更多钱,换取了前端(真正的浪费发生的地方)的大幅节省。"
---
二、CPU:Super Core + Performance Core 的微妙平衡
2.1 三档核心变两档
M5 家族取消了传统的大小核设计中的 Efficiency Core(效率核)。
| 芯片 | 超核 (Super) | 性能核 (Performance) | 效率核 (Efficiency) | GPU |
|---|---|---|---|---|
| M5 | 4 | 0 | 6 | 10核 |
| M5 Pro | 6 | 12 | 0 | 20核 |
| M5 Max | 6 | 12 | 0 | 40核 |
| M4 Max | 12 (当时叫P核) | 0 | 4 | 40核 |
2.2 Performance Core 的真相
Ars Technica 的 Andrew Cunningham 通过 sysctl 和 powermetrics 工具,确认了这些新 Performance Core 的真实规格:
| 指标 | Super Core | Performance Core | M5 Efficiency Core |
|---|---|---|---|
| L1 指令缓存 | 192KB | 128KB | 128KB |
| L1 数据缓存 | 128KB | 64KB | 64KB |
| L2 缓存 (每簇) | 16MB | 8MB | 6MB |
| 最低频率 | 1,308 MHz | 1,344 MHz | 972 MHz |
| 最高频率 | 4,608 MHz | 4,308 MHz | 3,048 MHz |
Apple 的官方说法:这些 Performance Core 是"全新设计","源自 Super Core 架构","专为功耗敏感的多线程负载优化"。
这和 AMD 的 Zen 4c/5c 策略类似:物理上同架构,但面积更小、频率更低、功耗更优,而不是像 Intel 那样用完全不同的微架构。
2.3 为什么没有 Efficiency Core 了?
这是一个大胆的决定。M5 Pro/Max 的 18 个核心全是"大核"变体,没有专门的小核做后台任务。
但实测数据反而证明这是对的:
- 轻负载待机功耗:M5 Max 在桌面待机(Chrome、邮件、几个 App 打开但不活跃)时,整机功耗 低于 2W
- 系统级待机:Apple 的可持续发展报告显示,M5 Max MacBook Pro 的全系统待机功耗从 M4 Max 的 7.6W 降至 7.1W
- 续航:M5 Max MacBook Pro 的电池续航比 M4 Max 还多了 1 小时
---
三、性能实测:数据说话
3.1 CPU 性能
| 基准测试 | M5 Max | M4 Max | M3 Ultra | 提升幅度 |
|---|---|---|---|---|
| Geekbench 6 单核 | 4,268 | 3,895 | 3,082 | +10% vs M4 Max |
| Geekbench 6 多核 | 29,233 | 25,984 | 27,157 | +12% vs M4 Max |
| Cinebench 2024 单核 | 738 | 676 | 573 | +9% |
| Cinebench 2024 多核 | 8,413 | 7,829 | 12,082 | +7% |
关键观察:
- 单核提升约 10%,主要来自 Super Core 的架构改进(10-Wide 前端,改进的缓存层次)
- 多核提升约 12%,18 核 vs 16 核的数量优势被频率下降抵消了一部分
- M5 Max 的 Geekbench 6 多核分数(29,233)超越了 M3 Ultra(27,157)——一台笔记本击败了一台台式机工作站芯片
3.2 CPU 功耗与散热
通过 powermetrics 实测:
| 场景 | M5 Max 功耗 | M4 Max 功耗 | 备注 |
|---|---|---|---|
| Handbrake 视频编码 | ~23% 更高 | 基准 | 总能量消耗略增 |
| Geekbench 峰值 | ~66W | - | 短暂爆发 |
| Cinebench 多核稳定 | ~50W | - | 散热限制后的稳定态 |
| 轻负载待机 | < 2W | - | 无 E-core 反而更低 |
- 前 10 秒:维持最高频率 4.24 GHz
- 随后降至 ~3.9 GHz 稳定态(偶尔跌至 3.4 GHz)
- 两个 Performance Core 簇稳定在 4.2-4.3 GHz,几乎不衰减
3.3 GPU 性能:M5 Max vs RTX 5070
| 基准测试 | M5 Max (40核) | M4 Max (40核) | RTX 5070 移动版 | M5 Pro (20核) |
|---|---|---|---|---|
| 3DMark Steel Nomad | 基准 | -8% | 落后 | 慢 41% |
| Geekbench Metal | +20-26% | 基准 | 接近 | - |
| OpenCL | +20-26% | 基准 | 略胜 | 被压制 |
| Cinebench 2024 GPU | +40% | 基准 | - | +46% vs M4 Pro |
| Blender | 略逊于 M4 Max | 基准 | - | +30% vs M4 Pro |
关键结论:
- M5 Max 40 核 GPU ≈ RTX 5070 移动版——在 OpenCL 和 Metal 基准中互有胜负
- M5 Max 在 3DMark Steel Nomad 中只比 M4 Max 快 8%,但已足够超越 RTX 5070
- M5 Pro 20 核比 M5 Max 慢 41%,位于 RTX 5050 和 RTX 5060 移动版之间
- Cinebench 2024 GPU 提升 40% 是最亮眼的数据,说明新一代 GPU 架构在计算密集型任务中进步显著
3.4 创意应用实测(PugetBench)
| 设备 | Photoshop | Premiere Pro (Standard) | DaVinci Resolve (Standard) |
|---|---|---|---|
| MBP 16" M5 Max (40核) | 15,875 | 157,049 | 127,090 |
| MBP 16" M5 Pro (20核) | 15,271 | 105,296 | 83,560 |
| Asus ProArt P16 (RTX 5090) | 10,096 | 107,130 | 85,114 |
| Asus ROG Z13 (Radeon 8060S) | 11,932 | 57,481 | 53,737 |
震撼结果:
- M5 Pro 的 Premiere Pro 分数(105,296)已接近 RTX 5090 移动版(107,130)
- M5 Max 的 Premiere Pro 分数(157,049)碾压所有 Windows 笔记本
- M5 Max 在 DaVinci Resolve 中优势更明显(127,090 vs RTX 5090 的 85,114)
- 即使是 14 英寸 M5 Max(散热受限),在 Premiere Pro 中仍达 149,151
3.5 游戏性能:不是强项,但进步了
| 游戏 | M5 Max vs M4 Max | vs RTX 5070 移动版 |
|---|---|---|
| 赛博朋克 2077 (1080P) | +8-24% | 互有胜负 |
| 刺客信条:影 (1080P) | +8-24% | 2K 下优势降低 |
| 博德之门 3 | +8-24% | - |
原因:游戏优化更依赖驱动和 API(DirectX / Vulkan),而 Apple 的 Metal 生态在游戏领域仍有差距。
---
四、内存与带宽:被低估的瓶颈
4.1 统一内存架构的演进
| 规格 | M5 Pro | M5 Max |
|---|---|---|
| 内存带宽 | 307 GB/s | 614 GB/s |
| 最大内存容量 | 48GB | 128GB |
| 内存类型 | LPDDR5X | LPDDR5X |
| 内存频率 | 8,533 MHz | 8,533 MHz |
| 位宽 | 256-bit | 512-bit |
- 接近 NVIDIA RTX 4090 的 1,008 GB/s,但在笔记本 SoC 中实现
- 足以在本地运行 70B 参数量化 LLM(llama.cpp Q4_K_M 量化,约 12 tokens/s)
- 对于视频编辑、3D 渲染、AI 推理等内存带宽敏感型任务,这是决定性优势
4.2 M5 Pro vs M5 Max 的内存差异
M5 Max 的 614 GB/s 是 M5 Pro(307 GB/s)的两倍,但这不是简单的"翻倍":
- M5 Max 的内存控制器在 GPU Tile 上,更多的 GPU 核心需要更宽的内存总线来喂饱
- M5 Pro 的 307 GB/s 对于 20 核 GPU 已经足够,但对于 40 核 GPU 会成为瓶颈
- 这也解释了为什么 M5 Max 支持 128GB 内存而 M5 Pro 只到 48GB——更大的 GPU 需要更大的内存池来存放模型权重和数据集
五、AI 与神经网络引擎:Apple 的隐藏王牌
5.1 每颗 GPU 核心内置 NPU
M5 系列最被低估的升级:每个 GPU 核心都集成了一个专用的 Neural Accelerator。
这使得 M5 Max 的 GPU AI 计算峰值达到 M4 的 4 倍。不是通过更多的 NPU 核心,而是通过在 GPU 内部遍布小型加速单元。
5.2 神经网络引擎的行为特征
Creative Strategies 让 GPT-5.4(Codex)直接分析 M5 Max 的 NPU 行为,得出了一个有趣的结论:
> "Apple Neural Engine 不太像通用的'AI 加速器',更像是一个非常快、但形状固定的密集计算引擎。一旦工作负载看起来像大型 FP16 矩阵乘法,它能提供惊人的吞吐量;但当工作负载变小、变动态、或调度密集时,性能迅速下降。"
具体数据:
- 针对大 FP16 matmul 调优后,实测峰值约 19.9 TFLOPS
- M4 的参考点是 15.8 TFLOPS
- 关键限制:NPU 对"小而零散的推理步骤"(如 token-by-token decode)表现远不如预填充阶段(prefill)
---
六、热管理与机身选择:14 英寸 vs 16 英寸
6.1 M5 Max 在 14 英寸中的挣扎
Notebookcheck 的测试揭示了一个重要事实:14 英寸 MacBook Pro 无法完全释放 M5 Max 的潜力。
| 场景 | 14" M5 Max | 16" M5 Max | 差距 |
|---|---|---|---|
| GPU 峰值功耗 | 72W(仅几秒) | 72W(可持续) | - |
| GPU 稳定功耗 | ~44W | ~72W | -28W |
| 自动模式功耗 | ~60W | - | - |
| 合成基准差距 | - | +10-13% | 显著 |
| Adobe/DaVinci | - | +10-18% | 显著 |
如果你买了 14" M5 Max,你支付的是旗舰价格,但得到的性能可能只比 M5 Pro 好 10-15%——而不是理论上 40 核 vs 20 核应有的翻倍差距。
6.2 M5 Pro 的甜点定位
对于 14 英寸用户,M5 Pro 可能是更理性的选择:
- CPU 性能和 M5 Max 几乎相同(同一块 CPU Tile)
- GPU 功耗 38W 峰值,在 14 英寸机身中可稳定维持
- 比 M5 Max 便宜,但 creative app 性能已接近 RTX 5090 移动版
七、与竞品的正面交锋
7.1 CPU:x86 的绝望追赶
| 芯片 | Geekbench 6 单核 | Geekbench 6 多核 | 功耗 (峰值) |
|---|---|---|---|
| M5 Max | 4,268 | 29,233 | ~30W |
| M4 Max | 3,895 | 25,984 | ~25W |
| Intel Core Ultra 9 285K | 3,294 | 22,760 | 253W |
| AMD Ryzen 9 9950X | 3,251 | 24,026 | 170W |
7.2 GPU:终于追上了 NVIDIA
| GPU | 制造工艺 | 着色单元 | TGP | 与 M5 Max 40核对比 |
|---|---|---|---|---|
| M5 Max 40核 | TSMC 3nm | 5,120 | ~72W | 基准 |
| RTX 5070 移动版 | TSMC 4nm | 6,144 | 250W | 互有胜负 |
| RTX 5070 桌面版 | TSMC 4nm | 6,144 | 250W | - |
| Radeon 8060S (Strix Halo) | TSMC 4nm | - | - | M5 Max 领先 15% |
关键事实:M5 Max 在 OpenCL 中略胜 RTX 5070 移动版,在 Metal 中大幅领先,但在 Blender 中略逊于 M4 Max(可能是驱动优化问题)。
---
八、升级建议:谁该买?
8.1 从 M1/M2 升级:非常值得
| 基准 | M5 Max vs M1 Pro/Max | 倍数 |
|---|---|---|
| 多线程性能 | Apple 官方数据 | 2.5x |
| 实际 Geekbench 多核 | ~29,233 vs ~12,000 | ~2.4x |
8.2 从 M3/M4 升级:边际收益
| 基准 | M5 Max vs M4 Max | 提升 |
|---|---|---|
| CPU 单核 | 4,268 vs 3,895 | +10% |
| CPU 多核 | 29,233 vs 25,984 | +12% |
| GPU | 综合 20-40% | +20-40% |
| AI 计算 | 4x NPU 峰值 | +300% |
8.3 选择矩阵
| 用户类型 | 推荐 | 理由 |
|---|---|---|
| 视频编辑/调色 | M5 Max + 16" | Premiere/DaVinci 分数碾压,需要散热 |
| 软件开发/数据科学 | M5 Pro + 14" | CPU 和 Max 一样,便宜,便携 |
| AI/ML 本地推理 | M5 Max 128GB | 70B 量化模型可本地运行 |
| 摄影师/设计师 | M5 Pro | Photoshop 分数接近 Max,省下的钱买显示器 |
| 游戏玩家 | 都不推荐 | 买 Windows + RTX 5070 |
| 学生/轻度办公 | 基础 M5 | Pro/Max 全是性能核,待机功耗反而更低,但没必要 |
九、Chiplet 的更大图景
9.1 对半导体行业的信号
Apple 从单片 SoC 转向 Chiplet,释放了一个行业级信号:
即使是最擅长单片设计的公司,在 3nm 节点也不得不做 Chiplet。
原因: 1. 掩模版限制:3nm 的最大光罩面积限制了单芯片的物理尺寸 2. 良率经济学:大芯片的良率崩溃太快,Chiplet 是唯一切实可行的路径 3. 灵活性:同一 CPU Tile + 不同 GPU Tile = 更多 SKU,更少研发分支
9.2 M5 Ultra 的预告
WWDC 2026(6 月)预计发布 M5 Ultra——两块 M5 Max 的 GPU Tile 拼接,保留单块 CPU Tile(或双 CPU Tile)。
泄露的基准:
- Geekbench 6 多核:40,000+
- Metal GPU:400,000-405,000
- 内存:256GB
9.3 对 Windows 生态的压力
Intel 的 Panther Lake 和 AMD 的 Strix Halo 都在 2026 年发力,但面临一个结构性问题:
- x86 的功耗劣势:M5 Max 在 30W 峰值下达到的性能,x86 需要 170-250W
- 生态锁定:Adobe、DaVinci 等软件在 Metal 上的优化深度,Windows 的 CUDA/OpenCL 生态难以复制
- 续航差距:M5 Max MacBook Pro 全天续航,x86 高性能笔记本 3-5 小时
> "即使是紧凑的 Windows 机型中最好的(Asus ProArt PX13 + Strix Halo),在 Photoshop、Premiere Pro 和 DaVinci Resolve 中也完全不是 M5 芯片的对手。"
---
十、结论:M5 Pro 与 M5 Max 的工程真相
10.1 架构层面的关键决策
| 决策 | 说明 | 影响 |
|---|---|---|
| CPU Tile 共享 | Pro 和 Max 用同一块 CPU Tile | 降低研发和制造成本,统一验证 |
| GPU Tile 差异化 | Pro 20核,Max 40核 | 通过良率分级实现灵活 SKU |
| 取消 Efficiency Core | 全 Super + Performance | 待机功耗意外降低,多线程 sustain 更强 |
| SoIC-MH 封装 | 混合键合 CPU+GPU Tile | 热解耦,性能隔离,成本可控 |
| 每 GPU 核心 NPU | 分布式神经加速 | 4x AI 峰值,但依赖工作负载形状 |
10.2 性能总结
M5 Max 是:
M5 Pro 是:
10.3 一个核心问题
M5 Pro 和 M5 Max 的评测揭示了一个反直觉的事实:
Apple 不再追求每一代的"百分比提升"最大化,而是在追求"系统级效率"的最大化。
制造效率提升
从 M5 Pro/Max 开始,Apple Silicon 的竞争维度从"跑分"转向了"系统工程"。
而在这个维度上,竞争对手们还有很长的路要走。
---
核心信息源
- Ars Technica M5 Max 深度评测 (2026-03-09): https://arstechnica.com/gadgets/2026/03/testing-apples-2026-16-inch-macbook-pro-m5-max-and-its-new-performance-cores/
- Creative Strategies Chiplet 分析 (2026-03-09): https://creativestrategies.com/research/m5-max-chiplets-thermals-and-performance-per-watt/
- Notebookcheck CPU 分析 (2026-03): https://www.notebookcheck.net/Apple-M5-Pro-Max-CPU-Analysis-M5-Max-is-not-much-faster-than-the-M4-Max.1253941.0.html
- Notebookcheck GPU 分析 (2026-03-10): https://www.notebookcheck.net/Apple-M5-Pro-M5-Max-GPU-Analysis-M5-Max-GPU-on-par-with-the-GeForce-RTX-5070-and-faster-than-Strix-Halo.1246060.0.html
- Tech Insider 基准汇总 (2026-04): https://tech-insider.org/apple-m5-chip-benchmarks-a-new-standard-for-personal-computing/
- NanoReview GPU 对比 (2026-04-16): https://nanoreview.net/en/gpu-compare/geforce-rtx-5070-vs-apple-m5-max-gpu-40-core
- Notebookcheck M5 Max 规格 (2026-04-25): https://www.notebookcheck.net/Apple-M5-Max-Processor-Benchmarks-and-Specs.1244918.0.html
- 新浪财经 M5 Max 评测 (2026-03-10): https://finance.sina.com.cn/tech/roll/2026-03-10/doc-inhqnvwn6282443.shtml