NVLink
NVIDIA 自研的 GPU-GPU / GPU-CPU 高速互联协议。带宽远超 PCIe,被视为 PCIe 在 AI 时代的"升级版"。NVLink Switch(NVSwitch) 构成 GPU 集群的核心交换骨干,是 NVIDIA 从"芯片公司"走向"系统公司"的关键技术之一。
是什么
NVLink 是 NVIDIA 2014 年首次推出的点对点高速互联协议,用于解决 GPU 之间、GPU 与 CPU 之间数据交换的带宽瓶颈。后续演进出 NVSwitch(NVLink Switch 芯片),把点对点链路扩展为可交换的 fabric,多颗 GPU 可以构成统一算力池。
为什么关键
- 大模型训练/推理是分布式负载 — 单卡装不下大模型,多卡之间数据交换的带宽决定整体效率
- 系统级竞争的核心组件 — 芯片+互联+内存+软件已加速融合为一体化算力平台,NVLink 是 NVIDIA 系统级护城河的关键一块
- GB200 NVL72 — 用 NVLink 5.0 将 72 颗 GPU 互联为统一算力池,是 Blackwell 平台的标志性形态
- PCIe 升级版 — 单链路带宽显著高于同代 PCIe;多链路聚合后差距进一步拉大
演进路线
| 代际 | 关联架构 | 量产 |
|---|---|---|
| NVLink 1.0 | Pascal / P100 | 2016 |
| NVLink 2.0 | Volta / V100 | 2017 |
| NVLink 3.0 | Ampere / A100 | 2020 |
| NVLink 4.0 | Hopper / H100 | 2022 |
| NVLink 5.0 | Blackwell / B200 / GB200 | 2024-2025(当代标配) |
竞争 / 替代
- ⚔ competitor::Infinity Fabric — AMD 的对应方案,用于 MI300X / Helios 等机架级系统
- ⚔ competitor::UALink — 由 AMD / Intel / Google / Microsoft / Meta / Broadcom 等组成的开放互联联盟,目标对抗 NVIDIA 私有 NVLink 生态
- InfiniBand / Ethernet(NVIDIA 自家 Spectrum-X / Quantum-X 也覆盖该层,但属于"集群间"而非"机架内"互联)
关键来源
- 2-01-核心逻辑芯片
- 详见 2-03-高速互联与网络
与 AI 产业链关系
⚔ competitor:: CXL 3.0 Infinity Fabric UALink