机柜功率密度(Rack Power Density)
定义
机柜功率密度 = 单个标准机柜(42U / 47U)的 IT 设备额定功率
单位:kW / rack。是 DC 物理设计的核心约束,直接决定供配电、制冷、PUE、占地的所有下游设计。
三代演进(据投行内部研究 2026-02)
| 阶段 | 单机柜功率 | 典型场景 | 散热 |
|---|---|---|---|
| 传统 IDC(2010-2020) | 4 - 8 kW | x86 通用服务器 | 风冷为主 |
| 早期 AIDC(2021-2024) | 15 - 30 kW | NVIDIA H100 8 卡服务器 | 风冷 + 冷板液冷 |
| 现代 AIDC(2024-2025) | 30 - 80 kW | NVIDIA HGX H100/H200 集群 | 冷板液冷主流 |
| 超高密度 AIDC(2025+) | 120 kW+ | GB200 NVL72 整机柜(132kW) | 浸没式 + 直接液冷 |
| 次世代(2026E+) | 200 - 500 kW | Rubin / GB300 NVL72 | 全液冷 + 800V直流供电 |
为什么暴增
- NVIDIA Blackwell 架构 — B200 单 GPU TDP 1000W → GB200 单卡(含 Grace CPU)1200W → 整机柜 72 卡 / 36 GPU 132kW
- 机内 NVLink 5 整合 — 让 72 个 GPU 像一颗超大 GPU,必须物理集中
- AI 训练规模 — 万卡集群需高密度集中以缩短互联延迟
工程冲击
- 供配电:传统 415V AC → 800V直流供电 / 48V直流母线
- 散热:风冷上限 30-50 kW/rack → 液冷成强制选项(不是优化项)
- PUE:高密度 + 液冷反而能压低 PUE 至 1.1
- 占地面积:单 MW 占地从 200-300㎡ → 100-150㎡(紧凑化)
- 造价:单 MW 投资从 ¥4,000 万 → ¥8,000-12,000 万
对中国 DC 行业的颠覆
传统 IDC 不能直接改造为 AIDC。存量 4-8kW 机柜面对 100kW+ 需求几乎要重建:
矛盾观点
[!note] 高密度是否过度? 部分声音认为单机柜 200kW+ 的散热和供电成本边际太高,多机柜中密度(30-50kW)+ 高速互联 也能实现等效算力,且改造成本更低。但 NVIDIA 的 NVLink 5 物理拓扑强制集中,路径基本锁死。
上下游关系
↑ up::液冷散热 800V直流供电 1-03-热管理与散热 ↓ down::GB200 NVL72 2-02-AI服务器整机 ∈ belongs_to::3-03-数据中心
关联深度报告
增量补充(2026-05-29)
- 核实 GB200 NVL72 整机柜功率与 GB200 NVL72 1200W 超级芯片数据属实:单机柜满载约 132 kW(HPE / Supermicro 官方规格,其中 ~115 kW 液冷 + ~17 kW 风冷),GB200 Grace+Blackwell 超级芯片整封装 TDP 1200W(NVIDIA 官方 GB200 NVL72 产品页,T1)。
- 口径提示:单颗 B200 GPU TDP 按 SKU 不同有 700W(风冷)与 1000W(液冷)两档;正文 "B200 单 GPU TDP 1000W" 对应液冷高功率档,与超级芯片 1200W、整机柜 132 kW 的核心结论一致。