液冷管理(Liquid Cooling Management)
DCIM 4.0 阶段诞生的新核心模块 — 专门管理冷板液冷 / 单相浸没 / 两相浸没系统的运行参数:冷却液温度/流量/压力、泄漏检测、二次侧换热器效率。AI 高密度算力机柜倒逼出来的"必备能力"。
为什么需要专项模块
NVIDIA GB200 NVL72 / NVIDIA Rubin 等 AI 机柜单柜 120-150 kW,远超风冷物理极限(约 30 kW/柜),液冷成为必然。但传统 DCIM 只懂"风系统",对液体的监测和管理有 5 大新需求:
- 冷却液参数(T/F/P) — 进出水温、流量、压差,关系到散热是否到位
- 泄漏检测 — 液冷一旦漏液即影响 IT 设备,需亚秒级检测
- CDU(Coolant Distribution Unit)健康度 — 内置泵 / 板换 / 阀门状态
- 二次侧换热效率 — 一次侧(外部冷源)→ 二次侧(机柜回路)换热温差
- 液质监测 — 浸没液介电常数、电导率、PH 值随老化变化
6 大核心功能
| 功能 | 监测对象 | 关键指标 |
|---|---|---|
| 冷却液 T/F/P 监控 | 进/出水/分集水器 | 进/出水温差、压力损失 |
| 泄漏检测 | 漏水绳、地坪、电缆桥架 | 报警响应 < 1 s |
| CDU 健康度 | 泵、板换、阀门、传感器 | 泵效率、流量稳定性 |
| 二次侧换热效率 | 换热器ΔT、log mean ΔT | LMTD、热阻系数 |
| 浸没液质量 | 介电常数 / 电导率 / pH / 含水率 | 周期采样 + 在线监测 |
| 液冷 PUE 分项 | 一次冷源 + 二次循环能耗 | 单独液冷 PUE / 总 PUE |
与传统风冷模块的差异
| 维度 | 风冷 DCIM | 液冷管理模块 |
|---|---|---|
| 主测物 | 空气 T/H、CRAC 状态 | 液体 T/F/P、CDU、漏液 |
| 报警容忍度 | 几秒-几分钟 | < 1 秒(漏液即损失) |
| 关键设备 | 精密空调、AHU | 液冷 CDU、Manifold、Quick Disconnect |
| 行业标准 | ASHRAE TC9.9 | OCP Cool IT、Open19、ASHRAE TC9.9 Edition 5 |
主要玩家
硬件厂商延伸 DCIM 液冷模块
- 英维克 — 全链条液冷(CDU + 冷板 + Manifold),DCIM 监控配套
- 佳力图 — 精密温控 + 液冷监控
- Vertiv — Liebert XDU + Trellis 联动
- 华为数字能源 FusionDC — 风液协同管理
纯软件
- 施耐德电气 EcoStruxure IT — 新增 Liquid Cooling Module(2024)
- 优锘科技 ThingJS — 3D 数字孪生液冷可视化
增长驱动
- GB200 NVL72 / Rubin 出货放量(据投行内部研究 2026-02)— 2024 全球液冷渗透 ~5%,2027E 30%+
- 超大规模云厂自建液冷 DC(Microsoft Quincy、Meta Mesa、字节张北)
- 国内绿色 DC 政策(PUE<1.25)— 液冷+ AI 是唯一可行路径
上下游关系
↑ up::液冷 液冷 CDU 1-03-热管理与散热 ↓ down::3-10-DCIM数据中心基础设施管理软件 ∈ belongs_to::3-10-DCIM数据中心基础设施管理软件