内存解耦合(Memory Disaggregation)
把内存从 CPU 物理解绑,独立部署为可被多个计算节点共享的资源 — 是 存储池化 在架构层面的延伸概念,AI 时代数据中心架构演进方向(据3-05)。
是什么
- 传统架构(CPU 绑定):每台服务器配固定的 CPU + DRAM + SSD + NIC,扩内存就要换主板
- 解耦架构:CPU 节点 / 内存节点 / 存储节点物理分离,通过 CXL / 高速 fabric 连接
- vs 存储池化:池化是"软"概念(资源池),解耦是"硬"概念(物理分离)— 池化通常基于解耦
- vs Disaggregated Storage:早已实现(SAN/NVMe-oF),内存解耦合是新前沿
关键技术依赖
- CXL 3.0 / CXL 3.1 Fabric:多层 switch + 跨机柜
- CXL MXC 控制芯片:把 DRAM 颗粒包装为 CXL 设备
- PCIe Switch / CXL Switch:实现 Fan-out
- OS / 软件栈:Linux kernel + 应用层适配
关键数据
| 维度 | 数据 | 来源 |
|---|---|---|
| 传统服务器内存利用率 | 40-60% | 综合 |
| 解耦后理论利用率 | 70-90% | 综合 |
| CXL 内存 vs 本地 DRAM 延迟 | +70-150 ns(接近远端 NUMA) | 综合 |
| 大规模商用预期 | 2027E | 综合 |
主要厂商 / 场景
- 场景验证:Meta / 微软 / Google / 阿里云 内部 PoC
- 硬件支持:澜起科技 CXL MXC + Astera Labs CXL Switch
- 早期商业模式:超大规模 CSP 自建 + 后期向企业级渗透
关键趋势
- AI 推理大模型驱动:Llama 70B+ / DeepSeek 等 KV-cache 需求增长
- TCO 优化:跨机柜共享内存,降低过度配置
- 生态早期:软件栈和 OS 支持需 3-5 年成熟
↑ up::CXL CXL 3.0 CXL MXC PCIe Switch ↓ down::3-01-云计算与智算平台 存储池化 ∈ belongs_to::3-05-AI存储系统