AI产业链地图·知识库 CloudMatrix384 · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/CloudMatrix384

更新 2026·06·17

概念技术 / 术语

CloudMatrix384

CM384 · 华为超节点 · CloudMatrix 384

CloudMatrix384（CM384）是华为 2024-25 推出的超节点（Super Pod）级 AI 训练 / 推理硬件平台。单节点内集成 384 颗昇腾 910C NPU + 192 颗鲲鹏 920 CPU + 高速光互联，所有计算单元通过全对等（all-to-all）光网络互联，对标 NVIDIA GB200 NVL72 的 72 颗 Blackwell + Grace CPU 架构，但卡数密度高 5 倍。

CloudMatrix384 CONCEPT · 概念

首次提出: 2024
关键参与方: [[华为]] · [[华为云]]
反向引用: 28 处 · 来自 12 页

归属华为昇腾超节点国产替代第三层

CloudMatrix384

华为推出的国产 AI 超节点架构。384 颗昇腾 NPU + 192 颗鲲鹏 CPU 全对等互联，对标 NVIDIA GB200 NVL72。是中国 AI 算力国产替代的旗舰产品，已在华为云部署 300+ 套。

定义

CloudMatrix384（CM384）是华为 2024-25 推出的超节点（Super Pod）级 AI 训练 / 推理硬件平台。单节点内集成 384 颗昇腾 910C NPU + 192 颗鲲鹏 920 CPU + 高速光互联，所有计算单元通过全对等（all-to-all）光网络互联，对标 NVIDIA GB200 NVL72 的 72 颗 Blackwell + Grace CPU 架构，但卡数密度高 5 倍。

CM384 的设计哲学是"用规模换性能"：单颗昇腾 910C 算力低于 NVIDIA B200，但通过更密集的并行和更高的互联带宽，整机训练性能据华为披露可媲美 GB200 NVL72。

技术细节

算力配置：384 颗昇腾 910C NPU + 192 颗鲲鹏 920 CPU
互联：全对等光互联（基于自研光模块），单节点内点对点带宽数百 GB/s
机柜：单超节点占 16 个标准机柜，整机功耗约 ~600 kW
冷却：全液冷设计，PUE ≤ 1.15
算力性能：单超节点峰值 FP16 ~300 PFLOPS（华为披露）
软件栈：CANN + MindSpore + ModelArts，配套盘古大模型优化

主要玩家

唯一供应商：华为（自研芯片 + 自研互联 + 自研软件栈）
关键客户：华为云自家智算中心、运营商智算节点（天翼云、移动云）、部分政企客户
生态合作：科大讯飞、商汤科技、百川智能等大模型公司适配

在 AI 产业链中的角色

CM384 是中国应对美国 NVIDIA H100/H200/B200 出口管制的"国家级答卷"。在 CUDA生态难以短期突破的前提下，华为通过堆叠昇腾生态 NPU 数量、配套全栈软硬件来对冲单卡性能差距。已在华为云部署 300+ 套，目标 2025 算力突破 150 EFLOPS，是国产 AI 算力的核心增量。

演进历史

2024：CloudMatrix 384 架构曝光，对标 NVIDIA GB200 NVL72
2025-Q1：华为云贵安智算中心首批部署，规模化导入
2025-Q2：累计部署 300+ 套，华为云智算算力突破 100 EFLOPS
2025-Q4：目标累计算力 150 EFLOPS
2026E：CloudMatrix 下一代（基于昇腾 920）发布

相关概念 / 关系

⚔ competitor::GB200 NVL72 GB300 NVL72 ↑ up::昇腾生态 ↔ related::万卡集群 ↓ down::华为云盘古大模型 ∈ belongs_to::3-01-云计算与智算平台

参考：来源摘要

反向引用链接到本页

反向引用 28

按引用量 ↓

… > [[华为]] 旗下云业务，2024 收入 **￥385 亿**，中国云份额 **17-18% CR3 第三**，**[[昇腾生态]] 国产替代核心载体**，贵安部署 **11 万+ 昇腾 NPU** + CloudMatrix384 300+ 套。 ## 基本信息 | 维度 | 内容 | |---|---| | 成立 | 2017（华为云 BU 成立） | | 总部 | 广东深圳 | …

… - **MaaS**：[[盘古大模型]] + 主流大模型 API（DeepSeek / 通义 / GLM） - **昇腾智算云**：基于 [[华为昇腾]] / CloudMatrix384 国产化算力 - **HCS（华为云 Stack）**：私有云解决方案，[[天翼云]] / [[联通云]] 大量采用 - **行业云**：政务云、金融云、医疗云、汽车云、制造云 …

… ## 技术亮点 / 战略 - **昇腾生态唯一全栈玩家**：[[华为昇腾]] NPU → [[CANN 生态]] → MindSpore → [[盘古大模型]] 全自研 - **CloudMatrix384 超节点**：384 颗昇腾 NPU 互联，对标 [[NVIDIA]] GB200 NVL72，已部署 300+ 套 - **贵安智算中心**：全球最大昇腾集群之一，11 万+ NPU …

… 还有 3 处提及

查看原文 →

… Model Flops Utilization）— 因 GPU 故障、网络抖动、负载不均衡，万卡训练实际 MFU 通常只能达到 35-50%。 ## 技术细节 - **网络拓扑**：Fat-Tree 三层 / Dragonfly+ / CloudMatrix384 全对等 - **节点内互联**：[[NVLink]] 900GB/s（8 卡全互联）/ NVSwitch - **节点间互联**：[[InfiniBand]] NDR 400G / 800G、[[RoCE]] v2 …

… - **中国互联网**：[[字节跳动]] 火山引擎、[[阿里云]] 灵骏、[[腾讯]] 智能高性能集群、[[百度智能云]] 百舸 / 万源 - **中国国产**：[[华为云]] 贵安智算中心（11 万+ 昇腾 NPU，CloudMatrix384 300+ 套） - **AI 公司自建**：[[商汤科技]] [[SenseCore大装置]] 4 万 GPU ## 在 AI 产业链中的角色万卡集群是大模型时代云计算和数据中心的标志性产品。 …

… - 2024：万卡成"国内一线大模型公司起步配置" - 2025：[[xAI]] Colossus 部署 20 万张 H100 GPU，刷新世界纪录；[[华为]] CloudMatrix384 实现昇腾万卡级国产替代 - 2025-2030：[[十万卡集群]] 进入工程实践，OpenAI 星门计划探索百万卡 ## 相关概念 / 关系 ↑ up::[[2-01-核心逻辑芯片]] [[2-02-AI服务器整机]] [[3-06- …

… 还有 1 处提及

查看原文 →

… > [[华为]] 常务董事、[[华为云]] CEO（2021 起接任）、华为 ICT 销售与服务总裁。华为 ToB 业务的核心决策者，主导 [[昇腾生态]] 在云端的商业化落地以及 CloudMatrix384 超节点产品化。 ## 一句话定位华为云一把手；华为"算力 + 鸿蒙 + ICT 三大业务群"中云业务的总指挥；昇腾国产替代云端商业化的拍板人。 ## 基本信息 …

… - **2021** — 接任 [[华为云]] CEO（前任 [[徐直军]] / [[侯金龙]] 等高管轮替后），开启华为云"政企 + 昇腾"双引擎战略 - **2023** — 晋升华为常务董事 - **2024-2025** — 主导 CloudMatrix384 超节点产品化、[[华为云]] 贵安 11 万+ 昇腾 NPU 集群部署（[据 3-01 子行业报告](../来源摘要/3-01-云计算与智算平台.md.md)） …

… 21 接任华为云 CEO** — 在美国制裁背景下重塑华为云"全栈自主可控"定位 - **昇腾生态云端商业化** — 把 [[昇腾910B]] / [[昇腾910C]] AI 芯片包装为云服务，对外提供 [[华为云]] AI 算力 - **CloudMatrix384 超节点** — 2025 推出对标 [[NVIDIA]] [[GB200 NVL72]] 的国产超节点，已部署 **300+ 套** - **贵安智算中心** — 11 万+ 昇腾 NPU，目标 2025 算力突破 **150 EFLOP …

… 还有 1 处提及

查看原文 →

… 1. **AI 处理器**：昇腾 310（推理）/ 910 / 910B / 910C（训练） 2. **服务器与超节点**：[[Atlas]] 800 / [[Atlas 900]] 集群 / CloudMatrix384 超节点 3. **互联**：自研华为缓存一致互联（HCCS）+ 光互联 4. **算子库与编译**：[[CANN]]（Compute Architecture for Neural Networks），对标 CUDA + cuDNN …

… - 2020-2022：被美国列入实体清单，昇腾迭代受阻 - 2023：昇腾 910B 量产，[[科大讯飞]] 万卡昇腾集群训练星火大模型 - 2024：昇腾 910C 流片成功，对标 H100 - 2025：CloudMatrix384 超节点 300+ 套部署，目标算力 150 EFLOPS - 2025-2030：争取在中国 AI 算力中份额突破 30% ## 相关概念 / 关系 ⚔ competitor::[[CUDA 生态]] …

… ## 相关概念 / 关系 ⚔ competitor::[[CUDA 生态]] ↑ up::[[华为]] 海思 ↔ related::[[CANN]] [[MindSpore]] CloudMatrix384↓ down::[[华为云]] [[盘古大模型]] 国产大模型训练 ∈ belongs_to::[[3-01-云计算与智算平台]] [[2-01-核心逻辑芯片]] …

查看原文 →

… . **云服务三层**：[[IaaS]] / [[PaaS]] / [[MaaS]] 7. **部署形态**：[[公有云]] / [[私有云]] / [[混合云]] 8. **国产替代**：[[CUDA生态]] vs [[昇腾生态]] / CloudMatrix384 超节点 9. **云端大模型**：[[通义千问]] / [[文心一言]] / [[混元大模型]] / [[豆包大模型]] / [[GLM大模型]] 10. **政策驱动**：[[东数西算]] / "十五五"算力规划 …

… 3. **价格战与调用量竞争** — [[豆包大模型]] 0.0008 元/千 tokens 引发降价潮，日调用量 63 万亿 tokens 中国第一 4. **昇腾国产替代加速** — [[华为云]] 贵安 11 万+ 昇腾 NPU + CloudMatrix384 300+ 套，目标 150 EFLOPS（2025） 5. **资本开支"军备竞赛"** — 中国云厂商总投资￥5,000 亿+/年：阿里 3,800/3 年、字节 1,600/2026、运营商 900+ …

查看原文 →

… ## 在 3-01 云计算与智算平台中的角色华为通过 [[华为云]] 成为**中国 AI 国产替代的核心载体**：在美国对华芯片出口管制持续收紧背景下，[[华为昇腾]] + CloudMatrix384 超节点是中国唯一能大规模替代 [[NVIDIA]] H100/B200 的方案。 **核心数据**（[据 3-01](../来源摘要/3-01-云计算与智算平台.md.md)）： …

… - [[华为云]] 2024 营收 **￥385 亿**（+8.5%） - 中国 IaaS+PaaS 份额 **17-18%**（CR3 第三） - 贵安智算中心部署 **11 万+ 昇腾 NPU** - CloudMatrix384 超节点已部署 **300+ 套** - 目标 2025 算力突破 **150 EFLOPS** **全栈国产生态**：[[华为昇腾]] NPU → [[CANN 生态]] → MindSpore → [[盘古大模型]]，是中国**唯一* …

查看原文 →

… - **存储**：并行文件系统（Lustre / GPFS / 阿里云 CPFS）、热数据 NVMe SSD - **网络拓扑**：Fat-Tree / Dragonfly+ / CloudMatrix384 全对等 - **AI 全栈**：从硬件 → 调度（Slurm / Kubernetes）→ 框架（DeepSpeed / Megatron）→ 训练数据流水线 …

… - 2024：[[万卡集群]] 普及，[[NVIDIA]] H100/B200 主流 - 2025：[[十万卡集群]] 启动建设（OpenAI 星门计划、xAI Colossus 20 万卡）；中国 [[华为云]] 部署 CloudMatrix384 300+ 套 - 2025-2030E：中国 AI 云市场 CAGR **26.8%**（Omdia） ## 相关概念 / 关系 ↑ up::[[2-01-核心逻辑芯片]] [[2-02-AI服务器整机]] …

查看原文 →

… - [[2-02-AI服务器整机]] - 详见 [[Blackwell]]、[[NVLink]] ## 与 AI 产业链关系 ⚔ competitor:: CloudMatrix384 …

查看原文 →

… ## 关键来源 - [[2-02-AI服务器整机]] - 详见 [[Blackwell]]、[[液冷]] ## 与 AI 产业链关系 ⚔ competitor:: CloudMatrix384 …

查看原文 →

… 在 AI 时代，IaaS 的核心产品从 "x86 虚拟机" 升级为 "GPU/NPU 集群实例 + [[RDMA]] / [[InfiniBand]] 高速互联 + 分布式存储"，单实例规格演化到 [[GB200 NVL72]] / CloudMatrix384 量级。 ## 技术细节 - **计算**：虚拟机（KVM/Xen）、裸金属、容器；GPU/NPU 实例（NVIDIA H100/B200、华为昇腾 910C） …

查看原文 →

… | 昇腾 910C | NPU | 制程升级（推测 5-7nm 国产） | 2025 出货 | | 昇腾 910D | NPU | 下一代 | 2026 计划 | | CloudMatrix384 | 超节点系统 | 384 颗 910 互联 | 已部署 300+ 套 | | 海思鲲鹏 920 | ARM CPU | 数据中心 | 持续 | | [[华为海思FPGA]] | FPGA | 国产 FPGA | 量产 | …

查看原文 →

… ↑ up::[[华为昇腾]] [[NVIDIA]] [[寒武纪]] [[超聚变]] [[长江计算]] [[华鲲振宇]] ↑ up::[[3-03-数据中心]] [[3-06-数据中心网络架构与互联服务]] ↑ up::CloudMatrix384 — 华为昇腾超节点底座 ↓ down::党政军 / 央国企 / 金融 / 医疗 / 教育 ⚔ competitor::[[移动云]] [[联通云]] [[阿里云]] [[华为云]] [[腾讯云]] [[火山引擎]] [[百度智能云]] …

查看原文 →