AI产业链地图·知识库 InfiniBand · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/InfiniBand

更新 2026·06·17

概念技术 / 术语

InfiniBand

IB · 无限带宽 · IB 网络

InfiniBand 是基于 RDMA（Remote Direct Memory Access）的网络协议栈，绕开 CPU 直接访问远端节点内存。相比传统 Ethernet：

InfiniBand CONCEPT · 概念

首次提出: 1999
关键参与方: NVIDIA, Mellanox
反向引用: 52 处 · 来自 30 页

归属互联协议AI集群NVIDIA低延迟第二层

InfiniBand

AI 集群专用低延迟高带宽互联协议 — 1999 年由 InfiniBand Trade Association 推出，原为 HPC 设计，NVIDIA 通过收购 Mellanox 获得，成为当代 AI 大模型训练 Scale-out 网络的事实标准。

是什么

InfiniBand 是基于 RDMA（Remote Direct Memory Access）的网络协议栈，绕开 CPU 直接访问远端节点内存。相比传统 Ethernet：

延迟更低（< 1μs 端到端）
带宽更高（当代 NDR 400G / XDR 800G）
零拷贝（用户态 verbs API）

适合 AI 训练的 all-reduce / all-to-all 集合通信。

为什么关键

大模型训练的事实标准 — GPT / Claude / Gemini 等头部模型训练集群基本用 IB
NVIDIA 软硬一体护城河的一部分 — 通过 2019 年收购 Mellanox 获得，与 NVLink / Spectrum-X 形成完整网络栈
三层互联体系 — IB 处于中间：NVLink（Scale-up 机柜内）+ InfiniBand（机柜间专网）+ Ethernet（通用 / Scale-out）
被 Ethernet 反扑 — Spectrum-X / Ultra Ethernet Consortium 正在用以太网 + 增强方案抢 IB 的位置

演进路线

代际	单链路带宽	时间
QDR	40 Gbps	2008
FDR	56 Gbps	2011
EDR	100 Gbps	2014
HDR	200 Gbps	2018
NDR	400 Gbps	2022（当代）
XDR	800 Gbps	2025-2026

演进与 NVIDIA 内部博弈

InfiniBand → Ethernet 演进 — NVIDIA 推 Spectrum-X / Quantum-X，把 IB 经验（RDMA / 拥塞控制）移植到以太网
⚔ competitor::Ethernet（含 Ultra Ethernet Consortium、AWS 自研 SRD）
⚔ competitor::NVLink（机柜内 fabric，更紧耦合）

关键来源

2-03-高速互联

与 AI 产业链关系

⚔ competitor:: CXL 3.0 Ultra Ethernet Consortium 云豹智能以太网

反向引用链接到本页

反向引用 52

按引用量 ↓

… # Ultra Ethernet（UEC，超以太网） > **挑战 InfiniBand 垄断的开放标准联盟** — 由 [[AMD]] / [[Arista Networks]] / [[Broadcom]] / [[Cisco]] / [[Intel]] / [[Meta]] / [[微软]] 等八家在 2023 年共同发 …

… **UEC 1.0 规范于 2024-2025 推进，产品化在 2026-2027**。 ## 定位与背景 [[NVIDIA]] 2019 年收购 Mellanox 后，InfiniBand 协议事实上被一家公司控制。在万卡 GPU 集群（[[GB200 NVL72]] / [[GB300 NVL72]]）成为主流的 AI 训练时代，超大规模云厂商（[[Meta]] / [[微软]] / [[AWS]]）和芯片巨头不愿被单一供 …

… AI 网络的"反垄断方案"——通过把训练流量从专有 IB 迁回开放以太网，让超大规模客户拿回议价权和供应链灵活性。一旦 UEC 1.0 在 2026-2027 大规模产品化，[[NVIDIA]] [[Spectrum-X]] 以太网平台和 InfiniBand Quantum 平台都将面临阵营式挑战。中国厂商（[[华为]] / [[新华三]] / [[锐捷网络]]）可以通过加入 UEC 工作组，弯道超车进入全球 AI 网络标准制定。 …

… 还有 1 处提及

查看原文 →

… 网络主流协议**，IEEE 802.3 标准族 — 由 Xerox 在 1980 年提出，统治企业局域网与数据中心前端网络 40 年。AI 时代正凭借 [[Ultra Ethernet]] / [[Spectrum-X]] 等增强方案反攻 InfiniBand 主导的 AI 后端市场。**2025 Q3 以太网占 AI 集群交换机出货量 2/3 以上**（[据3-06](../来源摘要/3-06-数据中心网络架构与互联服务.md.md)）。 …

… 上层运行 IP/TCP/UDP，构成全球互联网骨干。数据中心场景下，以太网通过 RoCEv2（RDMA over Converged Ethernet）实现低延迟内存直访，与 InfiniBand 同等支持 GPU 集群 all-reduce 通信。 ## 与 InfiniBand 的竞争 | 维度 | 以太网（含 RoCEv2 / UEC） | [[InfiniBand]] | …

… erged Ethernet）实现低延迟内存直访，与 [[InfiniBand]] 同等支持 GPU 集群 all-reduce 通信。 ## 与 InfiniBand 的竞争 | 维度 | 以太网（含 RoCEv2 / UEC） | InfiniBand | |---|---|---| | 开放性 | 多供应商开放标准 | NVIDIA 实质独家 | | 单链路速率 | 800G（2025）/ 1.6T（2026） | 400G NDR（2022）/ 800G XDR（2025） | …

… 还有 1 处提及

查看原文 →

… | 竞标对手 | [[Intel]] / [[Microsoft]]（据外媒报道也曾出价） | | 监管 | 经历美国 / 欧盟 / 中国反垄断审查，最终中国 2020-04 通过 | ## 事件经过 [[Mellanox]] 是 InfiniBand 协议的主要硬件供应商和 ConnectX 系列高速以太网网卡龙头，1999 年成立，2007 上市，市值约 $50-60 亿。2019-03 [[NVIDIA]] 出价 **$69 亿** 击败 [[Intel]] / [[Microso …

… **DPU 入口** — Mellanox 的 BlueField 系列成为 NVIDIA [[BlueField]] DPU 产品线起点，定义了"AI 数据中心 SuperNIC"品类 2. **InfiniBand 独家控制** — InfiniBand 此后事实上由 NVIDIA 一家控制，2024-2026 万卡 GPU 集群训练几乎只能选 NVIDIA IB 3. **以太网交换机入口** — Mellanox Spectrum 交换机成为 NVIDIA [[Spectrum-X]] …

… ## 关联实体 - 收购方：[[NVIDIA]] - 标的：[[Mellanox]] - 整合后产品线：[[BlueField]] / [[Spectrum-X]] / InfiniBand- 对标后续：[[2022-AMD收购Pensando]]、[[2026H2-NVIDIA BlueField-4发布]] ∈ belongs_to::[[3-06-数据中心网络架构与互联服务]] …

查看原文 →

… D]]、[[Arista Networks]]、[[Broadcom]]、[[Cisco]]、[[Intel]]、[[Meta]]、[[微软]]、Hewlett Packard Enterprise | | 目标 | 用开放以太网协议取代 InfiniBand 作为 AI 训练集群网络底座 | | 首个标准 | [[Ultra Ethernet]] UEC 1.0（2025-26 推进） | ## 事件经过 [[NVIDIA]] 2019 完成 $69 亿收购 Mellanox 后，[[In …

… | 首个标准 | [[Ultra Ethernet]] UEC 1.0（2025-26 推进） | ## 事件经过 [[NVIDIA]] 2019 完成 $69 亿收购 Mellanox 后，InfiniBand 协议事实上由一家公司控制。随万卡 GPU 集群成为 AI 训练主流（GPT-4、Llama 3 训练规模），超大规模云厂商（[[Meta]] / [[微软]] / [[AWS]]）和芯片巨头不愿被 NVIDIA 单一供应商绑架。 …

… *中国厂商机会**：[[华为]] / [[新华三]] / [[锐捷网络]] / [[盛科网络]] 可通过加入 UEC 工作组进入全球 AI 网络标准制定 ## 关联实体 - 倡导方：[[Ultra Ethernet]] - 受影响竞品：InfiniBand、[[NVIDIA]] [[Spectrum-X]] - 受益方：[[Broadcom]]、[[Arista Networks]]、[[Cisco]]、[[SONiC]] 生态、白牌交换机 …

查看原文 →

… rks]] / [[Broadcom]] / [[Cisco]] / [[Eviden]] / [[HPE]] / [[Intel]] / [[Meta]] / [[Microsoft]] 9 家创始成员发起的行业联盟，目标是**打造对标 InfiniBand 的开放以太网 AI 网络标准**，挑战 [[NVIDIA]] / [[Mellanox]] 在 AI 后端网络的垄断。 > **注**：本页是 organization 子类 entity，不是公司，无 ticker 无营收。 …

… - [[NVIDIA]] **不是 UEC 创始成员**，2024 年中加入但战略地位低 - NVIDIA 的 [[Spectrum-X]] 是私有 AI 以太网平台，部分技术 PK UEC - NVIDIA InfiniBand 仍是 AI 训练首选，UEC 短期难撼动 ## 上下游关系 ⚔ competitor::[[NVIDIA]] / [[Mellanox]] [[InfiniBand]] — 标准之争主要对手 …

… - NVIDIA [[InfiniBand]] 仍是 AI 训练首选，UEC 短期难撼动 ## 上下游关系 ⚔ competitor::[[NVIDIA]] / [[Mellanox]] InfiniBand — 标准之争主要对手 ⚔ competitor::[[Spectrum-X]] — NVIDIA 私有 AI 以太网 ↓ down::[[Meta]] [[Microsoft]] [[Oracle]] [[Google]] AI 数据中心 …

查看原文 →

… - [[烽火通信]]（600498.SH，市值 ~￥250 亿）★★ — 中国信科旗下央企 ## 核心技术维度 1. **协议路线**：[[以太网]] vs InfiniBand / [[Ultra Ethernet Consortium]]（UEC） 2. **速率**：[[800G 交换机]] / [[1.6T 交换机]] / [[400G]] / [[博通 TH6]] …

… ∈ belongs_to::[[第三层-AI基础设施]] ## 关键趋势 1. **以太网渗透 AI 后端，800G/1.6T 加速** — 2027 超 InfiniBand，[[博通 TH6]] 标志 1.6T 2. **DPU 千亿国产替代** — "每台服务器一定有 DPU"，[[中科驭数]] K3 800G 3. **AI 服务器铜缆爆发** — [[GB200]] 推动，224Gbps 竞赛 …

查看原文 →

… 机的"白盒+软件"代表 — 硬件用 [[Broadcom]] 公版芯片，差异化全靠 [[EOS]] 软件栈和 CloudVision 自动化平台。AI 训练集群中与 [[NVIDIA]] [[Spectrum-X]] 形成以太网联军，对抗 InfiniBand。 ## 关键数据（2025-2026） | 维度 | 数据 | 时间 | |---|---|---| | 市值 | 约 $1,400 亿 | 2026-Q1 | …

… - **AI 后端以太网 vs InfiniBand** — Arista 是 [[Ultra Ethernet Consortium]] 创始成员，押注 2027 以太网渗透率超 InfiniBand- **联合创始人 [[Andy Bechtolsheim]]** — Sun Microsystems 共同创始人 + Google 第一位投资人，硅谷传奇工程师，至今仍任 Arista 首席发展官 + 首席架构师 …

查看原文 →

… 期 GPU 优先供应权 + 联合产品研发，是 NVIDIA 体系内"亲儿子级"地位 2. **专注 AI 不做通用云** — 不做企业 IT 全栈，只做 GPU 算力 + 配套存储/网络，运营复杂度远低于 Hyperscaler 3. **InfiniBand 高速网络** — 全部署 NDR/XDR InfiniBand，训练性能优于 [[AWS]] / [[Microsoft Azure]] 同档实例 4. **快速部署最新 GPU** — [[GB200 NVL72]] 等新品上线速度领先 …

… 模式被 [[商汤科技]]、[[燧原科技]]、[[摩尔线程]] 等中国 AI 算力公司部分对标。 ## 客户与供应链 ↑ up::[[NVIDIA]] [[H100]] [[H200]] [[B200]] [[GB200 NVL72]] InfiniBand 美国二线 IDC ↓ down::[[Microsoft]]（OpenAI 训练溢出） [[OpenAI]] [[Meta]] [[xAI]] [[Cohere]] [[Mistral]] [[Stability AI]] …

查看原文 →

… AWS EC2（2006）是公认的现代 IaaS 起点。在 AI 时代，IaaS 的核心产品从 "x86 虚拟机" 升级为 "GPU/NPU 集群实例 + [[RDMA]] / InfiniBand 高速互联 + 分布式存储"，单实例规格演化到 [[GB200 NVL72]] / [[CloudMatrix384]] 量级。 ## 技术细节 - **计算**：虚拟机（KVM/Xen）、裸金属、容器； …

… - **存储**：对象存储（S3/OSS）、块存储（EBS/云盘）、文件存储（EFS/NAS） - **网络**：VPC 虚拟网络、负载均衡、专线、SD-WAN；AI 集群额外需要 [[RDMA]] / [[RoCE]] / InfiniBand- **计费**：按秒/分钟计费，支持竞价实例（Spot）和预留实例与 [[PaaS]] 边界：PaaS 在 IaaS 之上封装数据库、中间件、AI 训练框架； …

查看原文 →

… # Mellanox > **InfiniBand 鼻祖** — 1999 年成立的以色列网络芯片公司，2019 年被 [[NVIDIA]] 以 **$69 亿现金**收购，是 NVIDIA 数据中心网络霸权的起点。 …

… BlueField-2 → BlueField-3（2024，400G）→ BlueField-4（2026H2，800G） ### 光模块 - LinkX 光模块和有源铜缆，配套 NVIDIA AI 系统 ## 技术亮点 1. **InfiniBand 唯一供应商** — 1-2μs 端到端延迟，[[RDMA]] 零拷贝，HPC + AI 训练黄金标准 2. **GPUDirect RDMA** — GPU 显存直接通过网络互访，跳过 CPU，是 NVIDIA AI 集群的杀手锏 …

查看原文 →

… NVIDIA 通过 2019 年 $69 亿收购 [[Mellanox]] 切入数据中心网络，目前是 **InfiniBand 唯一供应商** + 以太网新势力： - **InfiniBand / [[Quantum]] 系列** — Quantum-2（400G NDR）/ Quantum-3（800G XDR，2026）；万卡 GPU 集群训练首选 …

… - [[Spectrum-X]] 以太网平台 — 2024 推出，2025 销售逼近 [[Arista Networks]]、超越 [[Cisco]] - InfiniBand Quantum 系列 — Q2（400G NDR）/ Q3（800G XDR，2026），万卡 GPU 集群训练首选 - [[BlueField]] DPU — BlueField-3（400G，2024 量产）/ **BlueFie …

查看原文 →

… | 差异化 | RDMA 高速网络协议支持 | — | ## 核心产品 - **DPU 芯片** — 集成网络/存储/安全卸载 - **[[RDMA]] 加速** — RoCEv2 / InfiniBand 协议硬件卸载，是 AI 集群 GPU-GPU 通信的核心 - **可编程数据面** — 配合云厂软件栈定制 ## 上下游关系 ↑ up::[[台积电]] — 代工 …

… ⚔ competitor::[[中科驭数]] — 国产 DPU 头部（侧重网络/存储综合卸载，云豹更聚焦 RDMA） [[云脉芯联]] ⚔ competitor::[[NVIDIA]] BlueField — 国际 DPU 龙头（同时也是 InfiniBand 标准制定者） ⚔ competitor::[[Broadcom]] / [[Marvell]] — 国际网络芯片巨头 ⚔ competitor::AWS Nitro — 自研 DPU …

查看原文 →

… | [[前端网络]] | 业务接入、运维、存储 | [[以太网]] | 100G / 400G | 南北向，散流 | | **后端网络** | GPU-GPU 集合通信 | InfiniBand / RoCEv2（[[Ultra Ethernet]]）| 400G / 800G / 1.6T | 东西向，洪流 | 后端网络的核心需求是 **大带宽 + 极低尾延迟 + 无损传输**——任何一条链路丢包都会让 all-reduce …

… | 2025 Q3 以太网占 AI 集群交换机出货 | **2/3+** | | AI 后端以太网 NVIDIA+Celestica 份额 | **~50%**（2025） | ## 主要玩家 - **协议路线**： - InfiniBand — NVIDIA Quantum 平台，xAI Colossus / Microsoft 部分集群 - [[以太网]] + [[Spectrum-X]] — NVIDIA 端到端，Oracle OCI / CoreWeave …

查看原文 →

… - **高功率密度**：单柜 30-150kW（[[GB300 NVL72]] 单柜 150kW+），传统风冷物理无解，[[液冷]] 成标配 - **高密度互联**：节点间用 InfiniBand 400G/800G 或 [[RoCE]] 高速无损网络 - **AI 软件栈**：预集成训练框架、调度系统、模型仓库 - **能效要求高**：PUE 普遍要求 1.2 以下 …

… ↑ up::[[1-01-电力]] [[1-03-热管理散热]] [[3-03-数据中心]] [[3-09-数据中心微模块-预制化]] ↑ up::[[2-02-AI服务器整机]] [[液冷]] InfiniBand↓ down::[[算力租赁]] [[智算服务]] [[GPU as a Service]] ↔ related::[[东数西算]] [[算力券]] ∈ belongs_to::[[3-02-AI算力租赁-智算服务]] …

查看原文 →

… 底层硬件以 [[GPU]]（[[NVIDIA]] H100/B200）/ [[NPU]]（[[华为]] 昇腾 910C）/ [[TPU]] 为主，配套高速互联（[[NVLink]] / InfiniBand / [[RDMA]]）、并行文件系统、AI 框架优化和分布式训练调度。智算服务的核心买家是大模型训练团队、AIGC 公司、自动驾驶研发、生物医药 AI 等高算力消费方。 …

… - **算力规格**：单集群 [[千卡集群]] → [[万卡集群]] → [[十万卡集群]] 演进 - **互联**：节点内 [[NVLink]] 900GB/s、节点间 InfiniBand 400G/800G / [[RoCE]] - **存储**：并行文件系统（Lustre / GPFS / 阿里云 CPFS）、热数据 NVMe SSD - **网络拓扑**：Fat-Tree / Dragonfly+ / [[CloudM …

查看原文 →

… - [[中航光电]]（军工连接器跨界） - [[博创科技]]（硅光） ## 核心技术维度 1. **铜互联（Scale-up）** — 机柜内 GPU 直连，[[NVLink]] / InfiniBand，单通道极限 [[224G PAM4]]，传输距离 <3 米 2. **光传输（Scale-out）** — 机柜间，800G 主流 → 1.6T 商用元年 → 3.2T 研发 …

查看原文 →

… - [[芯启源]] ★★★★（高速 SerDes IP） - [[云脉芯联]] ★★★★（CPO 技术） - [[云合智网]] ★★★（AI 网络管理软件） ## 核心技术维度 1. **协议之争**：InfiniBand（NVIDIA 垄断）vs [[Ultra Ethernet]]（UEC 1.0 开放标准） 2. **端口速率代际**：[[400G]] → [[800G]] → [[1.6T]] …

查看原文 →

… Cisco 是传统数据中心交换机霸主（自研 [[Silicon One]] 芯片 + Nexus 9000 + Cisco IOS），NVIDIA 通过 [[Spectrum-X]] + InfiniBand 在 AI 训练集群快速崛起。2024-2025 NVIDIA 数据中心以太网销售已逼近 Cisco，威胁后者基本盘。 2025-02-26，Cisco 在 Cisco Live 大会与 NVIDIA 联合宣布战略合作：**Cisco N …

查看原文 →

… 架构**：[[虚拟化]] / [[容器化]]（[[KVM]] / [[Docker]] / [[Kubernetes]]） 2. **算力集群**：[[万卡集群]] / [[十万卡集群]] / GPU/NPU 调度 3. **高速互联**：InfiniBand / [[RDMA]] / [[RoCE]] 4. **存算分离**：计算节点与存储解耦，提升资源利用率 5. **大模型推理**：[[vLLM]] / [[TensorRT]] 加速引擎 …

查看原文 →

… 2. **集群管理**：万卡集群运维 / 多租户隔离 / 资源调度 3. **散热**：[[液冷散热]]（单台功耗 10kW+，已成智算中心标配） 4. **互联**：InfiniBand / [[RoCE]] 高速网络 5. **调度平台**：[[星云2.0]]（利通电子，资源利用率 93.2%） / [[算力调度平台]] 6. **服务形态**：[[算力租赁]] / [[GPU as a Service]] / [[智算 …

查看原文 →

… - 与 [[GB200 NVL72]] / [[GB300 NVL72]] 节点配套，1:1 SuperNIC - 与 [[Spectrum-X]] 交换机协同，实现端到端拥塞控制 - 与 InfiniBand Quantum 平台兼容，覆盖 IB 客户 - 卸载多租户网络/存储，让公有云 GPU 集群"100% 算力给租户" ## 竞争格局 | 玩家 | 产品 | 定位 | …

查看原文 →

… ↑ up::[[CXL]] [[CXL 2.0]] [[PCIe 6.0]] ↓ down::[[存储池化]] [[内存解耦合]] [[CXL 3.1]] ⚔ competitor::[[NVLink]] InfiniBand∈ belongs_to::[[3-05-AI存储系统]] …

查看原文 →

… - **[[Ultra Ethernet Consortium]] 创始成员** — 与 [[Arista]] / [[Broadcom]] / [[AMD]] 联手挑战 InfiniBand 垄断 - **[[Splunk]] $280 亿收购（2024）** — 切入 AI 数据可观测性赛道 - **资本运作策略** — 大额并购消化期，未来 18 月预期以小型 AI 网络/安全 tuck-in 为主 …

查看原文 →

… ] [[SenseCore大装置]] / [[百度]] 的飞桨星河社区算力等）有理念相通之处。 ## 客户与供应链 ↑ up::[[NVIDIA]] [[H100]] [[H200]] [[B200]] [[GB200 NVL72]] InfiniBand 美国 IDC ↓ down::Stanford / MIT 等大学实验室 OpenAI 研究人员（个人）独立 AI 研究者中小型 AI 初创公司 ⚔ competitor::[[CoreWeave]] [[Nebius]] Vast.a …

查看原文 →

… HBM4 + CoWoS-L + 800V 直流（[[2025-NVIDIA推出800V直流供电架构]]） | ### 跨层产品矩阵 - **第 2 层**：GPU 芯片 + [[NVLink]] + [[Mellanox]] 网络（InfiniBand / [[Spectrum-X]] / [[BlueField]] DPU） - **第 3 层**：DGX Cloud 自营算力 + 通过 [[CoreWeave]] 等 NeoCloud 分销算力； …

查看原文 →

… 在中国市场，Nebius 无业务。 ## 客户与供应链 ↑ up::[[NVIDIA]] [[H100]] [[H200]] [[B200]] [[GB200 NVL72]] InfiniBand 欧洲 IDC（芬兰水电资源丰富） ↓ down::欧洲 AI 初创公司 [[Mistral]] Black Forest Labs Wayve 中东主权 AI 项目 Toloka 数据客户 …

查看原文 →

… 2]] 超节点早期最大商用客户之一，部署速度领先 [[AWS]] / [[Microsoft Azure]] / [[Google Cloud Platform]] 2. **RDMA 高速网络架构** — OCI 自研 RoCEv2 + InfiniBand 混合架构，支持 [[万卡集群]] 级别低延迟训练 3. **企业级合规和数据库优势** — 把 Oracle Database 客户迁到 OCI，提供"最佳运行环境"溢价 …

查看原文 →

… - **云厂商自研**：[[AWS]] Nitro、阿里云 CIPU、字节 NIC ## 在 AI 产业链中的角色 AI 训练集群中，SmartNIC/DPU 承担三大核心任务： 1. **RDMA 加速**：在 InfiniBand 或 RoCEv2 ([[Ultra Ethernet]]) 上做硬件级 RDMA，把 GPU-to-GPU 延迟降到 μs 级 2. **存储卸载**：NVMe-oF、压缩、加密 …

查看原文 →

… 4. **端到端协同**：Spectrum-4 + BlueField-3 联合配置，避免传统以太网"交换机和网卡各管各" ## 与 InfiniBand 对比（NVIDIA 双线策略） | 维度 | InfiniBand Quantum | Spectrum-X | |---|---|---| | 协议 | 专有 IB | 开放以太网（RoCE v2） | | 延迟 | <2μs | ~5μs | …

查看原文 →

… **网络拓扑**：Fat-Tree 三层 / Dragonfly+ / [[CloudMatrix384]] 全对等 - **节点内互联**：[[NVLink]] 900GB/s（8 卡全互联）/ NVSwitch - **节点间互联**：InfiniBand NDR 400G / 800G、[[RoCE]] v2 - **并行策略**：数据并行（DP）+ 张量并行（TP）+ 流水线并行（PP）+ 专家并行（EP）+ ZeRO 优化 …

查看原文 →