DOCA(Data Center Infrastructure on a Chip Architecture)
NVIDIA 为 BlueField DPU 打造的软件开发平台与 SDK,类比 CUDA 生态 之于 GPU——把 DPU 的网络/存储/安全加速能力封装成统一 API,让开发者一次编程跑遍 BF-2/BF-3/BF-4,是 NVIDIA 在 DPU 赛道建立软件护城河的核心抓手(据3-06)。
是什么
DOCA 是一套覆盖 DPU 全栈能力的开发框架:
| 层 | 模块 | 功能 |
|---|---|---|
| 应用 | DOCA Services | App Shield、Flow、Telemetry、URL Filter |
| 库 | DOCA Libraries | DPI、DPL(数据包处理)、Comm Channel、Compress |
| 驱动 | DOCA Drivers | RDMA、DMA、SHA、AES、RegEx |
| 基础 | DOCA Core | 内存管理、PE(处理引擎)抽象 |
开发者用 C / C++ / Python / Go 调用 DOCA API,编译出来的程序在 BlueField-2 / BlueField-3 / BlueField-4 上无需改动重跑。
为什么关键
- DPU 软件生态壁垒 — DPU 没有像 CUDA 生态 那样的现成生态,DOCA 是 NVIDIA 试图复制 CUDA 成功的关键
- 客户锁定 — 一旦客户基于 DOCA 写了网络/安全控制面,再换 DPU 厂商成本极高
- 跨代兼容 — 让 BlueField-3 客户能直接升级 BlueField-4,不用重写代码
- AI 集群管理 — 大模型训练集群的多租户隔离、性能监控、流量调度全靠 DOCA 上跑的服务
版本演进
| 版本 | 时间 | 关键能力 |
|---|---|---|
| DOCA 1.0 | 2021 | 初代,基础网络/存储 API |
| DOCA 2.0 | 2023 | 与 BlueField-3 配套,Spectrum-X 集成 |
| DOCA 3.0 | 2024 | App Shield 安全增强 |
| DOCA 4.0 | 2025 | AI Cloud Service Provider 优化 |
| DOCA 5.0 | 2026E | 与 BlueField-4 同步,AI 原生存储 API |
竞品对照
| 厂商 | 对应平台 | 状态 |
|---|---|---|
| NVIDIA DOCA | BlueField | 主导 |
| Intel IPDK | IPU / Mount Evans | 开源,生态弱 |
| AMD Pensando | DSC SDK | 客户绑定型 |
| AWS Nitro | 自用 | 不对外 |
| 中科驭数 HADOS | KPU | 国产唯一 |
在 AI 产业链中的角色
DOCA 是 NVIDIA "AI 工厂"端到端方案的最后一块软件拼图——GPU 有 CUDA 生态,网络有 Spectrum-X,DPU 有 DOCA。三层软件栈互相绑定,让客户买完 GPU 后几乎只能买配套的 NVIDIA 网络和 DPU。
⚔ competitor::中科驭数 HADOS、Intel IPDK ∈ belongs_to::3-06-数据中心网络架构与互联服务