算力调度平台
跨地域 / 跨架构 / 多租户管理 GPU 集群资源的软件中枢 — 决定智算中心资源利用率这一核心 KPI,是"圈卡"时代结束后行业竞争的真正护城河。
定义
算力调度平台(Compute Scheduling Platform)指部署在 智算中心 之上、对异构算力资源进行统一管理和动态分配的软件系统。能力栈包括:
- 资源池化:统一抽象 NVIDIA H100 / NVIDIA H800 / 华为昇腾910B 等异构 GPU
- 任务调度:训练 / 推理 / 微调任务的优先级排队和资源分配
- 多租户隔离:算力切片、网络隔离、计费精确到秒
- 跨地域调度:把任务分发到不同城市的 智算中心("东数西算"愿景)
- 运维监控:故障检测、热迁移、利用率优化
业务价值
算力调度直接决定资源利用率这一关键指标 — 利通电子 星云2.0 资源利用率达 93.2%(行业先进水平),意味着同样的 GPU 卡能多产出 30-50% 收入。"卖卡时代"过去后,调度能力是第三方算力商区分输赢的核心壁垒(据3-02)。
主要玩家
- 利通电子 星云2.0 — 资源利用率 93.2%,腾讯合资 世纪利通 落地验证
- 青云科技(688316.SH) — AI 算力调度平台 + 政府智算合作(2024 AI 算力云 ¥4,900 万)
- 优刻得(688158.SH) — 独立公有云背景,A 股稀缺的算力调度能力
- 并行科技(839493.BJ) — 18 年超算云积累,智算云 +151%
- 国际:Run:AI(被 NVIDIA 收购)、Anyscale、Run.house
政策驱动
工信部 2026 年发布算力互联互通行动计划,明确推动跨地域、跨厂商算力调度,与 东数西算 国家工程形成软硬协同。30+ 城市 算力券 补贴政策亦倾向于覆盖具备调度能力的算力供应商。
演进路线
| 阶段 | 调度能力 |
|---|---|
| 单集群调度 | Slurm / Kubernetes 基础调度 |
| 多集群调度 | 跨园区、跨地域统一调度 |
| 跨架构调度 | NVIDIA + 昇腾 + AMD 混部 |
| 全国一张网 | "东数西算"算力互联,国家级 |
关联
↑ up::2-01-核心逻辑芯片 智算中心 ↓ down::算力租赁 GPU as a Service 智算服务 ↔ related::星云2.0 东数西算 ∈ belongs_to::3-02-AI算力租赁-智算服务