AI产业链地图·知识库 云训练-边缘推理 · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/云训练-边缘推理

更新 2026·06·17

概念技术 / 术语

云训练-边缘推理

Cloud Training Edge Inference · 混合 AI 架构 · Hybrid AI

这是对早期"中心化 AI（训练+推理都在云）"和"端侧 AI（设备本地推理）"的折中方案。

云训练-边缘推理 CONCEPT · 概念

首次提出: 2024
关键参与方: [[Cloudflare]] · [[Akamai]] · [[Fastly]] · [[网宿科技]]
反向引用: 4 处 · 来自 4 页

归属混合架构云训练边缘推理第三层

云训练-边缘推理（Cloud Training + Edge Inference）

定义

云训练-边缘推理是 2024 年以来 AI 基础设施行业达成的混合 AI 架构共识：

训练阶段 — 留在中心化超大型 GPU 集群（10,000-100,000 卡），需要规模化的 NVLink/InfiniBand 互联 + HBM 显存 + 持续数月的稳定算力
推理阶段 — 下沉到 ↑ up::CDN 边缘节点 / 运营商 MEC / 终端设备，需要低延迟 + 全球分布 + 弹性扩缩

这是对早期"中心化 AI（训练+推理都在云）"和"端侧 AI（设备本地推理）"的折中方案。

为什么训练留在云、推理去边缘

维度	训练	推理
卡数需求	1K-100K 卡	1-8 卡
通信带宽	NVLink 900GB/s + IB	普通以太网即可
显存需求	80GB+/卡（HBM）	24-80GB
持续时间	数周-数月	毫秒-秒
用户分布	集中	全球分散
延迟敏感	不敏感	强敏感
数据主权	模型权重	用户实时数据
单 token 成本	高	边缘可大幅降低

关键玩家与产品组合

海外

Cloudflare — 训练用 CoreWeave / AWS，推理用 Workers AI + AI Gateway
Akamai — 训练交付给 NVIDIA DGX，推理用 41 个新建 DC + NVIDIA B200
Fastly — 不做训练，专攻语义缓存高利润率推理流量
OpenAI / Anthropic — 训练用微软Azure / AWS，开始与 Cloudflare/Akamai 合作 CDN 边缘部署

中国

网宿科技 — 训练协同阿里云 / 腾讯云，推理用自有 2,800+ 节点 + Moltbot 平台
云工场科技 — 灵境云 2,000+ 区县级节点推理
字节跳动 / 火山引擎 — 训练自建，推理用全球 CDN

与端侧 AI 的区别

维度	端侧 AI	边缘 AI（CDN/MEC）	云端 AI
算力	NPU/GPU 1-20 TOPS	GPU 100-1,000 TOPS	GPU 集群 PFLOPS
模型规模	<10B 参数	10B-70B	100B-2T
隐私	最强（不出设备）	中（节点处理）	弱（云端处理）
网络依赖	离线可用	必须联网	必须联网
案例	Apple Intelligence / 高通 8 Gen 4	Cloudflare AI Gateway	GPT-4

行业趋势

2026 边缘推理爆发 — 75% 数据将在边缘处理（IDC）
三层 AI 栈成共识 — 端 + 边 + 云协同
CDN 厂商 AI 收入快速增长 — Cloudflare/Akamai/Fastly AI 收入 2024 <5% → 2027E 15-25%
混合编排框架 — LangChain / LiteLLM / Vercel AI SDK 默认支持多端部署

关联

↑ up::CDN 3-01-云计算与智算平台 ↓ down::边缘 AI AI Gateway ∈ belongs_to::3-04-边缘节点-网络分发基础设施

反向引用链接到本页

反向引用 4

按引用量 ↓

… 5. **关键技术**：[[语义缓存]]（Fastly） / [[智能调度算法]] / [[高算力边缘编排]] 6. **节能**：[[绿色云图]] PUE **1.049** 7. **架构**：云训练-边缘推理混合 AI 架构 ## 上下游关系 ↑ up::[[3-03-数据中心]] — 边缘节点依托 IDC ↑ up::[[3-06-数据中心网络架构与互联服务]] — 互联基础 …

查看原文 →

… ** — INT4/INT8 量化、剪枝、蒸馏（→ [[4-04-模型部署与优化]]） 2. **[[语义缓存]]**（Fastly 核心技术） — 把语义相似的 prompt 命中已有结果，降低 GPU 调用 3. **混合架构** — 云训练-边缘推理，训练在中心、推理在边缘 4. **Serverless GPU 编排** — 按请求计费的 GPU 算力 ## 行业趋势 1. **CDN 厂商全面 AI 化** — Cloudflare/Akamai/Fastly 三家 AI 营收 …

查看原文 →

… | AI 推理 | <100ms | LLM 边缘部署、[[语义缓存]] | ## 行业趋势 1. **"云训练 + 边缘推理"成共识** — 大模型训练在中心云、推理下沉到边缘，详见云训练-边缘推理2. **CDN 节点 AI 化** — 全球 CDN 节点升级为 AI 推理节点 3. **运营商主导 MEC** — 中国三大运营商加速 5G+ 边缘 4. **75% 数据在边缘处理**（IDC 2025E）— 数据重心从云端转向边 …

查看原文 →

… 该观点配合网宿 **2026 年初 CDN 涨价 35-40%** 的定价行动，构成"中国 CDN 进入新周期"的双重叙事。 ## 关键履历 - 现任 [[网宿科技]] 架构师 - 在多个公开场合阐释云训练-边缘推理混合 AI 架构与网宿全球 **2,800+ 边缘节点**在该架构中的承接价值 - 与网宿 [[绿色云图]]（PUE 1.049）/ Moltbot 等 AI 相关产品线有关联 …

查看原文 →