MaaS
模型即服务 — 把训练好的大模型封装成 API 按 token 计费,让客户跳过训练直接调用。2025H1 中国 MaaS 增速 421%(IDC),是 AI 云增长最快的细分。
定义
MaaS(Model as a Service)是 ChatGPT 出圈后催生的全新云服务形态:云厂商把训练好的大语言模型 / 多模态模型 / 嵌入模型部署在自家算力上,按"千 tokens 调用量"或"图像生成次数"计费,开发者无须关心 GPU、推理框架、显存优化等底层细节,只需 HTTP API 一行调用。
MaaS 与 PaaS 的最大差异:PaaS 提供"训练 / 微调模型的工具",MaaS 直接提供"训好的模型"。MaaS 是云三层模式从基础设施→平台→模型本身的延伸,已被业内视为继 IaaS/PaaS/SaaS 之后的第四种核心云模式。
技术细节
- 核心产品:
- 文本生成:GPT-4o、Claude、Gemini、通义千问、豆包、文心一言、混元、GLM
- 多模态:图像生成(DALL·E、即梦)、视频生成(Sora、可灵)
- 嵌入与检索:embedding API、向量数据库联动
- Agent / 工具调用:function calling、computer use、code interpreter
- 计费维度:输入 tokens、输出 tokens、上下文窗口、批量推理折扣、缓存命中
- 极致价格战:豆包大模型 0.0008 元/千 tokens 引发全行业降价
- 调用量爆炸:2025H1 中国公有云大模型调用量 536.7 万亿 tokens,豆包大模型 日调用 63 万亿 tokens 国内第一
主要玩家
- 国际:AWS Bedrock(聚合 Claude / Llama / Titan)、Microsoft Azure OpenAI Service(独家代理 GPT-4o)、Google Cloud Platform Vertex AI(Gemini)
- 中国:
在 AI 产业链中的角色
MaaS 是云厂商把握 AI 第四层(模型层)入口的关键武器。从 2023 起,调用量已成为云厂商考核 AI 业务的核心 KPI,超越 IaaS 收入指标。MaaS 直接连通了第四层模型工厂的输出和第五层应用(智能驾驶、AIGC、金融、医疗)的需求,是云厂商绑定大模型生态、抗衡 OpenAI / Anthropic 直销的关键阵地。
演进历史
- 2020:OpenAI 推出 GPT-3 API,MaaS 雏形
- 2023-03:ChatGPT 引爆通用 MaaS 需求,国内厂商抢发大模型 API
- 2024-05:字节跳动 豆包大模型 0.0008 元/千 tokens 引发价格战
- 2025H1:MaaS 增速 421%,调用量 536.7 万亿 tokens
- 2025-12:豆包大模型 日调用 63 万亿 tokens
相关概念 / 关系
↑ up::IaaS PaaS ↓ down::第五层应用全部子行业 ∈ belongs_to::3-01-云计算与智算平台
参考:来源摘要