MaaS

Model as a Service · 模型即服务 · 大模型 API · 大模型即服务

MaaS（Model as a Service）是 ChatGPT 出圈后催生的全新云服务形态：云厂商把训练好的大语言模型 / 多模态模型 / 嵌入模型部署在自家算力上，按"千 tokens 调用量"或"图像生成次数"计费，开发者无须关心 GPU、推理框架、显存优化等底层细节，只需 HTTP API 一行调用。

MaaS

模型即服务 — 把训练好的大模型封装成 API 按 token 计费，让客户跳过训练直接调用。2025H1 中国 MaaS 增速 421%（IDC），是 AI 云增长最快的细分。

定义

MaaS 与 PaaS 的最大差异：PaaS 提供"训练 / 微调模型的工具"，MaaS 直接提供"训好的模型"。MaaS 是云三层模式从基础设施→平台→模型本身的延伸，已被业内视为继 IaaS/PaaS/SaaS 之后的第四种核心云模式。

技术细节

核心产品：
- 文本生成：GPT-4o、Claude、Gemini、通义千问、豆包、文心一言、混元、GLM
- 多模态：图像生成（DALL·E、即梦）、视频生成（Sora、可灵）
- 嵌入与检索：embedding API、向量数据库联动
- Agent / 工具调用：function calling、computer use、code interpreter
计费维度：输入 tokens、输出 tokens、上下文窗口、批量推理折扣、缓存命中
极致价格战：豆包大模型 0.0008 元/千 tokens 引发全行业降价
调用量爆炸：2025H1 中国公有云大模型调用量 536.7 万亿 tokens，豆包大模型日调用 63 万亿 tokens 国内第一

主要玩家

国际：AWS Bedrock（聚合 Claude / Llama / Titan）、Microsoft Azure OpenAI Service（独家代理 GPT-4o）、Google Cloud Platform Vertex AI（Gemini）
中国：
- 火山引擎 — 豆包大模型，调用份额 49.2% 国内第一
- 阿里云 — 通义千问，调用份额 27%
- 百度智能云 — 文心一言 + 千帆 MaaS，调用份额 17%
- 腾讯云 — 混元大模型
- 智谱AI — GLM大模型，开放平台 MaaS
- 华为云 — 盘古大模型，行业定制为主

在 AI 产业链中的角色

MaaS 是云厂商把握 AI 第四层（模型层）入口的关键武器。从 2023 起，调用量已成为云厂商考核 AI 业务的核心 KPI，超越 IaaS 收入指标。MaaS 直接连通了第四层模型工厂的输出和第五层应用（智能驾驶、AIGC、金融、医疗）的需求，是云厂商绑定大模型生态、抗衡 OpenAI / Anthropic 直销的关键阵地。

演进历史

2020：OpenAI 推出 GPT-3 API，MaaS 雏形
2023-03：ChatGPT 引爆通用 MaaS 需求，国内厂商抢发大模型 API
2024-05：字节跳动豆包大模型 0.0008 元/千 tokens 引发价格战
2025H1：MaaS 增速 421%，调用量 536.7 万亿 tokens
2025-12：豆包大模型日调用 63 万亿 tokens

MaaS

定义

技术细节

主要玩家

在 AI 产业链中的角色

演进历史

相关概念 / 关系

相关推荐