MosaicML
美国生成式 AI 训练平台公司,2021 年由 Naveen Rao(前 Intel AI 副总裁、Nervana Systems 创始人)创立,2023-06 被 Databricks $13 亿全资收购,整合为 Databricks 旗下 Mosaic AI 品牌,是 Databricks 切入大模型训练 / 微调赛道的关键收购。
一句话定位
把大模型训练从"NVIDIA + 自研代码 + 反复试错"做成端到端 SaaS — 客户提供数据,MosaicML 处理分布式训练、超参优化、checkpoint 管理、模型评估,并保证客户数据隐私和模型 IP 归属。
关键数据
| 维度 | 数据 | 时间 |
|---|---|---|
| 被收购对价 | $13 亿 | 2023-06 |
| 收购方 | Databricks | — |
| 创立时间 | 2021 | — |
| 总部 | 旧金山 | — |
| 创始人 | Naveen Rao / Hanlin Tang | — |
| 收购前 ARR | < $2,000 万(推测) | — |
| 主要投资方(被收购前) | Lux Capital / DCVC / Future Ventures | — |
核心产品
- MosaicML Platform — 大模型训练 / 微调 SaaS
- MPT 系列开源模型(MPT-7B / MPT-30B)— 商用友好开源 LLM,2023 发布
- Composer — PyTorch 训练优化库
- StreamingDataset — 大规模流式数据加载
技术亮点
- 训练效率优化 — 自研 algorithm(FSDP / Selective Activation Checkpointing),比标准 PyTorch 训练 LLM 成本降 5-10 倍
- 完整 LLM 开源(含训练代码 + 权重)
- 数据隐私 + 模型 IP 归客户(与 OpenAI / Anthropic API 模式形成差异)
在 Databricks 整合后的角色
- 2023-06 → 2024 — 整合为 Databricks Mosaic AI 品牌
- 提供企业级大模型训练 / 微调能力,与 Databricks Lakehouse 数据底座深度集成
- 2025 — Mosaic AI Agent Framework 推出,转向 Agent 构建平台
- 是 Databricks "数据 + AI 一体化"叙事的核心产品支柱,对 Databricks 估值从 $620 亿 → $1,340 亿有重要贡献
与 AI 产业链关系
↑ up::NVIDIA AWS Microsoft Azure ↓ down::企业 LLM 训练 / 微调用户 ⚔ competitor::Hugging Face AutoTrain / Together AI / Anyscale ∈ belongs_to::3-07-AI原生中间件与开发平台 ∈ belongs_to::Databricks
关键事件
- 2021 — Naveen Rao + Hanlin Tang 创立
- 2022 — A 轮 $3,700 万
- 2023-05 — MPT-7B 开源
- 2023-06 — Databricks $13 亿全资收购,2023-Databricks 13亿收购MosaicML
- 2024 — 整合为 Databricks Mosaic AI
- 2025 — Mosaic AI Agent Framework
战略意义
MosaicML 收购是 AI 中间件全栈整合的标志性事件之一 — 数据平台龙头 Databricks 通过收购直接获得大模型训练能力,绕开 OpenAI API 模式构建"数据 + 训练 + 推理"全栈,是 Snowflake 之后第二家以巨资入局生成式 AI 训练的数据平台公司。