Databricks
全球数据湖仓 / AI 平台领导者,2026-02 估值 $1340 亿(2026-02-Databricks 50亿美元融资 $50 亿融资 + $20 亿债务),AI 产品 ARR $14 亿。预期 2026 年 IPO,将是全球最大数据基础设施 IPO 之一。由 Apache Spark 创始团队(包括 Ali Ghodsi)于 2013 年创立。
一句话定位
Lakehouse 概念缔造者,统一数据湖(非结构化)与数据仓库(结构化)。ARR $54 亿(+65% YoY)、过去一年实现正自由现金流、AI 产品增速业内最快。
关键数据(2024-2026)
| 维度 | 数据 |
|---|---|
| 估值 | $1340 亿(2026-02) |
| 最新融资 | $50 亿股权 + $20 亿债务(2026-02) |
| ARR | $54 亿(+65% YoY,2025-01 季度) |
| AI 产品 ARR | $14 亿 |
| 自由现金流 | 已转正(2024-25 财年) |
| GAAP 净利润 | 尚未盈利 |
| 累计融资 | $190 亿+ |
| 创始 | 2013,UC Berkeley AMPLab |
| 总部 | 旧金山 |
| 创始人 | Ali Ghodsi 等 7 人(Spark 原班团队) |
核心产品
- Databricks Lakehouse Platform — 统一数据湖仓底座,支持 ETL / BI / ML / AI 应用
- Delta Lake — 开源数据湖存储层,提供 ACID 事务
- Unity Catalog — 跨工作区数据治理与血缘
- Mosaic AI(前 MosaicML)— 大模型训练与微调平台
- Databricks SQL — 数据仓库式 SQL 查询引擎
- Genie / AI/BI — 自然语言数据问答
技术亮点
- 开源生态护城河 — Apache Spark、Delta Lake、MLflow 三大开源项目均由 Databricks 主导
- 2023-06 收购 MosaicML($13 亿) — 切入大模型训练
- 2023-10 收购 Arcion — 数据流式集成
- 2024 收购 Tabular($10-20 亿) — Apache Iceberg 元数据层,对抗 Snowflake
AI 时代角色
- 企业 AI 训练数据底座 — 大模型企业级落地的事实标准,与 NVIDIA DGX 和云厂商 GPU 深度整合
- 数据 + AI 一体化 — 用同一份数据湖仓既做 BI 又做 AI 训练,是和 Snowflake 路径分化的核心
客户与供应链关系
- 客户:财富 500 强超 60%,含 Comcast、Shell、HSBC、JPMorgan、AT&T
- 战略投资人:Andreessen Horowitz、NEA、Tiger Global、Coatue、Wellington、Fidelity、T. Rowe Price 等
- 云合作:AWS / Azure / GCP 全部支持
与 AI 产业链关系
↑ up::NVIDIA(GPU 算力) ↑ up::AWS Microsoft Azure Google Cloud Platform(云基础设施) ↓ down::OpenAI 等大模型企业用户 ⚔ competitor::Snowflake 星环科技 Informatica Anyscale Collibra Weights & Biases 第四范式 ∈ belongs_to::4-01-数据引擎 ∈ belongs_to::3-01-云计算与智算平台
关键事件
- 2013 — UC Berkeley AMPLab 团队创立
- 2020 — 提出 "Lakehouse" 概念
- 2021-08 — H 轮融资估值 $380 亿
- 2023-06 — 收购 MosaicML
- 2023-09 — I 轮估值 $430 亿
- 2024-12 — J 轮 $100 亿,估值升至 $620 亿
- 2026-02-Databricks 50亿美元融资 — $50 亿 + $20 亿债务,估值 $1340 亿
- 预期 2026 IPO
风险与挑战
- 仍未 GAAP 盈利,私有市场估值是否合理存在争议
- Snowflake 在 SQL 仓库工作负载上仍领先
- 大型云厂商(AWS / Azure / GCP)的原生数据平台(如 Microsoft Fabric)构成长期竞争
在 4-04 模型部署与优化中的角色
- MLflow 母公司:MLflow 是 Databricks 主导的开源 MLOps 框架,提供实验追踪、模型注册、模型部署和模型评估,是全球下载量最大的开源 MLOps 框架,月活跃用户超 2,000 万。
- 端到端 MLOps:Lakehouse 平台将 MLflow 深度集成,提供从数据管理到模型运维的端到端解决方案;典型用户跨数据 + AI 双场景。
- 资本意义:Databricks 是全球数据+AI 统一平台标杆,2025-26 IPO 预期强烈,估值 $620-1,340 亿区间,对全球 MLOps 估值体系有重大锚定作用。
- 来源:4-04 子行业深度
在 3-07 AI 原生中间件与开发平台中的角色
Databricks 是 3-07 子行业的全球绝对龙头,体现"AI 中间件全栈整合"趋势的最完整代表:
连环战略收购("Data Intelligence Platform" 闭环)
| 年份 | 收购对象 | 对价 | 战略意义 |
|---|---|---|---|
| 2023-06 | MosaicML | $13 亿 | 切入大模型训练 / 微调 |
| 2024-06 | Tabular | >$10 亿(部分 $20 亿) | 抢占 Apache Iceberg 开放表格式标准 |
| 2025 | Neon | ~$10 亿 | OLTP + pgvector 向量检索补全 |
| 其他 | Arcion / Lilac / BladeBridge / Einblick | — | 流式集成 / 数据探索 / Migration / NL2SQL |
2025-12 L 轮估值跃升
- L 轮 $50 亿 + $20 亿债务,估值跃升至 $1,340 亿(2026-02-Databricks 50亿美元融资)
- 年化收入 $54 亿(+65% YoY),AI 产品 ARR $14 亿
- 已实现正自由现金流,预期 2026 H2 IPO,将是全球最大企业软件 IPO
在 3-07 子行业地位
- MLOps 母平台:MLflow(全球下载量最大开源 MLOps 框架,月活 2,000 万+)由 Databricks 主导
- 数据 + AI 一体化叙事的标杆:与 Snowflake 路径分化,靠 Lakehouse 同一份数据既做 BI 又做 AI 训练
- 2025 Mosaic AI Agent Framework 上线,向 Agent 构建平台转型
- 对中国对标公司(第四范式 / 星环科技)有重要估值锚定作用
- 来源:3-07 子行业深度