Milvus
Zilliz 主导的开源向量数据库项目,全球最流行的向量数据库(40,000+ GitHub Stars,10,000+ 企业用户),Apache 2.0 协议,2019 年捐赠给 LF AI & Data Foundation。是大模型 RAG 时代向量检索的事实标准开源底座。
一句话定位
Milvus 之于向量数据库,犹如 PostgreSQL 之于关系数据库 — 开源、分布式、多索引(HNSW / IVF / DiskANN)、支持万亿级向量、可商用。其商业化母公司即 Zilliz。
关键数据
| 维度 | 数据 | 时间 |
|---|---|---|
| GitHub Stars | 40,000+ | 2025-12 |
| 企业用户 | 10,000+ | — |
| 协议 | Apache 2.0 | — |
| 母公司 | Zilliz | — |
| 首次发布 | 2019 | — |
| 最新版本 | Milvus 2.5(2024-12) | 混合检索 |
| 托管基金会 | LF AI & Data Foundation | — |
核心技术
- 多索引并存:HNSW / IVF / DiskANN / SCANN,按数据规模与延迟需求择优
- 存算分离架构:协调节点 / 查询节点 / 数据节点 / 索引节点解耦
- 混合检索:向量 + 标量过滤 + Sparse Vector + 全文检索(BM25)
- GPU 加速:与 NVIDIA RAFT / CAGRA 集成,GPU 检索性能 10 倍提升
- 多语言 SDK:Python / Java / Go / Node.js / C++
在生态中的位置
- 标志性用户:NVIDIA / Salesforce / eBay / Airbnb / 沃尔玛 / 腾讯 / OPPO / 携程
- 被集成:LangChain / LlamaIndex / Haystack / Dify 等主流 LLM 应用框架默认支持
- 下载量:超过 Pinecone / Weaviate / Qdrant 总和(2024 数据)
与 AI 产业链关系
↑ up::NVIDIA — GPU 加速索引 ↓ down::OpenAI Anthropic Salesforce — RAG 应用层 ⚔ competitor::Pinecone Weaviate Qdrant Chroma pgvector ∈ belongs_to::3-07-AI原生中间件与开发平台
与母公司 Zilliz 关系
Milvus 是开源项目本身(社区维护),Zilliz 是商业化公司:
- Zilliz 雇佣 70%+ Milvus 核心提交者
- Zilliz Cloud = Milvus 全托管商业化服务
- 商业模式参考 Databricks(Spark)/ Confluent(Kafka)/ MongoDB(社区版 → Atlas)
关键事件
- 2019 — 首次发布并开源
- 2019 — 捐赠 LF AI & Data Foundation
- 2022 — Milvus 2.0 重构,云原生架构
- 2024-12 — Milvus 2.5 混合检索(Sparse + Dense + Full-Text)
风险
- 同质化压力:PostgreSQL pgvector / Elasticsearch / MongoDB / Redis 内置向量检索,开源独立向量库的生存空间被挤压
- 开源→商业转化:Milvus 自部署用户付费转 Zilliz Cloud 转化率压力