向量数据库(Vector Database)
专为 高维嵌入向量 设计的数据库系统 — RAG / 推荐 / 语义搜索的核心基础设施,是 LLM 时代崛起最快的新型数据基础设施品类。
定义
向量数据库以 嵌入向量(嵌入向量) 为一等公民,提供高维(通常 384 ~ 4,096 维)向量的存储、近似最近邻(ANN)检索、过滤、混合搜索等能力。相对传统数据库以"行/列/JSON"为存储单元,向量数据库以"向量+元数据"为存储单元,索引层使用 HNSW / IVF / DiskANN 等专为高维向量设计的算法。
核心能力
| 能力 | 描述 |
|---|---|
| ANN 检索 | 给定查询向量,毫秒级返回 Top-K 近邻 |
| 元数据过滤 | 支持 SQL-like where 条件(如 user_id=xxx) |
| 混合搜索 | 向量 + BM25 关键词 + 元数据三路融合 |
| 多模态 | 文本、图像、音频统一向量空间 |
| 多租户隔离 | 命名空间 / 集合切分 |
| 索引动态更新 | 增量写入不影响检索 |
市场规模
- 全球向量数据库(2025E):$25-27 亿(MarketsandMarkets / GM Insights)
- 全球向量数据库(2030E):$89.5 亿(CAGR 27.5%)
- 全球向量数据库(2032E):$130 亿(CAGR 25.5%,Kings Research)
- Gartner 预 2026 30% 企业应用使用向量数据库(据3-07)
主要玩家
独立向量数据库(专精)
- Zilliz / Milvus — 全球最大开源,40,000+ GitHub Stars、10,000+ 企业
- Pinecone — 全托管 Serverless,估值 $7.5 亿,2025 探索出售
- Weaviate — 荷兰,混合搜索原生,2025-10 C 轮 $5,000 万
- Qdrant — 德国,Rust 开发,2025 引入非对称量化 24 倍压缩
- Chroma — 美国,轻量级开发者友好
通用数据库内置向量能力("功能化"威胁)
- PostgreSQL pgvector
- MongoDB Atlas Vector Search
- Elasticsearch dense_vector
- Redis Vector Search
"功能化"危机
2025 年最大趋势:通用数据库内置向量搜索能力快速侵蚀独立厂商护城河。Pinecone 失去 Notion 等大客户,2025 下半年探索出售,是这一趋势的标志事件(据3-07)。
中国玩家
演进历史
- 2019 Pinecone / Weaviate / Milvus 几乎同期创立
- 2022-23 ChatGPT 引爆 RAG → 向量数据库估值狂飙
- 2024 通用数据库内置向量能力,独立厂商护城河收窄
- 2025 Pinecone 探索出售标志独立赛道见顶
相关
↑ up::嵌入向量 ↓ down::RAG ⚔ competitor::pgvector ∈ belongs_to::3-07-AI原生中间件与开发平台