AI产业链地图·知识库 向量数据库 · 概念
🚧 网站建设中 更新 2026·06·17 → 产业链图谱
首页/概念/向量数据库
更新 2026·06·17
概念 技术 / 术语

向量数据库

Vector Database · VectorDB · 向量库 · 嵌入数据库

向量数据库以 嵌入向量(嵌入向量 为一等公民,提供高维(通常 384 ~ 4,096 维)向量的存储、近似最近邻(ANN)检索、过滤、混合搜索等能力。相对传统数据库以"行/列/JSON"为存储单元,向量数据库以"向量+元数据"为存储单元,索引层使用 HNSW / IVF / DiskANN 等专为高维向量设计的算法。

向量数据库 CONCEPT · 概念
首次提出
2019
关键参与方
[[Zilliz]] · [[Milvus]] · [[Pinecone]] · [[Weaviate]]
反向引用
29 处 · 来自 16
归属 向量数据库RAGAI中间件第三层

向量数据库(Vector Database)

专为 高维嵌入向量 设计的数据库系统 — RAG / 推荐 / 语义搜索的核心基础设施,是 LLM 时代崛起最快的新型数据基础设施品类。

定义

向量数据库以 嵌入向量(嵌入向量 为一等公民,提供高维(通常 384 ~ 4,096 维)向量的存储、近似最近邻(ANN)检索、过滤、混合搜索等能力。相对传统数据库以"行/列/JSON"为存储单元,向量数据库以"向量+元数据"为存储单元,索引层使用 HNSW / IVF / DiskANN 等专为高维向量设计的算法。

核心能力

能力 描述
ANN 检索 给定查询向量,毫秒级返回 Top-K 近邻
元数据过滤 支持 SQL-like where 条件(如 user_id=xxx)
混合搜索 向量 + BM25 关键词 + 元数据三路融合
多模态 文本、图像、音频统一向量空间
多租户隔离 命名空间 / 集合切分
索引动态更新 增量写入不影响检索

市场规模

  • 全球向量数据库(2025E):$25-27 亿(MarketsandMarkets / GM Insights)
  • 全球向量数据库(2030E):$89.5 亿(CAGR 27.5%
  • 全球向量数据库(2032E):$130 亿(CAGR 25.5%,Kings Research)
  • Gartner 预 2026 30% 企业应用使用向量数据库(据3-07

主要玩家

独立向量数据库(专精)

  • Zilliz / Milvus — 全球最大开源,40,000+ GitHub Stars、10,000+ 企业
  • Pinecone — 全托管 Serverless,估值 $7.5 亿,2025 探索出售
  • Weaviate — 荷兰,混合搜索原生,2025-10 C 轮 $5,000 万
  • Qdrant — 德国,Rust 开发,2025 引入非对称量化 24 倍压缩
  • Chroma — 美国,轻量级开发者友好

通用数据库内置向量能力("功能化"威胁)

  • PostgreSQL pgvector
  • MongoDB Atlas Vector Search
  • Elasticsearch dense_vector
  • Redis Vector Search

"功能化"危机

2025 年最大趋势:通用数据库内置向量搜索能力快速侵蚀独立厂商护城河。Pinecone 失去 Notion 等大客户,2025 下半年探索出售,是这一趋势的标志事件(据3-07)。

中国玩家

演进历史

  • 2019 Pinecone / Weaviate / Milvus 几乎同期创立
  • 2022-23 ChatGPT 引爆 RAG → 向量数据库估值狂飙
  • 2024 通用数据库内置向量能力,独立厂商护城河收窄
  • 2025 Pinecone 探索出售标志独立赛道见顶

相关

↑ up::嵌入向量 ↓ down::RAG ⚔ competitor::pgvector ∈ belongs_to::3-07-AI原生中间件与开发平台