AI产业链地图·知识库 混合搜索 · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/混合搜索

更新 2026·06·17

概念技术 / 术语

混合搜索

Hybrid Search · Hybrid Retrieval · 混合检索 · Vector + Keyword Search

2. 两路 Top-K 用 RRF 融合 3. 可选 + CrossEncoder Rerank（如 Cohere Rerank、BGE-Reranker） 4. Top-N 喂给 LLM 生成答案

混合搜索 CONCEPT · 概念

首次提出: 2022
关键参与方: [[Weaviate]] · [[Milvus]] · [[Pinecone]] · [[Elasticsearch]]
反向引用: 5 处 · 来自 4 页

归属向量检索RAG混合第三层

混合搜索（Hybrid Search）

把 向量语义检索（dense）+ 关键词检索（sparse，BM25）+ 元数据过滤 三路融合，弥补纯向量"漏关键字" / 纯关键字"漏语义" 的短板 — 现代 RAG 的工程默认配置。

为什么需要混合

单一方案	弱点
纯向量（dense）	漏字面命中（人名、产品名、SKU、错别字）
纯关键词（BM25）	漏语义近似（"小猫" 找不到 "kitten"）
元数据过滤	不能做相关性排序

混合搜索 = 三者融合 → 召回率 +10-30%、回答质量显著提升。

融合方法

方法	描述	优劣
RRF（Reciprocal Rank Fusion）	按多路结果的排名倒数相加	实现简单、不需调参，工业最常用
Linear Combination	α × dense_score + (1-α) × sparse_score	需调权重
CrossEncoder Rerank	取并集后用 cross-encoder 重排	效果最好、延迟+成本最高
Learned Sparse（如 SPLADE）	用 LLM 生成稀疏向量	兼顾语义+关键字

工业实现

Weaviate：原生支持 Hybrid 查询 API（dense + BM25 + RRF），是其差异化卖点
Elasticsearch 8.x：dense_vector + BM25 + RRF
Milvus 2.4+：Hybrid Search API
Pinecone：Sparse-Dense 混合（用 SPLADE 等）
Qdrant：Hybrid Search via Query API

在 RAG 中的角色

RAG 工程化最佳实践的"标配"：

查询 → 同时发往向量索引 + BM25 索引
两路 Top-K 用 RRF 融合
可选 + CrossEncoder Rerank（如 Cohere Rerank、BGE-Reranker）
Top-N 喂给 LLM 生成答案

演进

2022 纯向量 RAG 时代，依赖 dense embedding
2023 业界发现纯向量"漏关键字"严重 → 混合搜索回归
2024 Weaviate / Elasticsearch / Pinecone 官方推 Hybrid
2025 多模态向量加入混合融合（文+图+音）

相关

向量数据库 / ANN / 嵌入向量
RAG（核心下游） / Reranking

∈ belongs_to::3-07-AI原生中间件与开发平台

反向引用链接到本页

反向引用 5

按引用量 ↓

… | 2024 营收 | **~$1,230 万** | ## 公司差异化 - **开源原生** — GitHub 12,000+ Stars，免费版功能完整 - **混合搜索默认** — 混合搜索（dense + BM25 + RRF）原生 API - **多模态** — 早期就支持 [[CLIP]] 文+图统一向量 - **欧洲玩家** — 部分企业（金融 / 政府）偏好非美国厂商 …

… - 跟投：Cortical Ventures、ING Ventures 等 - 此前轮次：B 轮 $5,000 万（2023） + B 轮延伸（2024） ## 关联 - [[Weaviate]] / [[向量数据库]] / 混合搜索- [[3-07-AI原生中间件与开发平台]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… 20493.BJ，市值 ~￥60 亿）★★★ — 北交所稀缺，智算云 +151%，2025 涨 288% ## 核心技术维度 1. **向量数据库**：[[ANN]] / [[HNSW]] / [[IVF]] / [[嵌入向量]] / 混合搜索 / [[pgvector]] 2. **RAG 体系**：[[RAG]] / [[语义搜索]] / [[多模态向量]] 3. **MLOps 工作流**：[[实验管理]] / [[超参数追踪]] / [[模型版本控制]] / [[特征工程 …

查看原文 →

… TQ / AWQ / [[GGUF]]）/ [[推测性解码]] / [[KV 缓存]] / [[Flash Attention]] / [[连续批处理]] 3. **RAG 技术栈**：[[向量数据库]] / [[Chunking]] / 混合检索 / [[Reranking]] / [[GraphRAG]] 4. **Agent 编排**：[[Function Calling]] / [[Tool Use]] / [[ReAct]] / [[多Agent协作]] / 状态记忆 / …

查看原文 →

… - **2024** 通用数据库内置向量能力，独立厂商护城河收窄 - **2025** [[Pinecone]] 探索出售标志独立赛道见顶 ## 相关 - [[嵌入向量]] / [[ANN]] / [[HNSW]] / 混合搜索 / [[多模态向量]] - [[RAG]]（最大下游应用） ↑ up::[[嵌入向量]] ↓ down::[[RAG]] ⚔ competitor::[[pgvector]] …

查看原文 →