AI产业链地图·知识库 嵌入向量 · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/嵌入向量

更新 2026·06·17

概念技术 / 术语

嵌入向量

Embedding · 向量嵌入 · 语义向量 · Word Embedding · Embedding Vector

嵌入（Embedding）= 通过深度学习模型把离散对象（如一段文本）映射为定长稠密向量（通常 384、768、1024、1536 或 3072 维），使得语义相似的对象在向量空间中距离更近。例如句子 "猫在睡觉" 与 "小猫在打盹" 的余弦相似度会显著高于 "经济政策"。

嵌入向量 CONCEPT · 概念

首次提出: 2013
关键参与方: [[OpenAI]] · [[Cohere]] · [[BGE]] · [[Hugging Face]]
反向引用: 12 处 · 来自 10 页

归属向量嵌入AI基础第三层

嵌入向量（Embedding）

AI 模型把任意输入（文本 / 图像 / 音频 / 代码）映射到 高维连续向量空间 — 让"语义相似"等价于"向量距离近"，是现代 AI 搜索/推荐/RAG 的底层物理基础。

定义

嵌入（Embedding）= 通过深度学习模型把离散对象（如一段文本）映射为定长稠密向量（通常 384、768、1024、1536 或 3072 维），使得语义相似的对象在向量空间中距离更近。例如句子 "猫在睡觉" 与 "小猫在打盹" 的余弦相似度会显著高于 "经济政策"。

关键属性

维度	典型值
维度数	384（小） / 768 / 1024 / 1536（OpenAI ada-002） / 3072（OpenAI 3-large）
距离度量	余弦相似度 / 内积 / 欧氏距离
模态	文本 / 图像（CLIP）/ 音频 / 代码 / 多模态融合
量化	float32 → float16 / int8 / binary（节省 4-32 倍空间）

主流嵌入模型

闭源 API

OpenAI text-embedding-3-large / 3-small / ada-002
Cohere embed-v3
Voyage AI voyage-3
Google gemini-embedding-001
阿里云 text-embedding-v3

开源

BGE（北京智源）— 多语言开源 SOTA，BAAI 出品
E5 (Microsoft) / GTE (阿里) / Nomic / Jina Embeddings
Sentence-BERT — 经典开源

多模态

CLIP (OpenAI) — 图文统一向量空间
SigLIP (Google) / CLIP-ViT-L

在 AI 产业链中的角色

嵌入向量是 RAG / 向量数据库 / 语义搜索 / 推荐系统 / 异常检测 的共同物理基础。没有嵌入，向量数据库没有存储对象，RAG 没有可检索的语义空间。

演进历史

2013 Word2Vec（Tomas Mikolov, Google）— 词嵌入开端
2018 BERT — 上下文嵌入，预训练范式
2022 OpenAI text-embedding-ada-002 → API 化普及
2023 Cohere / BGE / E5 — 开源闭源大爆发
2024-25 多模态向量普及 + 嵌入模型 token 价格 100x 下降

相关

向量数据库（存储） / ANN（检索算法） / RAG（核心应用）
多模态向量（文本+图像+音频统一）

∈ belongs_to::3-07-AI原生中间件与开发平台

反向引用链接到本页

反向引用 12

按引用量 ↓

… > 专为 **高维嵌入向量** 设计的数据库系统 — RAG / 推荐 / 语义搜索的核心基础设施，是 LLM 时代崛起最快的新型数据基础设施品类。 ## 定义向量数据库以 **嵌入向量（嵌入向量）** 为一等公民，提供高维（通常 384 ~ 4,096 维）向量的存储、近似最近邻（[[ANN]]）检索、过滤、混合搜索等能力。相对传统数据库以"行/列/JSON"为存储单元，向量数据库以"向量+元数据"为存储单元，索引层使用 [[HN …

… - **2024** 通用数据库内置向量能力，独立厂商护城河收窄 - **2025** [[Pinecone]] 探索出售标志独立赛道见顶 ## 相关 - 嵌入向量 / [[ANN]] / [[HNSW]] / [[混合搜索]] / [[多模态向量]] - [[RAG]]（最大下游应用） ↑ up::[[嵌入向量]] ↓ down::[[RAG]] …

… - [[嵌入向量]] / [[ANN]] / [[HNSW]] / [[混合搜索]] / [[多模态向量]] - [[RAG]]（最大下游应用） ↑ up::嵌入向量↓ down::[[RAG]] ⚔ competitor::[[pgvector]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… [[并行科技]]（920493.BJ，市值 ~￥60 亿）★★★ — 北交所稀缺，智算云 +151%，2025 涨 288% ## 核心技术维度 1. **向量数据库**：[[ANN]] / [[HNSW]] / [[IVF]] / 嵌入向量 / [[混合搜索]] / [[pgvector]] 2. **RAG 体系**：[[RAG]] / [[语义搜索]] / [[多模态向量]] 3. **MLOps 工作流**：[[实验管理]] / [[超参数追踪]] / [[模型版本控制 …

查看原文 →

… - **2024-25** DiskANN / SPANN 走向十亿级 + 量化压缩极致优化 ## 相关 - [[向量数据库]]（核心载体） - [[HNSW]] / IVF / DiskANN（主流算法） - 嵌入向量（被检索对象） ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… "的学术搜索流派 — 不直接回答问题，而是揭示论文之间的语义和影响关系，与 [[Semantic Scholar]]（全文检索）、[[Consensus]]（循证问答）三种范式互补。 ## 与 AI 产业链关系 ↑ up::大语言模型嵌入向量论文 corpus ↓ down::学者 / 研究员 ⚔ competitor::[[Semantic Scholar]] Research Rabbit [[Consensus]] …

查看原文 →

… Attribution）** 在学术领域的极致体现 — 与 [[Perplexity AI]] 通用网页溯源、[[Semantic Scholar]] 全文检索互补。 ## 与 AI 产业链关系 ↑ up::大语言模型 [[RAG]] 嵌入向量学术论文 corpus ↓ down::医生 / 研究员 / 政策制定者 / 记者 ⚔ competitor::[[Semantic Scholar]] [[Connected Papers]] [[Perplexity AI]] …

查看原文 →

… 一旦数据量超过单机内存（典型 1-10 亿向量），需切换到 IVF-PQ / DiskANN 等磁盘/量化方案。 ## 相关 - [[ANN]]（家族算法）/ [[向量数据库]]（载体） - 嵌入向量（被索引对象） ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… - **影响力评分** — 论文影响力 / 作者声誉 - **作者画像** — 学者代表作 / 合作关系 ## 与 AI 产业链关系 ↑ up::大语言模型 [[RAG]] 嵌入向量↓ down::全球学者 / 研究机构 / 学生 ⚔ competitor::[[Consensus]] [[Connected Papers]] Google Scholar 中国知网 [[百度]]学术 …

查看原文 →

… - **2024** ImageBind / SigLIP / BGE-VL 全面开花 - **2025** Voyage Multimodal / Cohere Multimodal 商业 API 上线 ## 相关 - 嵌入向量（父概念）/ [[向量数据库]]（载体） - [[CLIP]] / [[RAG]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… 024** Weaviate / Elasticsearch / Pinecone 官方推 Hybrid - **2025** [[多模态向量]] 加入混合融合（文+图+音） ## 相关 - [[向量数据库]] / [[ANN]] / 嵌入向量- [[RAG]]（核心下游） / Reranking ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… | [[模型量化]] | INT4 / INT8 减少模型显存占用 | | 知识蒸馏 | 大模型能力转移到小模型 | | Sparse Activation | 仅激活相关参数 | | 检索器轻量化 | 小型嵌入向量模型 + 本地向量库 | | Cache / KV-Cache 优化 | [[KV-Cache]] 复用 | ## 应用场景 - **手机端 AI 助手** — Apple Intelligence / 小米 / 华为 Harmony …

查看原文 →