AI产业链地图·知识库 RAG · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/RAG

更新 2026·06·17

概念技术 / 术语

RAG

检索增强生成 · Retrieval-Augmented Generation · 检索式生成

RAG = Retrieval（检索）+ Augmentation（增强）+ Generation（生成）。用户提问 → 将问题转向量 → 在外部知识库（向量数据库 / 关键词索引）检索相关片段 → 把检索结果连同问题一并喂给 LLM → LLM 基于真实文档生成回答。

RAG CONCEPT · 概念

首次提出: 2020
关键参与方: [[LlamaIndex]] · [[LangChain]] · [[Dify]] · [[RAGFlow]]
反向引用: 64 处 · 来自 39 页

归属 LLM知识检索第四层

RAG（Retrieval-Augmented Generation 检索增强生成）

让 LLM 从外部知识库实时检索信息再生成回复，解决"模型知识过时"和"幻觉"两大痛点的核心技术范式。

定义

RAG = Retrieval（检索）+ Augmentation（增强）+ Generation（生成）。用户提问 → 将问题转向量 → 在外部知识库（向量数据库 / 关键词索引）检索相关片段 → 把检索结果连同问题一并喂给 LLM → LLM 基于真实文档生成回答。

由 Meta（Facebook AI Research）的 Patrick Lewis 等于 2020 论文 "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" 提出。

技术细节

完整 RAG 管线包含 6 个阶段：

文档解析（Parsing）：PDF / DOCX / HTML → 纯文本（LlamaIndex LlamaParse / RAGFlow DeepDoc）
分块（Chunking）：按段落 / 语义 / 滑动窗口切片
嵌入（Embedding）：用嵌入模型（如 text-embedding-3、BGE）把片段转向量
存储（Storage）：向量入向量数据库（Pinecone / Weaviate / Milvus / Infinity）
检索（Retrieval）：查询向量化 → 相似度 / 混合检索（Dense + Sparse）→ Top-K 片段
重排（Reranking）：用 Cross-Encoder 模型重排，提升精度
生成（Generation）：把检索片段拼到 prompt → LLM 生成回复

主要玩家

专业框架：LlamaIndex（RAG 精专）/ LangChain（通用 + RAG 模块）
低代码平台：Dify / Coze / FastGPT
垂直 RAG 引擎：RAGFlow（文档深度理解）/ Anything LLM
向量数据库：Pinecone / Weaviate / Milvus / Chroma / Qdrant / Infinity

在 AI 产业链中的角色

RAG 是企业 AI 落地的"必备组件"——大多数企业知识库、智能客服、文档问答场景都依赖 RAG，是 4-03 子行业最大的细分。

演进历史

2020 Meta 提出原始 RAG 论文
2023 RAG 成为企业 AI 落地的标准范式
2024 GraphRAG / Multi-hop RAG / Self-RAG 等高级模式涌现
2025 向"Agentic RAG"演进 — 让 Agent 自主决定何时检索 / 多轮检索

相关概念

GraphRAG / Chunking / Reranking / 向量数据库
AI Agent（与 RAG 融合演进）

∈ belongs_to::4-03-模型生态与工具链

反向引用链接到本页

反向引用 64

按引用量 ↓

… # 5-07 AI搜索与信息服务 > **基于 LLM + RAG 的"答案引擎"赛道 — 直接生成结构化、带溯源的答案，正在替代传统关键词搜索成为下一代信息分发入口。** ## 一句话定位 AI 搜索 = **大模型推理 × 实时检索 × 多模态交互**。 …

… - [[字节跳动]] — 豆包 + 今日头条 + 抖音 AI 搜索 - [[华为]] — HarmonyOS + 盘古大模型本地化 ## 核心技术维度 1. **检索增强生成**：RAG / 多模态 [[RAG]] / 轻量化 [[RAG]] 2. **深度推理**：[[Chain-of-Thought]] / [[Chain-of-Thought as a Service]] / 跨学科综合推理 …

… - [[字节跳动]] — 豆包 + 今日头条 + 抖音 AI 搜索 - [[华为]] — HarmonyOS + 盘古大模型本地化 ## 核心技术维度 1. **检索增强生成**：[[RAG]] / 多模态 RAG / 轻量化 [[RAG]] 2. **深度推理**：[[Chain-of-Thought]] / [[Chain-of-Thought as a Service]] / 跨学科综合推理 …

… 还有 2 处提及

查看原文 →

… # 多模态向量（Multimodal Embedding） > 把 **文本 / 图像 / 音频 / 视频 / 代码** 统一编码到同一个向量空间 — 让"用文字搜图片"、"用图片搜视频"成为单次向量检索，是下一代 RAG 与电商/媒体搜索的核心基础。 ## 定义多模态向量是指用同一个模型把**多种模态**（文本、图像、音频等）映射到**共享向量空间**，使得不同模态的语义相似项在空间中距离接近。 …

… ## 关键应用 - **电商搜索**：拍照搜款（Amazon / 阿里、Pinterest） - **媒体检索**：跨模态视频/图片库搜索 - **多模态 RAG**：用户问问题 → 同时检索文档+图表+流程图 - **设计 / 资产管理**：用文字描述找设计稿、素材 - **医疗影像**：用主诉文字检索相似 CT/X 光 …

… | 评估 | 跨模态相似度难有 ground truth | | [[向量数据库]] 支持 | 需多模态元数据 + 异构索引 | ## 在 AI 产业链中的位置 **2024-25 RAG 的最热进化方向**。GPT-4V / Gemini / Claude 等多模态 LLM 的普及，倒逼"检索层"也必须多模态化。**[[向量数据库]] 厂商（[[Milvus]] / [[Weaviate]] / [[Pinecone]]） …

… 还有 1 处提及

查看原文 →

… # GraphRAG > **将知识图谱与向量检索结合的高级 RAG 范式，由 [[Microsoft]] Research 2024 推广，擅长处理需多步推理与跨文档关联的复杂问题。** ## 定义 GraphRAG = Graph（知识图谱）+ RAG（检索增强生成）。 …

… - **[[LlamaIndex]]** — Knowledge Graph Index - Neo4j / NebulaGraph — 图数据库底座 ## 在 AI 产业链中的角色 GraphRAG 是 RAG 的高级形态，特别适合： - **多步推理问题**："X 与 Y 有什么间接关系？" - **主题级总结**："这一千份文档的主要观点是什么？" - **跨文档关联**：实体在多个文档间的关联追踪 …

… Microsoft Research 官方 blog + arXiv，T1）</summary> - **2024-04** [[Microsoft]] Research 论文与开源代码发布 </details> ## 相关概念 - RAG / [[向量数据库]] / [[Reranking]] - 知识图谱 ∈ belongs_to::[[4-03-模型生态与工具链]] …

查看原文 →

… # Jerry Liu > **[[LlamaIndex]] CEO 兼联合创始人，把"用 LLM 访问企业自有数据"打造为独立赛道，是 RAG 范式最具影响力的布道者之一。** ## 基本信息 | 维度 | 内容 | |---|---| | 国籍 | 美国 | | 教育 | 普林斯顿大学 | | 现任 | [[LlamaIndex]] CEO 兼联合创始人 | …

… - **2024** 推出 LlamaParse 文档解析 SaaS - **2024-25** LlamaCloud 托管 RAG 管线产品化 - **持续**：是 RAG 范式最知名的布道者，技术博客与会议演讲影响广泛 ## 在 AI 产业链中的角色 Jerry Liu 代表"垂直深耕"创业路线 — 不与 [[Harrison Chase]] / [[LangChain]] 比"通用编排"广度，专精 R …

… 是 [[Anthropic]] [[Claude]] / [[OpenAI]] GPT 生态在企业知识库赛道的"工具层"代表创业者。 ## 关联实体 - [[LlamaIndex]]（CEO 创始人） - RAG（推广的核心技术范式） - [[LangChain]]（同代竞品 / 互补品） …

查看原文 →

… - [[CLIP]] (OpenAI) — 图文统一向量空间 - [[SigLIP]] (Google) / [[CLIP-ViT-L]] ## 在 AI 产业链中的角色嵌入向量是 **RAG / [[向量数据库]] / 语义搜索 / 推荐系统 / 异常检测** 的共同物理基础。**没有嵌入，[[向量数据库]] 没有存储对象，[[RAG]] 没有可检索的语义空间。 …

… 嵌入向量是 **[[RAG]] / [[向量数据库]] / 语义搜索 / 推荐系统 / 异常检测** 的共同物理基础。**没有嵌入，[[向量数据库]] 没有存储对象，RAG 没有可检索的语义空间。** ## 演进历史 - **2013** Word2Vec（Tomas Mikolov, Google）— 词嵌入开端 - **2018** BERT — 上下文嵌入，预训练范式 …

… - **2024-25** [[多模态向量]] 普及 + 嵌入模型 token 价格 100x 下降 ## 相关 - [[向量数据库]]（存储） / [[ANN]]（检索算法） / RAG（核心应用） - [[多模态向量]]（文本+图像+音频统一） ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… > 把 **向量语义检索（dense）+ 关键词检索（sparse，BM25）+ 元数据过滤** 三路融合，弥补纯向量"漏关键字" / 纯关键字"漏语义" 的短板 — 现代 RAG 的工程默认配置。 ## 为什么需要混合 | 单一方案 | 弱点 | |---|---| | 纯向量（dense） | 漏字面命中（人名、产品名、SKU、错别字） | …

… - **[[Pinecone]]**：Sparse-Dense 混合（用 SPLADE 等） - **[[Qdrant]]**：Hybrid Search via Query API ## 在 RAG 中的角色 **RAG 工程化最佳实践的"标配"**： 1. 查询 → 同时发往向量索引 + BM25 索引 2. 两路 Top-K 用 RRF 融合 3. 可选 + [[CrossEncoder Rerank]]（如 Cohere Rerank、BGE-Re …

… ate / Elasticsearch / Pinecone 官方推 Hybrid - **2025** [[多模态向量]] 加入混合融合（文+图+音） ## 相关 - [[向量数据库]] / [[ANN]] / [[嵌入向量]] - RAG（核心下游） / Reranking ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… > **[[Zilliz]] 创始人 / CEO，2017 创立公司、2019 开源 [[Milvus]]，全球最大开源向量数据库（40,000+ GitHub Stars、10,000+ 企业），开创 RAG 时代核心基础设施。** ## 基本信息 | 维度 | 内容 | |---|---| | 中文名 | 星爵（公开常用花名）/ 谢宇 | | 国籍 | 中国 | …

… 9-10 发布 **Milvus 1.0** 开源，是全球第一个**专门为向量相似度搜索设计的开源数据库**，2020 加入 LF AI & Data 基金会（[[Linux Foundation]] AI 子基金会）成为顶级项目。 **RAG 红利爆发（2023-至今）**：2022-11 [[ChatGPT]] 发布后，向量数据库作为 RAG（检索增强生成）核心组件迅速爆发，Milvus 受益最大，2024 GitHub Stars 突破 30K，企业客户突破 10,000+ …

查看原文 →

… - **2022-03** B 轮 $28M，估值 ~$200M - **2023-04** B+ 轮 $100M，估值 **$7.5 亿**，A16Z 领投 - **2023-2024** ChatGPT 引爆 RAG 红利，Pinecone 客户数突破 20,000+ - **2024-2025** 推出 Pinecone Serverless，定价模型重塑 - **2025-09** 让贤 [[Ash Ashutosh]] 出任 CEO，自己转任首席 …

… Edo Liberty 是**学术派创始人转型工业级 SaaS 的代表** — 其学术背景（矩阵草图 / 近似算法）直接映射到 Pinecone 的向量索引技术栈（HNSW / IVF / 量化）。Pinecone 是 RAG 时代第一个完成全托管 Serverless 化的向量数据库，2023 是 [[OpenAI]] 早期推荐的标配组件。但 2025 局势恶化：**[[PostgreSQL]] pgvector** / [[MongoDB]] Atlas …

查看原文 →

… # LlamaIndex > **文档索引与检索增强生成（RAG）专精框架，在知识密集型应用场景中表现卓越，与 [[LangChain]] 形成互补格局。** ## 一句话定位 LlamaIndex 由 [[Jerry Liu]] 于 2022 年创立（原名 GPT Index），专注于让 LLM …

… - **2022** [[Jerry Liu]] 开源发布（原名 GPT Index） - **2023** 改名 LlamaIndex，A 轮融资 ## 关联实体 - [[Jerry Liu]]（CEO 联合创始人） - RAG（核心技术） - [[LangChain]]（主要竞品 / 互补品） …

查看原文 →

… - **Collections / Spaces** — 收藏夹与协作空间 - **出版商计划** — 与内容方分享收益（应对版权争议） ## 技术亮点 / 护城河 - **RAG 架构** — 实时网络搜索 + LLM 推理深度融合 - **信息溯源** — 每个答案附引用来源（Source Attribution） - **多模型策略** — 不锁死单一基础模型，灵活调用 GPT-4 / Claude / Gem …

… - **下游**：C 端订阅用户 + B 端企业客户 + 开发者（API） ## 与 AI 产业链关系 ↑ up::[[OpenAI]] [[Anthropic]] [[NVIDIA]] RAG↓ down::C 端订阅用户 / B 端企业 / 开发者 ⚔ competitor::[[ChatGPT]] [[Google AI Overview]] [[You.com]] [[秘塔AI搜索]] [[Consensus]] [[秘 …

查看原文 →

… 源 RAG 新星，深度文档理解和 RAG 引擎，专注于高质量文档解析和精准检索，2024-25 与 [[Dify]] 并列中国开源 RAG 领域的代表。** ## 一句话定位 RAGFlow（无穷流科技 / Infiniflow）专注 RAG 引擎的深度文档解析能力，支持复杂文档格式（PDF 表格、图表、扫描件）的深度理解。是企业知识库 + 智能问答场景的高质量替代方案，对标海外 [[LlamaIndex]] LlamaParse。 …

… ⚔ competitor::[[LlamaIndex]] [[Dify]] [[FastGPT]] ∈ belongs_to::[[4-03-模型生态与工具链]] ## 关联实体 - RAG（核心技术） - [[Dify]] / [[FastGPT]]（同赛道） - [[金山办公]] / [[科大讯飞]]（潜在收购方） ## 增量补充（2026-05-29） …

查看原文 →

… 中国创始团队 + 美国旧金山总部的典型跨境结构，2017 年由星爵（Charles Xie，前 [[Oracle]] 美国研发主任工程师）创立，累计融资 **$1.15-1.32 亿**。在 AI Agent / RAG 时代，向量数据库已成为大模型企业落地的"标配中间件"，Zilliz/Milvus 是该赛道的全球技术标杆。 ## 一句话定位把全球开源向量数据库的"事实标准" Milvus 商业化为云原生 Zilliz Cloud，**40,000 …

… **2025 推出 Milvus 2.5** — Sparse Vector + Full-Text Search 一体化，对标 [[Elasticsearch]] 混合检索 ## AI 时代角色 Zilliz/Milvus 是大模型 RAG 范式的核心基础设施，2023-25 大模型企业落地浪潮使得向量数据库成为"刚需中间件"。**Gartner 预测 2026 年 30% 企业应用将使用向量数据库**。 …

查看原文 →

… - **2025** [[Pinecone]] 探索出售标志独立赛道见顶 ## 相关 - [[嵌入向量]] / [[ANN]] / [[HNSW]] / [[混合搜索]] / [[多模态向量]] - RAG（最大下游应用） ↑ up::[[嵌入向量]] ↓ down::[[RAG]] ⚔ competitor::[[pgvector]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

… - [[嵌入向量]] / [[ANN]] / [[HNSW]] / [[混合搜索]] / [[多模态向量]] - [[RAG]]（最大下游应用） ↑ up::[[嵌入向量]] ↓ down::RAG⚔ competitor::[[pgvector]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… - **实体抽取**：提取关键参数（订单号、日期等） - **对话状态跟踪**：[[多轮对话]] 上下文管理 - **回复生成**：模板 / 检索 / 生成式 - **RAG 检索增强**：结合知识库提升准确性 ## 主要应用场景 - **智能客服**（5-11 子行业核心） - **智能助理**（语音助手、Siri、Alexa） …

… ↑ up::[[4-02-模型工厂]]（大模型推理） ↓ down::各行业垂直应用 ## 相关概念 - [[智能客服]] / [[AI Agent]] / [[多轮对话]] / [[NLU]] - RAG / [[情感识别]] / [[多模态交互]] …

查看原文 →

… | 用户操作 | 自行点击 → 阅读 → 综合 | 直接阅读 → 必要时追问 | | 来源呈现 | 排序结果即来源 | 答案内嵌引用链接（[[信息溯源]]） | | 技术底座 | 倒排索引 + PageRank | LLM + RAG | | 单次成本 | 0.3 美分 | 3-30 美分 | | 单次收入 | 4.5 美分（广告） | 2.5-3.5 美分（订阅 + 探索中） | | 代表产品 | [[Google]] / [[百度]] / Bing | [[Perp …

… - 代表产品：[[Perplexity AI]] [[ChatGPT]] [[Google AI Overview]] [[秘塔AI搜索]] [[天工AI]] [[百度文心搜索]] - 技术基础：RAG [[Chain-of-Thought]] [[信息溯源]] - 范式革新：[[AI Overview]]（Google 嵌入式实现） vs 独立答案引擎（Perplexity 路线） …

查看原文 →

… # 轻量化 RAG > 通过**模型压缩、知识蒸馏、量化**等技术，将 RAG 系统**部署到边缘设备**（手机 / 智能音箱 / AR 眼镜 / 智能车机）。5-07 报告将此列为 AI 搜索三大未来趋势之一。 ## 技术路径 | 技术 | 目的 | …

… - **隐私优势** — 配合 [[秘塔AI搜索]] 等隐私优先产品的差异化 - **响应速度** — 本地推理延迟更低 - **离线可用** — 弱网/无网环境保持基础搜索能力 ## 关联 - 基础技术：RAG / [[模型量化]] / [[边缘 AI]] - 跨子行业：第四层 [[4-04-模型部署与优化]] / 第五层 5-07 - 关键玩家：[[NVIDIA]] Jetson / Apple Intelligence / [[华为]] 盘古 …

查看原文 →

… 1. **向量数据库**：[[ANN]] / [[HNSW]] / [[IVF]] / [[嵌入向量]] / [[混合搜索]] / [[pgvector]] 2. **RAG 体系**：RAG / [[语义搜索]] / [[多模态向量]] 3. **MLOps 工作流**：[[实验管理]] / [[超参数追踪]] / [[模型版本控制]] / [[特征工程]] …

查看原文 →

… 典 / 威科先行 / 北大法宝 / 法律谷等（传统法律信息服务商向 AI 转型） ## 核心技术维度 1. **法律垂直大模型**：[[PowerLawGLM]]、[[Legal AI|法律 LLM]] 等千亿参数法律专用模型 vs RAG + 通用大模型路线 2. **核心应用场景**：[[合同智能审查]] / [[法律文书生成]] / [[司法辅助决策]] / [[法律咨询问答]] 3. **底层技术**：[[法律知识图谱]] / [[语义检索]] / [[NER|命名实 …

查看原文 →

… 1. **大模型基座**：[[通义千问]] / [[文心一言]] / [[DeepSeek]] / [[GPT]] — 通用语义理解 + 推理 2. **垂直小模型**：行业知识库 + 业务流程，与大模型协同 3. **RAG 检索增强生成** — 结合企业知识库提升准确性 4. **[[AI Agent]] 框架** — 调用工具、API 执行业务，从 Copilot 到 Agent 范式转变 …

查看原文 →

… - **2025** 主要云厂商推出 Agent Runtime - **2026** 预计成为推理服务标配 ## 相关概念 - [[MaaS]] - [[LLMOps]] - RAG- [[MCP]] ∈ belongs_to::[[4-04-模型部署与优化]] …

查看原文 →

… 港股 18A 或科创板） - **财务**：预计 2026 年盈亏平衡、2027 年盈利 ## 与 AI 产业链关系 ↑ up::医疗大模型 [[AI医学影像]] RAG↓ down::医院 / 患者 / 药企 ⚔ competitor::[[医渡科技]] 平安好医生 ∈ belongs_to::[[5-04-智慧医疗]] …

查看原文 →

… | 推理模型升级 | 2025 | DeepSeek-R1 / Claude / Gemini | ## 在 AI 搜索的角色 5-07 报告将 [[Chain-of-Thought]] 列为**三大演进方向之一**（与 RAG / 多模态并列）： - 处理跨学科综合问题 - 提供带有推理过程的答案 - 支撑"深度研究 / Deep Research"等新型功能（[[Perplexity AI]] Deep Research / OpenAI Deep Rese …

查看原文 →

… （Source Attribution）** 在学术领域的极致体现 — 与 [[Perplexity AI]] 通用网页溯源、[[Semantic Scholar]] 全文检索互补。 ## 与 AI 产业链关系 ↑ up::大语言模型 RAG [[嵌入向量]] 学术论文 corpus ↓ down::医生 / 研究员 / 政策制定者 / 记者 ⚔ competitor::[[Semantic Scholar]] [[Connected Papers]] [[Perplexity …

查看原文 →

… - **2025** Agent / RAG / 工具调用监控成为新焦点 ## 相关概念 - [[MLOps]] - [[Agent Runtime]] - [[MaaS]] - RAG∈ belongs_to::[[4-04-模型部署与优化]] …

查看原文 →

… ]] 主导的开源向量数据库项目，**全球最流行的向量数据库**（40,000+ GitHub Stars，10,000+ 企业用户），Apache 2.0 协议，2019 年捐赠给 LF AI & Data Foundation。是大模型 RAG 时代向量检索的事实标准开源底座。 ## 一句话定位 Milvus 之于向量数据库，犹如 [[PostgreSQL]] 之于关系数据库 — 开源、分布式、多索引（[[HNSW]] / [[IVF]] / DiskANN）、支持万亿级向量 …

查看原文 →

… ⚔ competitor::传统 NLP 引擎 vs 大模型零样本理解 ## 相关概念 - [[智能客服]] / [[对话机器人]] / [[多轮对话]] - RAG / [[意图识别]] …

查看原文 →

… - **影响力评分** — 论文影响力 / 作者声誉 - **作者画像** — 学者代表作 / 合作关系 ## 与 AI 产业链关系 ↑ up::大语言模型 RAG [[嵌入向量]] ↓ down::全球学者 / 研究机构 / 学生 ⚔ competitor::[[Consensus]] [[Connected Papers]] Google Scholar 中国知网 [[百度]]学术 …

查看原文 →

… Use 是 [[Function Calling]] 的更宽泛概念，泛指 LLM 通过调用外部工具扩展能力的范式。常见工具包括： - **计算器 / 代码执行**：数学计算、数据处理 - **搜索 / 检索**：网页搜索、知识库查询（与 RAG 结合） - **API 调用**：第三方服务（天气、股价、地图、订票） - **数据库查询**：SQL 生成与执行 - **文件系统**：读写文件、执行命令 …

查看原文 →

… 相对 [[Perplexity AI]] 知名度较低，但在重视隐私和定制化的细分人群中有稳定用户基础。 ## 与 AI 产业链关系 ↑ up::[[OpenAI]] [[Anthropic]] RAG↓ down::C 端隐私敏感用户 / 企业 ⚔ competitor::[[Perplexity AI]] [[ChatGPT]] [[Google AI Overview]] [[Microsoft]] …

查看原文 →

… - **2025** 大厂集中入场，[[AutoGen]] / [[Microsoft]] Agent Framework 等加入 ## 相关概念 - [[AI Agent]] / RAG- SDK 框架（[[LangChain]] / [[LlamaIndex]]） ∈ belongs_to::[[4-03-模型生态与工具链]] …

查看原文 →

… 部分大型新闻机构（如 News Corp）已与 OpenAI / Perplexity 签订内容授权 + 收益分成协议 - 未来可能通过区块链等技术实现内容溯源和收益分配自动化 ## 关联 - 答案引擎：[[答案引擎]] - 技术基础：RAG 是溯源的工程基础 - 代表产品：[[Perplexity AI]] [[秘塔AI搜索]] [[Consensus]] - 法律争议：内容抓取合法性 / AI 摘要分流 / 事实错误责任三大议题 …

查看原文 →

… ↑ up::[[4-02-模型工厂]]（大模型长上下文能力） ## 相关概念 - [[智能客服]] / [[对话机器人]] / [[AI Agent]] / [[NLU]] / RAG …

查看原文 →

… - **垂直深度** — "高级搜索"针对金融/科研专项优化 ## 技术架构 - **底层模型**：[[天工大模型]]（Skywork 系列，[[昆仑万维]] 自研） - **搜索机制**：RAG + 实时检索 - **基础设施**：依托[[昆仑万维]]的 AI 算力 ## 商业模式 - **免费基础版** + Pro 会员 - **企业级服务** — API 接入、定制化方案 …

查看原文 →

… （5-07 报告评级，**潜在买家**：[[华宇软件]] / [[科大讯飞]] / [[阿里巴巴]]） - **IPO 可行性 ★★★★**（2026E，科创板，估值 **￥15-25 亿**） ## 与 AI 产业链关系 ↑ up::RAG 法律大模型 [[向量数据库]] ↓ down::律所 / 法务 / 企业合规 ⚔ competitor::[[iCourt]] [[理脉]] [[华宇软件]] [[Thomson Reuters]] [[LexisNexis]] …

查看原文 →

… - **私有化部署**（25%）：一次性授权费 + 年度维护费 - **混合部署**（10%）：核心数据本地 + 其他云端 ## 相关概念 - [[AI Agent]] / [[对话机器人]] / RAG / [[NLU]] / [[ASR]] / [[TTS]] - [[多轮对话]] / [[情感识别]] / [[多模态交互]] / [[虚拟数字人]] - [[全渠道客服]] / [[CDP]] / [[客服 SaaS]] …

查看原文 →

… 与大模型互补 —— 大模型解决语义理解，图谱解决精准引用和推理。Function Calling + RAG + 图谱是当前主流技术方案组合。 ## 相关概念 - RAG / [[PowerLawGLM]] / [[裁判文书网]] - [[合同智能审查]] / [[司法辅助决策]] ∈ belongs_to::[[5-10-AI法律]] …

查看原文 →

… - **估值区间**：5-07 报告未明确（可参考 [[iCourt]] / [[无讼]] 区间￥3-15 亿） ## 与 AI 产业链关系 ↑ up::RAG [[法律知识图谱]] [[向量数据库]] ↓ down::律所 / 法务 / 司法机构 ⚔ competitor::[[iCourt]] [[无讼]] [[华宇软件]] …

查看原文 →

… - 巨头（[[百度]] / [[360集团]] / [[字节跳动]]）碾压风险 - 推理成本高 vs 订阅收入低 ## 关联 - 母公司：[[秘塔科技]] - 商业模式参考：[[Perplexity AI]] - 技术基础：RAG + 大模型 + [[信息溯源]] - 直接竞品：[[360 AI 搜索]] [[天工AI]] [[百度文心搜索]] ## 与 AI 产业链关系 ⚔ competitor:: [[Perplexity AI]] …

查看原文 →

… 采取"**极致产品体验 + 口碑营销**"策略，瞄准注重搜索质量与隐私的用户群体，与 [[Perplexity AI]] 在中国市场形成对标。 ## 与 AI 产业链关系 ↑ up::[[OpenAI]] [[Anthropic]] RAG 大模型 API ↓ down::C 端隐私敏感 / 高知用户 ⚔ competitor::[[百度文心搜索]] [[360 AI 搜索]] [[天工AI]] [[Perplexity AI]] …

查看原文 →