AI产业链地图·知识库 LLMOps · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/LLMOps

更新 2026·06·17

概念技术 / 术语

LLMOps

大模型运维 · 大模型 MLOps · 大语言模型运维

LLMOps 是 MLOps 在大语言模型时代的演进版本，针对 LLM / 多模态模型生产环境的特有挑战，提供运维工具与方法论。

LLMOps CONCEPT · 概念

首次提出: 2023
关键参与方: [[Databricks]] · [[Weights & Biases]] · [[Hugging Face]]
反向引用: 20 处 · 来自 14 页

归属 MLOps大模型AI运维第四层

LLMOps

MLOps 的细分延伸，专门处理大语言模型生命周期管理特有的挑战（提示词、RAG 链路、幻觉、对齐评估）。

定义

LLMOps 是 MLOps 在大语言模型时代的演进版本，针对 LLM / 多模态模型生产环境的特有挑战，提供运维工具与方法论。

与传统 MLOps 的差异

维度	传统 MLOps	LLMOps
模型类型	分类、回归、CV 等	LLM、多模态、Agent
关键资产	训练数据、模型权重	提示词、RAG 知识库、Agent 工作流
评估方式	准确率、F1 等	幻觉检测、对齐评估、人类反馈
监控指标	数据漂移、模型衰减	RAG 检索质量、提示词性能、token 成本
部署模式	API / 嵌入式	API + 工具链 + 多模型编排

核心能力

提示词管理（Prompt Management）：版本管理、A/B 测试
RAG 链路监控：检索质量、嵌入向量漂移
幻觉检测（Hallucination Detection）
对齐评估：safety / helpfulness / honesty
Token 成本监控：按用户/应用/模型计费
多模型编排：路由、降级、回退
Agent 工作流追踪

主要玩家

海外：Weights & Biases Prompts/Weave、LangSmith（LangChain）、Databricks Mosaic AI、Helicone、Langfuse、Vellum
国内：第四范式 / 星环科技 / 阿里云 PAI / 火山引擎方舟

在 AI 产业链中的角色

生成式 AI 浪潮的必备基础设施：2026E 80%+ 企业将采用 GenAI，无 LLMOps 难以规模化
MLOps 厂商的关键演进路径：W&B、Databricks 等老牌玩家通过加 LLMOps 能力实现估值重估
新兴独立赛道：LangSmith、Langfuse 等针对 LLM 应用层的专业工具

演进历史

2023 概念由 LangChain、Humanloop 等同时提出
2024 W&B Prompts、Databricks Mosaic AI、LangSmith 商业化加速
2025 Agent / RAG / 工具调用监控成为新焦点

相关概念

∈ belongs_to::4-04-模型部署与优化

反向引用链接到本页

反向引用 20

按引用量 ↓

… # AgentOps（Agent Operations） > [[MLOps]] / LLMOps 在 **AI Agent 时代** 的最新演进 — 监控、追踪、调试、评估 Agent 工作流（包括工具调用、多步推理、多 Agent 协作），是 2025 年开始爆发的新中间件赛道。 …

… | 运行时监控 | 工具调用成功率、推理延迟、token 成本、循环检测 | | 反馈循环 | 人类反馈、自动评估、改进迭代 | ## 与 LLMOps / MLOps 的差异 | 维度 | MLOps | LLMOps | **AgentOps** | |---|---|---|---| | 核心实体 | 模型 | LLM + 提示词 + RAG | **Agent + 工具 + 推理链** | …

… - **2025** [[CoreWeave]] × [[Weights & Biases]] 整合 → "GPU+AgentOps" 全栈 ## 相关 - [[MLOps]] / LLMOps（演进路径） - [[Agent 编排]] / [[MCP Server]] - [[Datadog]] / [[Weights & Biases]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… | MLOps 1.0 | 2015-19 | DataRobot / H2O.ai 自动建模 | | MLOps 2.0 | 2020-22 | W&B / MLflow / Databricks 全栈 | | **MLOps → LLMOps** | 2023-24 | 大模型时代，提示词/RAG 引入新维度 | | **MLOps → [[AgentOps]]** | 2025+ | Agent 工作流监控、多 Agent 编排 | …

… 收购**：[[MosaicML]] $13 亿 / [[Tabular]] $10 亿 / [[Neon]] ~$10 亿 - **[[JFrog]] × [[Qwak AI]]**（2025）— DevOps + MLOps ## 与 LLMOps / [[AgentOps]] 的关系 ``` MLOps（2015+，传统 ML） → LLMOps（2023+，大模型特有：提示词、RAG、幻觉） → AgentOps（2025+，Agent 工作流、多 Agent 编排 …

… → LLMOps（2023+，大模型特有：提示词、RAG、幻觉） → AgentOps（2025+，Agent 工作流、多 Agent 编排、工具调用监控） ``` ## 相关 - LLMOps / [[AgentOps]]（演进版本） - [[特征工程]] / [[模型版本控制]] / [[数据漂移检测]] / [[模型部署]] - [[Weights & Biases]] / [[Databricks]] / [[第四范式]] …

查看原文 →

… 8. **AI 平台**：[[先知AI平台]]（第四范式）/ [[Sophon MLOps]] / [[飞桨 PaddlePaddle]] / [[昇思 MindSpore]] 9. **AgentOps 演进**：[[MLOps]] → LLMOps → [[AgentOps]] / [[Agent 编排]] 10. **可观测性**：[[AI SRE Agent]] / [[MCP Server]] ## 上下游关系 …

… 3. **中国算力调度 × 东数西算** — 海外市场化 vs 中国国家工程驱动 4. **MLOps → AgentOps 进化** — AI Agent 落地推动 [[AgentOps]] / LLMOps5. **中国 AI 平台分化** — [[第四范式]] vs [[星环科技]] 强弱悬殊 ## 资本运作要点 ### 高吸引力被收购 - [[优刻得]] ★★★★（A 股独立公有云+AI 调度） …

查看原文 →

… - **2010s** 学术研究：Concept Drift 检测算法 - **2019-22** Evidently / Arize / Fiddler 等商业产品涌现 - **2023+** 扩展到 LLMOps / [[AgentOps]] 维度 - **2025** Datadog AI Monitoring → 综合可观测性厂商入局 ## 相关 - [[MLOps]] / [[LLMOps]] / [[AgentOps]] …

… - **2023+** 扩展到 [[LLMOps]] / [[AgentOps]] 维度 - **2025** Datadog AI Monitoring → 综合可观测性厂商入局 ## 相关 - [[MLOps]] / LLMOps / [[AgentOps]] - [[模型部署]] / [[模型版本控制]] - [[Datadog]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… ## 关联 - [[CoreWeave]] / [[Weights & Biases]] - [[3-07-AI原生中间件与开发平台]] - [[MLOps]] / LLMOps / [[AgentOps]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… . **端侧部署**：[[ONNX Runtime]] / [[OpenVINO]] / [[llama.cpp]] / [[云-边-端协同]] 5. **MLOps 全生命周期**：实验追踪 / 模型注册 / 特征存储 / 模型监控 / LLMOps / [[数据漂移]] 6. **MaaS（Model-as-a-Service）**：[[MaaS]] / [[Agent Runtime]] / 多模型编排 / API 服务化 …

查看原文 →

… 24** LangGraph / AutoGen / CrewAI 等开源框架兴起 - **2025** 主要云厂商推出 Agent Runtime - **2026** 预计成为推理服务标配 ## 相关概念 - [[MaaS]] - LLMOps- [[RAG]] - [[MCP]] ∈ belongs_to::[[4-04-模型部署与优化]] …

查看原文 →

… - **2025** 多 Agent 编排走向 **企业级**（阿里云 / Databricks / Datadog） ## 相关 - [[AgentOps]]（运维支撑） / [[MCP Server]]（工具协议） / LLMOps∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… 当 [[Pinecone]] 等 AI 原生玩家面临"功能化"危机时，Datadog 反向用 AI 重构核心产品，证明"老 SaaS + AI 嫁接"路径可行性。在 [[MLOps]] → LLMOps → [[AgentOps]] 进化链上，Datadog 抢占 AI Agent 监控 / 调试 / 运维的关键卡位，与 [[Weights & Biases]]（被 [[CoreWeave]] 收购）/ [[Arize AI]] / [[ …

查看原文 →

… 得是中国版"GPU 云"端理想标的，**潜在 MLOps 平台联姻方向**：与 [[星环科技]] Sophon / [[第四范式]] 先知平台战略合作 - AI 占比从 0% → 31.54% 的快速跃升显示其在 [[MLOps]] → LLMOps 演进中的承接能力 …

查看原文 →

… - **AI 中间件全栈代表** — 与海外 Databricks 对位，但体量小一个数量级 ## 相关 - [[第四范式]]（出品方） / [[MLOps]] / LLMOps- 中国主要竞争对手：[[星环科技]] Sophon / 各云厂商 ML 平台 - 海外对位：[[Databricks]] ∈ belongs_to::[[3-07-AI原生中间件与开发平台]] …

查看原文 →

… - LLM 单实例可服务百万 / 千万用户 → 调度复杂度爆炸 - 推理成本高 → 优化（PagedAttention、连续批处理、量化）至关重要 - 多模型路由（小模型先答，大模型回退） → 与 LLMOps / [[AgentOps]] 融合 ## 相关 - [[MLOps]] / [[模型版本控制]] / [[数据漂移检测]] - [[4-04-模型部署与优化]]（深度优化在该子行业） …

查看原文 →

… - **开源 + 商业化双轨**：开源版扩大开发者基础，企业版（飞桨企业版 + 千帆）形成商业化转化 - **AgentOps 演进**：飞桨 3.0 增强大模型分布式训练 + Agent 工程化能力，跟进 [[MLOps]] → LLMOps → [[AgentOps]] 演进趋势（[据 3-07](../来源摘要/3-07-AI原生中间件与开发平台.md.md)） ## 资本运作 / IPO 预期 …

查看原文 →

… - 此次发布标志着阿里云从"IaaS + PaaS + MaaS"三层架构 → 扩展为"**IaaS + PaaS + MaaS + AgentaaS**"四层全栈 - 与全球 [[MLOps]] → LLMOps → [[AgentOps]] 演进趋势同步，对标 [[Databricks]] AI Agent 框架 / [[Datadog]] AI SRE Agent …

查看原文 →