AI产业链地图·知识库 大语言模型 · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/大语言模型

更新 2026·06·17

概念技术 / 术语

大语言模型

LLM · Large Language Model · 大模型 · 语言大模型

LLM 是参数规模在数十亿至万亿级的语言模型，通过大规模文本预训练 + 微调对齐获得通用语言理解和生成能力。典型代表：GPT-4o / o3、Claude 4.5、Gemini 2.5、Llama 4、DeepSeek-R1/V3、Qwen 3、GLM-4。

大语言模型 CONCEPT · 概念

首次提出: 2018
关键参与方: [[OpenAI]] · [[Anthropic]] · [[Google]] · [[Meta]]
反向引用: 18 处 · 来自 17 页

归属 LLM基础模型TransformerNLPAI大模型第四层

大语言模型

"LLM = Large Language Model"，基于 Transformer 架构在海量文本上预训练的通用语言模型。2026 年全球 LLM 市场规模 $105.7 亿（CAGR 34.4%，2035 达 $1,498.9 亿），是 4-02-模型工厂子行业核心。

定义

LLM 是参数规模在数十亿至万亿级的语言模型，通过大规模文本预训练 + 微调对齐获得通用语言理解和生成能力。典型代表：GPT-4o / o3、Claude 4.5、Gemini 2.5、Llama 4、DeepSeek-R1/V3、Qwen 3、GLM-4。

技术细节

核心架构演进

Transformer（2017）— Attention Is All You Need 论文奠基
GPT-3（2020）— 1750 亿参数，开启 scaling laws 时代
MoE 架构（2022 后）— Mixtral / DeepSeek-V3 普及
推理时计算（2024 OpenAI o1）— Chain-of-Thought 长思考链
多模态 LLM（2024 后）— GPT-4o / Gemini 多模态原生

关键能力

In-context Learning — 少样本/零样本学习
Reasoning — 推理链能力（OpenAI o3 / Claude / DeepSeek-R1）
Tool Use — 函数调用 / Agent 工具
Long Context — 200K 至 200 万 token 上下文

主要玩家

闭源前沿

OpenAI — GPT-4o / o3
Anthropic — Claude 4.5 Sonnet/Opus
Google — Gemini 2.5
xAI — Grok

开源前沿

Meta — Llama 4
阿里巴巴 — Qwen
DeepSeek — DeepSeek-R1 / V3
月之暗面 — Kimi K2
智谱AI — GLM-4

演进历史

2017 Google "Attention Is All You Need"（Transformer 论文）
2018 BERT（Google）+ GPT-1（OpenAI）
2020 GPT-3（1750 亿参数）
2022-11 ChatGPT 引爆全球
2023 GPT-4 / Claude / Bard 群雄混战
2024 推理模型（o1）+ MoE 普及
2025 DeepSeek R1 推理革命 + 万亿参数开源（月之暗面 Kimi K2）

在 AI 产业链中的角色

LLM 是 4-02-模型工厂的核心产品。其上游需要 2-01-核心逻辑芯片 GPU 算力 + 3-03-数据中心 + 4-01-数据引擎数据；下游驱动几乎所有 AI 应用（5-06-AI办公与企业服务 / 5-03-AIGC-数字媒体-创意工具 / 5-09-AI金融-量化交易等）。

相关概念

Transformer 架构 — LLM 的算法基石
混合专家模型（MoE）— 主流架构
推理模型（Reasoning）— LLM 升级方向
多模态模型 — LLM 横向扩展
长上下文窗口 — LLM 关键能力维度

增量补充（2026-05-29）

市场规模数据溯源：正文"2026 全球 LLM 市场 $105.7 亿、CAGR 34.4%、2035 达 $1,498.9 亿"经核对，与 Precedence Research《Large Language Model Market》（2026 = $10.57B、2026-2035 CAGR 34.44%、2035 = $149.89B）逐项精确吻合（T2 市场研究机构）。注：第三方市场咨询机构对 LLM 市场口径差异较大（Business Research Insights 给 CAGR 79.8%、Roots Analysis 给 2026 = $11.63B），本页采用的 Precedence 口径为相对保守且广被引用的一档。

∈ belongs_to::4-02-模型工厂

反向引用链接到本页

反向引用 18

按引用量 ↓

… > 2017 Google 论文 "**Attention Is All You Need**" 提出的神经网络架构，是 GPT / Claude / Gemini / Llama / DeepSeek 等所有现代大语言模型的算法基石。2024 全球基础模型市场 **$85 亿**中 Transformer 模型占 **66.4%**（$56.4 亿）。 ## 定义 Transformer 是基于**自注意力机制**（Self-Attention）的神经 …

… Transformer 是 [[4-02-模型工厂]] 的**算法基础设施**。理解 Transformer 即理解现代 AI；其架构选择直接影响训练成本 / 推理速度 / 模型能力。 ## 相关概念 - 大语言模型- [[混合专家模型]] - [[注意力机制]] - [[基础模型]] ∈ belongs_to::[[4-02-模型工厂]] …

查看原文 →

… - [[Tripo / VAST]] ★★★★（3D 生成 300 万+ 用户） ## 核心技术维度 1. **大语言模型** — [[Transformer 架构]] / 大语言模型 / [[基础模型]] / [[混合专家模型]]（MoE）/ [[长上下文窗口]] 2. **推理与对齐** — [[推理模型]]（Chain-of-Thought / Reasoning）/ [[RLHF]] / [[DPO]] / [[ …

查看原文 →

… - [[Cocos]] ★★★ — 国产游戏引擎，Unity 退出留空间 ## 核心技术维度 1. **AI NPC 智能化**：[[AI NPC]] / [[网易伏羲]] / [[Messiah引擎]] / 大语言模型 / [[记忆系统]] 2. **AIGC 内容生成**：[[AIGC游戏内容生成]] / [[Stable Diffusion]] / [[Midjourney]] / [[文生3D]] / [[AI音乐生成]] …

查看原文 →

… 寒]] AI NPC 商业化（[[2025-逆水寒AI NPC商业化]]），400+ NPC 上线，互动时长 +40% - **2026**：行业标配，从"噱头"走向"刚需" ## 相关概念 - ↑ up::[[4-02-模型工厂]] 大语言模型- ⚔ vs 传统脚本 NPC（FSM + 对话树） - ↔ [[AIGC游戏内容生成]]（互补） - ∈ belongs_to::[[5-13-AI游戏]] …

查看原文 →

… - 2025 完美世界 [[诛仙世界]]、恺英 [[形意大模型]] 标杆落地 - 2026 全链路 AI 工作流成行业标配 ## 相关概念 - ↑ up::[[4-02-模型工厂]] 大语言模型- ↔ [[AI NPC]]（互补，前者解决"内容生产"，后者解决"内容互动"） - ↔ [[Unity AI]] [[Code Assist]] [[Material Generator]] …

查看原文 →

… - **从统计模型 → 大模型** — LLM 做根因解释 + 运维知识问答 - **从被动响应 → 主动自愈** — Agent 自动执行 Runbook ## 上下游关系 ↑ up::大语言模型 [[预测性运维]] ↓ down::[[3-10-DCIM数据中心基础设施管理软件]] [[3-03-数据中心]] ∈ belongs_to::[[3-10-DCIM数据中心基础设施管理软件]] …

查看原文 →

… - **第三阶段（2026-27）**：AI 原生游戏（从 AI 出发设计玩法） ## 相关概念 - ↑ up::[[AI NPC]] [[AIGC游戏内容生成]] 大语言模型- ↔ [[UGC游戏生态]]（用户驱动 vs AI 驱动的内容生产） - ∈ belongs_to::[[5-13-AI游戏]] …

查看原文 →

… Ali Ghodsi 是**"开源 → 商业化"路径最成功的范例之一** — Databricks 从 Spark 起家，通过 Lakehouse 架构成为数据基础设施的事实标准，再借 MosaicML 收购切入 LLM 训练，构建"数据 + AI"双轮驱动飞轮。在 AI 基础设施赛道，Databricks 是 [[Snowflake]] / [[CoreWeave]] / [[AWS SageMaker]] 的核心竞争对手 — 唯一同时在数据平台 + …

查看原文 →

… - **2026**：与 [[Material Generator]] 协同，"让 10 岁儿童创作 3D 游戏" ## 相关概念 - ↑ up::[[Roblox]] 大语言模型- ↔ [[Material Generator]]（同套工具链） - ⚔ vs [[GitHub Copilot]] [[Cursor]] - ∈ belongs_to::[[5-13-AI游戏]] …

查看原文 →

… - **2026-01-29**：以 Project Genie 形式向 Google AI Ultra 订阅用户开放公测（T1） - 对游戏引擎商业模式形成威胁 ## 相关概念 - ↑ up::[[谷歌]] 大语言模型 [[文生3D]] - ⚔ vs [[Unity]] [[Epic Games]] [[Cocos]]（颠覆引擎商业模式） - ↔ [[AI原生游戏]] - ∈ belongs_to::[[5-13-AI游戏]] …

查看原文 →

… - **2023-25**：《星穹铁道》《绝区零》成为 AI 工具实战平台 - **2026**：可能在港股 IPO 中作为独立技术资产披露 ## 相关概念 - ↑ up::[[米哈游]] [[4-02-模型工厂]] 大语言模型- ⚔ vs [[网易伏羲]] - ∈ belongs_to::[[5-13-AI游戏]] …

查看原文 →

… # 开源大模型 > 公开模型权重的大语言模型。**2025 中开源模型全球市场份额达近 30%**（2024 末仅 1.2%）。中国 [[DeepSeek]] + [[阿里巴巴]] Qwen + [[Meta]] Llama 构成"开源三强"格局。 …

查看原文 →

… - **2026**：量产应用（[[2026-恺英网络形意大模型量产]]），用于在研项目全流程 - **2026 H2**：[[传奇盒子]] 第三方厂商接入 ## 相关概念 - ↑ up::[[4-02-模型工厂]] 大语言模型- ↔ [[传奇盒子]]（产业化平台） - ⚔ vs [[网易伏羲]]（同类垂直 AI 中台） - ∈ belongs_to::[[5-13-AI游戏]] …

查看原文 →

… # 推理模型 > 2024 OpenAI o1 引入的新范式：让大语言模型在回答前**生成长思考链**（Chain-of-Thought），通过**推理时计算**显著提升复杂任务（数学/代码/科学）表现。**DeepSeek-R1**（2025-01）以极低成本复刻该范式并开源，颠覆全球定价。 …

查看原文 →

… - 2024-12 DeepSeek-V3（671B / 激活 37B） - 2025-07 [[月之暗面]] Kimi K2 万亿 MoE ## 相关概念 - [[Transformer 架构]] - 大语言模型- [[稀疏激活]] ∈ belongs_to::[[4-02-模型工厂]] …

查看原文 →

… - **2025**：[[逆水寒]] AI NPC 商业化（[[2025-逆水寒AI NPC商业化]]） - **2026**：伏羲能力外溢，可能成为分拆候选 ## 相关概念 - ↑ up::[[4-02-模型工厂]] 大语言模型- ↔ [[Messiah引擎]] [[AI NPC]] - ⚔ vs [[反熵研究所]]（米哈游中台） - ∈ belongs_to::[[5-13-AI游戏]] …

查看原文 →

… # 长上下文窗口 > 大语言模型一次推理可处理的最大 token 数。2023 普遍 4K-8K，2024-2026 主流模型已达 **200K-200 万 token**。中国 [[月之暗面]] 是长上下文先发者，Google Gemini 1.5 Pro 突破 10 …

查看原文 →