金融大模型
针对金融场景训练或微调的大语言模型。代表性产品 BloombergGPT(Bloomberg 2023 发布)、LightGPT(恒生电子 2023 发布)、i问财(同花顺 2024+)。是把通用大模型能力落地金融行业的关键技术形态。
定义
金融大模型指在金融领域语料(财报、研报、新闻、公告、政策、交易数据)上预训练或微调的大语言模型,针对金融特有任务(投研、客服、风控、合规、营销)做指令对齐。
技术细节
三代演进
| 代 | 时间 | 代表 | 特点 |
|---|---|---|---|
| 第一代:通用直接应用 | 2023 | ChatGPT 接入金融 | 幻觉率高、专业性不足 |
| 第二代:金融垂直模型 | 2023-2024 | LightGPT、BloombergGPT、i问财 | 金融语料预训练 + 80+ 任务微调 |
| 第三代:推理增强模型 | 2025-2026 | DeepSeek R1、同花顺"深度思考" | 思维链 + 反思推理 + 结构化输出 |
关键训练参数(以 LightGPT 为例)
- 金融领域数据:4000 亿 tokens(资讯、公告、研报、结构化数据)
- 语种强化数据:400 亿 tokens(金融教材、百科、政府报告、法规条例)
- 任务适配:80+ 金融专属任务指令微调
- 性能提升(2023-10 升级):整体效果 +15%,安全合规性 +13%,推理速度 +50%
主要玩家
国际
中国
在 AI 产业链中的角色
金融大模型是 第四层模型工厂 → 第五层金融应用 的桥梁。其核心价值在于:
- 垂直语料:解决通用大模型在金融场景的幻觉问题
- 合规可控:满足金融监管对可解释性的要求
- 私有化部署:满足金融机构数据不出域要求
- 任务对齐:在投研、客服、风控等场景做深度优化
演进历史
- 2023-03:Bloomberg 发布 BloombergGPT,全球首个商用金融大模型
- 2023-06:恒生电子 发布 LightGPT
- 2023-09:2023-09-金融大模型评估标准发布 — 中国信通院 + 恒生电子联合发布国内首个标准
- 2024-2025:垂直模型大规模商用化
- 2025-2026:DeepSeek R1 推理模型嵌入金融分析,开启第三代
相关概念
- LightGPT / i问财 / BloombergGPT — 主要金融大模型产品
- DeepSeek / DeepSeek R1 — 推理模型在金融的应用
- 智能投顾 / 量化交易 — 金融大模型主要应用场景
∈ belongs_to::5-09-AI金融-量化交易