LightGPT
恒生电子 2023-06 发布的中国首批商用金融大模型。基于 4000 亿 tokens 金融语料训练,支持 80+ 金融专属任务,2023-10 升级整体效果 +15% / 推理速度 +50%。LightGPT-7B 已面向金融机构开源。是国内金融大模型的标杆产品。
定义
LightGPT 是 恒生电子 自研的金融垂直大模型,定位为金融行业 AI 中台底座。模型能力嵌入恒生电子全产品线(投研 Warren Q、投顾"光子"、客服、风控、运营),并以私有化部署 + SaaS 订阅两种模式销售。
技术细节
训练数据
- 金融领域数据:4000 亿 tokens(资讯、公告、研报、结构化数据)
- 语种强化数据:400 亿 tokens(金融教材、百科、政府报告、法规条例)
任务适配
支持 80+ 金融专属任务指令微调,包括:
- 智能投研(研报撰写、数据分析)
- 智能投顾(资产配置建议)
- 智能客服(7×24 金融咨询)
- 智能风控(异常交易、反洗钱)
- 智能运营(精准营销、客户画像)
性能提升(2023-10 升级)
| 指标 | 提升幅度 |
|---|---|
| 整体效果 | +15% |
| 安全合规性 | +13% |
| 推理速度 | +50% |
开源策略
LightGPT-7B 面向金融机构开源(参数量 7B),既是恒生的技术展示也是生态扩展工具。
主要应用场景
| 场景 | 产品 | 目标客户 |
|---|---|---|
| 智能投研 | Warren Q 平台 | 基金/券商研究部门 |
| 智能投顾 | "光子"助手 | 财富管理业务线 |
| 智能客服 | 金融客服系统 | 券商/银行客服中心 |
| 智能风控 | 异常交易识别 | 合规风控部门 |
| 智能运营 | 客户画像分析 | 营销运营部门 |
在 AI 产业链中的角色
LightGPT 是中国金融大模型应用的事实标准之一,其牵头编制的《面向行业的大规模预训练模型技术和应用评估方法 第1部分:金融大模型》(中国信通院 2023-09 发布)成为行业标准。
演进历史
- 2023-06-28:首次发布
- 2023-09:2023-09-金融大模型评估标准发布(恒生电子牵头编制)
- 2023-10:全面升级,整体效果 +15%
- 2024-2026:嵌入恒生全产品线 + 开源 LightGPT-7B + SaaS 订阅模式跑通
相关概念
∈ belongs_to::5-09-AI金融-量化交易