裁判文书网
最高人民法院 主管的全国法院判决文书公开平台 — 累计 1.5 亿+ 司法判例,是中国法律 AI 训练的核心公开数据资源
定义
裁判文书网(wenshu.court.gov.cn)是中国法院系统对外公开判决文书的统一平台,2013 年 7 月 1 日正式上线;累计公开判决书超 1.5 亿份,覆盖民事、刑事、行政、执行各类案件。
[!info] 口径说明(2026-06-02 核) 最高人民法院官方口径:截至 2022-09 累计公开约 1.3 亿余篇;上线 10 年后约 1.43 亿份(最高法官网,T1)。正文"1.5 亿+"为概数/峰值口径,与官方当前可见量存在差异(2021 年起部分文书撤下不再公开,"累计上传量"与"当前可访问量"非同一口径),两值并存。
数据特点
- 规模:1.5 亿+ 判决文书
- 覆盖:全国各级法院、各类案件
- 公开属性:依《政府信息公开条例》原则上公开
- 限制:批量爬取受限;未公开的卷宗材料属司法秘密
在 AI 产业链中的角色
Legal AI 训练数据 "公开核心" — PowerLawGLM、各类法律大模型的预训练 + 微调数据主要来源之一;司法辅助决策 中"类案推送"的检索基础。
数据合规
- 受《数据安全法》《个人信息保护法》约束
- 法律 AI 公司使用时需脱敏、去标识化处理
相关概念
- 法律知识图谱 / PowerLawGLM / 智慧法院
∈ belongs_to::5-10-AI法律