龙猫数据
国内 AI 数据采集与标注平台,通过 众包模式 汇集大量标注员,服务于多家互联网大厂。
一句话定位
众包驱动的数据标注平台,模式接近早期 Appen 但本土化。在数据采集层面有规模化优势,标注业务相对低单价高量。
关键数据
| 维度 | 数据 |
|---|---|
| 创始 | 2014 |
| 总部 | 北京 |
| 众包标注员 | 数百万级(自报) |
核心业务
- 数据采集 — 语音、图像、视频、文本众包采集
- 数据标注 — 大规模通用标注
- 专家服务 — 高门槛专业领域数据(医疗、法律)
- APP / 众包平台 — 标注员手机端任务接单
技术亮点
- 众包平台运营经验 — 标注员激励、质量审核、防作弊机制
- 规模化采集能力 — 全国各地多语种、多场景采集
AI 时代角色
- 大模型海量底层数据供给 — 大模型预训练 / 微调阶段对海量低单价数据有需求
客户与供应链
- 客户:百度、字节跳动、阿里巴巴、腾讯等互联网大厂
与 AI 产业链关系
↑ up::全国众包标注员网络 ↓ down::互联网大厂大模型团队 ⚔ competitor::海天瑞声 倍赛科技 整数智能 Appen ∈ belongs_to::4-01-数据引擎
资本运作
- 2014 — 创立
- 多轮融资(具体金额未披露)
风险与挑战
- 众包模式毛利率偏低
- 行业向"AI 预标注 + 专家审核"转型,纯众包模式压力增大
- 大厂自建众包能力(如百度众测)的内部化竞争
增量补充(2026-05-29)
编辑 agent 核查:本页为未上市数据标注公司,内容(众包模式、客户结构、标注员规模、风险)均来自 raw(4-01-数据引擎 子行业报告,Tier B)的专有/行业判断,无可对账的财务硬数字(无 ticker / 市值 / 营收)。按信源金字塔 D 档以 4-01-数据引擎 为准——这类一手专有数据网络无对应公开佐证不构成反证,保持原值不变。