YData
葡萄牙合成数据创业公司,专注于数据质量和合成数据的一体化方案。维护开源
ydata-profiling(前身pandas-profiling)项目,是 Python 数据科学社区知名工具。
一句话定位
数据科学家友好的合成数据平台。结合数据概况分析(profiling)+ 数据质量 + 合成数据生成于一站式产品。
关键数据
| 维度 | 数据 |
|---|---|
| 创始 | 2019,Gonçalo Martins Ribeiro / Fabiana Clemente |
| 总部 | 波尔图 |
| 累计融资 | $2000 万+ |
| 关键开源项目 | ydata-profiling(前 pandas-profiling,GitHub 万星级) |
核心产品
- YData Fabric — 数据准备一体化平台(profiling + 质量 + 合成)
- YData Synthesizers — 合成数据生成 SDK
- ydata-profiling(开源)— 数据概况自动报告(前身 pandas-profiling)
- ydata-quality(开源)— 数据质量自动评估
技术亮点
- 开源驱动 GTM — ydata-profiling 在 Python 数据科学生态深度渗透(pandas-profiling 重塑为 ydata-profiling 后被广泛使用)
- 数据准备闭环 — profiling → quality → synthesis 一站式
- Notebook 友好 — 与 Jupyter 深度集成
AI 时代角色
与 AI 产业链关系
↑ up::(开源生态) ↓ down::数据科学家个人 / 中小企业 AI 团队 ⚔ competitor::Gretel AI MOSTLY AI Syntho ∈ belongs_to::4-01-数据引擎
关键事件
- 2019 — 创立
- 2021 — 收购 pandas-profiling 并重塑为 ydata-profiling
- 2022 — A 轮 $1100 万
- 2024 — 推出 YData Fabric
风险与挑战
增量补充(2026-05-29)
[!note] 核查认源说明 本页硬数据(2019 创立、波尔图总部、累计融资 $2000 万+、2022 A 轮 $1100 万、收购 pandas-profiling 重塑为 ydata-profiling)均来自 4-01-数据引擎(Tier B 券商研报)。YData 为葡萄牙未上市小体量创业公司,无 T0 金标准、缺权威 T1 公开披露佐证——按"缺佐证≠反证",保持原值,以 4-01-数据引擎 为准,confidence 维持 medium。