AI产业链地图·知识库 YData · 公司
🚧 网站建设中 更新 2026·06·17 → 产业链图谱
第四层 · 未上市 · 更新 2026·06·17
公司 未上市

YData

YData.ai · ydata-profiling

数据科学家友好的合成数据平台。结合数据概况分析(profiling)+ 数据质量 + 合成数据生成于一站式产品。

YData 私募 · 未上市
主层
第四层 · AI 基础模型
主子行业
数据引擎
总部
Porto, Portugal
反向引用
9 处 · 来自 7
归属 第四层 · AI 基础模型数据引擎Porto, Portugal合成数据数据质量AI数据葡萄牙第四层

YData

葡萄牙合成数据创业公司,专注于数据质量和合成数据的一体化方案。维护开源 ydata-profiling(前身 pandas-profiling)项目,是 Python 数据科学社区知名工具。

一句话定位

数据科学家友好的合成数据平台。结合数据概况分析(profiling)+ 数据质量 + 合成数据生成于一站式产品。

关键数据

维度 数据
创始 2019,Gonçalo Martins Ribeiro / Fabiana Clemente
总部 波尔图
累计融资 $2000 万+
关键开源项目 ydata-profiling(前 pandas-profiling,GitHub 万星级)

核心产品

  • YData Fabric — 数据准备一体化平台(profiling + 质量 + 合成)
  • YData Synthesizers — 合成数据生成 SDK
  • ydata-profiling(开源)— 数据概况自动报告(前身 pandas-profiling)
  • ydata-quality(开源)— 数据质量自动评估

技术亮点

  • 开源驱动 GTM — ydata-profiling 在 Python 数据科学生态深度渗透(pandas-profiling 重塑为 ydata-profiling 后被广泛使用)
  • 数据准备闭环 — profiling → quality → synthesis 一站式
  • Notebook 友好 — 与 Jupyter 深度集成

AI 时代角色

  • 数据科学家入口 — 在团队选择合成数据工具时,通过开源工具先入为主
  • 小团队 AI 项目首选 — 比 Gretel AI / MOSTLY AI 更面向单体开发者

与 AI 产业链关系

↑ up::(开源生态) ↓ down::数据科学家个人 / 中小企业 AI 团队 ⚔ competitor::Gretel AI MOSTLY AI Syntho ∈ belongs_to::4-01-数据引擎

关键事件

  • 2019 — 创立
  • 2021 — 收购 pandas-profiling 并重塑为 ydata-profiling
  • 2022 — A 轮 $1100 万
  • 2024 — 推出 YData Fabric

风险与挑战

  • 商业化能力相对 MOSTLY AI / Gretel AI 偏弱
  • 开源策略转商业的难度
  • 行业整合大趋势下,可能成为收购标的

增量补充(2026-05-29)

[!note] 核查认源说明 本页硬数据(2019 创立、波尔图总部、累计融资 $2000 万+、2022 A 轮 $1100 万、收购 pandas-profiling 重塑为 ydata-profiling)均来自 4-01-数据引擎(Tier B 券商研报)。YData 为葡萄牙未上市小体量创业公司,无 T0 金标准、缺权威 T1 公开披露佐证——按"缺佐证≠反证",保持原值,以 4-01-数据引擎 为准,confidence 维持 medium。