计算机视觉(Computer Vision, CV)
AI 的核心能力之一,让机器理解图像与视频。2024 中国计算机视觉应用市场 ¥123.4 亿(YoY +21.2%),人脸/车辆/行为识别精度已达 98%+。
定义
计算机视觉是让计算机从图像、视频中提取语义信息的 AI 技术,涵盖:
- 图像分类 / 目标检测 / 语义分割
- 人脸识别 / 行为分析 / 车辆识别
- OCR / 关键点检测 / 3D 重建
- 视频理解 / 目标跟踪
关键技术演进
| 阶段 | 代表技术 |
|---|---|
| 传统 CV(2010 前) | SIFT / HOG / SVM |
| 深度学习(2012+) | CNN(AlexNet / ResNet) |
| Vision Transformer(2020+) | ViT / Swin |
| 多模态(2023+) | CLIP / Flamingo / GPT-4V |
中国市场结构
AI 四小龙(CV 出身)
硬件向上整合者
国际
在 5-05-智慧城市-AIoT 中的角色
- AI 安防渗透率:2020 15% → 2025 60%+
- 单摄像头边缘算力:0.5 → 5 TOPS
- 场景覆盖:人脸识别、行为分析、车辆识别、安防、智慧交通、零售、楼宇
商业化困境(5-05 视角)
四小龙均研发费用率 >80%,长期亏损:
根源:技术壁垒易复制 + 政府订单议价权弱 + 海康威视/华为 巨头硬件向上整合算法。
与 AI 产业链关系
↑ up::2-01-核心逻辑芯片 — 边缘 AI 芯片 ↑ up::4-02-模型工厂 — 视觉大模型训练 ↓ down::5-05-智慧城市-AIoT 5-12-AI制造-工业视觉 5-14-AI赋能安全应用 5-04-智慧医疗 — 应用场景 ∈ belongs_to::5-05-智慧城市-AIoT