OCR (光学字符识别)
Optical Character Recognition,把图像中的字符识别成可编辑文本的技术。在工业视觉中常用于产品序列号、条码、批号识别。
定义
OCR 是机器视觉的经典任务之一。工业 OCR 与通用 OCR(如文档识别)的区别在于:
- 工业字符常印刷在金属、塑料、玻璃等反光表面,难度大
- 字符位置和方向更可控
- 实时性要求高(产线节拍)
- 准确率要求极高(追溯链路不允许错误)
技术细节
两代技术:
- 传统 OCR:模板匹配 + 特征工程,对字体、背景敏感
- 深度学习 OCR:CNN + CTC / 端到端 Transformer(如 PaddleOCR、TrOCR),泛化能力强
工业典型应用
- 产品序列号 / SN / 批号读取(追溯)
- DPM 字符(金属直接打标)识别
- 印刷质量检测(缺字、错字)
- 药品包装批号、有效期识别
主要玩家
在 AI 产业链中的角色
OCR 是 5-12-AI制造-工业视觉 子行业最基础、最广泛的应用之一,从早期 2D 视觉时代延续至今,并通过深度学习焕发新生命力。
∈ belongs_to::5-12-AI制造-工业视觉