OCR识别
2019-04-28 10:31:43 3 举报
AI智能生成
OCR识别基础流程
作者其他创作
大纲/内容
分类
传统文本识别
印刷体识别
手写体识别
场景文本识别(文字检测+文字识别)
CTPN - 自然场景文本检测
CRNN - 卷积循环神经网络文本识别
流程
预处理
角度矫正(文本倾斜)
透视矫正
水平矫正
去噪点(页面污点)
二值
灰度
行列切割
对图片进行水平投影,找到每一行的上界限和下界限,进行行切割
对切割出来的每一行,进行垂直投影,找到每一个字符的左右边界,进行单个字符的切割
字符识别
识别方法
谷歌开源 ocr 引擎 Tesseract
对中文支持不太好,需要自己做二次开发
大公司,百度、腾讯等的 OCR 开发平台的 API
收费、无法优化ocr、数据安全
传统方法做字符的特征提取,输入分类器,得出OCR模型
特征提取耗时长、实现复杂、效果不好
暴力的字符模板匹配法
适用于简单业务的识别,如电表、车牌,只识别数字、字母
基于深度学习下的CNN字符识别
后处理识别矫正
0 条评论
下一页