OCR业务流程
2024-11-26 21:26:49 0 举报
OCR业务流程
作者其他创作
大纲/内容
二值化:将所有像素都变成黑白两色
图像输入
对比数据库:当输入文字算完特征后,不管是用统计或结构的特征,都须有一比对数据库或特征数据库来进行比对,数据库包括所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组
人工校正
倾斜较正:图像方向检测,并校正图像方向
人工寻找,更正OCR出错的地方
影像输入
分发挥数学运算理论的一个模块
人工校正的操作流程及其功能,亦影响OCR的处理效率,也是产品体验的重要组成部分。每一识别文字的候选字功能、拒认字的功能、及字词后处理后特意标示出可能有问题的字词都需要考虑到是否纳入到产品需求
字词后处理:由于OCR的识别率并无法达到百分之百,为增强识别正确性,根据识别结果及相似候选字群中,找出最合乎逻辑的字,类似“上下文技术”
格式化文件输出
常见算法:欧式空间的比对方法松弛比对法(Relaxation)动态程序比对法(Dynamic Programming,DP)类神经网络的数据库建立及比对HMM(Hidden Markov Model)…等著名的方法为了使识别的结果更稳定,也有所谓的专家系统(Experts System)被提出,利用各种特征比对方法的相异互补性进行识别
扫描仪,相机,等图形输入设备。分辨率越高,图像越清晰,OCR效率越高
影像预处理
解决问题最多的一个模块
文字特征抽取(OCR的核心):方式1:统计的特征,统计文字区域内的黑/白点数比,形成空间的一个数值向量方式2:取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对
The last dance
字符切割:切割输入设备造成的的字符粘连的情况,确保字符单个独立
版面分析:将文档图片分段落
降低特征提取算法的难度,并能提高识别的精度的方式
图像降噪:把图像受到输入设备的影响降到最低
字词数据库:为字词后处理所建立的词库。
对比识别(模型)
0 条评论
下一页