ocr思路
2016-12-07 15:03:10 0 举报
OCR(Optical Character Recognition,光学字符识别)是一种将图片中的文字转换为可编辑文本的技术。其基本思路是:首先对输入的图片进行预处理,包括灰度化、二值化、去噪等操作,以便于后续的特征提取;接着通过特征提取算法(如边缘检测、直方图等)提取文字区域的特征;然后利用分类器(如SVM、神经网络等)对提取到的特征进行训练和识别,得到识别结果;最后对识别结果进行后处理,如纠错、格式转换等,以得到最终的可编辑文本。
作者其他创作
大纲/内容
二值化方法https://docs.google.com/presentation/d/1N1scoKZhmneH_qyLCjdVcAWKqqL65T3ahKrk2-1Tvcg/edit#slide=id.i39
版式分析 DIA
切割文本行表格的切分
定位文本区域
切割文本行方法https://docs.google.com/presentation/d/1N1scoKZhmneH_qyLCjdVcAWKqqL65T3ahKrk2-1Tvcg/edit#slide=id.i151
二值化倾斜度估计
0 条评论
下一页