人工智能蓬勃发展,OCR作为AI黑技术的重要组成部分已经深深融入人们的日常生活工作当中。普通程序开发者和OCR领域的新人们又将离OCR开发更近一步。
从百度上我们可以简单的检索得知,利用OCR(Optical Character Recognition,光学字符识别)技
术,将图片、照片上的文字内容,直接转换为可编辑文本。
当下最流行的身份证识别为例,最简单的描述它的工作流程包括,图像的采集输入、图像预处理、图像文字的分割与识别、信息关键词归属的判断和处理,以及OCR识别信息的输出。在这五大模块中,图像的文字分割与识别作为核心技术在开源的OCR中,作为一个技术开发新人,无法从开源的OCR内获取到有用的算法或代码。例如谷歌的OCR开源项目,Tesseract-OCR需要通过复杂的配置和训练方式才有可能接近自己想要的结果。冗余的代码让工程师在代码熟悉阶段就对OCR技术望而怯步。
AI技术的提出到今年已经60周年,未来得AI者得天下,只有更多的技术研发参与者加入这个行业,技术的迭代才能更快,更加方便大家的生活,图睿信息致力于OCR领域的研究,努力促进国内OCR领域的深入发展。同时他们正在努力探索将包括字符特征提取和特征识别等OCR核心代码全部开源的可能性,在OCR商业软件公司走出了第一步,目前他们已将核心技术中的字符切割模块进行有限开源。开源代码遵循公司《协议说明》。安卓系统是移动端设备的主流,因此本次的代码开放方式采用安卓端的方式进行开放。具体的编译方式可以下载相应的程序的文档进行操作体验。
现在让我们从技术层面来揭开图睿OCR字符分割的神秘面纱。
图像的文字的模式识别一般只能对单位字符进行处理,如何得到纯净的单字符、有效的将粘连字符分开从而更好的服务模式识别是切分算法好坏的参考标准。
字符分割模块中,图睿OCR主要结合了以下几种技术[1][2] [3]:
(1)、基于识别反馈的粘连字符分割算法[2];
(2)、基于连通域的字符分割算法[1];
(3)、基于滴水算法的字符切割技术[3];
字符分割代码主要函数都在tur_char_split.c文件中实现。同时包含了tur_char_split.h和global_split.h两个头文件。
建议在进行代码熟悉之前,先查收文末列出的参考文献,保证在开发前对字符切分的基础识别有充分的理解。
协议说明链接:
http:ocr.xmturui.comdownloadsprotocol.doc
代码及说明文档链接:
http:ocr.xmturui.comdownloadsTURI_OCR_V1.0.zip
参考文献:
[1] 李甲长. 基于识别反馈机制的多粘连字符分割与识别[D].广东:中山大学, 2009:15-31.
[2] 周嫔,马少平,姜哲.基于单元合并的汉字切分算法的改进[J]. 中文信息学报, 1999, 13(2):33-39
[3]张闯,蔺志青,肖波,郭军. 适用于银行票据手写数字串切分的滴水算法[J].北京邮电大学学报, 2006, 29(1):13-16
标签: 熊猫ocr安卓版
评论列表
字符识别)技 术,将图片、照片上的文字内容,直接转换为可编辑文本。 当下最流行的身份证识别为例,最简单的描述它的工作流程包括,图像的采集输入、图像预处理、图像文字的分割与识别、信息关键词归属的判断和处理,以及OCR识别信息的输出。在这五大模块中,图像的文字分割