英语原文共 11 页
数字仪器自动检测的字符识别算法研究
摘要
在本文中,图像识别技术被应用到煤矿瓦斯报警装置自动检验系统的测试中。 通过对甲烷检测仪器拍摄的图像进行数字图像识别,实现机器视觉仪器的自动检测功能,不仅可以提高识别的效率和准确性还可以节省大量的人力和物力消耗。 在本文中,数字图像识别系统由图像采集,彩色图像转换为灰度,二值转换和去噪,字符分割,模板匹配等组成。
本研究收集了一组高清图像作为模板并进行大量采集的仪器图像和模板的匹配实验结果表明,识别率超过99.9%,符合工程应用的要求。
关键词 - 图像处理; 数字识别; 机器视觉; 自动检测
I. 引言
如果需要人来手动处理,仪器的检验和评估是繁琐和繁重的任务。随着一些数字图像处理技术的发展,一些自动仪器评估系统已经被提出并设计了。例如,Rahman Ashfaqur和Venna Brijesh [1]提出了所谓的集合分类器架构并对其对离线草书字符识别的作用进行了调查。四级特征集可以通过训练分类器的集合来提高识别准确度。 黄鹤鸣和大飞鹏[2]利用小波变换和不变矩进行了离线手写藏文字符识别实验。 根据音节的构造及其允许的序列,普通话被分类,字符语言模型被利用[3]。针对数据库CASLA-OLHWDB和CASIA-HWDB,国家模式识别实验室(NLPR)的研究人员,中国科学院自动化研究所启动使用最先进的方法开展了一系列试验,如ID和伪二维非均化方法,修正二次方法判别函数(MQDF),判别特征提取(DFE)和判别学习二次方判别函数(DLQDF)[4]。
然而,那些字符识别方法有它们的独特的应用背景,应用于工业测量系统的传统仪器不同于那些字符和特征。绝大多数仪器不仅仅只能通过LCD,LED和拨号显示数据,而且只能手动读取,更重要的是,他们不提供数据传输接口。 因此,很难实现数据自动采集并确保数据的实时性和准确性。考虑到上述情况,满足测量系统自动化的需要是很难的。虽然国内对计算机视觉辅助数字仪器自动识别的研究不多,但提出了许多重要的方法。 例如,根据[5]中对LED的字符给出了处理方法。七段数码管的特点是由七个显示段组成。 每个部分具有垂直或水平显示段,四个垂直段和三个水平段。 每个段的厚度和长度基本一致。这些特征是处理方法的原理,这种方法可以准确地识别数字字符。参考文献[6]采用单位采样方案进行数字识别。该方案制定了获得单个字符的过程确保每个数字段的字符在完成字符分割后只有一个像素值的宽度,确定每个含有字符的数字段中心点坐标的像素值,然后判断照明状态,最后根据相应的逻辑关系得到字符块显示的值。 这个识别方法算法简单,在识别过程中识别速度快。 考虑到数字仪器特征识别算法的研究[7,8],研究设计了一种基于图像处理的数字识别系统,以使系统能够很好地实现实时自动验证的功能。该研究通过VFW(Video for Windows)相机获得了了器乐阅读的图象然后应用数字识别技术处理捕获的图像,最终用仪器读取数据而不是手动。 在研究中,不仅很多人力和物力的消耗可以节省,也可以提高采集数据的实时性和准确性。同时,由于研究是在特殊的情况下进行的捕获图像的大小和方向是不变的,在数字识别部分采用模板匹配算法实现自动验证图像识别仪器的功能。
II. 系统的组成部分和算法的程序
本文设计的系统包括甲烷气体的仪器检测(用于检测甲烷气体的含量),工业相机(用于连续捕获仪器的图像),系统中使用的个人计算机,与VFW兼容的数码相机(之前称为工业相机,其他支持VFW的视频采集设备)支持USB1.0及以上版本的接口。平台是使用MFC开发的(Microsoft基础类)在Visual C 环境中以及Windows98以上的操作系统。 Windows系统必须安装所有工业相机和VFW的驱动程序动态链接库。
本文特别研究了图像识别过程的算法。 数字字符自动识别的过程可分为两部分。 第一部分称为图像预处理,包括将彩色图像转换为灰度图像和灰度图像的二值化过程。第二部分是测试数据的字符识别,字符分割,图像增强,小数点识别和模板匹配等。 最后,保存识别结果,以便这些结果可以分析和管理。
数字图像自动识别算法程序图如图1所示。
图l. 算法程序图
III. 每个部分的算法
A.图像捕获
计算机安装工业相机的底层驱动程序和相机的动态链接库。在一定光照条件下固定摄像机和甲烷检测仪器的相对位置。 在这些条件下,采用通过USB接口与计算机连接的工业相机连续捕获图像。
- 图像的预处理
工业相机拍摄的图像是真彩色图像(24位),如图2所示的图像由于获取图像中数值仪器的字符颜色为红色,红色分量可以从相机拍摄的真彩色图像中提取。 这种处理方法可以获得比将真彩色图像转换成灰色图像更清晰的图像。
图2.捕获的真彩色图像
- 将彩色图像转换为灰色
为了节省存储空间,真彩色图像应该被转换成灰度图像。灰度图像仅具有强度信息,但不具有颜色。如果图像的每个像素具有相同的红色,绿色,蓝色分量值,那该图像就是灰度图像。 图像的灰度值可以由式(1)计算。
(1)
R,G和B是分别是红色成分,绿色成分和蓝色成分的颜色值。H是转换后的灰度值。 根据公式(I),设计的系统只提取红色分量,所以本文将绿色和蓝色成分的系数改为0,所以得到公式(2):
(2)
基于公式2处理真彩色图像,结果如图3所示。
图3.基于公式2处理后的图像
- 灰度图像的二值化
图像的二值化过程是将某些像素的值设置为0或255,其目的是区分黑白效果。二值图像具有小的存储空间,并且可以提高图像处理的效率。更重要的是,二进制图像可以执行布尔运算。代表性的图像处理技术描述如下:它基于该对象目标判断像素是属于目标还是背景,
并且每个区域内的背景对灰度像素值的特征具有某种均匀性。 选择一个阈值theta;来对比像素,其值小于theta;,为背景或目标。
该方法描述为(3)[9-11]。
(3)
f1是阈值处理后的新图像,该方法将原始(x,y)点的像素值改变为新灰度级f1(x,y)。 在阈值处理后的图像被称为二值图像,并且处理的进程被称为灰度图像的二值转换。基于公式3处理灰度图像,结果如图4所示。
图4.基于公式3处理后的二值图像
- 数字识别
字符分割是分别对目标和背景的图像进行分割。目前已经提出了许多字符分割方法。例如,有杂色着色算法,峰值谷值算法和边缘检测算法等。杂色着色算法可以检测像素的连通性,但是这种方法不能执行优化的速度。峰值和谷值算法计算作为目标像素的白色像素的密度。峰值存在于白色像素的最大密度区域,谷值存在于白色像素的最小密度区域。 然后在低谷分割字符。 但是,这种方法不可靠。 边缘检测算法指出像素集在灰度值有巨大变化。 换句话说,图像经过二值化处理后变成单个字符。当该系统捕获图像时已经设置了距离和角度,因此不存在图像调整下降的问题,并且两个字符之间存在明显的距离。总之,在系统的字符分割部分采用边缘检测算法。
模板匹配的主要算法[7]是搜索大图像中的目标,找到目标并确认它们的位置,在确认有目标在图像中找到,并且目标与模板具有相同的尺寸,方向和图像,其中模板是小的已知图像。该8位图像,即一个像素由一个字节描述,作为例子。 具有mtimes;n像素的模板T在图像S上移动,W个H像素,被搜索,被模板覆盖的被搜索图像区域被称为子图像S ij。在内部,(i,j)是被搜索的图像S的左下位置,如图5所示。 搜索范围如下:
图5.模板匹配
本文采用的模板为0-9高分辨率字符,它在图6中显示。它们的相似性可以通过以下表示来衡量:
图6.模板图像
第一项是表示是子图像的值,第三项是模板的值,两者都与模板匹配无关。 第二项是模板和子图像的相关度,随着(i,j)的变化而变化。 当模板与子图像匹配时,此项的结果为最大值。对该项进行归一化后,模板匹配的相关系数如下:
当模板和子图像相同时,相关性系数R(i,j)= 1.在完成图像S中的研究之后,对应于R的最大Rmax(im,jm)的S的S(im,jm)是匹配目标。
字符分割后的图像如图7所示。
图7 字符分割图像
- 小数点的识别
在本文中,要处理的图像大小和方向是固定的。 每个字符块的大小固定意味着LED数码管显示单元也是固定的。小数点仅存在于每个字符块的右下角。 换句话说,小数点存在于三个地方,而这三个地方地方有相同的间隔。 因此,当检测小数点的位置时,只需计算这三个位置的像素值并检查亮度 - 暗度状态。 该地方的亮度状态是小数点的位置。
- 保存结果
最后的识别结果保存在* .txt文件中,这很容易查询。图8示出了数字识别系统的处理结果。
图8.单个过程的结果和最终结果
IV.结论
大量实验表明本研究中的数字识别的算法充分证明了机器视觉代替人工读取数据的实用性。该实验结果表明系统的准确性超过了99.9%,实现了高识别速度,充分证明了方法的实用性。 结果表明,机器视觉的自动检验功能取代人工读取数据,值得研究并应用于生产实践中。 由于我的时间和精力有限,本文存在许多不足之处,如计算模板匹配算法的数量比较大,有待进一步优化。
致谢
这项工作得到了哈尔滨科技创新精英青年研究员项目(拨款号2013RFQXJ003),黑龙江省重点研究项目省(格兰特号:GZIIA403)和硕士生黑龙江省创新计划(拨款号:YJSCX20 12-1 09HLJ)的支持。
光学字符识别算法和特征提取技术的评估
摘要
对于所有将印刷体或手写体字符作为输入的应用来说,光学字符识别或OCR是必要的第一步。我们需要训练我们的分类器以防我们考虑使用数据挖掘技术这样的目的。有几种已建立的通用分类技术机制,它们可以与特征提取技术一起使用,但重要的是要知道在哪种情况下哪些技术表现得更好。
我们评估了三种OCR方法用于手写体字符,并研究他们的结果。 我们设计一个案例研究其中我们需要识别有阅读障碍概率的病例。
关键词 - 光学字符识别,分类器,图像获取,特征提取。
I.引言
字符识别已经获得了显著的普及并且它已成为一个重要的研究领域。随着技术进步,对计算机和智能设备的期望正在日益增长。在现代世界中,可供使用的具有字符识别功能的系统有很多。例如银行支票读卡器,自动数据输入,写识别系统等。字符识别是一个根据预先定义的准则,使用某些技术对字符的输入进行分类的研究领域。但是,在手写识别的情况下,字符识别存在问题,因为字符在字体,大小和样式上因人而异,视觉图像也受噪声影响,特别是边缘部分。其它形式的噪声包括支线,线条,颜色斑点等。这导致准确度的损失,并且系统识别字符的精确度过低,会在后续步骤中增加更多的问题。已经提出好几种算法,但是对算法和分类器的选择可能对不同的问题域有不同的结果。我们使用案例研究,在研究者中需要找出存在于幼儿园学生的笔迹中的某些问题,以此反映阅读障碍的可能性。阅读障碍是指在阅读和写作中存在学习障碍,患有阅读障碍的学生在学习中需要额外的努力和帮助。技术的进步已经使对阅读障碍患者进行筛查成为可能。
我们使用三种分类器和两种特征提取技术来评估和比较结果。我们采用1-m方法比较局部二元模式(LBP)、支持向量机(SVM)和具有K-最近邻(KNN)的神经网络(NN)的结果。我们把每个由特征提取技术获得的值传递到我们的分类器。我们使用多训练的SVM分类器设置训练和目标的分类,并且获得的结果在结果部分中呈现。 我们最终会展示这些算法性能的总体情况。
本文的结构如下。 在第二节中我们提出相关的工作,在Sectionapproach中提出我们的方法和问题声明。 在第四节我们提出我们的评估并在第五节讨论我们的结果。最后在第六部分介绍我们的结论和未来的工作。
II.相关工作
离线字符识别对图片进行分析,而那些图片是由相机拍摄或通过扫描仪扫描的样品的硬拷贝。 在离线字符识别中,数据从图像转换为二进制形式,这是计算机可以理解的唯一语言形式。 数据是二维的和空间的。 在空间的形式中难以对联结的字母进行分类因此离线字符识别难以与在线字符识别的效果相比。 有研究已经表明为获得更好的表现,离线字符识别需要更多卓越的识别算法。在我们提出的系统中,我们比较了三种分类器,并根据两种特征提取技术评估每种系统的性能。即局部二元模式(LBP)和Zoning,主要任务或目标是增加正确识别的次数和识别的准确性。
SVM是基于学习算法的有监督学习模型,这有助于分析数据,它也有利于识别存在于数据中的不同模式。 SVM算法一直在研究人员的兴趣领域。 SVM被用于分类和回归分析。 Hang等人开发了分类方法原型,利用SVM作为界面适应器的角色。他们专注于研究两种方法,k-Mean算法和模糊c-均值算法,这基本上可以帮助他们调整原型。不久后他们成功地开发了混合方法,从而减少了训练时间和数据。这些提出的方法获得了显著的普及并从最近邻算法中获得了更好的结果。他们采用K-Mean聚类进行矢量量化,这在数据挖掘中的数据分析中很受欢迎[1]但是后来其中一位来自同一组的研究员Chang发明了一种集成了SVM和其它机制的新型学习机。这种提出的系统能够识别中国人的手写数字和字符,这表明他们已经取得了更好的时机[2]。 Abdul Rahim Ahmed开发了一种混合SVM / HMM的OHR模型,使用IRONOFF,UNIPEN和IRONOFF-UNIPEN数据集,用于在线和离线字符识别,他开发了一个模型[3],为样本字符中的每一个在线信
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。