罐底字符分割与识别Word文件下载.docx
《罐底字符分割与识别Word文件下载.docx》由会员分享,可在线阅读,更多相关《罐底字符分割与识别Word文件下载.docx(11页珍藏版)》请在冰豆网上搜索。
摘要:
罐底字符的识别在工业上有较为广阔的应用。
本文首先介绍罐底字符分割与识别的硬件系统的搭建;
然后详细介绍了对于罐底字符图片的预处理过程,并且通过垂直投影的方式确定字符区域的边界以及罐底字符的投影块;
最后利用模板匹配的方式找到与字符块最接近的模板,从而完成字符的识别。
实验结果表明,该方法能够有效分割出罐底图像中的字符并完成识别。
关键词:
字符分割;
模板匹配;
模式识别
引言
在易拉罐生产过程中,产品质量的控制往往需要对产品信息进行检测、追踪,喷码字符就是目前厂商通常记录产品信息的重要手段。
因此通过对喷码字符的识别,可以得到该批次产品的信息,是保证产品质量的重要手段。
本文采用固定阈值方法将图像二值化,并通过腐蚀和膨胀等形态学操作得到较为清晰的字符。
再利用垂直投影法找到字符区域的边界以及罐底字符的投影块;
最后利用利用模板匹配的方式找到与字符块最接近的模板,从而完成字符的识别。
实验结果表明,该方法能够较好地分割出罐底图像中的字符并完成识别。
1系统搭建
1.1光源部分
易拉罐底字符是喷码字符,在灰度上和罐底有明显的差异,使用的易拉罐是平底的易拉罐,直接采用手机的LED灯光容易造成局部曝光过度,因此选择用A4纸遮挡手机LED灯,产生较为均匀的面光源,避免了过度曝光的问题,同时背景噪声较少。
1.2摄像机部分
易拉罐罐底直径大约是30mm左右,字符单个喷码大约是0.1mm×
0.1mm左右,因此可以假设系统要求的分辨率为0.1mm,相机的视场范围至少为60mm×
60mm,相机横纵最小像素为60mm/0.1mm=600pixel,那么相机分辨率至少应该在1024×
768以上,像元尺寸4.65μm,靶面尺寸1/3″,因实验条件限制,采用2600万像素的手机相机代替工业相机。
1.3镜头部分
镜头分辨率=1000/(4×
4.65)=78lp/mm;
放大倍数=4.65μm/0.1m=0.465;
焦距=100×
0.465/(0.465+1)=32mm(假设工作距离为100mm);
因此可以确定采用1/3″,焦距为35mm,分辨率为80左右的镜头,本文使用手机相机自带镜头代替。
1.4图像处理系统:
采用PC端设计算法,编程环境为MATLAB2014。
1.5软件系统
软件系统的总流程图如图2-1所示:
图11算法流程图
2预处理
在图像采集过程中,由于摄像机或照相机等输入仪器因素影响,使得图像的质量与实际情况有一定的差距。
同时可能存在获取的图像含有人们不感兴趣的信息这些情况,因而在进行三维形状的恢复时首先应该对图像做预处理。
本文中采取的预处理主要有一下几种:
彩色图像灰度转换处理、图像平滑处理、二值化、图像形态学操作。
2.1彩色图像灰度转换
目前一般摄像器材从外界的客观事物获取所得的图像大部分都是彩色的,不能直接从中获取图像中像素点的灰度值,因此要涉及彩色图像转换为灰度图像的过程。
一幅数字图像由有限个像素组成,每个像素都具有两种特征即空间特征和颜色特征。
通常像素采用二维矩阵的形式来描述。
用矩阵元素的行列表示像素点的空间位置,用数值或向量来表示像素的颜色信息。
对于灰度图像来说,可以采用以下的二维矩阵来表示:
其中,
代表图像中第x行、第y列的像素,m,n分别为整幅图像像素点阵的行列数。
而目前大部分彩色图像采用RGB颜色模型。
RGB模型如图2-2所示
图21RGB模型
RGB模型由红色、绿色、蓝色这三原色的光谱分量按照一定的比例调和组成,在RGB颜色模型下,一幅彩色数字图像是所有构成图像的像素的集合,并且集合中所有像素的颜色都是RGB三颜色混合而成。
在RGB颜色模型下,彩色图像
用一个三维向量来描述:
表示像素空间位置
的颜色值,
分别表示该位置点的红、绿、蓝(RGB)三种颜色分量值。
在本文中,将直接使用matlab自带的函数rgb2gray函数来将彩色图像转化为灰度图像。
得到的结果如图2-3:
图22彩色图像和灰度图像
2.2图像平滑处理及二值化
由于不相关因素的干扰,采集的图像在计算机处理过程中与实际图像相比总是出现噪声污染、形态失真等图像质量的退化,这就需要采取一定的措施来消除。
图像平滑处理能够很好的解决这一问题,使图像在进入计算机处理时保持很好的质量以便更好的进行图像处理。
一幅数字图像
的任一点的平面坐标为
,对该点进行
掩模处理,该点得到的一个新的结果
,用公式表示为:
依此对图像逐点进行掩模处理,以达到减弱或消除图像的高频分量,而又不影响到图像的低频分量,进而达到滤除噪声使图像平滑。
其典型的滤波器有邻域均值滤波器、中值滤波器、高斯滤波器等。
其中高斯滤波器相较于其他两种滤波器来说平滑效果更柔和,而且边缘保留的也更好。
所谓高斯滤波器,就是利用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。
而二值化就是设定一个阈值,使得图像灰度高于阈值的点全部为白色,而低于阈值的点全部为黑色,即
在本文中,对灰度图像采用3×
3,
的高斯模板进行高斯滤波,去除毛刺,再将高斯滤波过后的图像二值化并翻转,便于之后的处理过程。
处理结果如图2-4:
图23高斯滤波和二值化后的图像
2.3图像形态学
数学形态学图像处理是以几何学为基础,着重研究图像的几何结构。
其基本思想是,用具有一定形态的结构元素去度量和提取图像中对应的形状以达到对图像进行分析与识别的目的。
二值腐蚀与膨胀是最基本的形态学运算,它们互为对偶运算。
对图像作腐蚀,就是把图像中相当于结构元素的部分缩为结构元素的中心点。
而对图像进行膨胀运算,是把图像上每一点扩大为结构元素。
A和B是两个集合,A被B膨胀定义为
A
B=
A被B腐蚀定义为
由于细小的喷码中间有不连续的地方,因此先采用形态学中的全方位膨胀,连接喷码点不连续的地方,再进行全方位的腐蚀,恢复被膨胀扩大的边界。
形态学运算后的结果如图2-5:
图24膨胀和腐蚀后的图像
经过上述预处理步骤之后,便可以对字符区域进行提取和字符的分割。
3字符分割
3.1字符区域提取
利用投影法初步定位字符区域,将图像分别对水平方向和数字方向进行投影(找到白色像素点在x方向上和y方向上进行线性积分),其投影结果如图2-6所示。
图31X与Y方向上的投影
将白色像素集中的区域分割出来,这块区域就是字符所在区域,如图2-7所示:
图32字符区域
可以看出字符区域共有两行,且基本按Y方向的中线分行,因此从Y中点将图像分开分别进行字符分割。
3.2字符分割
利用垂直投影法分别对两行字符进行分割。
将图像在垂直方向投影可的下图2-8:
图33第一行和第二行字符的垂直投影
由图3-3可以看出,各个字符之间的分段较为明显,因此可以通过检测不为0的投影区域来确定垂直分割字符的分割线。
分割之后的字符大小不一,因此通过归一化得到统一大小的字符,并存入硬盘中,便于下一步的字符识别。
归一化后的字符如图2-4所示:
图34归一化后的分割字符
4模板匹配
字符识别的方法有很多种,限于字符样本的数量,本文采用模板匹配法。
即计算样本与模板之间的距离,取与样本距离最小的模板作为识别字符的最终结果。
距离计算采用欧式距离:
其中𝑥
𝑖
𝑗
是原图像中像素点的灰度值,𝑥
’𝑖
是模板中像素点的灰度值。
通过与模板进行匹配比较,得到的识别结果如图4-1所示:
图41识别结果
同时在Matlab命令行输出结果:
Recognized_Char=
20160906UHM10101A
图4-2是另一幅罐底图像的识别结果:
图42另一识别结果
20160823UHM10321C
5实验结果分析
由上一章的实验结果来看,该方法可以有效分割罐底字符,得到归一化的字符图像,在识别过程中对于数字的识别正确率也较高,没有出现错误。
但在识别字母字符“W”时两次都出现,将其识别成了“U”。
原因可能是在归一化的过程中字符发生了变形,另一种可能是样本是喷码字体,而模板则是打印字体,两者之间的本身的区别造成了匹配准确度不高。
此外,该方法还可以添加倾斜校正环节,这样对于拍摄的图片要求更宽松,从而获得更大的应用范围。
参考文献
[1]南阳,白瑞林,吉峰.易拉罐喷码字符在线视觉检测[J].光学技术,2015,(06):
489-493.
[2]唐慧.基于机器视觉技术的易拉罐罐底喷码检测系统设计[J].自动化博览,2012,(07):
48-50.
[3]冉令峰.基于垂直投影的车牌字符分割方法[J].通信技术,2012,(04):
89-91+98.
[4]熊馨,赵建军.基于图像形态学的棉花异纤识别算法[J].机械科学与技术,2009,(01):
121-123.
[5]田娟,郑郁正.模板匹配技术在图像识别中的应用[J].传感器与微系统,2008,(01):
112-114+117.
[6]黄涛.模板匹配在图像识别中的应用[J].云南大学学报(自然科学版),2005,(S2):
327-332.