一种车牌字符分割新方法.docx
《一种车牌字符分割新方法.docx》由会员分享,可在线阅读,更多相关《一种车牌字符分割新方法.docx(13页珍藏版)》请在冰豆网上搜索。
一种车牌字符分割新方法
一种车牌字符分割新方法
摘要
字符分割是车牌识别系统(LPR)中重要的一步。
在本文中,结合拉普拉斯变换、区域增长和车牌先验知识,提出一种新型的车牌字符分割方法。
在提出的方法中,首先要对车牌进行图像处理,增强车牌上的字符区域。
然后通过拉普拉斯变换检测字符的边缘,并通过区域增长算法定位候选区域的字符。
接着利用车牌的先验知识确定字符分割的区域。
最后,字符就从原始的车牌中分割出来了,然后对字符进行二值化,二值化可以使其在OCR系统中更有效地进行字符识别。
所提出的这种字符分割的方法快速、准确,而且能解决车牌的变形、旋转、框架、铆钉、间隔符等问题。
基于中国的车牌实验已经获得了可喜的成果。
1引言
车牌自动识别系统在交通监控系统中起着重要的作用。
这样的系统,应用在停车场、高速公路、桥梁和隧道中,可以代替人类施工,提高整体服务质量。
在任何要求现场自动控制以及根据车牌号码设别机动车辆的场合都可能是一个潜在的应用程序。
LPR(车牌识别)算法包含三个部分:
车牌定位、字符分割和字符识别。
本文提出了一种新字符分割算法。
有许多因素会给字符分割的任务带来困难,如图像噪声、边框、铆钉、间隔符、车牌旋转和光照不均。
我们的算法使用了拉普拉斯变换、区域增长算法和车牌的先验知识来克服以上困难。
该方法由六个步骤组成:
图像预处理,增强字符区域,字符边缘检测,字符候选区域定位,确定字符分割区域,字符分割和二值化。
直到现在,有些字符分割的工作都已经完成了。
和图像二值化的方法相比,本算法利用信息的强度解决了字符断裂和粘连的问题,这些都是图像二值化的缺陷。
由于使用了拉普拉斯变换、区域增长和先验知识,使得分割较简单的投影方法更加准确和鲁棒性。
实验结果表明,该方法对车牌的字符分割非常有效。
本文的其余部分安排如下:
第二节讨论中国车牌的先验知识,第三节详细介绍算法,第四节显示实验结果,最后的第五节是参考文献。
2中国车牌的先验知识
一个典型的中国车牌如图1所示。
在中国,不同的车辆有不同类型的车牌(LP),如公共汽车和卡车的车牌是黑色和黄色的,轿车和轻型货车的车牌是蓝色和白色的,警车和军事车辆的车牌是黑色、红色和白色的,外交车辆的车牌是黑色和白色的。
众所周知,在同一图像中车牌较其他区域有很多特征。
1)车牌由两种或三种颜色组成;2)车牌的轮廓大小是440×140(毫米),宽度和高度的比大约是3;3)基于车牌的统计,字符的面积大约占整个车牌面积的20%;4)相邻符号的间隔通常是12毫米,第二个和第三个符号的距离是34毫米。
字符的大小是45×90(毫米)。
为了能从车牌中快速、准确地提取字符,这些特征必须要使用到。
图1公共汽车和卡车上使用的车牌
3分割的算法
在该算法中,我们提供了一种车牌定位与提取后从车牌中分割字符的技术。
如图2所示,算法主要有六个步骤:
图像预处理、增强字符区域、字符边缘检测、字符候选区域定位、确定字符分割区域、字符分割与二值化。
3.1预处理
预处理对于成功字符分割非常重要。
我们的预处理包括确定车牌种类与设定车牌中字符高度和宽度的标准值。
3.1.1确定车牌种类
中国车牌有三种:
黄底黑字,蓝底白字和黑底白字。
灰度图像的两种:
白底黑字和黑底白字。
在这两种灰度图像中白色像素与黑色像素数量的比率是完全不同的。
因此,可通过直方图分析是哪一种图像。
我们用后分割算法处理黑底白字的图像。
这样,在预处理中车牌图像的种类就确定了,如果一个车牌图像是白底黑字,那么它的颜色将反转。
图2算法流程图
3.1.2设定车牌中字符高度和宽度的标准值
车牌图像的尺寸大小是影响字符分割准确度的一个重要因素。
不同的车图像是从不同的场景中获得的,这样车牌的尺寸大小就不同。
为了能从车牌中准确的得到字符,必须计算字符高度和宽度的标准值。
从第二节中我们得知,车牌外形尺寸是440×140(毫米),字符的尺寸是45×90(毫米)。
因此字符高度和宽度的标准值可以通过公式1和公式2计算出来,其中char_width是字符的宽度,char_height是字符的高度,m和n分别是实际车牌的宽度和高度。
char_width=(45/440)*n=0.1n
(1)
char_height=(90/140)*m=0.643m
(2)
3.2增强字符区域
车牌图像的质量对我们获得的数据影响很大。
光照不均和噪声使字符分割变得困难。
因此必须通过增强图像来改善图像质量。
我们都知道,直方图均衡化和灰度级尺度是图像增强中使用最广泛的方法,在这本文用精确的方法来增强车牌图像。
增强算法包括两个步骤。
首先,计算出每个车牌灰度级密度,阈值的密度也可以得到。
其次,对原车牌进行对比度拉伸变换,增强预处理车牌中字符灰度级质量。
3.2.1计算车牌的灰度级密度
车牌灰度级密度可以通过计算同样灰度级像素的数量得到。
具体操作见公式3,原车牌和灰度级密度分别如图3和图4所示。
在公式3中grayA是灰度级密度,A(i,j)是由横坐标i和纵坐标j组成的像素的灰度级。
grayA(1,A(i,j)+1)=grayA(1,A(i,j)+1)+1(3)
图3原始图像
图4灰度级密度
在这个算法中灰度级密度的阈值是平均密度,可通过公式4计算得到。
threshold=(m*n)/256(4)
3.2.2对比度拉伸变换
对比度拉伸变换最一种最简单的分段线性函数。
对比度拉伸的思想是增加预处理图像灰度级的动态范围。
本变换可以描述如下:
首先,在灰度级密度中找出最大和最小灰度级,以及大于阈值的密度。
然后,将灰度级密度值比最大值大的设置为255,灰度级密度值比最小值小的设置为0,其他的通过公式5计算得到,其中B是增强后的车牌,A是原始车牌,min和max分别是灰度级密度大于阈值的最小值和最大值。
原始车牌经过增强后如图5所示。
B(i,j)=((A(i,j)−min)/(max−min))*255(5)
图5增强后的车牌
3.3字符边缘检测
边缘是图像的基本特征。
边缘检测在图像处理中起着重要的作用,可明确不同灰度等级间的区域边界。
在本文中在拉普拉斯变换用于字符的边缘检测。
拉普拉斯变换的主要原则是使用3×3的拉普拉斯算子乘以一个从车牌图像中得到的3×3区域。
乘法的结果保存为3×3区域中间的像素值。
在对整个车牌区域应用拉普拉斯变换后,一些规则用于去除伪边缘。
3×3的拉普拉斯算子如图6所示,经拉普拉斯变换后的车牌如图7所示。
图6拉普拉斯算子
图7经拉普拉斯变换后的车牌
3.4字符候选区域定位
区域增长是一个基于预定义的标准,用于将像素集合或分区域分成较大区域的程序。
其基本方法是从一组“种子”点出发,附加到每个相邻像素性质类似的种子(如灰度等级和颜色的特殊范围)构成这些增长区域。
在我们的算法中,我们希望利用区域增长分割如图7所示的车牌字符区域。
首先要做的是确定初始种子点。
在这种应用中,众所周知的是,字符的像素往往有允许的最大数字值(255在这种情况中)。
根据这些信息,我们选定所有像素值是255的点为出发点。
接下来为增长区域选择标准,。
在该算法中,我们为附加区域的像素选择标准,该像素必须至少连接到这个区域中的一个像素。
如果一个像素连接到一个以上的区域,就合并该区域。
图8展示了从图7的种子出发受影响的区域,运用了上一段中定义的标准。
原始图像区域中的白色长方形显示,在一个可接受的准确度内区域增长程序确实分割了字符。
图8区域增长后的车牌
考虑到光照不均的影响、背景噪声等,区域生长算法可能会产生虚假的字符候选区域。
所以我们必须采用3.1.2中计算的字符高度和宽度的标准值处理候选区域。
如果一个区域的宽度或高度值太大或太小,该区域将被删除。
如果高宽比率太大或太小,该区域也将被删除。
经选择后的字符候选区域如图9所示。
图9经选择后的字符候选区域
3.5确定字符分割区域
由于在区域增长过程中多个字符可能粘合在一起或一个字符可能被分在多个区域中,并在选择候选区域的过程中一些字符区域可能会被删除,如字符“1”,必须运用一些车牌的先验知识调整字符地区,确保对字符分割区域正确精确地定位。
根据车牌的先验知识,字符的尺寸是45×90(毫米),相邻字符的间隔通常是12毫米,第二个和第三个字符的间隔是34毫米。
此外,从第一个字符到左边界或最后一个字符到右边界的长度是25毫米。
在我们的算法,通过计算所有候选区域的平均宽度来重新计算字符的宽度aver_width,相邻字符的间隔是0.27*aver_width,第二个和第三个字符的间隔是0.76*aver_width,从第一个字符到左边界或最后一个字符到右边界的距离是0.56*aver_width,其中,0.27=12/45,0.76=34/45,0.56=25/45。
从图9可以看出,一个白色矩形代表一个候选区域的字符,这个字符可以在位置矩形边框的上、下、左、右方。
所以我们可以使用边界的左、右位置调整字符区域。
首先,要分裂有一个以上字符的部分区域,所有候选区域按照左边界的位置进行降序排列,该区域比左边界较小的数要大。
因为一个车牌有七个字符,位置编号从1到7,我们要确保数第一候选区域的位置。
如果它的位置编号数值小于7,我们要运用车牌的先验知识确定从下一个位置编号到7的区域。
例如,如果位置的编号是5,我们应该利用先验知识确定区域6和7的位置。
然后我们比较第一候选区域的左边位置与第二候选区域的右边位置。
如果差异大于t*1.2*aver_width,那么两个候选区域间的字符就是t,其中aver_width是所有候选区域的平均宽度,t是从0到5之间的一个数。
如果t大于0,我们应该运用车牌的先验知识将t附加到字符之间,并将第二候选区域设置为7-t-1,否则设置为6。
就像这个例子我们可以处理从3号到最后的候选区域。
最后,我们调整1号候选区域的左侧位置。
如果位置的数值是负的,它应该被重置1。
经过调整后,就可以从原始图像中得到如图10所示的准确的字符分割区域,其中白色的矩形表示字符区域。
图10准确的字符分割区域
3.6字符分割与二值化
通过上述步骤,我们可以得到字符分割区域的准确位置。
根据这些位置,我们可以从原始车牌中准确的提取字符。
由于从原始车牌中提取的字符对比度非常低,为了得到更高的对比度必须提高字符的灰度等级,就像公示6所示的那样。
在公示6中字符分割图像的像素有阈值,char(x,y,i)代表位置编号为i的字符分割图像,char’(x,y,i)代表位置编号为i的二值化字符分割图像,i从1到7变化。
二值化的字符图像从如图11所示的车牌中得到。
图11二值化的字符图像
4实验结果
我们将上述算法应用在我们汽车车牌的数据库中,所有这些真实场景图像都是通过CCD相机获得的。
这些图像中不同条件下都有车,车牌可能有变形、旋转、边框、铆钉、反色等问题。
图12显示了一些实验的测试图像。
在图像中(a)、(b)、(c)、(d)、(e)分别是有变形、旋转、边框、铆钉和反色问题的白底黑字原始车牌。
(a1)、(b1)、(c1)、(d1)和(e1)分别是(a)、(b)、(c)、(d)和(e)图像的增强。
(a2)、(b2)、(c2)、(d2)和(e2)分别是图像(a1)、(b1)、(c1)、(d1)和(e1)区域增长后的图像。
(a3)、(b3)、(c3)、(d3)和(e3)分别是图像(a)、(b)、(c)、(d)和(e)最终的字符分割区域。
(a4)、(b4)、(c4)、(d4)和(e4)分别是从(a)、(b)、(c)、(d)和(e)中得到的字符图像。
表1显示了我们的实验结果。
从表中我们可以看到,在大多数情况下,字符都可以从车牌中有效地分割出来。
表1字符分割算法应用于实时图像数据库的结果
所有的图像
分割成功的图像
分割失败的图像
320
311
9
%
97.2%
2.8%
(a)
(b)
(c)
(d)
(e)
(a1)
(b1)
(c1)
(d1)
(e1)
(a2)
(b2)
(c2)
(d2)
(e2)
(a3)
(b3)
(c3)
(d3)
(e3)
(a4)
(b4)
(c4)
(d4)
(e4)
从实验结果可以看出,该方法可以很好地分割车牌字符,虽然有时候会出错。
由于缺乏其他国家车牌的先验知识,目前,该方法只适用于提取中国车牌的字符。
在未来,我们将进一步研究特征提取的规则,并使该方法能鲁棒性地提取各种字符。
由于处理的结果在字符包围盒中以黑底白字的格式输出,他们可以直接输入OCR来用于识别。
5总结
本文提出的算法可以准确地对车牌图像进行字符分割。
预处理能将各种车牌归一化为黑底白字的车牌。
增强字符区域能够提高分割的准确度。
字符分割算法结合拉普拉斯变换、区域增长和先验知识识能够快速而准确的确定字符区域,去除车牌变形、旋转、边框、铆钉等的影响。
最后,字符被分割和二值化为适用于在OCR系统中进行识别。
但仍有一些问题需要做进一步研究。
例如,这种方法不能对没有先验知识的车牌进行字符分割。
这些问题在以后的工作中将得到解决。
参考文献
[1]曹迪铭,宣国荣.牌照字符分割中的区域分裂与合并.计算机工程,2000,10
[2]H.-M.Suen,etal.Segmentationofuniformcolouredtextfromcolourgraphicbackground.IEEProc.-Vis.ImageSignalProcessing.1997,144(6):
317-322
[3]J.Barroso,A.Rafel,E.L.DaglessandJ.BulasCruz.Numberplatereadingusingcomputervision.IEEEInternationalSymposiumonIndustrialElectronicsISIE’97,UniversidadedoMinho,Guimaraes,Portugal,Julho,1997.
[4]牛欣,沈兰荪.基于车牌识别技术的研究.测量控制技术,1999,12
[5]H.Fujisawa,etal.Informationcapturingcameraanddevelopmentalissues.Proc.5thInt.Conf.DocumentAnalysisandRecognition.1999,205-208
[6]Y.Watanalbe,etal.Translationcamera.Proc.14thInt.conf.PatternRecognition.1998,613-617
[7]Y.Zhang,etal.Locatingtextincomplexcolorimages.PatternRecognition.28(10):
1523-1536,1995.
[8]C.-M.Lee,etal.Automaticextractionofcharactersincomplexsceneimages.InternationalJournalofPatternRecognitionandArtificialIntelligence.9
(1):
67-82,1995.
[9]中国人民共和国公共安全行业标准,中国人民共和国机动车号牌,GA36-92
[10]RafaelC.Gonzalez,RichardE.Woods,DigitalImageProcessing(Prentice-HallInc,2002).