基于MATLAB的字符识别研究Word下载.docx
《基于MATLAB的字符识别研究Word下载.docx》由会员分享,可在线阅读,更多相关《基于MATLAB的字符识别研究Word下载.docx(21页珍藏版)》请在冰豆网上搜索。
对图像进行灰度化处理、边缘提取、再利用形态学方法对车牌进行定位。
具体步骤如下:
首先对图像进行灰度转换,二值化处理然后采用4X1的结构元素对图像进行腐蚀,去除图像的噪声。
采用25X25的结构元素,对图像进行闭合应算使车牌所在的区域形成连通。
再进行形态学滤波去除其它区域。
I=imread('
CAR/0.jpg'
);
%读取图片
I1=rgb2gray(I);
%转化为灰度图像
I2=edge(I1,'
robert'
0.09,'
both'
%采用robert算子进行边缘检测
se=[1;
1;
1];
%线型结构元素
I3=imerode(I2,se);
%腐蚀图像
se=strel('
rectangle'
[25,25]);
%矩形结构元素
I4=imclose(I3,se);
%图像聚类、填充图像
I5=bwareaopen(I4,2000);
%去除聚团灰度值小于2000的部分
通过对比原始图片,我们可以发现形态滤波后的图像已经很接近正确的车牌位置了,因此后期处理将通过这张图来找出车牌位置。
3.车牌定位
观察经过预处理后得到的图像发现车牌位置有明显的矩形有明显的矩形图样,通过对矩形区域的定位即可获得具体的车牌位置。
(1)车牌的行起始和终止位置的确定
[y,x,]=size(I5);
I6=double(I5);
%绘制行曲线图
Y1=zeros(y,1);
fori=1:
y
forj=1:
x
if(I6(i,j,1)==1)
Y1(i,1)=Y1(i,1)+1;
end
end
figure();
subplot(1,3,1);
plot(0:
y-1,Y1),title('
行像素灰度值累计'
),xlabel('
行值'
),ylabel('
像素和'
[temp,MaxY]=max(Y1);
PY1=MaxY;
while((Y1(PY1,1)>
=80)&
&
(PY1>
1))
PY1=PY1-7;
PY2=MaxY;
while((Y1(PY2,1)>
(PY2<
y))
PY2=PY2+7;
(2)车牌的列起始位置和终止位置的确定
%绘制列曲线图
X1=zeros(1,x);
forj=1:
fori=PY1:
PY2
X1(1,j)=X1(1,j)+1;
subplot(1,3,2);
x-1,X1),title('
列像素灰度值累计'
列值'
像数和'
PX1=1;
while((X1(1,PX1)<
3)&
(PX1<
x))
PX1=PX1+7;
PX2=x;
while((X1(1,PX2)<
(PX2>
PX1))
PX2=PX2-7;
(3)最后拼合获取的车牌在图像的行列位置
DW=I(PY1:
PY2,PX1:
PX2,:
subplot(1,3,3);
imshow(DW),title('
车牌定位后图像'
4.字符分割
在汽车牌照自动识别过程中,字符分割有承前启后的作用。
它在前期牌照定位的基础上进行字符的分割,然后再利用分割的结果进行字符识别。
%%车牌图像转为灰度
ifisrgb(I)
I1=rgb2gray(I);
else
I1=I;
%%二值化车牌图像
I1=im2bw(I1,graythresh(I1));
%二值化图像
I2=bwareaopen(I1,16);
%去除小于16像素的区块
subplot(1,2,1);
imshow(I2),title('
二值化车牌图像'
%%分割字符按行积累量
[y,x]=size(I2);
I3=double(I2);
fori=1:
if(I3(i,j,1)==1)
subplot(1,2,2);
车牌列像素点累计'
%%分割字符
Px0=1;
Px1=1;
7
while((X1(1,Px0)<
(Px0<
Px0=Px0+1;
Px1=Px0;
while(((X1(1,Px1)>
=3)&
(Px1<
x))||((Px1-Px0)<
10))
Px1=Px1+1;
Z=I2(:
Px0:
Px1,:
switchstrcat('
Z'
num2str(i))
case'
Z1'
PIN0=Z;
Z2'
PIN1=Z;
Z3'
PIN2=Z;
Z4'
PIN3=Z;
Z5'
PIN4=Z;
Z6'
PIN5=Z;
otherwise
PIN6=Z;
subplot(1,7,i);
imshow(Z);
Px0=Px1;
分割成七块后的车牌图像
5.建立字符模板数据库
模板库的合理建造是字符识别准确的关键之一,所以在字符识别之前必须把模板库设置好。
汽车牌照的字符一般有7个,大部分车牌第一位是汉字,通常代表车辆所属省份,或是军种警别等有特定含义的字符简称;
紧接其后的为字母与数字。
车牌字符识别与一般文字识别在于它的字符数有限,十个阿拉伯数字0~9,26个大写英文字母A~Z以及相关的车牌用汉字:
京、沪、苏、台、港、澳、甲、乙、丙、使、领、学、试、境、消、边、警等,以及新式军牌中的汉字南、兰、广、北、沈、济、空、海等;
车牌颜色:
蓝、白、黑、黄等。
所以建立字符模板库也极为方便。
通过前面实验获取的几幅不同的车牌图片截取到的图片加上使用PhotoShop制作的部分图片如下:
建立模板数据库时必须对这些图片进行统一处理,因为对前面处理分割后的车牌图像的测量得知单个字符的最佳宽高比是1:
2,所以将这些图片归一化为50×
25大小;
因为之后的字符识别考虑使用神经网络算法进行字符识别,所以再将上面归一化后的模板图像的样本排列在一起构成1250×
18的矩阵样本,程序设计如下:
functioninpt=Pretreatment(I)
%%训练样本前期处理
I1=I;
I1=imresize(I1,[5025]);
%将图片统一划为50*25大小
I1=im2bw(I1,0.9);
[m,n]=size(I1);
inpt=zeros(1,m*n);
%%将图像按列转换成一个行向量
n
m
inpt(1,m*(j-1)+i)=I1(i,j);
这是一个自定义函数的Pretreatment.m文件,可以解决频繁写重复代码的问题,前面的图像预处理及车牌定位的代码可以写进Location.m文件中,通过代码DW=Location(I);
取得车牌定位后的图像;
同时字符分割的代码亦可写进StringSplit.m文件中,可以通过代码[PIN0,PIN1,PIN2,PIN3,PIN4,PIN5,PIN6]=StringSplit(DW);
取得的字符分割后的图像。
6.字符识别
字符的识别目前用于车牌字符识别(OCR)中的算法主要有基于模板匹配的OCR算法以及基于人工神经网络的OCR算法。
基于模板匹配的OCR的基本过程是:
首先对待识别字符进行二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选最佳匹配作为结果。
用人工神经网络进行字符识别主要有两种方法:
一种方法是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。
识别效果与字符特征的提取有关,而字符特征提取往往比较耗时。
因此,字符特征的提取就成为研究的关键。
另一种方法则充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。
本文主要研究基于人工神经网络的方法来识别车牌字符。
设计代码如下:
closeall;
clearall;
%%归一化训练样本
I0=pretreatment(imread('
BP/0.jpg'
));
I1=pretreatment(imread('
BP/1.jpg'
I2=pretreatment(imread('
BP/2.jpg'
I3=pretreatment(imread('
BP/3.jpg'
I4=pretreatment(imread('
BP/4.jpg'
I5=pretreatment(imread('
BP/5.jpg'
I6=pretreatment(imread('
BP/6.jpg'
I7=pretreatment(imread('
BP/7.jpg'
I8=pretreatment(imread('
BP/8.jpg'
I9=pretreatment(imread('
BP/9.jpg'
I10=pretreatment(imread('
BP/A.jpg'
I11=pretreatment(imread('
BP/B.jpg'
I12=pretreatment(imread('
BP/C.jpg'
I13=pretreatment(imread('
BP/D.jpg'
I14=pretreatment(imread('
BP/G.jpg'
I15=pretreatment(imread('
BP/K.jpg'
I16=pretreatment(imread('
BP/L.jpg'
I17=pretreatment(imread('
BP/M.jpg'
P=[I0'
I1'
I2'
I3'
I4'
I5'
I6'
I7'
I8'
I9'
I10'
I11'
I12'
I13'
I14'
I15'
I16'
I17'
];
T=eye(18,18);
%输出样本
%%bp神经网络参数设置
net=newff(minmax(P),[1250,32,18],{'
logsig'
'
},'
trainrp'
net.inputWeights{1,1}.initFcn='
randnr'
;
net.layerWeights{2,1}.initFcn='
net.trainparam.epochs=5000;
net.trainparam.show=50;
%net.trainparam.lr=0.003;
net.trainparam.goal=0.0000000001;
net=init(net);
[net,tr]=train(net,P,T);
%训练样本
%%测试
DW=Location(I);
%车牌定位
[PIN0,PIN1,PIN2,PIN3,PIN4,PIN5,PIN6]=StringSplit(DW);
%字符分割及处理
%%测试字符,得到识别数值
PIN0=pretreatment(PIN0);
PIN1=pretreatment(PIN1);
PIN2=pretreatment(PIN2);
PIN3=pretreatment(PIN3);
PIN4=pretreatment(PIN4);
PIN5=pretreatment(PIN5);
PIN6=pretreatment(PIN6);
P0=[PIN0'
PIN1'
PIN2'
PIN3'
PIN4'
PIN5'
PIN6'
fori=2:
T0=sim(net,P0(:
i));
T1=compet(T0);
d=find(T1==1)-1;
if(d==10)
str='
A'
elseif(d==11)
B'
elseif(d==12)
C'
elseif(d==13)
D'
elseif(d==14)
G'
elseif(d==15)
K'
elseif(d==16)
L'
elseif(d==17)
M'
elseif(d==0)
0'
elseif(d==1)
1'
elseif(d==2)
2'
elseif(d==3)
3'
elseif(d==4)
4'
elseif(d==5)
5'
elseif(d==6)
6'
elseif(d==7)
7'
elseif(d==8)
8'
elseif(d==9)
9'
else
str=num2str(d);
switchi
case2
str2=str;
case3
str3=str;
case4
str4=str;
case5
str5=str;
case6
str6=str;
str7=str;
%%识别出的结果以标题形式显示在图上
S=strcat('
粤'
str2,str3,str4,str5,str6,str7);
imshow(DW),title(S);
第一次训练后识别出的车牌号码:
发现第二个字符识别错误,在进行第二次识别:
可以看出完成了准确识别车牌的目的。
三、总结
在汽车车牌识别的整个过程中,查找了很多资料,综合了各方面的信息。
车牌实现的每一步都有许多的方法,各种方法都有其优劣,但是对于具体的图像处理,并不是每一种理论在实践中都可以实现,即使实现了也很难说哪一种方法最合适,还得在具体的实验中比较选择。
第二点在程序调试的过程中要耐心的检查每一个错误。
测试结果表明,本设计有以下几条优点:
(1)充分利用MATLAB中已有的函数库,使整个程序设计简单易行;
(2)使用了MATLAB的自定义函数功能,使程序设计更简洁。
但也发现了更多的缺点:
(1)程序的局限性:
只能针对图像中一辆汽车的牌照进行识别;
对于图像内的元素较复杂的照片可能无法进行识别。
(2)神经网络的训练要花费30秒以上的训练时间才能进行下一步的字符识别,效率太慢。
(3)程序可能会受软件环境的影响识别准确性,据测试,MATLAB的2010a版比2009a版识别效率高,准确性也高点。
车牌识别程序设计能够得以顺利完成。
在很大程度上得利于MATLAB这套软件,MATLAB功能强大,它包括数值计算和符号计算,并且计算结果和编程可视化。
这为编程调试创造了一个便利的环境。
作为图像处理最适用的工具之一,其突出的特点是它包含一个图像处理工具包,这个工具包由一系列支持图像处理操作的函数组成。
所支持的图像处理操作有:
图像的几何操作、邻域和区域操作、图像变换、图像恢复与增强、线性滤波和滤波器设计、变换(DCT变换等)、图像分析和统计、二值图像操作等。
在图像的显示方面,MATLAB提供了图像文件读入函数imread(),用来读取如:
bmp、tif、jpg、pcx、tiff、jpeg、hdf、xwd等格式图像文件;
图像写出函数imwrite(),还有图像显示函数image()、imshow()等等。
这些,都使编程效率大为提高。