图像识别技术综述Word文件下载.docx
《图像识别技术综述Word文件下载.docx》由会员分享,可在线阅读,更多相关《图像识别技术综述Word文件下载.docx(11页珍藏版)》请在冰豆网上搜索。
![图像识别技术综述Word文件下载.docx](https://file1.bdocx.com/fileroot1/2022-11/16/523233f2-67ba-44f2-96d4-170dc0998adb/523233f2-67ba-44f2-96d4-170dc0998adb1.gif)
人脸、指纹识别技术实现处理与个人有关的一切事物,利用视觉自动监视系统监视环境中发生的非常事件,利用字符识别技术实现文档图像的自动录入与处理。
因此把传统的图像处理技术与模式识别处理技术相结合是图像处理的新趋势。
2传统的图像处理技术
图像处理技术始于20世纪50年代,1964年美国喷射推进实验室(JPL)使用计算机对太空船送回的大批月球照片处理后得到了清晰逼真的图像,这是这门技术发展的里程碑,此后这门技术得到了广泛的发展。
传统图像处理技术包含图像的获取、变换、增强、编码、分割等方面的内容。
2.1图像获取
图像可以根据其形式或产生方法来分类。
图1图像的分类
图像的获取[4]是指将其变为计算机可识别的信息。
通常是数字化的过程,及扫描、采样、量化三个步骤。
经过数字化过程后就得到了一幅图的数字表示,即数字图像。
一般这个过程由摄像头等设备完成。
反过来还可将数字图像进行显示。
2.2图像变换
图像变换[6]广泛应用于图像滤波[2]、统计滤波[5]、图像数据压缩以及图像描述等。
图像变换是将N×
N维空间图像数据变换成另外一组基向量(通常是正交向量空间)的坐标参数,我们希望这些离散图像信号坐标参数更集中代表了图像中的有效信息,或者是更便于达到某种处理目的。
通常采用的方法有:
傅里叶变换、相关分析、小波变换[7]、离散余弦变换(DCT)、正弦变换、沃尔什-哈达玛变换、K-L变换[13][14][15](主成分分析法)等。
着重介绍K-L变换在实际中的应用算法SIMCA。
SIMCA(SoftIndependenttModelingofClassAnalog)方法是一种有监督模式识别方法。
该方法是对训练集中每一类样本的量测数据矩阵分别进行主成分分析[10][11][12](PCA),建立每一类的主成分分析数学模型,然后在此基础上对未知样本进行分类,即分别试探将该未知样本与各类样本数学模型进行拟合,以确定其属于哪一类或不属于任何一类。
基本的SIMCA方法有两个主要步骤,第一步先建立每一类的主成分分析模型,第二步以未知样本逐一去拟合各类的主成分模型,从而进行判别归类。
主成分提取的原理是对高维的原变量空间进行降维,以消除众多化学信息中相互重叠的信息部分,使数目较少的主成分(新变量)成为原变量的线性组合,而且新变量应最大限度地表征原变量的数据结构特征而不丢失信息。
其方法是将光谱数据向均方差最大方向投影。
通过对主成分个数的合理选取,去掉代表干扰组分和干扰因素的主成分,新变量最大限度地反映了被测样品的组成和结构信息,而最小限度地包含噪音。
另外,主成分之间相互正交,能够克服原变量多重相关性造成的信息重叠。
这样有助于从样品的测量光谱中最大限度地提取有用的化学信息,建立优秀的数学模型。
PCA方法是把光谱矩阵分解为两个维数较小的矩阵的乘积:
其中
为光谱矩阵,
为得分矩阵,
为载荷矩阵,E为光谱残差,维数与
相同。
m为样品数目,p为波长数目,f为PCA主成分个数。
主成分与原变量之间的相关系数称为载荷(Loading)。
载荷表征原始变量与新变量之间的相关性。
样本在新变量下的坐标值称为得分(score)。
经过主成分分析后,常用聚类分析[8]来分析图像。
2.3图像增强
图像增强[9]就是增强图像中的有用信息,其目的主要有两个:
一是改善图像的视觉效果,提高图像成分的清晰度;
二是使图像变得更有利于计算机处理。
图像增强的方法一般分为空间域和变换域两大类。
空间域方法直接对图像像素的灰度进行处理。
变换域方法在图像的某个变换域中对变换系数进行处理,然后通过逆变换获得增强图像。
常用的图像增强方法包括:
空间域单点增强(灰度级修正)、图像平滑、图像锐化、图像滤波与彩色增强等。
2.4图像编码
图像信息已经成为通信和计算机系统中的重要处理对象。
与文字信息不同的是,图像信息占据大量的存储容量,所用传输信道也较宽。
因此对图像数据的压缩成了迫切需求。
由于图像本身固有的冗余性和相关性,使得将一个大的图像数据文件转换成较小的图像数据文件成为可能。
图像压缩[17]不能丢失原始图像的重要信息,衡量压缩性能的指标是客观保真度和主观保真度。
常用的客观保真度可以采用图像的均方根误差ems、信噪比SNR与峰值信噪比PSNR表示。
在相同的压缩比下,均方误差ems越小,性能越好。
在相同均方根误差ems下,压缩比越大,性能越好。
常用的数据编码方法有:
统计编码、预测编码、变换编码、轮廓编码等。
2.5图像分割[16]
在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣。
这些部分常称为目标或前景(其他部分称为背景),它们一般对应图像中特定的、具有独特性质的区域。
为了辨识和分析目标,需要将这些有关区域分离或提取出来,在此基础上才有可能对目标进一步利用,如进行特征提取和测量。
图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。
这些特征可以是灰度、颜色、纹理或几何性质等,目标可以对应单个区域,也可以对应多个区域。
分割出的区域应同时满足:
(1)分割出的图像区域的均匀性和连通性。
均匀性是指该区域中所有像素点都满足基于灰度、纹理、色彩等特征的某种相似性准则,连通性是指该区域内存在连接任意两点的路径。
(2)相邻分割区域之间针对选定的某种差异显著性。
(3)分割区域边界应规整,同时保证边缘的空间定位准确。
基本的分割算法,首先对灰度图像的分割可基于像素灰度值的2个性质:
不连续性和相似性。
区域内的像素一般具有灰度相似性,而区域之间的边界上一般具有灰度不连续性。
所以分割算法可据此分为利用区域间灰度不连续性的基于边界的算法和利用区域内灰度相似性的基于区域的算法。
其次,根据分割过程中处理策略的不同,分割算法又可分为并行算法和串行算法。
在并行算法中,所有判断和决策都可独立地和同时地做出,而在串行算法中早期处理的结果可被其后的处理过程所利用。
一般串行算法所需计算时间常比并行算法长,但抗噪声能力也较强。
这2个准则互不重合又互为补充,所以分割算法根据这2个准则分成四类:
(1)并行边界类;
(2)串行边界类;
(3)并行区域类;
(4)串行区域类。
3图像识别
图像识别,可分为是图像的模式识别,它是模式识别技术在图像领域中的具体运用。
传统图像处理是对输入图像的某种有效的改善,其输出仍是一幅完整的图像,而识别是可认为是认识它而且能从一堆物件中间把它与其他事物区别开来。
3.1判别函数和判决规则
模式识别系统的基本功能是能判别各模式所归属的类型,完成这一功能的重要方法之一是采用判别函数。
判别函数[18]有线性和非线性之分。
3.1.1线性判别函数
线性判别函数是应用较广的一种判别函数。
所谓线性判别函数,是指判别函数是图像所有N个特征量的线性组合。
设它的组合系数为
,则对于M类问题,其任一类i的线性识别函数为
(1)
式中:
代表第i个判别函数,
是系数或权,
为常数或称为阈值。
在
和
两类之间的判决分界处有
,所以边界方程为
(2)
该方程在二维空间是直线,在三维空间是平面,在N维空间是超平面。
可以写成如下形式:
(3)
相应的判决规则为:
如果
,则
;
。
用线性判决函数构造的分类器是线性分类器。
任何m类问题都可以分解为(m-1)个两类识别问题。
方法是先把模式空间分为某一类和其他类的组合,即两两对比,如此进行下去即可实现最终分类。
因此,两类线性分类器是最简单和最基本的。
图2两类的线性分类器
在线性分类器中要找到合适的权值,才能使分类尽可能不出差错,有效地方法就是实验法。
3.1.2最小距离判别函数
在图像识别中,线性分类器一种很重要的方法就是将未知类别的图像和特征空间中作为模板的点(标准样点的中心)之间的距离作为分类的准则。
对于M类模板,未知类别图像与哪一类距离最近就属于哪一类。
这就是最小距离判别函数[8]。
3.1.3非线性判别函数
线性判别函数很简单,但也有缺点,它对于较复杂的分类往往不能胜任。
在较复杂的分类问题中,往往需要提高判别函数的次数,这就有了非线性判别函数。
非线性判别函数可以写成一下形式:
(4)
式(4)是一个二次型判别函数,通常二次型判别函数的决策边界是一个超二次曲面。
3.2特征的提取和选择
在图像识别中,对获得的图像直接进行分类是不现实的。
首先,图像数据占用很大的存储空间,直接进行识别费时费力,其计算量无法接受;
其次,图像中含有许多与识别无关的信息,如图像的背景等,因此必须进行特征的提取和选择,这样的就能对被识别的图像数据进行大量压缩,有利于图像识别。
再次,由于测量上可实现性的限制或经济上的考虑,所获得的测量值为数不多。
在图像识别中良好的特征应具有4个特点:
(1)可区别性。
对于属于不同类别的图像,它们的特征值应具有明显的差异。
(2)可靠性。
对于同类的图像,它们的特征值应比较相近。
(3)独立性。
所使用的各特征值之间应彼此不相关。
(4)数量少。
特征选择和提取的总原则是:
应尽量减少整个识别系统的处理时间和错误识别概率。
当两者无法兼得时,需要人们做出相应的平衡。
要么缩小错误识别的概率。
以提高识别的精度,但会增加系统的运行时间;
要么提高整个系统速度以适应实时需要,但会增加错误识别概率。
这个就要根据系统所使用的场合合理选择,做出最佳平衡效果。
随着科技理论的发展,识别方法有模糊识别方法以及人工神经网络识别方法[19]。
4图像识别系统实例
4.1硬件平台
控制器:
飞思卡尔公司16位单片机MC9S12XS128
摄像头:
数字CMOS摄像头OV7620
4.2整体设计框图
图3图像识别系统整体框图
4.3图像识别算法
本系统使用物体的外形特征来区分物体。
本系统微处理器选择飞思卡尔公司的16位单片机MC9s12xs128,最高总线频率40MHz,这就决定了图像处理算法要尽