树叶分类数字图像处理在树叶识别中的应用.docx

资源描述

树叶分类数字图像处理在树叶识别中的应用.docx

《树叶分类数字图像处理在树叶识别中的应用.docx》由会员分享，可在线阅读，更多相关《树叶分类数字图像处理在树叶识别中的应用.docx（16页珍藏版）》请在冰豆网上搜索。

树叶分类数字图像处理在树叶识别中的应用.docx

树叶分类数字图像处理在树叶识别中的应用

数字图像处理研究报告

数字图像处理在树叶识别中的应用

侯杰：

土木系

侯晓鹏：

林科院

苏东川：

航院

张伟：

精仪

指导教师：

马慧敏教授

日期：

2007.12.30

数字图像处理在树叶识别中的应用

一、课题意义及背景

1课题背景

植物的识别与分类对于区分植物种类，探索植物间的亲缘关系，阐明植物系统的进化规律具有重要意义。

因此植物分类学是植物科学乃至整个生命科学的基础学科。

然而，由于学科发展和社会等原因，全世界范围内目前从事经典分类（即传统的形态分类）的人数急剧下降，且呈现出明显的老龄化趋势，后继乏人，分类学已经成为一个“濒危学科”（Buyck,1999）。

这不仅对于植物分类学本身，而且对整个植物科学和国民经济的发展带来重大的不利影响。

目前植物识别和分类主要由人工完成。

然而地球上仅为人所知的有花植物就有大约25万种，面对如此庞大的植物世界，任何一个植物学家都不可能知道所有的物种和名称，这就给进一步的研究带来了困难。

在信息化的今天，我们提出的一种解决方案是：

建立计算机化的植物识别系统，即利用计算机及相关技术对植物进行识别和管理[1]。

2课题意义[2-3]

（1）人工进行植物叶形的分类难度很大。

这种传统的判别方法要求操作者具有丰富的分类学知识和长期的实践经验,才能开展工作。

要做到准确和快速地识别手中的植物是非常困难。

并且相应人才极为短缺。

（2）仅为人所知的有花植物就有大约25万种，面对如此庞大的植物世界，任何一个植物学家都不可能知道所有的物种和名称。

建立植物识别系统和数据库十分必要。

（3）植物学研究人员在野外考察时,时常需要获取植物叶片面积等参数。

（4）叶子面积大小对植物的生长发育、作物产量以及栽培管理都具有十分重要的意义。

因此，基于计算机图像处理识别技术的树叶图像识别技术对于植物学，农业科学等都具有重大意义。

二、相关理论综述

1图像预处理

（1）边缘检测[4]

图像的边缘是指图像局部亮度变化最显著的部分，即在灰度级上发生急剧变化的区域。

从空域角度看，二维图像上的边缘相邻像素灰度从某一个值跳变到另一个差异较大的值。

其灰度变化曲线呈现奇异信号波形：

阶跃信号或屋脊形脉冲信号。

图像边缘信息是图像的重要特征，也是计算机视觉和图像识别的基础。

对树叶的边缘进行检测是树叶识别的基础，从二维数字图像上可得到的所有树叶的特征都基于其轮廓信息的。

因此对树叶边缘信息检测情况的好坏直接影响到最终的处理结果。

对于边缘的检测常常借助于空域微分算子进行，通过将其模板与图像卷积完成。

两个具有不同灰度值的相邻区域之间总存在灰度边缘。

灰度边缘是灰度值不连续（或突变）的结果，这种不连续常可利用求一阶和二阶导数方便地检测到。

已有的边缘检测方法，主要有一次微分（Sobel算子、Roberts算子等）、二次微分（Laplace算子等）和模板操作（Prewitt算子、Kirsch算子、Robinson算子等）等。

Sobel算子：

Sobel边缘算子的掩模模板是两个3×3的卷积核。

Sobel边缘算子强调中心像素的4-邻域对其的影响，而削弱4个对角近邻像素对其作用。

它是有方向性的，在水平方向和垂直方向上形成最强烈的边缘。

-1

-2

-1

-2

-1

Roberts算子：

Robert边缘算子是一种局部差分算子，采用两个2×2的掩模模板对图像的边缘进行检测。

-1

GxGy

Prewitt算子：

Prewitt算子与Sobel算子的方程一样，只是常量c=1。

-1

Gauss-Laplace算子：

Laplace算子是二阶微分算子，具有各项同性，只需要一个卷积核进行计算即可。

Laplace算子精度高，但是同时对噪声更敏感，因此在检测之前一般先进行平滑，把高斯平滑滤波器和Laplace锐化滤波器结合起来形成Gauss-Laplace算子。

正因为如此，本文首选该算子预处理图像。

常用的Gauss-Laplace算子是5×5模板，如下图所示。

-2

-4

-2

-4

-2

-4

-2

Gauss-Laplace算子

（2）图像平滑

在对图像进行边缘检测以及后续的处理时，由于噪声的影响会使得处理结果不够准确。

噪声点和周围像素点灰度值差异较大，空间频率比较高，因此可以利用空间滤波的方法抑制图像的高频分量，使噪声点的影响减小，即平滑处理。

图像平滑一般采用的方法有均值滤波和中值滤波两种。

均值滤波:

对模板内的所有像素点的灰度值取均值或加权均值。

中值滤波:

对模板内的像素点的灰度值排序，取中间值作为返回值。

两种滤波方法各有特点。

相较来说，中值滤波对图像的细节保存更好一些。

同时，模板大小的选取对平滑的结果也有很大的影响，模板越大则处理后的图像越模糊，细节损失越多，对图像的边缘也有不利的影响。

综合图像的特点，边缘检测选用Gauss-Laplace算子作，图像平滑选用5×5平滑模板，中值滤波选用8×8模板。

（3）Otsu最大类间方差法自适应图像分割[5]

最大类间方差法是由Otsu在1978年提出的。

它从一维灰度直方图角度出发，利用类别方差作为判据，选取使类间方差最大的灰度值作为最佳阈值。

最大类间方差阈值分割法的基本思路是将图像的直方图以某一灰度为阈值将图像分成两组并计算两组的方差，当被分成的两组之间的方差最大时，就以这个灰度值为阈值分割图像。

Otsu最大类间方差法计算简单，速度快，稳定有效，我们采用此法对树叶图像进行阈值分割。

Otsu法求取图像最佳阀值的公式如下：

式中：

：

灰度值为的频率；

：

目标部分比例；

：

背景部分比例；

：

目标均值；

：

背景均值；

：

总均值。

2图像特征提取[3-4]

图像特征提取是影响图像识别效果的关键环节，需要充分考虑图像的尺度及特征的种类、稳定性和个数的选取。

对于本课题，图像尺度最初取树叶最大高度对应300像素，认为图像可识别的特征长度是最大高度的1/100，即3个像素，则像边界点采样频率为每3像素取1个。

但通过试算得知，一般模版尺度也基本是3个像素，这样在前处理中的平滑运算会消除图像的一些边界特征，并且在图像缩放中，在图像边界局部也会产生2到3个像素级别的误差，即误差的级别与特征长度较近，容易引起特征提取错误，把局部误差毛刺提取成边界特征。

另外，特征尺度主要与树叶周长直接相关，取其为最大高的固定百分比也是不合适的，应该直接与树叶周长相关，而不是最大高度，因为图像周长特性比最大高度要稳定的多，比如叶柄的直、曲对树叶周长影响很小，而对树叶最大高度影响较大。

正因为最大高度不稳定，最后取消了第五个特征（最大高度/周长）对于识别的贡献，对于所有树叶该值均取为常数零。

也就是说，如果图像特征不稳定，则增加特征个数对于识别效果是不利的，反之则有利。

通过不断调试，图像总体尺度取树叶周长对应2000个像素，可识别的特征长度取为10，即总尺度的1/200。

所提取得图像特征如下：

（1）roundness：

归1化圆形度

评价树叶整体外形与圆形的近似程度，用于提取图像的“胖瘦”特性。

（2）ratio_anl_Nside：

拐点平均间距与周长比

描述树叶周边凹凸性的尺度，此值越小则表示树叶周边凹凸越尖锐。

（3）Ninflexion：

拐点数

理论上应为树叶周边凸包个数的两倍，实际由于最小特征尺度的选取和边界毛刺误差，具体提取的拐点数会有一定的随机性。

（4）ave_sideEnergy：

平均边界能量

取为边界上各采样点处转角平方和的平均，以能量的形式反映边界的复杂程度。

（5）ratio_Hm_Nside：

最大高度/周长

考虑到图像最大高度受叶柄的直、曲影响很大，其值很不稳定，因而会降低树叶识别效果，不再提取其实际值，直接赋值为常量零。

3图像识别——LVQ神经网络[6-8]

神经网络通过寻找输入/输出数据之间的关系，来实现特征提取和统计分来等模式识别任务。

经过几十年的发展，神经网络已经点定了在模式识别领域不可或缺的位置。

在模式识别的应用中，单层感知器是能一致逼近线性连续函数空间的最简单的神经网络，但是它具有其固有的局限性，即对非线性样本空间不可分。

BP网络是一种应用最为普遍的网络，其缺点在于采用了基于的梯度下降的非线性优化策略，有可能陷于局部最小问题，不能保证求出全局最小值。

其他一些优化策略如遗传算法、模拟退火算法等，虽然可以求得全局最小，但是计算量很大，有时会出现效率问题。

本论文尝试利用LVQ网络来实现模式识别，LVQ网络的优点是不需要将输入向量进行归一化、正交化，只需要直接计算输入向量与竞争层之间的距离，从而实现树叶图像的模式识别。

LVQ网络简介

学习矢量量化的英文全称是LearningVectorQuantization，简称为LVQ。

LVQ算法是在有教师状态下对竞争层进行训练的一种学习方法，它是从Kohonen竞争算法演化而来的。

LVQ神经网络在模式识别和优化领域有这广泛的应用。

LVQ算法是对SOM算法的一种扩展，它的基本思想源于SOM算法，它对应的网络结构与SOM很相似，但并不像SOM网络那样存在某种特定的拓扑结构。

LVQ算法是一种监督类型的聚类方法，该算法与SOM算法最大的区别在于提供给LVQ网络的每个训练例都有一个“标记”（label），该“标记”用于知名每个训练例所属的类别，在网络的训练过程中起到一定的监督作用。

因此，LVQ算法实际上是SOM算法基本思想在监督学习领域中的一种应用。

学习矢量量化（LVQ）神经网络是在监督状态下对竞争层进行训练的一种学习算法，允许对输入被分到哪一类进行指定，竞争层将自动学习对输入向量分类，同时LVQ算法建立的决策区是近似最优的，另外由于LVQ网络结构的特殊性，使得能够通过训练来识别由几个不连接区域构成的类，同时能以较小的计算量处理大量输入数据。

Kohonen学习规则

Kohonen网络特征自动识别的聚类功能主要是通过以下两个简单的规则实现的[2]：

记所有输出神经元C组成的集合为Φ。

神经元C与输入层神经元之问的连接权向量为W

（1）对于提供给网络的任一个输入向量ξ，确定相应的输出层获胜神经元s，其中

（2）确定获胜神经元s的一个领域N，按照如下公式调整N，范围内神经元的权向量：

，该调整过程使得N内神经元的权向量朝着输入向量ξ的方向靠拢。

随着学习的不断进行，学习速率α将不断减小，领域N也将不断缩小。

所有权向量将在输入向量空间相互分离，各自代表输入空间的一类模式，这就是Kohonen网络特征自动识别的聚类功能。

LVQ网络结构

LVQ网络结构如图1所示。

一个学习矢量量化（LVQ）网络由三层神经元组成，即输入层、隐竞争层和输出层。

图1LVQ网络结构

该网络在输入层与隐竞争层之间为完全连接，而在隐竞争层与输出层之间为部分连接，每个输出神经元与隐竞争层神经元的不同组相连接。

隐竞争层和输出神经元之间的连接权值固定为1。

输入层和隐竞争层间的连接权值建立参考矢量的分量（对每个隐竞争层神经元指定一个参考矢量）。

在网络训练的过程中，这些权值被修改。

隐竞争层神经元和输出神经元都具有二进制输出值。

与竞争网络一样，LVQ网络隐竞争层的每个神经元通过学习原型向量对输入空间的区域分

展开阅读全文