基于支持向量机的图像分割技术Word格式.docx

资源描述

基于支持向量机的图像分割技术Word格式.docx

《基于支持向量机的图像分割技术Word格式.docx》由会员分享，可在线阅读，更多相关《基于支持向量机的图像分割技术Word格式.docx（40页珍藏版）》请在冰豆网上搜索。

基于支持向量机的图像分割技术Word格式.docx

图像科学已成为各高科技领域的汇流点。

图像处理技术日新月异，在各个领域的应用都取得了巨大的成功与显著的经济效益，特别是在工程领域、工业生产、军事、医学以及科学研究当中的应用已经非常普遍［1］。

但应用计算机对图像进行处理，具有一定的优缺点。

其优点是处理精度高，处理内容丰富，可以进行一些复杂的非线性处理，并且具有灵活的变通能力，一般来说只需通过对软件的改变就可以改变处理的内容。

然而，在计算机处理图像过程中，处理的速度还有待提高，特别是某些复杂的图像，如：

医学图像处理，遥感图像处理等。

一般情况下处理静止画面多[2]。

此外，在图像处理特别是图像分割方面，利用现有的算法对图像进行处理。

往往难以达到令人满意的效果，因而人们将新的概念，新的方法引入图像。

而应用在统计学习理论基础上发展起来的新的通用学习方法——支持向量机来解决图像处理当中的一些实际问题，获得了良好的效果。

然而，在图像处理过程当中的时间复杂度和空间复杂度较大等问题。

因此，如何有效的应用支持向量机对图像进行处理，并且降低算法在图像处理中的时间复杂度和空间复杂度，成为应用支持向量机进行图像处理的一个关键。

1.2国内外研究现状

近年来，支持向量机的理论取得一些重大进展，其算法时间策略以及实际也发展迅速。

可以确信，该技术的研究已逐渐发展成为机器学习中的一个独立的子领域，在理论和实践两方面都取得较好的成绩。

目前在国外，支持向量机（supportvectormachine，SVM）是一个研究的热门，虽然SVM方法在理论上具有很突出的优势，但与其理论研究相比，应用研究相对比较落后[3]。

在图像分割研究中，一些理论成果主要是利用SVM作为模式识别的工具，但是应用在图像处理其他方面的研究较少。

采用不同和函数的SVM进行图像分割对比，实验证明采用支持向量机应用于肿瘤图像分割领域，取得了良好的效果［4］。

可以看出，SVM的应用研究已不再局限于模式识别的问题中，已经开始在其领域取得一些成果。

对于SVM的研究，目前大多还停留在应用研究的阶段，特别是在对图像处理的应用研究方面。

邢伟提出的采用梯度一致性。

灰度均值及灰度方差来构成分割特征向量，并采用支持向量机来分类，从而对图像进行分割[5]。

通过对SVM一对多方法的研究和应用，将SVM推广到多类分割问题来解决mr脑组织图像分割。

赵衍运等人提出了使用SVM进行指纹图像背景分割的方法，以图像的灰度方差和对比度为特征，用小样本训练分割背景的SVM模型[6]。

即利用了指纹的图像特征，也融入了SVM训练，得到了较好的分割结果。

将原有的图像特征进行了必要降维后，再使用支持向量机来对图像进行分割[7]。

1.3主要研究内容

本文的主要工作是研究支持向量机的SVM算法，并将其应用于图像分割，仿真验证其可行性和有效性。

在第一章中，主要对课题的研究背景、目的和意义及国内外的研究现状进行了简单叙述，展现现有算法对于图像分割面临的问题。

第二章对数字图像分割技术进行了简单介绍，和数字处理技术的方法、图像分割的定义，图像分割的应用对象，和图像分割的原理，再者对图像分割的开发工具进行了简单介绍，最后介绍了支持向量机理论及基于支持向量机的图像分割原理。

第三章研究了图像分割的传统分割算法，采用其中一些经典的分割算法（边缘检测算法、阈值分割），并对其进行仿真实现最后得出其优缺点并做简要分析。

第四章中，简单介绍了支持向量机理论，重点是设计了一种基于支持向量机的图像分割算法。

其中主要研究了如何选择训练样本、提取特征参数、核函数选择、训练样本，最终用Maltab仿真实现支持向量机对图像的分割，并且对其结果进行分析，并与传统分割算法比较，得出优缺点。

第2章图像分割原理

2.1数字图像概述

视觉是人类最重要的感知手段之一，视觉信息是人类从自然界获得信息总量的80%。

图像是人类视觉的基础，图像优于其他表达方式。

图像在人类接受和互通信息中扮演这重要角色。

图像信息具有以下特点：

（1）直观形象

图像可以将客观事物的原型真实的展现在眼前，供不同目的、不同能力、不同水平的人去观察、理解。

而声音文字信息只能通过描述来表达事物。

既然是描述，就会受到描述者诸如主观、专业、情绪、心情等因素限制，有可能使描述特征偏离客观事物。

（2）易懂

人的视觉系统有着瞬间获取图像、分析图像、识别图像与理解图像的能力。

只要将一幅图像呈现在人的眼前，其视觉系统就会立即得到这幅图像所描述的信息，从而达到一目了然的效果。

（3）信息量大

图像信息量大有两层含义，其一是“一图胜千言”，图像本身所携带的信息远比文字、声音信息丰富：

其二是图像的数据量大，需要占据较大的存储空间与传输时间。

下面简单介绍一下数字图像处理的概述：

数字图象处理技术亦称计算机图像处理。

其技术涉及数学、计算机科学、模式识别、人工智能、信息论、生物医学等种学科，是一门多学科交叉应用技术。

其技术处理内容丰富。

包括图像获取、图像变换、图像增强、图像复原、图像编码、图像分析、图像识别、图像理解。

其数字图像的处理方法大致分为两大类，空间域处理法和变换域处理法。

并且数字图像的应用也十分广泛，数字图像处理技术受到前所未有的广泛重视。

其应用领域有：

计算机图像生成、图像传输与图像通讯、机器人视觉及图像测量、办公自动化、图像跟踪及光学制导、医学图像处理与材料分析中的图像处理技术、遥感图像处理和空间探测。

数字图像处理系统一般包括三个阶段，首先是图像的预处理阶段，第二是特征抽取阶段，第三个是分析阶段。

图像的预处理阶段，旨在对获得的图像信息进行必要预处理，如去噪声、彩色校正等，对图像进行预处理，可以提高信噪比。

对信息微弱的图像还可以进行图像增强的操作。

其作用在于提供一个能满足一定要求的图像，以便人分析使用，而为了从图像中得到需要识别的目标，就需对图像进行分割，也就是所需要识别的物体进行定位与分离。

图像复原是指对退化的图像加以重建和恢复。

2.2图像分割原理

在对图像的分析研究和应用中，人们通常对图像中的某些特定目标感兴趣，为了分析和识别这些目标，它们首先必须从图像中提取出来。

这种获得目标的技术被称为图像分割技术。

好的图像分割应具有一下特性：

1．分割出来的各区域对某种性质（如灰度，而言具有相似性，区域内都是联通的且没有过多小孔）。

2．相邻区域对分割的性质有明显的差异。

3．区域边界是明确的。

图像分割的形式化定义如下：

定义1.1：

令I表示图像，H表示具有相同性质得谓词，图像分割把I分解成n各区域

i=1，2，n，满足：

（2-1）

（2-2）

（2-3）

条件

（1）表明了分割区域覆盖整个图像且各区域不相重叠，条件

（2）表明每一个区域都具有相同的性质，条件（3）表明相邻的两个区域性质相依不能合并为一个区域。

到目前为止，对图像分割的好坏进行评价没有统一的准则。

因此，图像分割是计算机视觉和图像分析当中经典的难题。

已有的算法实现方式各不相同，然而大部分都给予图像像素及的两个性质：

不连续性和相似性。

属于统一目标的区域一般具有相似性，而不同的区域在边界表现出不连续性。

图像分割在整个图像处理过程中的作用：

图像预处理

图像识别

图像理解

图像分割

图像

图2-1图像分割在整个图像处理过程中的作用

由此图可以看出图像分割是图像识别和图像理解的先提条件和基础，其需要在图像预处理的前提下进行，如果没有图像分割就无法进行图像识别功能，这样图像的理解功能就无法谈及。

2.3基于新理论和新方法的图像分割算法概述

支持向量机（SVM）是建立在统计学理论的基础上的，它是统计学习理论的具体实现。

统计学习理论是专门研究小样本情况下的机器学习理论，它摒弃了传统学习方法基于经验风险最小化原则[8]，采用结构风险最小化原则，较好的解决了小样本学习问题。

1992—1995年将统计学习理论具体应用于实际问题中，发挥了基于统计学习理论的支持向量机算法。

支持向量机是统计学习理论中最年轻、最实用的内容，目前在机器学习领域得到了广泛地重视，并且在不断发展。

统计学习理论研究了经验风险Remp（w）与真实风险R（w）之间的关系，他们以至少1-η的效率满足如下关系：

R（w）≤Remp（w）+φ（n∕h）（2-4）其中h是函数集的VC维，n是样本数，这说明，学习机器的实际风险是由两部分组成的；

一是经验风险（训练误差），另一部分称作置信范围，它和学习机器的VC维及训练样本数有关，可以简单的表示为：

R（w）≤Remp（w）+φ（n∕h）（2-5）结构风险最小化就是同时最小化经验风险和置信范围，即经验风险最小化的同时，设法控制学习机的VC维，使经验风险和置信范围之和达到最小。

支持向量机是统计学习理论的具体实现，它是从线性可分的最优分类面发展而来的。

线性可分情况下寻求能够将两类分开的最优分类面的思想如图2-2中○和□分别表示两类可分的训练样本。

H分类面将两类样本无错误的分开，H1和H2分别是过两类样本中离H最近的点且平行于H的平面。

H1和H2之间的距离称为两类的分类间隔。

最优分类面就是要求分类面不但能将两类样本正确分开（训练错误率为0），而且要使两类的分类间隔最大。

根据结构风险最小化原则，前者是保证经验风险最小，而后者使分类间隔最大，也就是使推广性的界中的置信范围最小，从而达到使真实风险最小[9]。

图2-2支持向量机定义图

而在实际分类问题中，分类问题往往是一个非线性的问题，理想的分类面应该是非线性的。

而对非线性问题，可以通过非线性变换，将非线性问题转化为某个高维空间的线性问题。

目前，常用且效果比较理想的核函数主要有线性核函数、多项式核函数（Polynomial）、径向基函数（RadialBasisFunction,RBF）/Sigmoid核函数。

（2-7）

这四种函数分别分别对应了三种不同的学习机器，只需要改变核函数的形式就可以构造出不同学习机器，核函数决定了特征空间结构，核函数的形式及其参数决定了分类器的类型和复杂程度，因此核函数选择是非常重要的，不同问题选择不同核函数。

2.4开发工具简介

实际的图像处理及分析都是面向某种具体问题的，所以上述条件中各种关系也要视具体情况而定，目前，还没有一种通用的方法可以很好的兼顾这些约束条件，也没有一种通用的方法可以完成不同图像分割任务。

原因在于实际的图像是千差万别的，还有一个重要原因在于图像数据质量的下降，包括图像在获取和传输过程中引入的种种噪声以及光照不均等因素。

到目前为止，到目前为止，对图像分割的好坏进行评价至今提出的分割算法已有上千种，每年还有不少新算法出现。

这些算法的实现方式各不相同，然而像边缘检测、阈值分割、分水岭算法都是基于图像在像素级的两个性质，不连续性和相似性。

新理论支持向量机则基于纹理特征和灰度特征两种故图像近乎完整并且分割方法简单图像清晰。

第3章图像分割算法研究

3.1边缘检测理论及依据

图像的边缘对人的视觉具有重要意义，一般而言，当人们看到一个有边缘的物体时，首先感觉到的便是边缘。

灰度或结构等信息的突变处称为边缘，边缘是一个区域的结束，也是另一个区域的开始，利用该特征可以分割图像。

需要指出的是，检测出的边缘并不等同于实际目标的真实边缘。

由于图像数据是二维的，而实际物体是三维的，从三维到二维的投影必然会造成信息的损失图像的边缘有方向和幅度两个属性，沿边缘方向像素变化平缓，垂直于边缘方向像素变化剧烈。

边缘上的这种变化可以用微分算子检测出来，通常用一阶或二阶导数来检测边缘，两者不同之处在于一阶导数认为最大值对应边缘位置，而二阶导数则以过零点对应边缘位置[10]。

3.1.1边缘检测算子

基于一阶导数的边缘检测算子包括Roberts、sobel、Prewitt边缘检测算子在算法过程中，通过2×

2（Roberts算子）或者3×

3模版作为核与图像中每个像素点做卷积和运算，其边缘检测都是基于微分方法的，然后选取适应的阈值以提取边缘。

拉普拉斯边缘检测算子是基于二阶导数的边缘检测算子，该算子对噪声敏感，一种改进方式是先对图像进行平滑处理。

然后再应用二阶导数的边缘检测算子，其代表是LOG算子，canny算子是另外一类边缘检测算子，它不是通过微分算子检测边缘，而是在满足约束条件下推导出的边缘检测最优化算子。

3.1.2Roberts、Prewitt、sobel边缘检测算法设计及分析

Roberts边缘检测算子用图3.1.2（a）的模版来近似计算图像函数f（x,y）对x和y的偏导数：

图3-1图像邻域模版

-1

图3-2Roberts模版

计算出Gx，Gy的值后，用公式g=（Gx2+Gy2）1/2计算（x，y）点的梯度值找到图像边缘即可对图像完成分割。

Sobel边缘检测算子用图3.1.2（b）所示的模板来近似计算图像函数f（x,y）对x，y的偏导数。

-2

（3-1）

（3-2）

图3-3Sobel模版

Prewitt边缘检测算子用图3.1.2（c）所示的模板来近似计算图像函数f（x,y）对x，y的偏导数。

（3-3）

（3-4）

图3-4Prewitt模版

计算出Gx，Gy的值后，用公式g=（Gx2+Gy2）1/2计算（x，y）点的梯度值找到图像边缘即可对图像完成分割。

三种方法计算出梯度值后，设定一个合适的阈值T，如果（x，y）处的g≥T则认为该带点是边缘点。

对三种算法仿真实现结果如下：

图3-5原图像及三种算法分割结果

（1）由图像结果可知在此梯度边缘检测算法中，Roberts算子边缘定位精度较高，但容易丢失一部分边缘，同时由于图像没经过平滑处理，因此不具备抑制噪声能力，该算子对具有陡峭边缘且含噪声少的图像效果较好。

其原因是利用局部差分算子寻找边缘，并且Roberts对噪声特别敏感，检测的边缘间断处多，出现了大量的噪声孤立点，对于间断较严重地方很难设计较好的算法来进行连接。

（2）由图像可知Sobel算子和Prewitt算子虽然这两种检测算法边缘定位效果不错，但检测出的边缘容易出现多像素宽度。

其原因为对图像先做加权平滑处理，然后再做微分运算，所不同的是平滑部分的权值有些差异，因此对噪声具有一定的抑制能力，但不能完全排除检测结果中出现的虚假边缘。

还能由图看出Sobel算子具有噪声抑制能力，在一定程度上对边缘间断有些许改进，但是仍然不能达到很好的检测效果。

3.1.3Canny边缘检测算子设计与分析

在图像边缘检测中，抑制噪声和边缘精确定位是无法同时满足的，边缘检测算法通过平滑滤波去除图像噪声的同时，也增加了边缘定位的不确定性；

反之，提高边缘检测算子对边缘的敏感性同时，也提高了对噪声的敏感性。

Canny算子力图在抗噪声干扰和精确定位之间寻求最佳折衷方案，用Canny算子检测图像边缘步骤如下：

（1）用高斯滤波器平滑图像。

（2）计算滤波后图像梯度的幅值和方向。

（3）对梯度幅值应用非极大值抑制，其过程为找出图像梯度中的局部极大值点，把其他非局部极大值点置零以得到细化的边缘。

（4）用双阈值算法检测和连接边缘，使用两个阈值T1和T2（T1>

T2），T1用来找到每条线段，T2用来在这些线段的两个方向上延伸寻找边缘断裂处，并连接这些边缘。

对其用仿真实现运行结果如下：

图3-6原图像及Canny算子分割结果

由图可以看出Canny算子检测的边缘大部分是连续的同样该算子也会将一些高频边缘平滑掉，造成边缘丢失，其原因是因为算子同样采用高斯函数对图像进行平滑处理。

因此具有较强的抑制噪声能力，再者可以由图推断得出Canny算子也有一个明显的缺点，也就是在后续的边缘连接阶段，很难将虚假边缘排除。

3.2基于区域阈值的理论及依据

图像分割的经典方法是基于灰度阈值的分割方法，它通过设置阈值，把像素点按灰度级分为若干类，从而实现图像分割。

把一副灰度图像转化成二值图像是阈值分割的最简单形式，设原始图像为f（x，y），首先以一定准则在f（x，y）中找出一个灰度值t作为阈值，将图像分割为两部分，即把大于等于该阈值的像素点的值置为1，小于该阈值的像素点的值置为0.阈值运算后的图像为二值图像f（x，y）[11]。

阈值分割技术一般分为两个步骤，第一步根据一定的规则确定一般的分割阈值。

第二步将该阈值和像素相比较，来分类像素。

因此，阈值T的选择将直接影响到分割效果，直接关系到分割精度。

3.2.1阈值分割算法的设计与分析

阈值法的关键是确定分割的阈值，而阈值的确定由灰度直方图形状确定。

基于灰度阈值的分割方法，其关键是如何合理的选择阈值，此处有人工法和自动阈值法。

虽然人工法可以选出令人满意的阈值，但是在无人介入的情况下自动选取阈值是大部分应用的基本要求此处用迭代式阈值选择和Otsu法阈值选择。

此处说明的灰度选择法是在分析灰度直方图的基础上，人工选择出合适阈值，从中选择出最佳阈值即把阈值放到某一确定值后再比较得出。

图3-7原始图像及灰度直方图

图3-8阈值为110图像分割结果

图3-9阈值为140图像分割结果

从图可以看出，阈值为140时和阈值为110时的图像分割两者都有共同的缺陷：

容易造成边缘丢失和背景与灰度值混淆而造成一定的分割失误。

3.2.2迭代式阈值选择方法设计与研究

迭代式阈值选择方法的基本思想是：

开始时选择一个阈值作为初始值，然后按某种策略不断的改进这一估计值，直到满足给定的准则为止。

在迭代过程中，关键之处在于选择什麽样的阈值改进策略。

好的阈值改进策略应该具有两个特征：

一是能够收敛，二是在每一个迭代过程中，新产生的阈值优于上一次的阈值。

其具体步骤如下：

（1）选择灰度的中值作为初始阈值T0。

（2）利用阈值T把图像分割成两个区域—R1和R2，用下式计算区域R1和R2的灰度均值

和

。

（3）计算出

后，用下式计算出新的阈值

（3-5）

（4）重复步骤2、3，直到两者之差小于某个给定值。

其运行结果如下：

图3-10原图像及迭代阈值二值化分割图像结果

由图像可直观得出：

容易造成边缘丢失并且分割得到的边缘不光滑等并且由分割图中的小点得出易于受噪声因素的干扰，从图可以推断出传统方法是利用图像的一种特定的数据特征对其进行分割的，即直接来自图像像素点的信息—灰度值或颜色值。

其优点是过程、思路简单，便于理论研究和简单图形的分割，缺点是计算过于复杂，难以满足实时性和时域性。

3.2.3Ostu阈值分割方法设计和研究

Otsu法是一种使类间方差最大的自动确定阈值的方法，该方法具有简单、处理速度快的特点，是一种常用的阈值选取方法。

其基本设计方法：

Otsu法是一种使类间方差最大的自动确定阈值的方法，该方法具有简单、处理速度快的特点，是一种常用的分割方法，其设计理念是把图像中的像素按灰度值用阈值T分成两类C0和C1由灰度值在[0，T]之间的像素组成，再用此方法求出阈值后，用该阈值进行二值化处理得到图像。

展开阅读全文