基于遗传算法的图像分割概要.docx
《基于遗传算法的图像分割概要.docx》由会员分享,可在线阅读,更多相关《基于遗传算法的图像分割概要.docx(21页珍藏版)》请在冰豆网上搜索。
基于遗传算法的图像分割概要
基于遗传算法的图像分割研究
摘要:
遗传算法是对生物进化论中自然选择和遗传学机理中生物进化过程的模拟来计算最优解的方法。
遗传算法具有众多的优点,如鲁棒性、并行性、自适应性和快速收敛,可以应用在图像处理技术领域中图像分割技术来确定分割阈值。
图像分割是图像处理技术的研究对象之一,它对于图像特征提取、图像识别等图像处理技术等有着重要意义。
主要研究基于遗传算法的图像分割效果,采用Matlab软件进行仿真实验,对不同图像分割算法的效果进行比较。
实验表明,遗传算法是处理图像分割的优秀算法,图像分割效果相比于传统的图像分割算法效果更佳。
关键词:
图像分割;阈值计算;遗传算法;图像特征
指导老师签名:
StudyonImagesegmentationbased
ongeneticalgorithm
Abstract:
Geneticalgorithmisanoptimalsolutionmethodofusingnaturalselectioninbiologicalevolutionandbiologicalevolutioningeneticmechanism.Geneticalgorithmhasmanyadvantagessuchasrobustness,parallel,adaptive,andfastconvergence,canbeusedinthefieldofimageprocessingtodeterminethethresholdvalue.Imagesegmentationisoneoftheobjectsofimageprocessing,itismeaningfultotheimagefeatureextraction,imagerecognitionandotherimageprocessingtechnologies.TheimagesegmentationeffectbasedongeneticalgorithmofusingMATLABsoftwaretosimulatethedifferentimagesegmentationalgorithmsandcomparetheresult.Experimentsindicatethatthegeneticalgorithmisoutstandingtodealwiththeimagesegmentation,theresultsismoreoutstandingthantraditionalimagesegmentationalgorithm.
Keywords:
imagesegmentation;thresholdcomputation;geneticalgorithm;imagefeature
Signatureofsupervisor:
第一章绪论
1.1遗传算法
1.1.1遗传算法的提出
智能计算也有人称之为“软计算”,是人们受自然(生物界)规律的启迪,根据其原理,模仿求解问题的算法。
从自然界得到启迪,模仿其结构进行发明创造,这就是仿生学。
这是我们向自然界学习的一个方面。
另一方面,我们还可以利用仿生原理进行设计(包括设计算法),这就是智能计算的思想。
这方面的内容很多,主要包括遗传算法、群体智能算法等。
各种智能计算方法有以下一些共同的特点:
(1)它们大都引入了随机因素,因此具有不确定性。
不少计算过程实际上是在计算机上作随机过程的模拟。
(2)它们大都具有自适应机制的动力体系或随机动力体系,有时在计算机过程中体系结构还在不断调整。
(3)这些算法都是针对通用的一般目标而设计的,它们不同于针对特殊问题而设计的算法。
(4)其中不少算法在低维或简单的情况下的效果不佳,但是到了高维复杂情况下具有很强的竞争力。
1975年,美国密歇根大学的心理学教授、电子工程学与计算机科学知名教授Holland和他的同事与学生共同研究了具有开创意义的遗传算法理论和方法。
遗传算法最初被研究的出发点不是为专门解决最优化问题而设计的,它与进化策略、进化规划共同构成了进化算法的主要框架,都是为当时人工智能的发展服务的。
迄今为止,遗传算法是进化算法中最广为人知的算法。
该算法是一种借鉴生物界自然选择和进化机制发展起来的高度并行、随机、自适应搜索算法。
概括地讲,它使用了群体搜索技术,将种群代表一组问题解,通过对当前种群施加选择、交叉和变异等一系列遗传操作,从而产生新一代的种群,并逐步使种群进化到包含近似最优解的状态。
由于其思想简单、易于实现以及表现出来的鲁棒性,遗传算法广泛地渗透到许多应用领域,特别是近年来在问题求解、优化和搜索、机器学习、智能控制、模式识别和人工生命等领域取得了许多令人鼓舞的成就。
以遗传算法为核心的进化计算,己与模糊系统理论、人工神经网络等一起成为计算智能研究中的热点,受到广泛的关注。
1.1.2遗传算法研究概况
对遗传算法的研究主要集中在算法的理论基础,算法结构,算法参数选择,算法与其他算法的比较,算法的应用等方面。
在算法的数学基础研究方面,Holland的模式理论奠定了GA的数学基础,进而Bertoni和Dorigo推广了此研究。
模式定理中模式适合度是难以计算和分析的,Bethke运用了walsh函数和模式转换发展了有效的分析工具,Holland扩展了这种算.Goldberg首先运用.walsh模式转换法设计出了最小GA一欺骗问题并进行了详细分析。
遗传算法全局收敛性的分析已经取得了突破,使用的主要数学工具是马尔科夫链。
Goldberg和Segrest首先使用了马尔科夫链分析了遗传算法,Eiben等用马尔科夫链证明了保留最优个体的GA的概率性全局收敛,Rudolph用齐次有限马尔科夫链证明了带有复制、交换、突变操作的标准遗传算法收敛不到全局最优解,不适合于静态函数优化问题,建议改变复制策略以达到全局收敛用。
Back和Muhlenbein研究了达到全局最优解的遗传算法的时间复杂性问题。
遗传算法计算中的瓶颈是群体适合度函数的计算,为了克服群体数大造成的计算费时,Krishnakumar提出了称为uGA的小群体方法,群体数取为五,其仿真结果显示了较高的计算效率和适用于动态系统优化的潜力,但理论上的分析与更严格的实验尚待进行。
二进制编码的遗传算法进行数值优化时,有精度不高的缺点。
Schraudo1ph和Belew提出了参数动态编码(DPE)的策略,类似于Schaffe对搜索空间尺度变换的方法,是一种提高GA精度的新的结构形式。
遗传本质上是进行无约束优化的;简单约束尚能处理,复杂约束问题尚待研究。
Androulakis等提出一种扩展遗传搜索算法(EGS),采用实数编码,把搜索方向作为独立的变量处理,文中报道对无约束和有约束问题均有较好结果,但无详细实验过程。
为了克服早熟收敛,Poths等提出了基于迁移和人工选择的遗传算法(GAMAS),利用四组群体进行宏进化,类似于并行实现的思想,结果显示了较好的性能。
遗传算法具有天然并行的结构,目前一般在串行机上实现。
遗传算法并行实现的研究由来己久并颇有前景,因为它的计算瓶颈是适合度的计算,Grefenstette全面研究了遗传算法并行实现的结构问题,给出的结构形式有:
同步主从式,半同步主从式,非同步分布式及网络式等。
遗传算法的应用研究比理论研究更为丰富,已渗透到许多学科。
遗传算法的应用按其方式可分为三大部分,即基于遗传的优化计算,基于遗传的优化编程、基于遗传的机器学习,分别简称为遗传计算,遗传编程,遗传学习。
遗传计算是GA最直接、最简单的应用,其面也最广。
自DeJong起,函数优化已成为经典的例子,常规采用二进制编程,目前使用实数编码的研究增多。
与函数优化问题区别最大的是组合优化问题,使用序号编码,使用特殊的交换操作。
在自动控制学科中,Michalewic等用浮点数编码的GA研究了离散时间最优控制问题;陈根社运用GA进行了Riccati方程求解。
Murdock等用GA分析了控制系统的鲁棒稳定问题,Krisnakumar等用GA进行了航空控制系统的优化。
Potter等运用GA研究了数字PID控制器的调节。
Kristinsson和Dumant深入研究了连续和离散的系统的参数辨识问题,用GA寻找零极点。
Park等研究了一种新的基于遗传的模糊推理系统,用于产生优化参数集,获得了良好的性能。
自动控制是近年来GA应用的活跃领域,由于GA有天然的增强式学习能力,因此在系统辨识、非模型控制系统设计,模糊控制器设计等方面的研究将会更为深入。
以上的研究大多只是原理性的,面对实际应用对象的很少,以后的研究将会向实用性推进。
在机器人学中,Davidor研究了把机器人当作模型未知的生物体,运用遗传算法优化机器人的连续轨迹精度。
Yun和Xi研究了在机器人关节空间运用遗传算法求最优轨迹。
Pearce用遗传算法学习机器人行为之间的协调参数。
Parker和Goldberg研究了用GA求解冗余度机器人的逆运动学方程。
Uevama和Fukuda等运用GA研究了细胞机器人系统的结构位形优化、运动规划以及行为协调。
机器人是复杂的难以精确建模的系统,可以自然地类比为生物体,运用GA对机器人结构、运动行为进行优化的研究将更为活跃和深入。
遗传算法己渗透到了许多学科,如工程结构优化、计算数学、制造系统、航空航天、交通、计算机科学、通信、电子学、电力、材料科学等。
1.2图像分割技术的研究现状
图像分割是图像处理中的一项关键技术,自20世纪70年代起一直受到人们的高度重视,至今已提出上千种分割算法。
但因尚无通用的分割理论,现提出的分割算法大都是针对具体问题的,并没有一种适合所有图像的通用分割算法。
另外,还没有制定出选择使用分割算法的标准,这给图像分割技术的应用带来许许多多实际问题。
最近几年又出现了许多新思路,新方法或改进算法。
根据近年来的研究情况,可将图像分割方法分为如下四类:
1.阈值分割方法.
阈值分割方法的历史可追溯到近40年前,现己提出了大量算法,对灰度图像的取阈值分割就是先确定一个处于图像灰度取值范围之中的灰度阈值,然后将图像中各个象素的灰度值都与这个阈值相比较,并根据比较结果将对应的象素分为两类,这两类象素一般分属图像的两类区域,从而达到分割的目的。
从该方法中可以看出,确定一个最优阈值是分割的关键。
现有的大部分算法都是集中在阈值确定的研究上。
阈值分割方法根据图像本身的特点,可分为单阈值分割方法和多阈值分割方法;也可分为基于象素值的阈值分割方法、基于区域性质的阈值分割方法和基于坐标位置的阈值分割方法。
若根据分割算法所有的特征或准则,还可以分为直方图与直方图变换法、最大类空间方差法、最小误差法与均匀化误差法、共生矩阵法、最大熵法、简单统计法与局部特性法、概率松驰法、模糊集法、特征空间聚类法、基于过渡区的阈值选取法等。
2.基于边缘的分割方法
图像最基本的特征是边缘,它是图像局部特性不连续(或突变)的结果。
例如,灰度值的突变、颜色的突变、纹理的突变等。
边缘检测方法是利用图像一阶导数的极值或二阶导数的过零点信息来提供判断边缘点的基本依据,经典的边缘检测方法是构造对图像灰度阶跃变化敏感的差分算子来进行图像分割,如Roben算子、S0bel算子、Prewitt算子、Laplacian算子等。
根据检测边缘采用方式的不同,边缘检测方法大致包括以下几类:
基于局部图像函数的方法、多尺度方法、图像滤波法、基于反应一扩散方程的方法、多分辨分法、基于边界曲线拟合方法、状态空间搜索法、动态规划法、边界跟踪法、哈夫变换法等。
3.基于区域的分割方法
区域分割的实质就是把具有某种相似性质的像素连通起来,从而构成最终的分割区域。
它利用了图像的局部空间信息,可有效的克服其它方法存在的图像分割空间不连续的缺点,但它通常会造成图像的过度分割!
。
在此类方法中,如果从全图出发,按区域属性特征一致的准则,决定每个像元的区域归属,形成区域图,这常称之为区域生长的分割方法;如果从像元出发,按区域属性特征一致的准则,将属性接近的连通像元聚集为区域是区域增长的分割方法;若综合利用上述两种方法,就是分裂—合并的方法。
区域生长法的基本思想是将具有相似性质的象素合起来构成区域,具体做法是选给定图像中要分割的目标物体内的一个小块或者说种子区域,再在种子区域的基础上不断将其周围的象素点以一定的规则加入其中,达到最终将代表该物体的所有象素点结合成一个区域的目的,该方法的关键是要选择合适的生长或相似准则。
生长准则一般可分为3种:
基于区域灰度差准则、基于区域内灰度分布统计性质准则和基于区域形状准则。
分裂合并法是先将图像分割成很多的一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的。
4.结合特定理论工具的分割方法
图像分割至今为止尚无通用的自身理论。
近年来,随着各学科许多新理论和新方法的提出,人们也提出了许多与一些特定理论、方法和工具相结合的分割技术。
(1)基于数学形态学的分割技术:
其基本思想是用具有一定形态的结构元素去量度和提取图像中的对应形状以达到对图像分析和识别的目的。
由于形态学对图像分割具有优异的特性,使其在未来的图像分割中起主导作用。
但该方法的主要缺陷还不能很好地解决耗时问题,将其与一些节约时间的措施结合起来,是图像分割的一种趋势。
(2)基于模糊技术的图像分割方法:
基于模糊集合和逻辑的分割方法是以模糊数学为基础,利用隶属决图像中由于信息不全面、不准确、含糊、矛盾等造成的不确定性问题,该方法在医学图像分析中有广泛的应用。
(3)基于人工神经网络技术的图像分割方法:
基于神经网络的分割方法的基本思想是通过训练多层感知机来得到线性决策函数,然后用决策函数对象素进行分类来达到分割的目的。
近年来,还出现了人工神经网络技术和模糊技术结合应用于图像分割中。
(4)遗传算法在图像分割中的应用:
遗传算法是基于进化论自然选择机制的、并行的、统计的、随机化搜索方法。
对此,科学家们进行了大量的研究工作,并成功地将它们运用于各种类型的优化问题,在分割复杂的图像时,人们往往采用多参量进行信息融合,在多参量参与的最优值的求取过程中,优化计算是最重要的,把自然进化的特征应用到计算机算法中,将能解决很多困难。
遗传算法的出现为解决这类问题提供了新而有效的方法,它不仅可以得到全局最优解,而且大量缩短了计算时间。
(5)基于小波分析和变换的分割技术:
该方法是借助新出现的数学工具小波变换来分割图像的一种方法,也是非常新的一种方法。
小波变换是一种多尺度多通道分析工具,比较适合对图像进行多尺度的边缘检测。
例如,可利用高斯函数的一阶或二阶导数作为小波函数,利用Mallat算法分解小波,然后基于马尔算子进行多尺度边缘检测,这里小波分解的级数可以控制观察距离的“调焦”,而改变高斯函数的标准差可选择所检测边缘的细节程度。
小波变换的计算复杂度较低,抗噪声能力强。
理论证明,以零点为对称点的对称二进小波适应检测屋顶状边缘,而以零点为反对称点的反对称二进小波适合检测阶跃状边缘。
近几年来多进制(Multi-Band)小波也开始用于边缘检测。
另外,利用正交小波基的小波变换也可提取多尺度边缘,并可通过对图像奇异度的计算和估计来区分一些边缘的类型。
利用小波变换和其它方法结合起来用分割技术也是现在研究的热点。
虽然近年来研究成果越来越多,但由于图像分割本身所具有的难度,使研究没有大的突破性的进展。
仍然存在的问题主要有两个:
其一是没有一种普遍使用的分割算法;其二是没有一个好的通用的分割评价标准。
1.3主要研究内容
本课题在研究过程中,参考了大量中外文文献,并借鉴了现有的研究成果,将遗传算法应用于图像分割的研究。
本文的主要章节安排如下:
首先对遗传算法的研究现状及图像分割技术的研究现状进行了综述。
第二章对遗传算法进行研究,较全面的介绍了遗传算法,包括遗传算法的基本原理、算法模型、算法特点。
第三章讨论了图像分割算法方法及其应用的研究进展,对多种类型的图像分割方法进行归纳,分析各自特性。
第四章将遗传算法在图像分割中的应用研究阐述了基于遗传算法在图像分割领域的应用现状,给出了遗传算法应用于图像分割的步骤。
最后总结了论文,提出今后有待于研究和探讨的问题。
第二章遗传算法
2.1遗传算法的生物学基础
生物在自然界中的生存繁衍,显示出了其对自然环境的自适应能力。
受其启发,人们致力于对生物各种生存特性的机理研究和行为模拟,为人工自适应系统的设计和开发提供了广阔的前景。
遗传算法(GeneticAlgorithms,简称GAs)就是这种生物行为的计算机模拟中令人瞩目的重要成果。
基于对生物遗传和进化过程的计算机模拟,遗传算法使得各种人工系统具有优良的自适应能力和优化能力。
遗传算法所借鉴的生物学基础就是生物的遗传和进化。
2.1.1遗传与进化的系统观
虽然人们还未完全揭开遗传与进化的奥秘,即没有完全掌握其机制、也不完全清楚染色体编码和译码过程的细节,更不完全了解其控制方式,但遗传与进化的以下几个特点却为人们所共识:
(1)生物的所有遗传信息都包含在其染色体中,染色体决定了生物的性状;
(2)染色体是由基因及其有规律的排列所构成的,遗传和进化过程发生在染色体上;
(3)生物的繁殖过程是由其基因的复制过程来完成的;
(4)通过同源染色体之间的交叉或染色体的变异会产生新的物种,使生物呈现新的性
(5)对环境适应性好的基因或染色体经常比适应性差的基因或染色体有更多的机会遗传到下一代。
2.1.2遗传
世间生物从其父代继承特性或性状,这种生命现象就称为遗传(Heredity),由于遗传的作用,使得人们可以种瓜得瓜、种豆得豆,也使得鸟仍然是在天空中飞翔,鱼仍然是在水中邀游。
构成生物的基本结构和功能的单位是细胞(Cell)。
细胞中含有的一种微小的丝状化合物称为染色体(Chromosome),生物的所有遗传信息都包含在这个复杂而又微小的染色体中。
经过生物学家的研究,控制并决定生物遗传性状的染色体主要是由一种叫做脱氧核糖核酸(deoxy曲onucleicacid简称DNA)的物质所构成。
DNA在染色体中有规则地排列着,它是个大分子的有机聚合物,其基本结构单位是核苷酸,许多核苷酸通过磷酸二酯键相结合形成一个长长的链状结构,两个链状结构再通过碱基间的氢键有规律地扭合在一起,相互卷曲起来形成一种双螺旋结构。
基因就是DNA长链结构中占有一定位置的基本遗传单位。
遗传信息是由基因(Gene)组成的,生物的各种性状由其相应的基因所控制。
基因是遗传的基本单位。
细胞通过分裂具有自我复制的能力,在细胞分裂的过程中,其遗传基因也同时被复制到下一代,从而其性状也被下一代所继承。
遗传基因在染色体中所占据的位置称为基因座(Locus);同一基因座可能有的全部基因称等位基因(Allele);某种生物所特有的基因及其构成形式称为该生物的基因型(Genotype);而该生物在环境中呈现出的相应的性状称为该生物的表现型(Phenotype);一个细胞核中所有染色体所携带的遗传信息的全体称为一个基因组(Genome)。
生物的遗传方式:
(1)复制
生物的主要遗传方式是复制。
遗传过程中,父代的遗传物质DNA被复制到子代。
即细胞在分裂时,遗传物质DNA通过复制承(Reproduction)而转移到新生的细胞中,新细胞就继承了旧细胞的基因。
(2)交叉
有性生殖生物在繁殖下一代时,两个同源染色体之间通过交叉(Crossover)而重组,亦即在两个染色体的某一相同位置处DNA被切断,其前后两串分别交叉组合而形成两个新的染色体。
(3)变异
在进行细胞复制时,虽然概率很小,仅仅有可能产生某些复制差错,从而使DNA发生某种变异(Mutation),产生出新的染色体。
这些新的染色体表现出新的性状。
如此这般,遗传基因或染色体在遗传的过程中由于各种各样的原因而发生变化。
2.1.3进化
地球上的生物,都是经过长期进化而形成的。
根据达尔文的自然选择学说,地球上的生物具有很强的繁殖能力。
在繁殖过程中,大多数生物通过遗传,使物种保持相似的后代;部分生物由于变异,后代具有明显差别,甚至形成新物种。
正是由于生物的不断繁殖后代,生物数目大量增加,而自然界中生物赖以生存的资源却是有限的。
因此,为了生存,生物就需要竞争。
生物在生存竞争中,根据对环境的适应能力,适者生存,不适者消亡。
自然界中的生物,就是根据这种优胜劣汰的原则,不断地进行进化。
生物的进化是以集团的形式共同进行的,这样的一个团体称为群体(Population),或称为种群。
组成群体的单个生物称为个体(Individual),每一个个体对其生存环境都有不同的适应能力,这种适应能力称为个体的适应度(Fitness)。
遗传算法中,将n维决策向量X=[x1,x2,…xn]。
用n个记号xi(i=l,2,⋯,n)所组成的符号串X来表示,把每一个xi看作一个遗传基因,这样,x就可看做是由n个遗传基因所组成的一个染色体。
这里的等位基因可以是一组整数。
也可以是某一范围内的实数值,或者是纯粹的一个记号。
最简单的等位基因是由O和1这两个整数组成的,相应的染色体就可表示为一个二进制符号串。
这种编码所形成的排列形式X是个体的基因型,与它对应的X值是个体的表现型。
对于每一个个体x,要按照一定的规则确定出其适应度,个体的适应度与其对应的个体表现型X的目标函数值相关联,X越接近于目标函数的最优点,其适应度越大;反之,其适应度越小。
遗传算法中,决策变量x组成了问题的解空间。
对问题最优解的搜索是通过对染色体X的搜索过程来进行的。
从而所有的染色体x就组成了问题的搜索空间。
生物的进化是以集团为主体的。
与此相对应,遗传算法的运算对象是由M个个体所组成的集合,称为群体(或称种群)。
与生物一代一代的自然进化过程相类似,遗传算法的运算过程也是一个反复迭代过程:
第t代群体记做P(t),经过一代遗传和进化后,得到t+1代群体,记做P(t+1),这个群体不断地经过遗传和进化操作,并且每次都按照优胜劣汰的规则将适应度较高的个体更多地遗传到下一代,这样最终在群体中将会得到一个优良的个体X,它所对应的表现型x将达到或接近于问题的最优解。
2.1.4遗传算法的运算过程
选择(复制):
根据各个个体的适应度,按照一定的规则或方法,从第t代群体P(t)中选择出一些优良的个体遗传到下一代群体P(t+1)中;
交叉:
将群体P(t)内的各个个体随机搭配成对,对每一对个体,以某个概率(称为交叉概率)交
换它们之间的部分染色体;
变异:
对群体P(t)中的每一个个体,以某一概率(称为变异概率)改变某一个或某一些基因座上的基因值为其他基因值。
图2.1遗传算法的过程
随着问题种类的不同以及问题规模的扩大,要寻求一种能以有限的代价来解决搜索和优化的通用方法,遗传算法正是提供了一个有效的途径,它不同于传统的搜索和优化方法。
主要区别在于:
(1)自组织、自适应和自学习性(智能性)。
应用遗传许法求解问题时,在编码方案、适应度函数及遗传算子确定后.算法将利用进化过程中获得的信息自行组织搜索。
由于基于自然的选择策略为“适者生存,不适应者被淘汰",因而适应度大的个体具有较高的生存概率。
通常,适应度大的个体具有更适应环境的基因结构,再通过基因重组和基因突变等遗传操作,就可能产生吏适应环境的后代。
进化算法的这种自组织、自适应特征,使它同时具有能根据环境变化来自动发现环境的特性和规律的能力。
自然选择消除了算法设计过程中的一个最大障碍,即需要事先描述问题的全部特点,并要说明针对问题的不同特点算法应采取的措施。
因此,利用遗传算法的方法,我们可以解决那些复杂的非结构