基于形状特征的图像检索Word下载.docx
《基于形状特征的图像检索Word下载.docx》由会员分享,可在线阅读,更多相关《基于形状特征的图像检索Word下载.docx(45页珍藏版)》请在冰豆网上搜索。
Cannyoperator;
edgedetection;
Fouriershapedescriptors
目 录
1前言
1.1课题背景及研究意义
随着多媒体技术、计算机技术、通信技术及Intemet网络的迅速发展,人们正在快速地进入一个信息化社会。
现代技术已能运用各种手段大量的采集和产生各种类型的多媒体数据,人们对多媒体信息的需求也越来越大量和频繁。
虽然信息的快速增长促进了社会的发展,但是信息膨胀也给人类带来了过多信息量以至于超过了人的接受能力。
因此,除了获取、处理和存储多媒体信息十分重要,怎样在海量的多媒体信息中快速有效地访问人们感兴趣的多媒体信息也显示出了同样的重要性。
图像信息是多媒体信息中最常见的一种,也具有多媒体信息数据量大、抽象程度低的特点。
如何从海量的图像信息中有效地获取有用信息,即图像信息资源的管理和检索显得日益重要。
随着人们对图像信息的巨大需求的增长,产生了基于文本的图像检索技术,比如著名的搜索引擎XX中对图像的检索。
这种基于文本的检索技术所利用的人工标注方法存在局限性,经常检索出来大量的用户不感兴趣的图像,[5]但在没有更好解决办法的情况下,用户只能继续使用。
因此如何对图像的内容自动、客观、全面地进行特征提取。
真实有效的表示图像内容,帮助用户快速有效地访问感兴趣的图像有着极大的研究需求和迫切的需要,而基于内容的图像检索(ContentBasedmageRetrieval,CBIR)技术恰好能有效的解决这个问题。
另外在实际的应用中,图像数据库及其检索的研究对多媒体数字图书馆、医学图像管理、卫星遥感图像和计算机辅助设计和制造、地理信息系统、犯罪识别系统、商标版权的管理,生物的辨识分类等方面提供有力的支持。
1.2国内外发展状况
近年来,CBIR已经成为一个非常活跃的研究领域,各国科研机构与公司已陆续推出了一些CBIR系统的产品,有的已经成功应用到医学、商标、专利检索等领域。
IBM的QBIC(QueryByImageContent)是第一个商业性的CBIR系统。
它提供了基于颜色、纹理、形状和手绘草图的图像索引方法。
Columbia大学的VisualSEEK提供了基于色彩和纹理的索引方法。
PhotoBook是麻省理工学院(MIT)媒体实验室开发的一套检索、浏览图像的交互式工具,它包含三个子系统分别提取形状、纹理和人脸特征,【4】用户可以分别做基于上述一种特征的检索。
MARS(multimediaanalysisandretrievalsystem)系统由美国UIUC大学开发,其不同之处在于用到了很多领域的知识:
计算机视觉、数据库管理系统和信息检索。
新加坡国立大学开发的一个基于内容的图像检索系统,其显著技术特色包括:
多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。
清华大学的ImgRetr结合了多种组织方法,就能提供基于主色、纹理、直方图、颜色分布、框架等多种方式的检索。
1.3课题研究的主要内容
本文依托基于内容的图像检索技术,重点研究基于形状特征的图像检索。
形状特征不同于颜色、纹理特征,形状特征的表达必须以对图像中物体或区域的划分为基础。
在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,通常情况下.形状特征有两类表示方法,一类是区域特征,利用的是整个形状区域;
另一类是轮廓特征,利用的则是图像的外边界。
本文主要研究的就是外边界的索引方法边缘检测,边缘检测的方法有很多,如:
Roberts交叉微分算子、Sobel微分算子、Priwitt微分算子和Laplacian微分算子以及Canny算子。
而其中属Canny算子最好。
对图像特征进行描述有很多种方法,链码、曲率尺度空间、TAR描述符、傅立叶描述符、小波描述符、边界矩等。
本文主要研究的是傅里叶描述符。
其主要思想是用物体边界的傅立叶变换作为其形状描述。
2基于形状特征的图像检索
2.1图像检索技术的发展过程
图像检索技术始于上个世纪70年代,当时主要是基于文本的检索,即使用关键词和描述性文本进行检索,要求用户对文本特征的描述具有一定的准确性和规范性。
但是随着大规模数字图像库的出现,基于文本的检索技术暴露出自身的缺点。
进入90年代,基于内容的图像检索技术应运而生,其思路是利用图像自身的视觉特征,如:
颜色、纹理结构、形状、空间关系作为图像的内容进行匹配、查找。
它通过利用已有的算法,使得特征提取和匹配完全可以由机器自动完成,检索过程不需要太多的人为干预和解释,这就克服了手工注释的低效和二义性。
2.1.1基于内容的图像检索技术
目前,对图像的检索在图像索引与研究中应用最为广泛,基于图像颜色特征、纹理特征、形状特征和物体空间方位的检索方法是比较成熟的几种。
近年来,基于内容的图像检索引起了多交叉学科研究人员的注意。
在国外,特别是在美国等发达国家,这项技术已成为一个研究热点。
一些科研部门、高等院校、商业公司以至于政府机构都纷纷投入大量人力和物力进行系统的研究和开发,以期取得领先地位。
目前已经推出了一些CBIR系统的产品,如美国的IBM公司、Virage和Excalibur开发出的基于图像内容的相似性特征的图像库检索引擎,并在网上提供了演示站点。
国内的研究主要集中在基于图像颜色的查询,也有一部分基于纹理和形状的查询。
目前,该技术已成功应用于人脸识别技术;
针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。
除此之外,它还可以解译影像数据中的建筑、村庄、耕地等不同种类的地形信息,实现对遥感图像的检索。
总之,该项技术在实际中的应用会越来越广泛,而且必将在各个领域当中占据主导地位,并带动相关产业的发展,促进多媒体信息化的交流。
2.1.2基于形状特征的图像检索
由于许多图像检索系统都把重点放在基于颜色或者纹理的方法上。
但是对于某些图像来说,纹理和颜色信息不够丰富,如一些商标图像等,这时基于颜色和纹理的方法就无法满足检索需要,而必须从图像的形状着手。
形状特征是图像的核心特征之一,图像的形状信息不随图像颜色的变化而变化,是物体的稳定特征。
用形状特征区别物体非常直观,是人们分类不同图像的主要特征之一。
因此,利用形状特征检索图像可以提高检索的准确性和效率。
基于形状特征的图像检索主要是检测出目标的轮廓线或分割出目标的轮廓,并针对其进行形状特征的提取或直接针对图像寻找适当的矢量特征。
形状描述应该在尽可能区别不同目标的基础上对目标的平移、旋转和尺度变化不敏感。
目前,虽然已经提出了许多形状分析方法,但要将其有效地运用于图像检索上还有一些问题亟待解决,如算法的效率和复杂性,形状特征的提取与描述等。
2.2边缘检测
边缘是图像的最重要的特征。
边缘是指周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。
Poggio在文中说:
“或许对应着图像中物体的边界或许并没有对应着图像中物体的边界,但是边缘具有十分令人满意的性质它能大大地减少所要处理的信息但是又保留了图像中物体的形状信息”。
边缘检测是图像识别的基础和前提,直接决定了图像识别结果的正确性。
由于边缘检测还不成熟,直接影响了图像识别的应用,一直是图像识别领域的一个研究热点。
经过多年的研究,边缘检测已经渗透到各个应用领域。
在医学上,边缘检测用于肾小球的提取,在工业和工程方面的应用在工业和工程领域中,用于纤维制品的检测,在。
喷漆、焊接、装配中也得到了有效的利用。
在文化艺术上,用于纺织工艺品设计,服装设计与制作,发型设计,文物资料照片的复制和修复,运动员动作分析和评分等等。
总之,边缘检测已经应用于各个领域。
是我们不可忽视的一项研究热点。
2.3Canny边缘检测
2.3.1Canny指标
基于微分算子的边缘提取存在的一个比较麻烦的的问题就是如何选择合适的阈值,可以使边缘从细节当中提取出来。
阈值的选择不同,所提取出的边界信息就不同。
在两个不同的阈值下,采用同样的微分算子均可以提取出图像的边缘,但是两者有比较大的区别。
这样,在边缘提取中就存在着对提取好坏的评价。
针对这一问题,根据边缘检测的有效性和定位的可靠性,Canny研究了最优边缘检测器所需的特性,给出了评价边缘检测性能优劣的三个指标:
(1)好的信噪比,即将非边缘点判为边缘点的概率要低,将边缘点判为非边缘点的概率要低;
(2)好的定位性能,即检测出的边缘点要尽可能在实际边缘的中心;
(3)对单一边缘仅有惟一响应,即单个边缘产生多个响应的概率要低,并且虚假响应边界应得到最大的抑制。
用一句话说,就是希望在提高对景物边缘的敏感性的同时,可以抑制噪声的方法才是好的边缘提取方法。
值得庆幸的是,且个线性算子可以在抵抗噪声与边缘检测之间获得一个最佳的折中,这个算子就是高斯函数的一阶导数。
高斯函数与原图的卷积达到了抵抗噪声的作用,而求导数,则是检测景物边缘的手段。
对于阶跃形的边缘,Canny推导出的最优边缘检测器的形状与高斯函数和一阶导数类似,因此Canny边缘检测器就是由高斯函数的一阶导数构成的。
我们知道,高斯函数是圆对称的,因此Canny算子在边缘方向上是对称的,在垂直于边缘的方向上是反对称的。
这就意味着该算子对最急剧的变化方向上的边缘特别敏感,但在沿边缘方向上是不敏感的。
设二维高斯函数为
(2-1)
其中,σ是高斯函数的分布参数,可用以控制对图像的平滑程度。
最优阶跃边缘检测算子是以卷积▽G*
为基础的,边缘强度为
,而边缘方向为
。
从高斯函数的定义可知,该函数是无限拖尾的,在实际中,一般情况下是将原始模板截断到有限尺寸N。
实验表明,当
时,能够获得较好的边缘检测结果。
2.3.2Canny算子的实现
下面是Canny算子的具体实现。
利用高斯函数的可分性,将▽G的两个滤波卷积模板分解为两个一维的行列滤波器:
(2-2)
其中
(2-3)
(2-4)
(2-5)
(2-6)
(2-7)
(2-8)
K为常数将式(2-2)(2-3)分别与图像
(2-9)
则
反应了图像上
点处的边缘强度,
是图像的点
处的法向矢量(下交于边缘方向的方向)。
根据Canny的定义,中心边缘点为算子
与图像
(x,y)的卷积在边缘梯度方向上的区域中的最大值。
这样,就可以在每一点的梯度方向上判断此点强度是否为其领域的最大值来确定该点是否为边缘点。
当一个像素满足以下三个条件时,则被认为是图像的边缘点。
(1)该点的边缘强度大于沿该点梯度方向的两个相邻像素点的边缘强度;
(2)与该点梯度方向上相邻两点的方向差小于45度;
(3)以该点为中心的
领域中的边缘强度极大值小于某个阈值。
此外,如果
(1)和
(2)同时被满足,那么在梯度方向上的两相邻像素就从候选边缘点中取消,条件(3)相当于区域梯度最大值组成的阈值图像与边缘点进行匹配,这一过程消除了许多虚假的边缘点。
图像边缘检测的基本步骤:
(1)滤波,边缘检测主要基于导数计算,但受噪声的影响。
但滤波器在降低噪声的同时也导致了边缘强度的损失。
(2)增强,增强算法将邻域咴度有显著变化的点突出显示。
一般通过计算梯度幅值完成。
(3)检测,但在有些图像中梯度幅值较大的并不是边缘点。
最简单的边缘检测是梯度幅值阈值的判定。
(4)定位,精确确定边缘的位置。
综上所述,Canny算子的具体算法步骤如下:
(1)用高斯滤波器对图像进行滤波,去除图像中的噪声;
(2)用高斯算子的一阶微分对图像进行滤波,得到每个图像的梯度强度和方向;
(3)对梯度进行“非极大抑制”梯度的方向可以被定义为如图2-1所示
标识为1,2,3,4的属于四个区之一,各个区用不同的邻近像素来进行比较,以决定局部极大值。
例如,如果中心像素x的梯度方向属于第4区,则把x的梯度值与它左上和右下相邻像素的梯度值比较,看x的梯度值是否是极大值。
如果不是,就把像素x的灰度设为0。
这个过程称为“非极大抑制”。
4
3
2
1
x
图2-1梯度方向图
(4)对梯度取两次阈值,即取阈值
,两者关系为
我们把梯度值小于
的像素的灰度设为0,得到图像1。
然后把梯度值小于
的像素的灰度设为0,得到图像2。
由于图像2的阈值较高,去除大部分噪声,但同时也损失了有用的边边缘缘信息。
而图像1的阈值较低,保留了较多的信息。
我们以图像2为基础,以图像1为补充来连接图像的边缘。
(5)链接边缘的具体步骤如下:
1.对图像2进行扫描,当遇到一个非零灰度的像素P时,跟踪以P为开始点的轮廓线,直到轮廓线的终点Q。
2.考察图像1中与图像2中Q点位置对应的点
的8邻近区域。
如果在
点的8邻近区域中有非零像素
存在,则将其包括到图像2中,作为R点。
从R开始重复第一步,直到我们在图像1和图像2中都无法继续为止。
3.当完成对包含P的轮廓线的连接之后,将这条轮廓线标记为已仿问。
回到第①步,寻找下一条轮廓线,重复第
(1)步第
(2)步第(3)步,直到图像2中找不到打新轮廓线为止。
至此完成Canny算子的边缘检测。
2.4基于轮廓的描述方法
基于轮廓的形状描述方法也分为连续型(即全局型)和离散型(即结构型)两种类型。
连续型的描述方法不对轮廓进行分段处理,往往是从全局轮廓抽取特征矢量。
离散型的方法往往首先将轮廓划分为很多片段,然后提取相应的特征。
简单的形状描述符主要有链码、傅立叶描述符、曲率尺度空间描述符及小波描述符四种基于轮廓的描述方法。
2.4.1傅立叶形状描述符
傅立叶形状描述符(Fouriershapedescriptors)是一种广泛应用的形状描述符,其基本思想是用物体边界的傅立叶变换作为其形状描述,假设一个二维物体的轮廓是由一系列坐标为
的像素组成,其中
,而N是轮廓上像素的总数。
从这些边界点的坐标中可以推导出四种形状表达,分别是曲率函数、质心距离、复坐标函数和弦长函数。
轮廓线上某一点的曲率定义为轮廓切向角度相对于弧长的变化率。
曲率函数
可以表示为:
(2-10)
其中
是轮廓线的切向角度,定义为:
(2-11)
质心距离定义为从物体边界点到物体中心
的距离,如下所示:
(2-12)
复坐标函数是用复数表示的像素坐标:
(2-13)
这种复坐标函数的傅立叶变换会产生一系列复数系数。
这些系数在频率上表示了物体形状,其中低频分量表示形状的宏观属性,高频分量表达了形状的细节特征。
形状描述符可以从这些变换参数中得出。
为了保持旋转无关性,我们仅仅保留了参数的大小信息,而省去了相位信息。
缩放的无关性是通过将参数的大小除以DC分量(或第一个非零参数)的大小来保证的。
请注意变换无关性是基于轮廓的形状表示所固有的特点。
对于曲率函数和质心距离函数,我们只考虑正频率的坐标轴,因为这时函数的傅立叶变换是对称的,即有
基于曲率函数的形状描述符表示为:
(2-14)
其中表示傅立叶变换参数的第i个分量。
类似的,由质心距离所导出的形状描述
符为:
(2-15)
对于复坐标函数,正频率分量和负频率分量被同时采用。
由于DC参数与形状的所处的位置有关而被省去。
因此,第一个非零的频率分量被用来对其它变换参数进行标准化。
复坐标函数所导出的形状描述符为:
(2-16)
为保证数据库中所有物体的形状特征都有相同的长度,在实施傅立叶变换之前需要将所有边界点的数目统一为M。
例如,M可以取为
这样就可以采用快速傅立叶变换来提高算法效率。
2.5图像的相似性度量
在基于内容的图像检索中,特征的相似性度量也是需要解决的重要问题之一。
只有在得到图像的特征后进行特征的相似性度量,才能有效的根据相似距离进行判断,实现图像的检索。
为了达到图像检索的目的,需要对提取的特征进行相似度计算。
相似度是以数值的形式来表示两个对象之间的相似程度的度量结果。
将图像的特征看作是坐标空间中的点,两个点的接近程度即相似度通常用他们之间的距离表示,不同类型的特征数据所采用的相似性度量函数是不一样的,相似度公式的选择的恰当与否对检索的精确度有很大的影响,合适的距离度量函数的选择,将使得图像特征向量的比较更加符合人类对视觉感知内容的仿真,有助于基于内容的图像检索的性能提高。
假设在图像数据库中,用特征向量来表示任何一个图像特征,其中X和Y,分别是任意两个特征向量,它们之间的接近程度可以采用距离度量或者统计学方法来进行图像相似性判断。
常见的距离度量有欧几里德距离、Manhattan距离等。
下面重点介绍欧几里德距离。
欧几里德距离是一个应用非常普遍的距离变量。
它计算简单,并且与参考系统的旋转不变量相关。
它的定义:
(2-17)
当发生数据丢失或者当所有特征向量不具备相同的权重时,那么就不能使用欧几里德距离来进行相似性测度。
为了避免这种情况,在实际的应用过程中可以对欧几里德距离来进行归一化。
归一化欧几里德距离的定义如下所示:
(2-18)
3基于形状特征的图像检索系统的设计
3.1Canny算子的程序设计
本文是用C++编程来实现图像的处理,整体流程图如3-1图所示
未打开
图3-1整体流程图
Canny算子程序流程图如图3-2所示:
图3-2Canny算子程序流程图
3.2 图像特征数据库设计
对于数据库模块,本文利用MicrosoftAccess建立图像数据库系统,使其不仅可以存储原始图像,还可以存储提取后的图像特征,并且能够对存储的原始图像按照形状特征进行图像的自动分类。
在基于形状特征的图像检索系统的中的图像特征数据库用于存放图像库中各图像的形状特征。
在这里,将得到的一组图像形状特征(曲率、质心距离、复坐标和弦长)存放到Access相应的特征表中,组成特征数据库。
如表3-1所示:
表3-1图像形状特征表
字段名
字段类型
字段长度
字段说明
energy
数字
单精度
曲率
contrast
质心距离
entropy
复坐标
Inversegap
数字
弦长
对于图像检索,本文设计了图像的入库、显示、删除和添加描述四个功能。
首先,利用灰度共生矩阵提取方法得到图像的形状特征,并将这些特征存储到Access数据库中;
然后,利用基于文本或缩略图浏览的方式从Ac