ImageVerifierCode 换一换
格式:DOCX , 页数:33 ,大小:211.95KB ,
资源ID:26577324      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/26577324.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于内容的图像检索方法的研究.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

基于内容的图像检索方法的研究.docx

1、基于内容的图像检索方法的研究基于内容的图像检索方法的研究摘要近年来,随着多媒体技术和计算机互联网技术的快速发展,数字图像的数量正以惊人的速度增长。面对日益丰富的图像信息海洋,人们需要有效地从中获取所期望得到多媒体信息。因此,在大规模的图像数据库中进行快速、准确的检索成为人们研究的热点。为了实现快速而准确地检索图像,利用图像的视觉特征,如颜色、纹理、形状等来进行图像检索的技术,也就是基于内容的图像检索技术(CBIR)应运而生。其中,颜色特征作为图像的一种重要的视觉特征,已得到广泛的应用。本文主要研究基于图像颜色特征的检索。选用基于颜色直方图的算法,并利用Visual Basic程序设计语言和Ac

2、cess数据库技术设计实现了基于颜色直方图算法的图像检索系统。主要做法是:采用符合人类视觉特征的HSV颜色空间来表示图像的颜色特征,利用人对颜色的感知来对颜色分量进行非等间隔的量化并形成特征矢量,用相似性度量函数进行图像的相似性匹配,从而实现图像的检索。关键字:图像数据库;CBIR;颜色直方图;相似距离The Research of Content-based Image Retrieval MethodABSTRACTWith the rapid development of multimedia and computer network technique, the quantity of

3、 digital image and video is going up fabulously. Facing the vast ocean of information of image, it has a good sense to obtain the desired multimedia information. Currently, rapid and effective searching for desired image from large-scale image databases becomes an hot research topic. In order to ret

4、rieve image quickly and accurately using image visual features such as color, texture, shape, which named content-based image retrieval (CBIR) came into being. Among them, the color features as an important visual features of the image has been widely used. This paper studies the retrieval based on

5、image color characteristics. Using algorithm based on color histogram, and the Visual Basic programming language and Access Database Design to implement the image retrieval system based on color histogram algorithm. The main approach is: to represent the images color characteristics consistent with

6、human visual characteristics of the HSV color space, using the perception of color to the color component unequal interval quantization and to form a feature vector, using measure function to match image similarity, in order to achieve image retrieval.Key words: Image database; CBIR; Color histogram

7、; Similarity distance目录 前言 11.1课题背景及研究意义 11.2基于内容的图像检索技术研究的现状和发展方向 11.3本文主要研究内容 22基于内容的图像检索 32.1概念 32.2特点 32.3CBIR过程的一般框架 33图像特征提取与相似性度量 53.1图像的文件格式 53.2颜色模型 63.2.1RGB颜色空间 63.2.2HSV颜色空间 73.2.3RGB 颜色空间到 HSV 颜色空间的转换 73.3颜色量化 83.4颜色直方图 83.5基于子块颜色直方图算法 93.6图像的相似性度量 103.6.1图像的相似度 103.6.2相似度计算公式 104基于颜色特征

8、的图像检索系统设计和实现 124.1系统结构设计 124.2图像特征数据库设计 124.3系统开发环境 124.4系统流程 134.5系统的实现 134.5.1图像的获取 134.5.2图像特征的提取 144.5.3图像的检索 165总结 18参考文献 19致谢 20前言1.1课题背景及研究意义近年来,伴随着计算机网络技术和多媒体数据库技术的迅猛发展,特别是大量图像数据的广泛应用,实现图像检索成为多媒体数据库中最基本也是最普遍的要求。传统的图像检索是基于文本方式,对图像库中的每一幅图像使用关键字进行标记,然后利用文字属性的匹配进行对图像的检索。这种基于文本的图像检索需要人工注解的工作量很大,且

9、文本描述很难准确的表达图像中丰富的信息,常常会因为不同人对同一内容的描述方式不同而千差万别,造成检索的准确程度降低。在信息需求的不断增加和日益迫切的今天,原始的图像检索系统已经远远不能满足要求。因此,基于内容的图像检索技术的研究越来越成为人们研究的热点。特别是多媒体内容描述接口MPEG-7的制定和完善,更加推动了这一技术的开发和运用。基于内容的图像检索技术对促进图像技术的发展具有重要的作用。首先,在检索图像的准确度上,基于内容的图像检索技术把图像的颜色、形状、纹理等视觉特征作为图像的内容来查找和匹配图像,通过算法实现图像特征的提取和图像间的相似性匹配,提高了检索结果的准确性。其次,随着数据库技

10、术研究的深入、计算机视觉以及人工智能的发展,我们可以对图像的这些特征进行自动的提取和匹配,大大减少了人工的工作量,从而在提高检索准确度的同时,降低了图像检索所需要的时间。目前,这项技术已经广泛应用于图像的网络搜索、遥感、数字图书馆、计算机辅助设计、地理信息系统、商标版权管理等诸多领域,具有广阔的应用前景。1.2基于内容的图像检索技术研究的现状和发展方向目前,对图像的检索在图像索引与研究中应用最为广泛,基于图像颜色特征、纹理特征、形状特征和物体空间方位的检索方法是比较成熟的几种。近年来,基于内容的图像检索引起了多交叉学科研究人员的注意。在国外,特别是在美国等发达国家,这项技术已成为一个研究热点。

11、一些科研部门、高等院校、商业公司甚至于政府机构都纷纷投入大量人力和物力进行系统的研究和开发,以期取得领先地位。目前已经推出了一些CBIR系统的产品,如美国的IBM公司、Virage和Excalibur都已经开发出了的基于图像内容的相似性特征的图像库检索引擎,并在网上提供了演示站点。国内的研究主要集中在基于图像颜色的查询,也有一部分基于纹理和形状的查询。自20世纪90年代以来,基于内容的图像检索成为一个研究热点。目前,该技术已成功应用于人脸识别技术;针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。除此之外,它还可以解译影像数据中的建筑、村庄、耕地等不同种类的地形信息,实现对遥感图像的检索

12、。基于内容的图像检索技术研究的发展方向主要有:(1)两类图像检索技术的结合传统的图像搜索引擎主要侧重于对图像内容的文本描述,而图像库检索技术则更侧重于通过算法对图像内容的特征的提取和匹配,它们虽然侧重不同却相互补充。如果能将二者结合起来,取长补短,则图像检索技术必将会有新的进展。(2)对基于内容的编码技术的研究自20世纪90年代起,国际上就有了对基于内容的图像检索技术的研究。从基本的颜色检索,到综合利用多种图像特征进行检索,推出了大量原型系统。其中,部分已经投入到实际应用中并取得良好效果。在Internet环境下,MPEG专家组制定了一个基于内容的多媒体描述方案,即MPEG-7标准,对各种不同

13、类型的多媒体信息内容的描述方式进行了标准化定义,从而实现CBIR与TBIR(基于图像文本特征的检索)的互连。总之,该项技术在实际中的应用会越来越广泛,而且必将在各个领域当中占据主导地位,并带动相关产业的发展,促进多媒体信息化的交流。1.3本文主要研究内容本文在介绍基于颜色特征的图像检索技术的基础上,将颜色直方图作为研究重点,对CBIR技术进行了较为全面的研究,以多媒体图像数据库为平台,将CBIR作为一种信息检索技术,应用到图像数据库中,作为检索引擎来实现基于颜色特征的图像检索功能。(1)详细讨论了常见的颜色特征表示方法以及从RGB模型到HSV模型的转换和颜色特征的提取方法,采用符合人类视觉感知

14、特征的HSV模型来提取颜色特征,并按照人的视觉分辨能力将颜色量化为36柄的一维特征向量。(2)运用相似性度量算法,用户可以根据自己的兴趣,针对不同的区域,灵活地调整权重系数,更准确地实现图像颜色特征的匹配。(3)在开发工具上,选用Visual Basic 6.0程序设计语言,对图像进行了定义,完成图像特征的读入和提取,用Access数据库存放图像的特征索引向量,并通过颜色匹配算法实现基于图像颜色特征的检索功能。2基于内容的图像检索2.1概念基于内容的图像检索(CBIR)是指根据图像颜色、纹理、形状等视觉特征,从已定的图像库中查找含有特定特征的图像。与传统的图像检索手段不同,它融合了图像理解技术

15、,在输入图像的同时将其相应的特征向量也存入特征库。在进行图像检索时,对每一幅给定的关键图,进行图像分析,并提取图像的特征向量。将该图像的特征向量和特征库中的特征向量进行匹配,根据相似距离的大小在图像库中进行搜索就可以得到所需要的检索图了。2.2特点CBIR 方法利用图像的视觉特性,实现了用图像来检索图像。这比利用传统的文字标注等要有效的多。基于内容的图像检索是根据图像的颜色 、形状、纹理等特征以及这些特征的组合来查询图像的,这是计算机图像处理和数据库技术的很好的结合。它具有以下几个显著的特点1:(1)用于检索的是反映图像内容的各种量化特征;(2)使用基于相似性度量的近似查询;(3)大多采用实例

16、查询QBE(Query By Example)方法。对于基于内容的图像检索有三个关键:一是要选取恰当的图像特征;二是要采取有效的特征提取算法;三是要有准确的特征匹配算法。2.3CBIR过程的一般框架CBIR系统可以看作是一个用户和图像数据库之间的一个界面或通道2,其过程的一般框架可以描述为如图2-1。图2-1基于内容的图像检索各模块的作用:(1)查询模块:为用户提供多样的查询手段,以支持用户进行多种类型的查询;(2)描述模块:将用户查询的外部表达转化成为对图像信息内容的内部表达和描述;(3)匹配模块:将查询描述与库中被查询信息的描述进行匹配,确定它们内容的一致性和相似性;(4)提取模块:把满足

17、既定条件的信息自动的从库中提取出来;(5)验证模块:为用户提供方便的验证手段以评价提取的效果。目前,很多基于内容的图像检索系统中还包含有用户反馈机制,其主要功能是收集检索出的图像信息,根据用户自己的期望,对搜索到的图像进行粗略的判断,然后修改查询信息并提交给查询模块。3图像特征提取与相似性度量基于内容的图像检索系统在进行图像检索的过程中,将关键图和被检索的图像进行图像分析,提取出这些图像的特征向量,再将关键图的特征向量和被检索的图像的特征向量进行相似性匹配,根据相似距离检索到期望的图像。由这个工作原理可知,该系统的关键点包括:选取恰当的图像格式,以便提取其有效的颜色特征;选择准确的特征匹配算法

18、,从而实现图像的相似性匹配。因此,如何恰当的提取颜色特征,以及对颜色特征如何进行有效地抽取和匹配也就成为CBIR研究领域的重点。3.1图像的文件格式本文采用的图像格式是BMP格式。BMP文件是常见的图像文件格式之一,是 Windows 操作系统中的标准文件格式。由于不进行图像压缩,所以BMP图像文件能够表达丰富的色彩信息。BMP图像文件的结构可以分为四个部分:文件头数据结构、文件信息数据结构、调色板以及图像数据。其中,文件头的长度为固定值54个字节;调色板数据对所有的不超过256色的图像模式都需要进行设置,即使是单色图像模式也不例外;图像数据既可以采用一定的压缩算法进行处理,也可以不必对图像处

19、理软件进行压缩处理,这不仅与图像文件的大小有关,而且也与对应的图像处理软件是否支持经过压缩处理的BMP图像文件相关3。图像文件的文件头和文件信息头的定义形式如下:(1)文件头(BITMAPFILEHEADER)Public Type bitmapfileheaderbftype As Integerbfsize As Longbfreserved1 As Integerbfreserved2 As Integerbfofbits As LongEnd Type该程序中定义了BMP文件的类型、大小,以及图像数据的偏移量,即从文件头开始多少个字节后是图像数据的起始。(2)文件信息头(BITMAPI

20、NFOHEADER)Public Type bitmapinfoheaderbisize As Longbiwidth As Longbiheight As Longbiplanes As Integerbibitcount As Integerbicompress As Longbisizeimage As Longbixpelspermeter As Longbiypelspermeter As Longbicirused As LongBMP文件信息头基本上包含图像的所有重要的信息,包括宽度、高度和每像素的位数。3.2颜色模型所谓颜色模型2是指某个三维颜色空间中的一个可见光子集,包括某个

21、颜色域的所有颜色。常见的颜色模型包括RGB(红、绿、蓝),HSV(色调、饱和度、亮度),CMYK(青、洋红、黄、黑)等。其中,HSV空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域。3.2.1RGB颜色空间RGB 颜色空间是一种常用的颜色空间。目前,图像采集系统以及彩色显示器等硬件显示设备大都采用了 RGB 颜色空间来表示颜色。数字图像一般也都采用这一颜色空间来表示。如图 3-1所示,RGB颜色模型是三维直角坐标颜色系统的一个单位正方体。它以红(R)、绿(G)、蓝(B)作为三基色。在空间坐标系的原点上,三基色的亮度均为零,此时代表黑色;当

22、三基色同时达到最高亮度时为白色;由等量的三基色组合而成的颜色是灰色,这些灰色点均落在RGB彩色立方体的对角线上。图3-1RGB颜色空间虽然RGB空间模型在实际生活中广泛应用,但是它并不具有视觉一致性,不符合人对颜色的感知心理,且RGB颜色空间上的距离并不代表人眼视觉上的差异。因此,需要用另一种符合人的视觉感知的颜色模型来表示颜色。3.2.2HSV颜色空间HSV颜色空间具有视觉一致性,它比RGB颜色空间更符合人的视觉特性。HSV颜色空间把常见颜色表示为三种属性:色调 H(Hue)、饱和度S(Saturation)和亮度 V(Value)。HSV模型对应于圆柱体坐标系的一个圆锥子集。圆锥的顶面对应

23、于V=1,色调H又绕V轴给定,饱和度S取值从0到1,由圆心向圆周过度。H表示色调信息,即所处的光谱颜色的位置,通常由颜色名称来辨别,如红、橙、黄、绿等,它用角度-180180或0360来度量。饱和度S为一比例值,指颜色的深浅程度,范围从0%到浓度完全饱和的100%,它表示所选颜色的纯度和该颜色最大的纯度之间的比率,即在纯色中包含白色光的成分。V表示色彩的明亮程度, 0%为最暗的黑色,而100%为最亮的白色3。HSV颜色模型如图3-2所示。图 3-2HSV 颜色空间模型HSV颜色空间直接对应于人眼色彩视觉特征的三要素,通道之间各自独立,因此可以独立感知各颜色分量的变化,其中色调尤其影响着人的视觉

24、判断。因此在基于内容的图像检索中,应用这种颜色空间模型会更适合用户的视觉判断。3.2.3RGB 颜色空间到 HSV 颜色空间的转换一般情况下,人们认识到的图像都是在RGB颜色空间描述的,但在图像检索的应用过程中,HSV空间模型更适合于人的视觉感知。因此,应该将图像从RGB空间模型转换到HSV空间模型4。设r,g,b0,1,2,255,由RGB颜色空间模型到HSV颜色空间模型的转化为:设v=max(r,g,b),定义r,g,b为:r=,g=, b=,则 v=v/255,v0,1 ,S (3-1)5b,若rmax(r,g,b)且gmin(r,g,b)。1g,若rmax(r,g,b)且gmin(r,

25、g,b)60h= 1r, 若gmax(r,g,b)且bmin(r,g,b) , (3-2)3b,若gmax(r,g,b)且bmin(r,g,b)3g,若bmax(r,g,b)且rmin(r,g,b)5r, 否则 这里r,g,b0,255,h0,3604。3.3颜色量化颜色量化是指确定一组颜色以表示图像的颜色空间,然后确定从颜色空间到选定颜色集合的映射,即将颜色空间映射到一个给定大小的子集中,并使其总体误差最小。因为 CBIR 中采用的HSV颜色空间具有视觉一致性的特点,而且人眼分辨颜色的能力是有限的5。因此,在量化时可以考虑按照人的颜色感知对颜色空间进行非等间距的量化,量化结果为:0,H 0,

26、601,H 60,120 0, V 0,0.3H= 2,H 120,180 , , V= 1, V 0.3,0.8 (3-3)3,H 180,240 2, V 0.8,1 4,H 240,3005,H 300,360量化结束后,可以将HSV颜色空间划分为LHLSLV个相似色空间,其中量化级数LH=6,LS=2,LV=3。故把三个分量合并成一个一维的特征矢量就是L=LSLVH+LVS+V=6H+3S+V。这样H、S、V三个分量分布在一维矢量上,L的取值范围为0,35,即颜色量化后的图像可以得到36柄的一维颜色直方图3。3.4颜色直方图对于基于颜色的图像检索系统,关键问题之一是对颜色特征的提取。目

27、前,大部分基于颜色的检索系统都是以比例分布作为颜色的基本特征,这也就是图像的颜色直方图。颜色的直方图特征是图像检索领域中提出最早、算法最简单,而且具有尺度不变性和旋转不变性2,因此成为使用最为广泛的颜色特征之一。它是在确定颜色空间的基础上,统计出图像中每种颜色分量的像素数占图像总像素数的比值,从而得到图像各种颜色分量的比例分布直方图,将其转换成为一维的特征向量,作为这幅图像的特征。颜色直方图是颜色信息的函数,它表示图像中具有同颜色级别的像素的个数,其横坐标是颜色级别,纵坐标是颜色出现的频率,即像素的个数。颜色直方图是一种概率统计的方法。它将图像中各颜色像素的个数进行统计,并用直方图的形式表达出

28、来,具体定义为:H(P)=(hc1(L),hc2(L),hc3(L),hci(L))其中,hci(L)= ,|Lci|表示图像中所有颜色为Ci的像素的个数。这种颜色直方图只反映了图像中所占的百分比,而丢失了图像颜色的空间分布信息,也就是说两幅颜色空间分布完全不同的图像(如天空和海洋)仍可以具有相同的直方图,这势必造成检索的误差。这时,可以加进颜色的空间分部信息。3.5基于子块颜色直方图算法一般颜色直方图在算法上比较简单,但图像检索时却不够准确,因为颜色直方图相似的图像可能内容差别很大。这时便可以通过利用基于子块颜色直方图算法来实现图像的检索。将图像划分为几个单元,然后分别计算这些单元颜色直方图

29、。在计算图像的相似距离时,先计算每张图像中每个单元之间的距离,然后将这些距离组合起来,便可以得到图像与图像的距离。基于子块颜色直方图的图像检索方法可以采用一种比较简单的固定划分策略,将图像分解成为若干个大小相同并且互相不重叠的单元区域。同时,用户可以对自己感兴趣的子块增大权重,提高检索准确率。通常情况下,主要内容位于图像的中间区域,图像的四周大多是背景画面。因此可以采用这样一种分块方法3:图3-3分块策略由此划分方法可知:图像的主要区域位于第5块,其余的标号为1、2、3、4的属于背景。在特征的提取过程中,提取第5块的主颜色,提取1、2、3、4块的平均颜色,剩下图像的四角部分对图像特征影响不大,

30、往往可以忽略。提取特征的方法为:(1)计算各个分块的一般颜色直方图设二维数组LI,j中存放的是图像各像素点量化后的HSV颜色值,其中i,j为各像素点坐标。数组PicCenterk中存放中心区域的一般直方图,k为量化后的HSV颜色值。(2)然后计算第5块(中心区域)的主颜色m5主颜色是指图像中出现次数最多的那种颜色,即main=取下标(maxhc)。将设定好的颜色区域窗口沿直方图从左向右移动,并记录窗口内颜色的总频数。得到总频数最大的窗口位置时,此窗口内颜色的加权平均值即为图像的主颜色,即main=hci/ 。(3)计算1、2、3、4块的平均颜色ei,i=1,2,3,4平均颜色是一般直方图颜色的

31、加权平均:mean=hc/。(4)图像分块颜色特征向量由第5块的主颜色和1、2、3、4块的平均颜色共同组成了分块颜色特征向量:F=m5,e1,e2,e3,e4。3.6图像的相似性度量在基于内容的图像检索中,特征的相似距离的度量也是需要解决的重要问题之一。只有在得到了图像的特征后进行特征的相似性度量,才能有效的根据相似距离进行比较,准确地实现图像检索。3.6.1图像的相似度为了达到图像检索的目的,需要对提取的特征进行相似度计算。相似度是以数值的形式来表示两幅图像之间的相似程度的度量结果,即相似距离。将图像的特征看作是坐标空间中的点,两个点的接近程度即相似度通常用他们之间的距离表示,不同类型的特征数据所采用的相似性度量函数是不一样的,相似度公式的选择的恰当与

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1