毕业设计论文web图像检索系统的设计.docx

上传人:b****4 文档编号:24207696 上传时间:2023-05-25 格式:DOCX 页数:50 大小:1.20MB
下载 相关 举报
毕业设计论文web图像检索系统的设计.docx_第1页
第1页 / 共50页
毕业设计论文web图像检索系统的设计.docx_第2页
第2页 / 共50页
毕业设计论文web图像检索系统的设计.docx_第3页
第3页 / 共50页
毕业设计论文web图像检索系统的设计.docx_第4页
第4页 / 共50页
毕业设计论文web图像检索系统的设计.docx_第5页
第5页 / 共50页
点击查看更多>>
下载资源
资源描述

毕业设计论文web图像检索系统的设计.docx

《毕业设计论文web图像检索系统的设计.docx》由会员分享,可在线阅读,更多相关《毕业设计论文web图像检索系统的设计.docx(50页珍藏版)》请在冰豆网上搜索。

毕业设计论文web图像检索系统的设计.docx

毕业设计论文web图像检索系统的设计

摘要

计算机处理能力的日益增强,因特网技术的广泛普及和网络带宽不断提高,大量的图像信息不断产生,如何从这些海量图像数据中搜索人们感兴趣并有效利用这些图像,成为迫切需要解决的问题。

本设计首先以“Web图像检索”为背景介绍了在Internet中检索图像的基本概念和常用的两种重要技术:

基于文本的图像检索和基于内容的图像检索,并简要阐述了它们的基本概念、原理,说明了目前这一领域的发展现状。

其次重点介绍了图像的内容特征:

颜色特征、纹理特征和形状特征,和以图像内容特征为基础的Web图检索原理,对常用的对应图像检索算法分别介绍和对比,并分析了其优劣性。

最后以基于内容的图像检索为重点,利用VC++编程工具对Web图像检索系统进行了模拟和验证。

 

关键字:

Web图象检索,特征提取,颜色直方图,相似度

 

Abstract

Thecapacityofcomputerprocessingisinincreasing,Internettechnologyisinpopularwithmoreandmorepeopleandnetworkbandwidthbroadens,Besides,amassofimagedatainformationisbeingproducedconstantly,sohowtofindsoneimagewhatpeopleareinterestedinandtousetheseeffectivelyfromtheWeb,becomeaurgentproblem.

Firstly,thisprojectintroducedthebasicconceptofWebimageretrievalandtwocommonbutimportanttechnologys:

basedontextimageretrievalandcontent-basedimageretrieval.andbrieflydescribestheirbasicconcept,principleandthecurrentsituationofthedevelopmentofthisfield.Secondly,itintroducedthecontentscharacteristic:

colorimagefeatures,thetexturefeaturessandshapefeatures,andtheoryofWebimageretrievalthatisbasedonthesecontentfeatures,meanwhile,severalimportantimageretrievalalgorithmsusedareintroducedandcompared,andanalysedtheiradvantagesanddisadvantages.Finally,tocontent-basedimageretrieval,Designa“Webimageretrieval”systemtosimulateandtestbyusingVC++6.0programmingtool.

 

Keywords:

Webimageretrieval,featureextraction,colorhistogram,similarity

 

 

第一章前言

Web图像检索概述

从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-basedImageRetrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。

到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-basedImageRetrieval,简称CBIR)技术。

CBIR属于基于内容检索(Content-basedRetrieval,简称CBR)的一种,CBR中还包括对动态视频、音频等其它形式多媒体信息的检索技术。

在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:

一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;最后一方面是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。

为了进一步提高检索的准确性,许多系统结合相关反馈技术来收集用户对检索结果的反馈信息,这在CBIR中显得更为突出,因为CBIR实现的是逐步求精的图像检索过程,在同一次检索过程中需要不断地与用户进行交互。

1.2图像检索方法的研究综述

目前,检索的方法基本分为两大类:

基于文本的图像检索和基于内容的图像检索。

基于文本的检索

基于文本的图像检索沿用了传统文本检索技术,回避对图像可视化元素的分析,而是从图像名称、图像尺寸、压缩类型、作者、年代等方面标引图像,一般以关键词形式的提问查询图像,或者是根据等级目录的形式浏览查找特定类目下的图像,如GettyAAT使用近133,000个术语来描述艺术、艺术史、建筑以及其它文化方面的对象,并推出30多个等级目录,从7方面描述图像的概念、物理属性、类型和刊号等。

又如Gograph将图像分为动态图像、照片、图标、背景、艺术剪辑图、插图、壁纸、界面、成套图像8个一级类,下设数量不等的子类。

在图像数字化之前,档案管理者、图书管理员都是采用这种方式组织和管理图像。

图像所在页面的主题、图像的文件名称、与图像密切环绕的文字内容、图像的链接地址等都被用作图像分析的依据,根据这些文本分析结果推断其中图像的特征。

现阶段,真正进入普通意义上的实用阶段的图像检索方法,基本上还都是采用了基于文本的检索方法。

这种方法,实际上就是靠人工为图像进行标注,用对图像的一些描述信息来作为检索时的关键字,如作者、标题、大致内容、创作时间等。

广泛流行的商用搜索引擎,如G00GLE、XX。

这种检索的策略,实际上是抛开了图像信息本身,其实质还是传统的文本信息检索。

而且,显而易见的是,由于不同的人对同一幅图像可能有不同的理解,从而不可避免的造成了二义性。

并且由于现实情况的复杂性,要建立能够完整表达图像信息的关键字是十分困难的,几乎不可能办得到。

同时,随着图像的不断增多,人工标注的工作量也会急剧攀升。

所以,使用这种方法,虽然在一定程度上缓解了人们的迫切需要,但往往不能取得令人满意的效果,应用范围受到极大的限制。

所以说,基于文本的图像检索方法,只能是权宜之策,而不是最终的解决之道。

基于内容的图像检索技术

基于内容的图像检索(ContentBasedImageRetrieval,CBIR)是基于内容检索技术(ContentBasedRetrieval,CBR))的一种是近些年发展起来的侧重于挖掘图像本身特征的一种检索策略。

图像的内容即图像的特征,而基于内容的检索就是通过两幅图像的特征匹配,即图像特征的相似性度量来实现的。

要进行图像特征匹配首先要进行特征提取。

图像的特征分为低层物理特征(如颜色、纹理、形状、轮廓等)和高层语意特征(是人对图像的概念级的反映,如对图像的个人感受等)。

高层特征在目前的条件下,一般通过人工注释的方法来实现,也就是前面说的基于文本的图像检索方法,这种方法要实现自动化有较大的困难,且主观性太强,不利于标准化的实现。

而低层次的颜色、纹理、形状等特征则相对较容易提取,也可较客观地反映图像之间的差别。

基于内容的查询方法和基于文本的查询方法相比,有这样几个特点:

(l)采用从图像中提取出来的颜色、纹理、形状等真实特征来作为检索的依据,而不是人为的文字评价;

(2)对这些特征进行相似性度量,即采用近似查询的方法;(3)多采用示例查询的方法QBE(QuerybyExamPle),即给出示例图像,再从图库中查找与之相似的结果图像来。

如果将图像检索和图像理解相比的话,两者在基础技术上比较相似,但还是存在着许多重要的不同之处的。

比如,CBIR并不需要计算机识别出具体的目标是什么,计算机可以在完全不了解具体内容的意义的情况,而找出若干幅类似的图像来,另外,图像检索是模糊的相似性判断,检索结果应尽可能包含图像库中的所有相关图像,并且允许在结果中存在不相关的图像,而不同于图像识别那样必须找出明确的、完全相似的内容。

采用CBIR方法开发的第一个功能较为齐全的系统,要属IBM公司Almadell研究中心开发的QBIC[3](QuerybyImageContent)系统,它可以利用颜色、纹理、形状和草图等多种方法进行检索,用户只需给出示例图像或草图,就可方便地在图像库中找到相似的图像来。

图像检索技术研究的三个方向

基于文本和基于内容是图像检索发展的两个分支,不过从目前图像检索研究的趋势而言,尤其结合网络环境下图像的特征——嵌入在具有文本内容的Web文档中,出现了三个不同的研究着眼点。

(1)立足于文本,对图像进行检索:

试图将传统的文本检索技术移植于对多媒体信息的检索上,因为基于文本的检索技术发展已经成熟。

但是因为受控词汇本身的局限,易歧义,更新慢,所以不太容易应对网络上日新月异的各类图像。

(2)立足于图像内容,对图像进行分析和检索:

相比而言,尽管图像检索已经出现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法,但是要突破对低层次特征的分析,实现更高语义上的检索,实现难度大,进展慢。

不过,基于内容的图像检索建立在多媒体信息的内容语义上,能够更为客观地反映媒体本质的特征。

(3)结合文本和内容,进行融合性研究:

发挥各自的优势促进图像的高效、简单检索方式的实现,尤其是网络环境下,结合图像所在Web文档的特征分析,推断图像的特征,同时结合对图像的内容分析,共同标引达到对图像的分析和检索。

以说,三个方向都是相互影响和促进的,任何一个方向的进展都会促进图像检索技术向前更进一步。

图像检索系统的性能指标和评价准则

图像检索有两种类型:

图像匹配和相似度检索。

设图像库有N福图像。

对于匹配问题,理想情况下是正确图像是检索结果V(X0)中第一个。

通常用下面的式子评价匹配结果:

匹配比率=

对相似度问题,通常的方法是人工一个相似图像子集S,假定S中图像的相似性比S和非S图像的相似度高。

取X∈S,Precision-Recall曲线能全面反映检索效果,下面称为P-R曲线,其中:

recall=,precision=

由于相似图像集合S是人工选出的,这个评价标准不可辟免带有主观因素。

不同人对相似度感受不同,因此在一定程度上不可取。

此外,采用排序方法评价系统性能也是一种常用的方法。

固定返回图像集合的数目n,设R为相关图像数目,p为相关图像的排序序号,T为实际的相关图像数目,评价参数为:

AVPR=,LAVPR=,MT=,

其中AVPR是相关图像的平均排序,LAVPR是理想的相关图像的平均排序,MT为丢失的相关图像率。

一般地,AVPR和LAVPR越小,检索算法越好,MT越好,性能越好。

 

第二章Web图像检索原理

2.1基于文本的图像检索

基于文本的图像检索方法诞生于二十世纪70年代,是图像检索方法的常用技术之一,它利用人工进行图像语义识别,并用相应的文本关键词对图像语义进行注解以实现图像的检索。

由于语言文字是人们进行语义表达最直观和熟知的手段,也是检索技术中广泛采用的检索方法,故通过其实现的图像检索使得检索形式较为简便、且由于采用人工注解图像语义,有效跨越了。

语义鸿沟”,从一定意义上说是基于语义的图像检索方法。

在图像规模较小的初期应用中,这种方法有效地满足了图像的检索需求,然而,随着图像检索应用的不断深入,利用人工提取图像语义标识以实现检索的方法存在着一些明显的缺陷:

1、人工提取图像语义标识需要耗费大量的人力资源,尤其面对呈指数级增长态势的图像资源,完全依赖人工工作存在着明显的效率问题;

2、人工实现图像语义标识的提取过程存在着主观片面性,图像的语义丰富,充分理解图像语义依赖于不同的知识结构及理解能力,不同人对其理解存在着主观差异性。

因此,面对不断增长的图像资源检索需求,如何高效、客观地实现图像语义的识别是影响基于文本的图像检索方法发展的瓶颈技术。

基于文本的图像检索结构如下所示:

图2.1基于文本的图像检索系统构成

2.2基于内容的图像检索

.1体系结构

本设计以VC++为开发环境实现了一个基于内容的图像检索原型系统如图2-2所示,主要用于验证各种特征提取算法的可行性和有效性。

首先对用户提交的示例图像进行特征提取,然后与图像特征库中的特征值进行匹配,最后将检索结果返回给用户。

系统的关键模块包括查询模块、特征提取模块、匹配模块,实际应用中每个模块都有许多具体技术可以采用,下面主要讨论各模块的功能及相关实现技术。

图2.2基于内容的图像检索系统结构

查询模块

查询模块用于提供前端界面的有关查询接口,用户通过查询界面访问图像库从而找到满足要求的图像,检索结果也是通过这个接口返回给用户。

通常提供用户查询的方法有:

(1)利用示例图像:

即用户给定一幅与期望图像类似的图像作为查询图像。

(2)利用绘制草图:

即用户借助绘图工具绘制出待查询图像。

(3)利用主色调的检索:

用户可以设置图像颜色百分比和颜色分布信息,从而找到具有相似颜色及比率的图像。

特征提取模块

基于内容的图像检索首先要解决的问题就是图像内容的分析和表示。

图像内容的分析和表示指的是通过对图像像素的颜色属性以及像素间的相住关系进行分析,从而得到一系列数字或者描述特征,这些特征可以在一定程度卜描述图像本身的内容。

然后,利用这此特征可以对图像建立索引,从而达到图像检索的目的。

因此,图像内容的表示问题本质上是一个图像特征的提取问题。

从广义上来讲,图像的特征包括图像的底层特征和高层语义特征。

底层特征用来描述图像共有的特征,主要包括颜色、纹理、形状等;后者则用来描述图像自身的内容信息,比较抽象。

本设计主要基于图像底层特征的特征提取。

系统中的特征提取模块负责图像处理工作,具体实现CBIR系统中支持的各种特征提取算法,从而能从图像中提取相应的特征信息。

本节简要地介绍几种图像特征。

常用的图像特征

1、颜色特征:

颜色信息是在图像检索中使用最广泛的底层特征,它和图像中的物体和场景有找紧密的联系。

与其他底层特征相比,颜色特征对于图像缩放、旋转、遮挡及其他形变有更强的鲁棒性。

最早采用颜色特征进行图像检索的是由Swain和Ballard提出的基于颜色直方图的检索方法。

图像颜色特征的表达涉及如下几个方面的问题:

一是选择一个合适的颜色空间;二是将颜色特征量化为向量形式;三是定义种相似度(距离)标准用来度量不同图像之间在颜色上的相似性。

由于颜色特征和其他特征相比具有一定的稳定性,不随物体的平移、旋转、观察距离的变化而变化,对于图像缩放、旋转、遮挡及其他形变有着更强的变化。

2、纹理特征:

纹理也是图像的一个重要属性。

航空、遥感照片、织物设计图案、复杂的自然风景以及动植物都有纹理。

纹理特征有两个要素构成:

(1)纹理基元;

(2)基元的排列。

纹理基元是一种或多种图像基元的组合,有一定的现状和大小。

纹理由纹理基元排列而成,。

基元排列的疏密程度、周期性、方向性的不同,能使图像的外观产生极大地改变。

纹理可以认为是灰度(颜色)在空间以一定的形式变化而产生的图案,是真实图像区域固有的特征之一。

类似于颜色,纹理也常取决于飞人们的感知,一般说来可以认为纹理是由许多相似接近的、互相编织的元素构成,所以直观来说纹理描述可提供图像区域的平滑、稀疏、规则性等特性。

3、形状特征:

形状特征对于人类说是识别物体的主要信息,是一种重要的图像内容表达手段。

按表达的形式分,可分为基于边界的和基于区域的两种类型。

边界特征包括:

线型形状,多边形逼近,有限元模型和傅里叶描绘子。

区域特征主要有矩不变量等。

形状特征是比颜色和纹理更高层一些的特征,对形状的表达比对颜色或纹理的表达从本质上要复杂的多,图像的形状信息不随图像颜色等特征的变化而变化,是物体稳定的特征。

特别对于图形,形状是它唯一重要的特征。

形状特征的各种表示方法中一个重要标准是它必须具有仿射不变性,即相对于旋转平移和尺度变换具有不变性。

通常来说,形状特征有两种表示方法,一种是基于边界轮廓特征(contour-based)的,包括:

傅立叶形状描述户、小波轮廓描述子、边界直方图、链编码、曲率尺度空间等,其中最典型的方法为傅立叶形状描述子。

一种是基于区域特征(region-based)的,如不变矩。

前者只用到物体的外边界,而后者则关系到整个对象所在的区域。

4、语义特征:

图像的视觉特征在一定程度上能代表图像包含的信息,但事实上,人们判断图像的相似性并非仅仅建立在视觉特征的相似性上.更多的状况下,用户主要根据返回图像的含义,而不是颜色、纹理、形状等特征,来判别图像满足自己需要的程度.这些图像的含义就是图像的高层语义特征,它包含了人对图像内容的理解.基于语义的图像检索的目的,就是要使计算机检索图像的能力达到人的理解水平.在一般的图像内容层次模型中,语义位于最高层;第2层和第3层之间的差别被许多学者称为“语义鸿沟”,语义鸿沟的存在是目前CBIR系统还难以被普通用户接受的原因.在某些狭窄的专业领域。

比如指纹识别和医学图像检索中,将图像低层特征和高层语义建立某种联系是可能的,但是在广泛领域内,低层视觉特征与高层语义之间并没有很直接的联系。

采用颜色、纹理、形状等底层特征对图像进行的描述往往与人对图像的描述存在较大的差异,直接利用这些特征作为检索依据常得不到令人满意的结果。

解决这类问题的办法是采用高层的特征即“语义特征”进行检索。

由于它是从人类视觉理解出发,着眼于提取图像中符合人类视觉的概念。

基于语义的检索技术难度很大,是图像检索领域的研究方向。

在语义级图像检索技术中,关键是实现语义的提取。

这就要解决两个问题:

语义特征具有“模糊性”,因此要提取图像的语义特征就必须解决特征的“模糊化”问题;语义特征与人的视觉理解紧密相关,所以在检索中要融入人的视觉感知,在“理解”图像的基础上检索图像。

虽然采用语义内容进行查询是最符合人的使用要求的方式,也是理想的检索方式,但是就当前的计算机和图像理解的发展水平来看,这种完全智能化的检索方法前正处于研究阶段,与实际应用还有较大的距离。

匹配模块

查询模块将用户的查询请求通过特征提取模块转换为查询特征向量,然后调用匹配模块计算特征库中的侮一个特征与待查图像特征的相似度,并按相似程度由大到小排列返回给用户所需要的图像。

基于内容的图像检索系统所使用的匹配不是精确匹配而是一种基一于相似的检索,它关心的是排序,选择合适的相似性度量函数很重要。

目前研究图像内容的相似性度量是指图像特征间的相似性,是图像检索研究的重要组成部分。

相似性度量方法的好坏影响到图像检索的性能;而相似性度量的计算复杂性影响到图像检索的用户响应时间。

一般假设图像特征矢量是距离空间中的元素(其中的元素称为点),通过计算两点之间的接近程度来衡量图像特征之间的相似度。

相似性度量函数

对于图像特征向量X,Y,若满足相似性度量中的正定性、对称性和一三角不等性度量公理,它们之间的相似程度可以采用下面的距离度量或统计学方法来进行图像相似性判断。

定义D(I,J)为示例图像I和图像数据库中图像J之问的距离

表示图像I的N维特征向量中第i个特征向量。

(1)Minkowski距离

如果图像特征向量互相独立而且同等重要,那么可以采用Minkowski距离

L。

来度量图像之间的相似性:

这里当P分别等于1,2,…,∞,时,D(I,J)称为L1,L2,L3,…,L∞。

(2)欧几里德距离

欧几里德趾离是一个应用非常普遍的距离度量。

它的计算简单,并且与参考系统的旋转不变量相关。

它可以看作是当p=2时的Murkowski距离吞,即

3)直方图交距离(Histogramintersection)

直方图交距离(Histogramintersection)G‘可以认为是L,距离的一种特殊形式,Swain等用直方图交距离来计算图像颜色之间的相似性。

图像I和图像J的直方图间的交距离定义为:

 

第三章基于内容的图像颜色特征提取

在图像的形状、颜色、纹理等特征中,颜色特征是最显著、最可靠、最稳定的视觉特征,是人识别图像的主要感知特征。

相对几何特征而言,颜色对图像中子对象的大小和方向的变化都不敏感,具有相当强的鲁棒性。

同时,在许多情况下,颜色又是描述一幅图像最简便而有效的特征。

人们对于幅图像的印象,往往从图像中颜色的空间分布开始。

所有这些都促使颜色成为基一于内容的图像检索所采取的主要手段,如何准确充分的提取一幅图像的颜色信息,井以适当的方式表示,将改接影响整个系统的效率和精度。

常用的颜色模型

所谓颜色模型就是指某个三维颜色空间的一个一可见光一子集,它包含某个颜色域的所有颜色。

颜色模型的用途是在某个颜色域内方便地指定颜色,对于每一个颜色域都是可见光的子集,所以任何一个颜色模型都无法包含所有可见光。

RGB模型

所谓RGB模型,是指采用CIE规定的、以700nm(红)、546.1nm(绿)、435.8(蓝)三个光色为三基元,及颜色的三个属性所构成的模型。

该模型将自然界的颜色通过选用这三基色按照不同比例混合而形成的模型,该模型可以用如下立方体来示意:

 

图3.1RGB颜色模型示意图

值得注意的是,RGB模型所覆盖的颜色域取决于显示设备荧光点的颜色特性,是与硬件相关的,与人的视觉感知有一定的距离,人们无法感知给定一个RGB值其所对应的颜色,这时使用面向视觉感知的颜色模型比较方便。

HSV模型

HSV空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域。

它把彩色信号表示为三种属性:

色调H(Hue)、饱和度S(Saturation)和亮度V(value),其中亮度又称LightneSS或Intensity,所以HSV空间还有HLS和HIS这两种叫法。

HSV模型的色调H表示从一个物体反射过来的或透过物体的光的波长,更一般地说,色调是由颜色名称来辨别的,如红、橙、黄、绿等,它用角度-180~180或O~360来度量。

亮度V是颜色的明暗程度,通常用百分比度量,0%为最暗的黑色,而100%为最亮的白色。

饱和度S指颜色的深浅程度,即在纯色中包含的白色光的成份。

例如同样是红色,也会因颜色浓度不同而分为深红色、粉红色和浅红色。

饱和度S也用百分比来度量,从浓度最小的0%到浓度完全饱和的100%。

色调H和饱和度S分量合起来定义了颜色的色度(Chromatieity)特性。

3.L*a*b模型

L*a*b颜色模型是在1931年国际照明委员会(CIE)制定的颜色度量国际标准的基础上建立的。

1976年,这种模型被重新修订并命名为CIEL*a*b。

L*a*b颜色设计为与设备无关,不管使用什么设备创建或输出图像,这种颜色模型产生的颜色都保持一致。

L*a*b颜色由亮度或光亮度分量(L)和两个色度分量组成:

即a分量(从绿到红)和b分量(从蓝到黄)。

CMY模型

以红、绿、蓝的补色青(eyan)、品红(Magenta)、黄(Yellow)为原色构成的CMY颜色模型,常用于从白光中滤去某种颜色,又被称为减性原色系统。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 研究生入学考试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1