基于多示例学习的图像检索方法研究和实现论文.docx

资源描述

基于多示例学习的图像检索方法研究和实现论文.docx

《基于多示例学习的图像检索方法研究和实现论文.docx》由会员分享，可在线阅读，更多相关《基于多示例学习的图像检索方法研究和实现论文.docx（16页珍藏版）》请在冰豆网上搜索。

基于多示例学习的图像检索方法研究和实现论文.docx

基于多示例学习的图像检索方法研究和实现论文

成绩

本科毕业论文（设计）

题目：

基于多示例学习的图像检索方法研究和实现

学生姓名

学号

指导教师

院系

专业

年级

教务处制

诚信声明

本人郑重声明：

本人所呈交的毕业论文（设计），是在导师的指导下独立进行研究所取得的成果。

毕业论文（设计）中凡引用他人已经发表或未发表的成果、数据、观点等，均已明确注明出处。

除文中已经注明引用的内容外，不包含任何其他个人或集体已经发表或在网上发表的论文。

特此声明。

论文作者签名：

指导老师签名：

日期：

年月日

摘要

随着网络信息的发展和人们查找信息的日益增多，基于图像的搜索越加的得到人们的关注和重视，怎么样有效的、快速地从众多的图像数据中搜索出用户感兴趣的图像是急需解决的问题。

首先，基于内容的图像处理是通常基于图像的单一特征进行处理，但是由于图像中包含的内容不止一个，所以不能充分有效的表示多个内容，从而很容易造成图像搜索的歧义性。

而多示例学习则可以很好的解决这个问题。

通过分析现有的多示例学习的图像检索的各种方法，使得我们可以很明显的看出多示例学习方法的基本思想是首先将图像转换成一个多示例包，然后通过多示例学习的算法得出相应的检索结果。

本文首先对图像检索的国内外的研究现状进行了阐述，继而通过对多示例学习的相关理论知识出发研究了多示例学习的多个方法，随着多示例学习方法的深入对多示例学习有了一个总体的认识，最后对全文的研究内容做出了总结，并提出了后续学习的研究方向，对今后的学习和工作的方向做出了展望。

关键词：

多示例学习，特征，图像检索，图像分割，基于内容的图像检索

Abstract

Withthedevelopmentofnetworkinformationandanincreasingnumberofpeoplewhofindinformation,image-basedsearchhasbeenincreasinglyconcernandattention,howtoeffectivelyandquicklyinsearchofanimageofinteresttotheuserisanurgentproblemfromanumberofimagedata.Firstofall,Content-basedimageprocessingistypicallybasedonasinglefeatureoftheimageprocessing,However,sincethecontentoftheimagecontainedinmorethanone,Itisnotthefullandeffectiverepresentationofthepluralityofcontent,Makingiteasytocreateanimagesearchambiguity.Themulti-instancelearningcanbeagoodsolutiontothisproblem.

Throughavarietyofmethodstoanalyzetheexistingmulti-instancelearningimageretrieval,sowecanclearlyseethatthebasicideaofmulti-instancelearningmethodistofirstconverttheimageintoamulti-samplepackage,thenlearningthroughmultipleexamplesofalgorithmshavethecorrespondingsearchresults.

Firstly,imageretrievalresearchstatusathomeandabroadaredescribed,followedbymulti-instancelearningoftheoreticalknowledgestartingexaminedanumberofmulti-instancelearning,withthedeepeningofmulti-instancelearningmethodformulti-instancelearninghasageneralunderstanding,finallymadearesearchpapersummarizedandmadefollow-upresearchstudyonthefuturedirectionofstudyandworktomaketheprospect.

Keywords:

Multi-instancelearning,feature,imageretrieval,imagesegmentation,content-basedimageretrieval

摘要1

Abstract2

第一章绪论4

1.1研究背景和意义4

1.2研究现状5

1.3论文的组织结构6

第二章基于内容的图像检索6

2.1基于内容的图像检索6

2.1.1技术概述7

2.1.2特点7

2.1.3图像特征8

2.2本章小结8

第三章多示例学习8

3.1引言8

3.2多示例学习的特点9

3.3相关的算法研究9

3.3.1DD算法9

3.3.2EM-DD算法10

3.3.3KNN算法10

3.3.4其他相关的多示例学习算法11

3.4本章小结11

第四章基于多示例学习的图像检索11

4.1检索流程11

4.2实验设计12

4.2.1实验环境12

4.2.2图像库12

4.2.3图像分割13

4.3实验结果和分析14

4.4本章小结15

第五章总结和展望15

5.1工作总结15

5.2未来展望15

参考文献15

致谢17

第一章绪论

1.1研究背景和意义

伴随着电子信息科技、网络的快速发展，使我们需要获取的信息更加的巨大，电子设备的使用人数也急剧增多，各类的网络设备已然成为了家庭必备品走进了大家的日常生活。

人们通过这些电子设备获取信息也变得越加的快速和便捷。

在学习和工作中，人们通过视觉、听觉、触觉等各种方式获取各种不同的信息，其中主要信息包括文字和图像。

图像作为信息的常用来源，能够清晰的表现出很多内容，是我们获取信息的常用途径。

比如人们在淘宝、京东购物时的实物图，再比如摄影师所拍摄的各种优美的山水风景或者肖像照片，这些都能很直观的使我们获取信息。

但是随着人们对于信息的需求越来越多，图像中的所包含的信息更加复杂和巨大，使我们在获取需要的图像时也更加的麻烦和复杂。

因此，图像检索方式的提高就越加的迫切。

从20世纪70年代末，人们开始从文本上对所需要的信息进行查找，该技术的核心是经过人为的使用文字对图像解释和标注，形成一种文字特征对图像检索。

该方法检索方便、直接，容易用户操作，但是检索的时候需要人为的对图像进行解释。

但是随着图像数据集的越加庞大，我们不难发现使用文字解释方式进行检索还存在这很多的难点：

使用文字解释和说明图像费时费力，在处理数量较多的图像时，对庞大的图像库中的图像人工解释和注解的工作量是难以想象的；此外人为的标注图像存在着主观性和不准确性，这一弊端对于检索结果的实际影响是非常巨大的，难以得到我们想要的真实数据，并且还可能会让我们得到错误的结果，产生时间的浪费。

到了20世纪90年代初期，伴随着图像集更多更大，显然基于文本的图像检索（TBIR）已经不能满足人们从庞大图像集中实现图像检索的需求，于是技术人员便提出了基于内容的图像检索（简称CBIR）。

很快由于CBIR并没有像TBIR需要对图像进行文字解释那样复杂，并不需要人工，实现了机器的自动化。

主要利用了图像中的一些信息，如颜色，形状等作为检索的途径，从而效率更高、更加直观，因此CBIR得到了快速的发展。

总的来说就是它利用了图像本身拥有的颜色形状等特征，一般不需要人工的去解释，从而避免了人为的主观性和不准确性，减少了主观因素的影响。

CBIR是一个值得研究的课题，应用前景十分广泛，有着非常大的研究价值。

但是如今的网络时代，图像信息呈现着爆炸式的增长趋势，而且人们有兴趣的检索内容也不仅仅是一个整体的图像，而可能是图像中具体的个例事物，要想从如此庞大的图像库中找出用户所关心的图像信息是很困难的，这也使得图像检索越加的重要了。

因为只用整体特征是不能充分的描述局部内容，也更加不能表达用户需要的内容，由此会引发歧义性。

多示例学习方法的出现却可以更好的解决CBIR所引起的歧义性，从而在很大的程度上提高了图像搜索的准确性。

该图像检索的思想是将已有的一副图像转化为一个示例包，图像里面的各个具体的特征成为该示例包的示例。

继而通过多示例算法进行学习。

本文使用多示例算法对目标图像进行处理，从而在图像库中对相似图像查找，来达到精确检索的目的。

研究主要通过对图像进行预处理，提取目标图像特征，生成代相应的示例包，最后通过多示例学习实现对图像的检索。

该方法降低了基于内容的图像检索中存在的歧义性，根据用户提供的具体的特征来进行图像检索，可以提高用户的查准率，具有可观的发展前景以及用户使用率。

1.2研究现状

CBIR起源于美国的一个耗时四年的“数字图书馆”项目，之后数家研究机构组织纷纷实施组织了第二期计划的进行，然后持续发展成为一个新的研究热门，从此掀起了广泛性的基于内容的检索技术的狂潮。

从上面我们已经知道，在图像的检索过程中，大多数人更感兴趣的是图像中的具体事物即具体图像特征，而不是简单的一副图像，而这就引起了图像内容检索的歧义性。

正因为多示例学习可以很好的处理CBIR这种歧义性，所以在近几年来，基于多示例学习的图像检索已经引起了广大技术员的兴趣，从而多示例学习的图像检索也得到了很大的发展，利用多示例学习方法处理问题也取得了很大大的进展。

在20世纪90年代中后期，研究人员对药物活性预测的研究中，正式的提出了多示例学习的概念。

他们将每个分子作为一个包，分子的每个不同形态作为包中的示例，当某个分子适合制药时就标记为正包，反之为反包。

多示例学习的目标是通过分析已有的训练包得到目标函数，从而正确的预测未知数据。

在2000年，Yang和Lozano-Perez[18]、张敏灵和周志华扩展多示例学习方法，将其应用与CBIR的研究上，随后Goldman和Scott[3]又将界面匹配转化为多示例问题研究解决。

从上述研究历史中可以看出，多示例图像检索就是提取图像特征，生成合适的示例包，然后使用多示例方法学习训练，包的生成方法是很重要的。

所以该过程中主要是对图像分割和特征提取以及示例的训练。

提取的示例应该具有很好的覆盖性，示例的描述应具有检索的特殊性。

1.3论文的组织结构

本文共分5章。

第一章首先介绍了图像检索的发展以及多示例学习的由来，接着阐述了多示例学习在国内外的发展趋势以及重要性，最后介绍了文章的层次结构。

第二章主要介绍了CBIR的概念和特点，常用的技术和图像特征的简要描述。

第三章概述了多示例学习的概念和特点，阐述了多示例学习的相关算法

第四章概述了多示例学习的图像检索的流程以及实验环境和结果，对多示例学习进行了评价和

展开阅读全文