数字图像处理作业文档格式.docx
《数字图像处理作业文档格式.docx》由会员分享,可在线阅读,更多相关《数字图像处理作业文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
阅卷评语:
阅卷教师(签名)
重庆大学研究生院制
基于颜色直方图的图像检索设计
摘要:
基于内容的图像检索根据图像、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。
随着图像数据库急剧膨胀,如何快速、准确地从图像资源中获取有用的图像成了信息检索技术研究的热点。
本设计应用Matlab,通过计算图片的颜色直方图、进行特征分析分析,实现对图像库的检索并显示匹配的前八张图片的功能,实现相似性度量。
经验证,本算法能够实现准确的图像检索。
关键字:
基于内容的图像检索;
颜色直方图;
特征提取;
Matlab。
一基于内容的图像检索简介
随着互联网和多媒体技术的兴起及迅猛发展,数字图像正以难以想象的速度与日剧增,因此,迫切需要一门技术来帮助人们解决如何在大规模的图像库中快速、准确的找出自己感兴趣的图像。
基于内容的图像检索技术已成为国内外广泛关注的焦点[1]。
基于内容的图像检索(CBIR)是一门根据用户的需求从图像库中检索出与示例图像相似图像的技术。
它的过程机制是:
首先利用计算机自动提取图像的低层特征。
然后选择合适的相似度量方法计算示例图像和图像库中图像的相似度。
最后将匹配的结果返回给用户。
为了实现人机交互,引入相关反馈机制,用户根据检索到的结果,选择自己想要的图像,这样经过特征调整后,形成了新的检索结果,可以多次反馈,直到得到用户满意的结果。
其中牵涉到的关键技术有特征提取、相似度量方法的选择等几个方面。
本文主要针对基于内容的图像检索技术中的颜色直方图与特征提取方法进行系统设计,最终实现对图像库进行检索的功能。
二图像特征提取
2.1颜色特征提取方法
(1)颜色直方图
数字化图像的每一种颜色组合有一个唯一的色度空间值,称为一个颜色频道。
所以用颜色直方图来表示一幅图像上所有象素的色度空间值分布(图1),图中横坐标表示该图像颜色频道的分布,纵坐标表示该图像所有象素中落入特定颜色频道的象素数量[2,3]。
设图像为I,图像颜色由L级颜色频道组成,其中第i种颜色Ci的象素数量为hi,则H(h1,h2.....hL);
这个向量组就是颜色直方图,它在图中表现为一条离散的曲线。
例如图1所示:
图1图像上所有颜色的色度空间值分布
根据上述原理,对于每个图像I,可生成颜色直方图H(I)=H(h1,h2....hL)作为该图像的颜色特征索引。
对于数据库中的M个图像(成为目标图像),可生成(H1,H2....Hm)直方图阵列,作为目标图的颜色索引库,用以匹配检索[3]。
(2)颜色特征提取
在图像检索中,基于颜色特征的图像检索算法主要集中在两个方面:
全局颜色特征和空间颜色特征[4]。
本文研究的是基于全局颜色特征的颜色直方图来提取颜色特征的。
在确定颜色空间的基础上,对一幅数字图像统计每一种颜色出现的像素点数,然后把颜色值作为横坐标,颜色出现的像素点数作为纵坐标,以此绘出的图形就称为该颜色的颜色直方图。
图像的归一化颜色直方图H定义为:
(1)
表示第k种颜色在该图像中出现的像素点频数。
颜色直方图具有平移和旋转不变性,因此得到了广泛的应用。
本文特征提取的是图像的颜色直方图,bin为采样区间。
在检索时,根据设置直方图不同方向上颜色区间bin值,计算每个颜色出现的概率。
对应不同的bin值,计算出每个颜色出现的概率。
2.2相似性度量方法
常用的相似性度量方法有:
(1)直方图相交距离
直方图反映了图像特征的统计分布,而直方图相交距离法是一种经典的度量直方
图的方法,两个直方图之间的距离定义为公式
(2):
(2)
其中,Hp(i),Hq(i)分别表示用户提交的查询图像P和数据库中的图像Q的统计直方图,这种相似性度量方法是为了计算出这两个直方图在每个柄中共同拥有的像素数目[5]。
有时,为了在特殊场合中使用,可以对其进行标准化,使值处于[0,1]范围内。
(2)欧式距离
欧式距离是我们最常用到的一种距离度量函数,它不但计算简单,而且图像的各个特征分量是正交无关的。
它的定义如下:
(3)
但是欧式距离在下列情况下不适合:
(a)对不同的特征向量设置不同的权重值;
(b)发生数据丢失。
为了防止以上情况,在计算图像间的相似度时对欧式距离进行归一化[5]。
由于人们对图像各个部分的关注程度不同,因此,对提取的图像特征需要赋予不同的权重,所以常使用加权后的欧式距离来度量图之间的相似性,计算公式如下:
(4)
其中,ωi是权重值。
三图像检索系统设计
3.1设计要求
本文设计的是一个基于颜色直方图的图像检索系统。
通过计算待测图像的颜色直方图,提取颜色特征,从提供的图像数据库中搜索出与其最近似的四幅显示出来。
3.2背景介绍
目前,网络上常用的搜索引擎(如XX,搜狗等),都是通过对图像进行文本标注来检索图像。
虽然这些搜索引擎在现实中得到广泛地应用,但存在很大的弊端:
首先,随着图像规模的增长,手工注释图像,工作量相当大,这使得对所有的图像进行人工文本注释变得无法实现,因此使检索的效果不精确;
其次,人工注释不可避免带有主观意识,不同的人对于同一图像可能用不同的文本信息来标注,而且注释后被存入文件中,无法完成自动更新;
再次,有些视觉特征难以用文字来正确的描述[6]。
因此,在实际的应用中,用这种方法检索到的结果和用户的实际需求有很大的差距。
而基于内容的图像检索技术(Content-basedImageRetrieval,CBIR)很好的解决了文本图像检索中问题,成为一门新兴的技术,得到国内外学者的广泛关注。
基于内容的图像检索已经取得很大的成绩,但是仍然主要是通过提取图像的低层特征来实现图像的检索,这些由计算机自动提取的特征与人们理解的语义有很大的差别,因此检索的效果并不理想。
随后,为了克服以上缺点,引入了相关反馈机制,通过对用户查询出的结果进行动态地调整,实现了人机交互过程,使检索的结果更能满足用户的需求。
近年来,对相关反馈算法的研究成为国内外学者热点研究的对象。
基于内容的图像检索已经应用于Internet上的图像检索、医疗诊断、远程遥感、数字图书馆、公安局侦查、军事、知识产权和商标等领域。
作为一门综合技术,它引用了多领域的知识,如图像处理,机器学习,人工智能,神经网络技术等,具有很高的研究价值。
对于其他学科的发展,也起了很大的促进作用。
因此,基于内容的图像检索具有广阔的应用前景和研究意义
3.3开发工具简介
MATLAB是由美国MathWorks公司推出的用于数值计算和图形处理的软件。
它的工具箱主要有通信、控制系统、滤波器设计、图像处理、非线性控制设计、系统识别、神经网络、最优化、模糊逻辑、信号处理、鲁棒控制、统计等。
借助于这些工具箱,用户可以非常方便地进行分析、计算及设计工作[7]。
MATLAB全称是MatrixLaboratory(矩阵实验室),一开始它是一种专门用于矩阵数值计算的软件,从这一点上也可以看出,它在矩阵运算上有自己独特的特点。
实际上MATLAB中的绝大多数的运算都是通过矩阵这一形式进行的。
这一特点也就决定了MATLAB在处理数字图像上的独特优势。
理论上讲,图像是一种二维的连续函数,然而在计算机上对图像进行数字处理的时候,首先必须对其在空间和亮度上进行数字化,这就是图像的采样和量化的过程。
二维图像进行均匀采样,就可以得到一幅离散化成M×
N样本的数字图像,该数字图像是一个整数阵列,因而用矩阵来描述该数字图像是最直观最简便的了。
而MATLAB的长处就是处理矩阵运算,因此用MATLAB处理数字图像非常的方便。
MATLAB的图像处理工具箱(ImageProcessingToolbox)功能十分强大,支持的图像文件格式丰富,包括五种图像类型,即索引图像、灰度图像、二值图像、RGB图像和多帧图像阵列;
支持BMP、GIF、HDF、JPEG、PCX、PNG、TIFF、XWD、CUR、ICO等图像文件格式的读、写和显示。
图像处理工具箱是由一系列支持图像处理操作的函数组成,可以进行诸如几何操作、线性滤波和滤波器设计、图像变换、图像分析与图像增强、二值图像操作以及形态学处理等图像处理操作。
3.4系统开发环境
硬件环境:
AMD翼龙处理器,320G硬盘,2G内存
操作系统:
Windows7
开发工具:
MatlabR2012b
开发语言:
Matlab
开发内容:
基于GUI的图像检索系统
四图像检索系统实现
4.1编程步骤
本文的图像检索编程步骤如下:
1)计算待测图像的直方图,再计算出每个方向的每个采样区间的颜色出现的频数。
2)加载图像数据库的直方图,在计算每一幅图像每个方向的每个bin值出现的频数;
对每一个图像,计算待测图像和数据库中i个图像的距离;
只保留距离为D2的图像,这些图像的hist大于预定义的阈值T,L为满足要求的图像数量;
找到激励为D3的图像,各图像的Hist小于第二阈值T2,L2为满足要求的图像数量。
3)相似度计算:
4)搜索到最相近的图像,并显示结果。
4.2图像检索过程
打开Matlab,在命令窗口中实现一幅具体的图像检索的步骤:
1)指定一个搜索路径(如:
cd(c:
\digitalimage\’))
2)载入图像数据库load('
model1hist.mat'
)
3)搜索一幅图像searchimagehist('
patra(13).jpg'
'
5)
检索结果如图2所示
图2检索结果
由检索结果可看出,本文设计的基于颜色的图像检索设计能后满足设计要求,检索结果良好。
五总结
通过这次的设计,加深了我对图像的理解,巩固并拓宽了数字图像处理方面的知识,我又掌握了Matlab的一些功能,熟悉了很多指令的用法,将自己的逻辑带入程序设计中,加深了对MATALAB的理解,熟悉了GUI的设计,在此过程中也暴露出诸多的不足,如理论知识不扎实、不全面,对MATLAB的运用不熟练,需要在以后多加练习,弥补自己的不足。
但是锻炼了自学的能力,自己查所需的指令,借助各种工具加快学习,这是我们在课堂之外获得的技能,必将毕生受益。
我相信这次算法研究以及检索系统的开发对我以后的软件工作有很大的帮助,甚至对我的人生都有很大帮助,让我不断进步。
在设计过程中遇到了很多问题,我积极询问身边的同学和舍友,我更加理解了,有很多事是我们不能独立完成的,时刻记住三人行必有我师,还要充分发挥团队力量。
参考文献
[1]张鑫,温显斌.基于内容的图像检索方法研究[D].天津:
天津理工大学,2013
[2]高如如.基于内容的图像检索技术研究[D].合肥:
中国科学技术大学,2011.
[3]YangYuanfeng,WuJian,FangJing.ImageRetrievalUsingESNsandRelevanceFeedback[C].InternationalSymposiumonDistributedComputingandApplicationstoBusiness,EngineeringandScience,2012,10:
383-387.
[4]陈昱,庄天戈,王合.直方图估计互信息在非刚性图像配准中的应用[J].计算机学报.2006,3(4):
444-447.
[5]毛力,张晓林.基于颜色内容图像检索的原理与方法[J].情报科学,2000,6:
552-555.
[6]王兴