基于CBIR的服装款式图检索.docx

上传人:b****6 文档编号:3642113 上传时间:2022-11-24 格式:DOCX 页数:14 大小:28.47KB
下载 相关 举报
基于CBIR的服装款式图检索.docx_第1页
第1页 / 共14页
基于CBIR的服装款式图检索.docx_第2页
第2页 / 共14页
基于CBIR的服装款式图检索.docx_第3页
第3页 / 共14页
基于CBIR的服装款式图检索.docx_第4页
第4页 / 共14页
基于CBIR的服装款式图检索.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

基于CBIR的服装款式图检索.docx

《基于CBIR的服装款式图检索.docx》由会员分享,可在线阅读,更多相关《基于CBIR的服装款式图检索.docx(14页珍藏版)》请在冰豆网上搜索。

基于CBIR的服装款式图检索.docx

基于CBIR的服装款式图检索

摘要

基于内容的图像检索技术(ContentBasedImageRetrieval,CBIR)己成为图形图像处理、人工智能、信息检索等交叉领域的一个研究热点。

这里的基于内容的图像检索技术,是指利用图像内容的颜色、形状、纹理、空间、频率等特征,对指定范围的查询图像和提取各项综合特征,根据检索要求,检索特征空间最相似的图像。

在服装数字化系统研究领域,服装款式图是各种研究的基本素材,服装设计师设计的各种款式素材数量庞大,采用计算机图像识别技术,设计基于内容的服装款式检索系统,是对传统服装设计工作的一项非常有意义的工作。

为了实现服装款式图的综合检索,本文创建了款式图数据库,采用了基于内容的图像检索技术。

采用了色彩域、形状域、空间域、频率域等特征特征的描述服装款式,并在此基础上进行多种相似度检索,本文提出检索系统能够发现一些单纯靠形状特征不能检索到的结果。

本文开发的系统可以作为技术原型为大型服装企业开发综合数字化生产系统提供参考。

关键词:

服装款式图;基于内容的图像检索;特征提取;图像数据库

ABSTRACT

Contentbasedimageretrieval(ContentBasedImageRetrieval,CBIR)technologyhasbecomeahotresearchareainthecrossfieldofgraphics,imageprocessing,artificialintelligenceandinformationretrieval.Thecontent-basedimageretrievaltechnologyhere,referstotheuseofthecontentoftheimagecolor,shape,texture,spatialandfrequencycharacteristics,comprehensivefeaturesofthequeryimageandtheextractionofthespecifiedrange,accordingtotheretrievalrequirement,retrievethemostsimilarimagefeaturespace.

Inthefieldofclothingdigitalsystem,garmentdrawingisabasicmaterialresearch,variousstylesoffashiondesignerstodesignmaterialinlargequantities,usingcomputerimagerecognitiontechnology,designcontentofgarmentbasedretrievalsystemisaverymeaningfulworkforthetraditionalclothingdesignwork.

Inordertoachievethecomprehensiveretrievalofclothingpattern,thispapercreatesadatabaseofstylemapsandadoptscontent-basedimageretrievaltechnology.Thecharacteristicsofcolor,shape,spatialdomainandfrequencydomaindescriptionsoftheclothingstyles,avarietyofsimilarityretrievalandonthisbasis,thispaperretrievalsystemcanfindsomesimpleshapefeaturescannotberetrievedbythe.Thesystemdevelopedinthispapercanbeusedasatechnicalprototypetoprovidereferenceforlarge-scalegarmententerprisestodevelopintegrateddigitalproductionsystems.

Keywords:

clothingstyleimage;contentbasedimageretrieval;featureextraction;imagedatabase

目录

摘要V

ABSTRACTVI

第1章引言8

1.1背景8

1.2研究内容8

第2章图像内容的多特征描述9

2.1图像颜色特征描述9

2.2图像纹理特征描述9

2.3图像形状特征描述10

2.4图像空间特征描述10

第3章图像特征相似度匹配方法11

3.1L1距离和L2距离12

3.2标准欧氏距离12

3.3马氏距离13

3.4余弦距离13

第4章系统设计与实现13

4.1需求分析14

4.1.1系统开发目的14

4.1.2系统概述14

4.1.3系统具体需求14

4.2概要设计15

4.2.1体系结构设计15

4.2.2服装款式图特征提取模块16

4.2.3数据存储模块16

4.2.4款式图特征匹配检索模块18

4.2.5检索结果分析工具模块18

4.3详细设计18

4.3.1开发环境介绍18

4.3.2颜色特征提取及数据集创建18

4.3.3基于图例的图像检索方法20

4.3.4检索结果分析工具24

第5章总结25

5.1总结26

参考文献28

致谢28

学位论文数据集29

引言

1.1背景

随着工业4.0升级浪潮的到来,作为服装生产和消费大国,我国的服装行业正在经历产业转型升级的考验。

服装消费者的消费心理也正在向个性化等更高等级的需求发展。

在传统的产销模式中,服装款式生产厂商的设计师批量化设计生产的,无法满足部分消费者的个性化需求。

此外,面对海量的现有服装款式,消费者如何挑选到预期的款式信息,也是一个有挑战的技术难题。

而计算机图像处理技术的发展支撑了服装设计、生产、销售密切相关的相关的领域的技术向着智能化发展,例如虚拟试衣系统、虚拟购物Buy+系统等等,而这系统的基础支撑算法和技术都已经相对成熟。

为此,本文以满足消费者个性化需求出发,采用计算图像内容识别检索技术,设计和开发了一款服装款式图的特征提取和检索系统。

1.2研究内容

针对本课题的研究内容,以本项目为例,确定基本的研究内容如下所述:

(1)基于内容识别的服装特征提取和匹配方法研究。

(2)完成产品需求的分析和功能模块的设计。

(3)完成基于MATLAB的系统框架搭建以及系统原型实现。

第2章图像内容的多特征描述

目前主要使用图像的颜色、纹理、形状和空间关系等中低层特征进行基于内容的图像检索。

这几种视觉特征尽管不能完全的语义内容描述更高层,但其之的关联性,每种视觉特征都具有多种描述方式,每种方式都从觉特征进行了可算性描述,间存在着一定利用这几种中低层视觉特征的检索算法,不仅可以检索到视觉上相似的图像,还会包含一些语义不同角度对视相关的图像。

2.1图像颜色特征描述

颜色是图像检索中使用最受旋转、平移和尺广泛的视觉特征,它和图像等的影响较中所包含的物体和场景关系非常密切,并且与其他的视觉特征相比,度变化小,具有较高的稳定性。

颜色直方图是最常用的表达颜的颜色分布,色特征的方法,它所描述的是不同颜色在整幅图像中所占的比例,计算图像即各种颜色出位置,所以它现的概率,并利用直方图相交算法计算图像之间的相似度,而不关心每种颜色所处的空间并没有识别图像中的合用于描述那些对象。

直方图比较位置的适难以进行对象识别且不需要考虑颜色空间图像。

图像的匹配用数值来有方法目前有很多,如何效的表示图像在颜色上的相似度,这便是图像的相似性度量问题[2]。

在模的相似性度式识别技术中,特征量一般采用距离法,即用特征向量示。

在直方图检索中,通过对直方图之间的距离的设定,当它的空间距离来表们的距离小于给定的阈值时,即认为符合检索之间的距离可定结果。

常用的距离度量方法有多种,其中L-1度量法,图像I和H义为

(2-1)

其中i和h分别是H中的颜色区间l的像素数。

另外常用的还有欧式距离、马氏距离、二落入图像I和次距离等。

由于颜色直方图不能反映空间信息,Strickcr提像分割为适出的颜色矩(ColorMoments)可以弥补这个缺陷,其原理是先将于只包含有图当的分块再用颜色直方图和颜色矩提取每个分块的局部颜色特征。

它对图像的分辨明确对象的图像特别有效,与其他颜色特征相比较简洁,但小其他颜色特同时也可能降低对能力,因此经常在其他颜色特征之前使用,以缩征的搜索空间。

除了对颜色直方以外,还有一些颜色特征提取方法也加入了颜色的空间信息[3],如颜色相关向量图法的改进法就通过将属于不同是颜色聚颜色区域的像素分为相关和不相关两类来加入了一定的空间信息。

另一种颜色所占类法,将图像中的颜色按照预先设定的误域颜差来进行聚类,这样就可以通过的比例反映区色的分布。

2.2图像纹理特征描述

纹理特征和颜色的全局特征一样,描述的是图像分布特性。

它描述事物表面的了图像纹路分布,但是征不依赖纹理特色彩或者亮度,反映了灰度模式的图像空间分布,包含关于表结构安排面的及周围环境的关系。

纹理的表示方法可以分为两类:

结构法较适用和统计法。

结构化的方法通过定义结构化的原语和它们的位置规则描述纹理,比矩阵、分于处理纹理特征十分规则的图像。

统计的方法包括Tamura纹理特征、共生像强度的形模型、马尔可夫随机场、小波变换、Gabor变换等,这些方内容的图像法通过统计图分布情况来描述图像的纹理特征,常被有效利用于很多基于检索系统中。

20世纪90年代初,研究人员开波变换及其理论框架研究纹理表示。

用子带小波中提取的统计量作为始使用小纹理特征,采用波变换来分树结构小波变换提取中带特征来进一步提高分类的准确率,用共生矩变换、正阵和小析纹理。

对不同小波变换表示的纹理特征进行变换最符评估,例如树结构小波交和双正交小波变换以及Gabor小波变换,发现Gabor小波合人类视觉感知特性。

因此针对某些特殊的图也是像库,纹理特征是广泛使比其他视觉特征更加适合的一种图像内容信息描述方法。

纹理类似纹特征CBIR系统用的一种视觉特征,通过纹理特征表述图像内容信息,以检索理分布的图像。

纹理特征的缺点是当图像变化不大的的分辨率时候,所计算出来的纹理可能会有较大的偏差。

区分纹理的的粗细、疏密、形状等,当这些分辨信息之间相差不大的时候,通常的关键在于纹路纹理特征只是描理之间的述图像展示的表面纹理的统计分布,很难准视觉感觉确地反映出人上细节处纹差别。

2.3图像形状特征描述

图像经过边缘提像分割,就取和图会得到对象特征建的边缘和区域,进而获得对象的形状。

基于形状的检索的区域技术的关键是形状的表示和二维图像匹配,目前的检索方法大多围绕着从形状的边缘特征和形状立图像索引。

在空间中,形状通常被认为是一条封闭的轮廓曲线所的描述。

包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这种:

一种个边界所包围区域根据采用的信息是形状的边界还是形状的内部,其描述而后者则方法可以分为两是基于边界的;一种是基于区域的。

前者仅使用形状外边界,用了整个形状的区域信息。

基于边界的形、傅立状特征提取往往是抽取图像的轮廓特征,这类方法有直线段描述、样条拟合曲线叶描述子等[4],傅里叶描述本思想是用对图像进行傅里叶变换得到的边界高频分量对应作为形状描述。

其中一个优点就子的基是把二维问题简化为一维问题。

傅里叶叶系数来变换的细节而低频分量对于区域的应总体形状。

所以可以只用一些对应低频分量的傅数学上的简里近似描述边点,形状特界形状。

基形状特征提取主要是指各种矩技术,矩技术具有明性、多种对象级样化等特征提取通过使用图像分割算法将一幅图像分象区域的解为若干对象区域。

这获取对形的表示更接近于人类自动提取视觉系统的理解,但由于自像进行分割动状十分困难,仍然需要依赖于人工对图、提取目标,还不差别,为能实现形状特征的功能,并且从不同的视角获得的确进行形状可能会有很大了准形状匹配解决平移、,需要缩放、旋转中的不变性问题。

所仍然是颜色以形状特征一般仅特征,因限于细节特征比较为简单的物体,在目前的检索系统中使用最多的和纹理为人眼对这些较敏感,提取方法也相对比较简单。

2.4图像空间特征描述

颜色、纹理和形状的是图像的整体特征,没有体现图像内对象之间的空间关系,如拓扑、方位、距等特征反映离等。

在某些基于内容的图像,图像检索系统中,用户通过交互界面提供的绘图工具简。

基于空单描绘出示例希望检索结果中对象间的空间关系和示例图像中的类似间关系进行图像检索时,首先对图拓扑、方像进行自动分割,会为这些划分向量建立出图像中所包含的对象或颜色幅图像的区域;然后定义位、距离等各种空间关系;最后根据这些定义提取出每的相似性空间关系特征向量。

系统还特征索引,检索时会根据相应匹配准则,利用索引检索系的图像出具有相似空间关。

基于空间关的步骤:

1)将图像数初在数据库中据库中的所有图像映射为多维特征空间的点,这种映射是系特征检索通过准则来定最为每幅图像构建一个ARG(属性关系图)来完成的。

2)对应每义一个距离度量。

由于检索时基于拓扑、方位和距离共三种相似性准分的权则来完成的,所种相似性以最终的距离度量是这三个部分的聚集,可以根据情况设空间的一置各部重。

3)建立多的索引(如R树)。

4)将所查询的图像映射到特征个点或一个区域,维特征返回选择点点然后选取与查询点靠近或者位于查询区域范用于图像围内的点。

5)作为检索结果,所对应的图像。

以上四种特征在应检索时各有其优点和缺点。

颜色特征侧重于图像整体信息的描述,对图像的方向、大小等模式匹变化不敏感,因此不能捕捉图像中对象的局部特征。

纹理特征更偏重于局部,在配中具有较大的优越性,不会因为局部的偏差而无法匹配成功,且其具有旋转分辨率不变性。

但是纹理只纹理可能会有较大偏差。

基于形状特征的检索可以比较有效地利用图像中具体的,计目标进行描述物体表面的特性,并不反映物体的本质属性,当图像的发生变化时算出的检索,但是检索方法目前还缺特征进乏较完善的数学模型。

空间关系特征的景信息,为使用能够更好的描述图像的内容,但在视觉应用中,它不能有效地表达场了保证有较好的效果,还需结合其他行检索。

综合利用颜色、状和空间关系特征进行检索的基础上可以两两结合,也可以使用两种以上的特征来完成。

纹理、形如在颜色特征加上纹理特征可弥补缺乏空间分布信息的不足又能保留颜色特征计算简便的彩色性质。

优点,加上形状特征不仅可描述图像的整体彩色性质还可以描述目活性和标局部的检索可以达到不同特征优势互补的效果,还可以提高检索的灵系统的性能,满足实综合特征际应用的需求。

图像特征相似度匹配方法

基于文本的检索方法采用的是文本内容的精确匹配,而在基于内容的图像检索的过程,是通过计算查询图像与候选图像之间视觉特征向量的相似度来完成,是模糊匹配。

采用各种图像特征描述算法,将图像的颜色、纹理、形状等特征提取出来并且形成特征向量以后,就可以用这些特征向量来代表相应的图像,然后进行图像相似度的衡量。

因此,一个稳定的相似度计算方式与特征提取方法一样,都会对图像检索结果产生很大的影响。

因此,定义一个合适的视觉特征相似度度量方法对检索的效果有很大的影响。

由于上一章中的视觉特征人都可以表示成向量的形式,常用的相似度方法都是向量空间模型,即将视觉特征看作是向量空间中的点,通过计算两个点之间的接近程度来衡量图像特征间的相似度。

2.5L1距离和L2距离

如果图像特征的各分量之间是正交无关的,各维度的重要程度相同,两个特征向量A和B之间距离可以用L1距离或者L2距离(也称为欧拉距离)来度量。

其中L1距离可以表示为:

(3-1)

其中D是特征向量的维数。

类似地L2可以表示为

(3-1-1)

2.6标准欧氏距离

欧几里德距离Euclideandistance但也有明显的缺点。

1.它将样品的不同属性(即各指标或各变量)之间的差别等同看待,这一点有时不能满足实际要求。

2.它没有考虑各变量的数量级(量纲),容易犯大数吃小数的毛病。

所以,可以先对原始数据进行规范化处理再进行距离计算。

标准化欧氏距离是针对简单欧氏距离的缺点而作的一种改进方案。

标准欧氏距离的思路:

先将各个分量都“标准化”到均值、方差相,样本集的标准化过程(standardization)用公式描述就是:

标准化后的值=(标准化前的值-分量的均值)/分量的标准差。

(3-2)

2.7马氏距离

如果特征向量的各个分量间具有相关性或者具有不同的权重,可以采用马氏距离(Mahalanobisdistance)来计算特征之间的相似度。

马氏距离是由印度统计学家马哈拉诺比斯(P.C.Mahalanobis)提出的,表示数据的协方差距离。

它是一种有效的计算两个未知样本集的相似度的方法。

与欧氏距离不同的是它考虑到各种特性之间的联系(例如:

一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。

对于一个均值为μ,协方差矩阵为Σ的多变量向量,其马氏距离为sqrt((x-μ)'Σ^(-1)(x-μ))。

(3-3)

马氏优缺点:

1)马氏距离的计算是建立在总体样本的基础上的,因为C是由总样本计算而来,所以马氏距离的计算是不稳定的;

2)在计算马氏距离过程中,要求总体样本数大于样本的维数。

3)协方差矩阵的逆矩阵可能不存在

2.8余弦距离

余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。

向量,是多维空间中有方向的线段,如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。

而要确定两个向量方向是否一致,这就要用到余弦定理计算向量的夹角。

余弦定理描述了三角形中任何一个夹角和三个边的关系。

给定三角形的三条边,可以使用余弦定理求出三角形各个角的角度。

假定三角形的三条边为a,b和c,对应的三个角为A,B和C,那么角A的余弦为:

第3章系统设计与实现

3.1需求分析

3.1.1系统开发目的

实现一个能提供基于图像内容的服装款式检索原型系统,作为算法研究平台为后续的其他科研及实际生产工作奠定基础。

3.1.2系统概述

1.系统名称:

基于CBIR的服装款式图检索系统

2.本系统使用范围:

在PC端实现基于服装款式图的颜色、纹理、形状等内容特征的图像检索系统。

3.软件描述:

本软件以文件目录形式存放待检索图像数据,以Matlab的*.mat数据集文件作为保存图像特征集的后台数据库,通过选择一幅示例图像,用户可以检索所选择的图像数据库目录中与示例图像在指定的相似度方法下最相似的图像集合。

并预留了一些分析工具。

4.软件功能

a.通过图像预处理模块对图像进行为了适应后续特征提取的统一化预处理处理。

b.通过特征提取模块提取图像的多种特征,并集成为多维度综合特征,存入数据集。

c.选择待查询图像可在图像集合中检索到候选图像。

d.操作简单直观,可以调整检索参数满足研究需求。

3.1.3系统具体需求

菜单栏需求:

在系统UI的顶部显示菜单栏。

在菜单栏需要提供检索图像必须的选择数据集,选择待检索目标图像这两个菜单选项,同时也需要提供预处理必须的选择查询图像库以及对查询图像库创建特征数据集的菜单选项。

待检索图像预览需求:

在UI的主要区域显示待检索图像,供用户确认。

检索结果查看列表需求:

在UI的主要区域显示检索结果图像,结果数量可选,以多行多列的形式罗列。

待检索图像与候选图像应该并列查看,以便对比。

多特征融合需求:

单一的特征描述方法不能准确描述服装款式图像的全部特征,通过将颜色、纹理、形状和空间关系特征组合成综合特征,根据综合特征检索可以达到不同特征优势互补的效果,提高检索的准确度,满足实际应用的需求。

相似性度量方法选择需求:

服装款式检索,主要是通过比较不同服装款式图的特征向量的相似度的匹配程度来实现的,即通过计算待检索图像与候选图像之间综合特征向量的匹配程度来实现。

不同的相似性度量方法会对图像检索结果产生不同的影响,用户可以选择不同的度量方法来得到最符合期望的检索结果。

分析工具需求:

需要对数据集进行SVM分析,计算查询对象所属类别。

需要分析SVM模型在数据集上的分类精度和查全率。

3.2概要设计

本系统将基本功能模块划分为:

图像预处理模块、服装款式图特征提取模块、数据存储模块、款式图特征匹配检索模块、检索结果分析工具模块等几个基本部分。

其中服装款式图特征提取模块和款式图特征匹配检索模块是整个系统的核心部分。

各个模块主要功能描述如下:

3.2.1体系结构设计

根据对服装款式图检索系统的工作流程梳理,得出系统的数据流图,如图4-1所示:

图4.1系统数据流图

本系统将基本功能模块划分为:

图像预处理模块、服装款式图特征提取模块、数据存储模块、款式图特征匹配检索模块、检索结果分析工具模块等几个基本部分。

其中服装款式图特征提取模块和款式图特征匹配检索模块是整个系统的核心部分。

同时,根据对服装款式图检索系统的工作流和需求分析,得出系统的整体体系结构图,如图4-2所示:

图4.2系统体系结构图

3.2.2服装款式图特征提取模块

特征提取模的功能包括:

图像颜色特征的提取(颜色直方图、颜色矩、颜色自相关图、颜色聚合向量等),图像纹理特征的提取(gabor滤波等),图像形状特征的提取(傅里叶描述子、sift特征等)。

3.2.3数据存储模块

数据存储模块主要负责图像数据及图像特征数据的创建、存放、管理及建立索引等基本功能。

由于本系统的信息管理功能比较单一,仅仅涉及到图像特征数据的创建、存放和检索,故设计成将图像以本地文件的形式存放在文件目录下,而图像特征信息以.mat的数据集文件格式存放在本地目录中。

在数据集的创建过程中,需要记录一些图像信息,设计若干个结构体来记录文件信息和图像信息。

文件信息包括文件名、数据大小、目录、创建日期等,图片信息包含图片的格式、尺寸、颜色数量、修改时间等。

下面将描述结构体详细内容。

图文件结构体:

该结构体主要作用为存储图片文件信息,每种图片类型对应一个结构体。

结构如下表所示:

表4.1图文件结构体

列名列编码种类介绍

id0Integer主键id

name1Text文件名

data2Text图片数据

bytes3Integer数据大小

didir4Text目录

datenumDate创建日期

图片信息结构体:

该结构体主要作用为图片的具体信息的结构。

这些具体信息包括图片的格式、尺寸、颜色数量、修改时间等等。

结构如下表所示:

表4.2图片信息结构体

列名列编码种类介绍

id0Integer主键id

format1Text格式

colornum2Integer颜色数量

bytes3In

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1