毕业论文基于深度学习的图像目标类别检测研究与实现.doc

资源描述

毕业论文基于深度学习的图像目标类别检测研究与实现.doc

《毕业论文基于深度学习的图像目标类别检测研究与实现.doc》由会员分享，可在线阅读，更多相关《毕业论文基于深度学习的图像目标类别检测研究与实现.doc（37页珍藏版）》请在冰豆网上搜索。

毕业论文基于深度学习的图像目标类别检测研究与实现.doc

图书分类号：

密级：

毕业设计（论文）

基于深度学习的图像目标类别检测研究与实现

RESEARCHANDIMPLEMENTATIONOFIMAGEOBJECTCATEGORYDETECTIONBASEDONDEEPLEARNING

学生姓名

孔冬荣

学院名称

信电工程学院

学号

20120508106

班级

12软嵌1

专业名称

计算机科学与技术

指导教师

鞠训光吕宝旺

2016年

6月

3日

徐州工程学院毕业设计（论文）

徐州工程学院学位论文原创性声明

本人郑重声明：

所呈交的学位论文，是本人在导师的指导下，独立进行研究工作所取得的成果。

除文中已经注明引用或参考的内容外，本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。

对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式标注。

本人完全意识到本声明的法律结果由本人承担。

论文作者签名：

　　　　日期：

　　年　月　　日

徐州工程学院学位论文版权协议书

本人完全了解徐州工程学院关于收集、保存、使用学位论文的规定，即：

本校学生在学习期间所完成的学位论文的知识产权归徐州工程学院所拥有。

徐州工程学院有权保留并向国家有关部门或机构送交学位论文的纸本复印件和电子文档拷贝，允许论文被查阅和借阅。

徐州工程学院可以公布学位论文的全部或部分内容，可以将本学位论文的全部或部分内容提交至各类数据库进行发布和检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

论文作者签名：

　　导师签名：

日期：

　　年　月　　日日期：

　　年　月　　日

摘要

大数据时代使得数字图像的数量和规模与日俱增，给图像处理带来挑战。

提高图像识别的效率和速率，对图像物体检测与识别具有一定的现实意义。

深度学习DL（DeepLearning）是近几年热门的一种含有多层结构的深度神经网络。

通过学习一种深层非线性网络结构，提高对复杂分类问题的泛化能力。

由此而言，在图像检测难度较大的情况下，为达到更高的处理效率和准确率，运用深度学习技术便顺理成章。

本选题将研究应用机器学习方法的最新成果--深度学习来实现目标类别检测。

本文的主要工作包括：

（1）查阅近年来的深度学习及目标检测的相关文献资料，了解深度学习和图像检测算法的国内外研究现状，概述深度学习的发展及其机理和训练方法，研究深度学习的Caffe框架及卷积神经网络、FastR-CNN等机理；

（2）在Linux系统下搭建Caffe学习框架，应用CUDA并行架构，采用基于AlexNet网络的图像目标检测FastR-CNN模型，通过交替无监督和有监督学习训练网络，最终实现对图像目标人、猫、车、沙发等二十个类别的检测；

（3）通过实验验证FastR-CNN在数据集PASCALVOC2007的检测效果较为理想，证实使用深度学习进行图像目标检测具有可行性和有效性。

关键词目标类别检测；深度学习；卷积神经网络；FastR-CNN

Abstract

Bigdataerabringsgrowingnumberofimagesandthechallengesofimageprocessing.Improvingtheefficiencyandspeedofimagerecognitionhasacertainpracticalsignificanceoftheimageobjectdetectionandrecognition.

DeepLearningDL（DeepLearning）ispopularinrecentyears.Ithasadeepneuralnetworkwithmulti-layerstructure.Bylearningadeepnonlinearnetworkstructure,thegeneralizationabilityofthecomplexclassificationproblemisimproved.

Therefore,seeingthatimagedetectionisverydifficult,inordertoachievehigherprocessingefficiencyandaccuracy,wewouldusedeeplearningtechniquesnaturally.Thistopicwillstudytherecentapplicationofmachinelearningmethods--deeplearningtoachievethetargetcategorydetection.

Themainworkofthispaperincludes:

（1）Werefertotheliteratureinformationofdeeplearningandtargetdetectioninrecentyears,understandthedomesticandforeignresearchstatusofdeeplearningandimagedetectionalgorithm.Weprovideanoverviewofitsdevelopmentmechanismandtrainingmethodsdeeplearning,mechanismofitsframeworkCaffeandconvolutionalneuralnetworks,fastR-CNNetc;

（2）WebuildaCaffelearningframeworkundertheLinuxsystem.UsingCUDAparallelarchitectureandimagetargetdetectionfastR-CNNmodelbasedonAlexNetnetwork,byalternatelyunsupervisedandsupervisedlearningtotrainthenetwork,weultimatelydetecttwentycategoriesofimagetargetsuchascats,cars,sofaandsoon;

（3）TheexperimentalresultsshowthatthedetectioneffectofFastR-CNNonthedatasetPASCALVOC2007confirmthattheuseofdeeplearningforimagetargetdetectioniseffectiveandfeasible.

KeywordsTargetclassdetectionDeeplearningConvolutionalneuralnetworkFastR-CNN

III

徐州工程学院毕业设计（论文）

1绪论 1

1.1课题背景 1

1.2研究目的及意义 2

1.3国内外研究现状 2

1.3.1国内研究现状 2

1.3.2国外研究现状 3

1.4论文组织结构 4

2深度学习相关技术 5

2.1深度学习概述 5

2.2深度学习机理及训练方法 6

2.2.1深度学习机理 6

2.2.2深度学习训练方法 6

2.3卷积神经网络CNN 7

2.3.1卷积神经网络的网络结构 7

2.3.2卷积操作 8

2.3.3子采样（池化）操作 9

2.4本章小结 10

3深度学习框架Caffe 11

3.1Caffe概述 11

3.2Caffe层次结构简介 11

3.2.1blob数据 11

3.2.2Layer的计算和连接 12

3.2.3Net的定义和操作 12

3.2.4Loss简介 13

3.2.5Solver简介 13

3.2.6Methods 14

3.3Caffe中的机器学习相关内容介绍 14

3.3.1GDM梯度下降法 14

3.3.2SGD随机梯度下降法 15

3.3.3设定学习率和动量的经验法则 15

3.4本章小结 16

4FastR-CNN目标类别检测模型机理 17

4.1系统基本框架AlexNet 17

4.2R-CNN模型 18

4.3SPP-Net模型 19

4.4FastR-CNN模型 19

4.5本章小结 20

5基于深度学习的图像目标识别与分类的实现 21

5.1硬件及软件环境介绍 21

5.2基于深度学习的图像目标分类与检测的具体实现 21

5.2.1Caffe框架的搭建并构建FastRCNN 21

5.3系统实验测试与分析 24

5.3.1数据集与评测指标 24

5.3.2算法及参数测试分析 24

5.4本章小结 27

结论 28

致谢 29

参考文献 30

1绪论

1.1课题背景

人工智能（ArtificialIntelligence），就像长生不老和星际漫游一样，是人类最美好的梦想之一。

其中，人们通过机器学习（MachineLearning），使用实例数据或过去的经验训练计算机，使其能够随时间或环境变化，解决特定的问题。

数字图像处理已经成为医学、心理学、工商学、社会自然科学等领域的重要研究处理问题。

对图像目标对象进行精确且要详细的类型识别，在更全面地理解图像、深入研究图像处理技术有着重要的意义。

计算机视觉可以利用计算机判断感知图像中的目标以模拟人的视觉功能。

目标类别检测技术（objectclassdetection）受到人们广泛关注[1、3]。

用户可以从中得到图像的简单分类，而且可以更为准确的从图像中获得目标的位置信息，甚至是目标对象的语意类别，这使得图像检测更为方便与智能。

图像目标类别检测技术，通过传统构建特征的方法如SIFT、HOG、LBP、MSER等图像处理技术及模式识别领域的方法，用边界框标定出目标对象的位置并检测目标的类别。

其中，正确构建并选取特征以对图像合理有效的表达是正确识别图像目标和行为的关键。

近年来，研究者发现通过无监督的方式进行学习可以更好提取到本质特征。

深度学习，通过逐层构建多层网络可以使机器学习到更隐藏的特征且计算速度更快因而近年来大受欢迎。

深度学习在工业界产生了巨大的影响。

在Hinton的科研小组赢得ImageNet比赛之后半年，谷歌和百度发都布了新的基于图像内容的搜索引擎。

他们沿用了Hinton在ImageNet竞赛中用的深度学习模型，应用在各自的数据上，发现图像搜索的准确率得到了大幅度的提高。

Facebook于2013年12月在纽约成立了新的人工智能实验室，聘请深度学习领域的著名学者，卷积网路的发明人YannLeCun作为首席科学家。

2014年1月，谷歌四亿美金收购了一家深度学习的创业公司DeepMind。

百度在2012年就成立了深度学习研究院，于2014年5月又在美国硅谷成立了新的深度学

展开阅读全文