22基于pca的苹果特征提取研究开题报告.docx

资源描述

22基于pca的苹果特征提取研究开题报告.docx

《22基于pca的苹果特征提取研究开题报告.docx》由会员分享，可在线阅读，更多相关《22基于pca的苹果特征提取研究开题报告.docx（11页珍藏版）》请在冰豆网上搜索。

22基于pca的苹果特征提取研究开题报告.docx

22基于pca的苹果特征提取研究开题报告

毕业设计（论文）开题报告

题目：

基于pca的苹果特征提取研究

学院：

电气信息学院

专业：

自动化

学生姓名：

学号：

*****************************************

2017年月日

开题报告填写要求

1．开题报告（含“文献综述”）作为毕业设计（论文）答辩委员会对学生答辩资格审查的依据材料之一。

此报告应在指导教师指导下，由学生在毕业设计（论文）工作前期内完成，经指导教师签署意见及所在专业审查后生效。

2．开题报告内容必须用黑墨水笔工整书写或按此电子文档标准格式（可从教务处网页上下载）打印，禁止打印在其它纸上后剪贴，完成后应及时交给指导教师签署意见。

3．“文献综述”应按论文的格式成文，并直接书写（或打印）在本开题报告第一栏目内，学生写文献综述的参考文献应不少于10篇（不包括辞典、手册），其中至少应包括1篇外文资料；对于重要的参考文献应附原件复印件，作为附件装订在开题报告的最后。

4．统一用A4纸，并装订单独成册，随《毕业设计（论文）说明书》等资料装入文件袋中。

毕业设计（论文）开题报告

1．文献综述：

结合毕业设计（论文）课题情况，根据所查阅的文献资料，每人撰写2500字以上的文献综述，文后应列出所查阅的文献资料。

1.引言

在苹果的检测分类中，分类器要求的训练样本数量随输入的特征项呈指数关系增长，重复和次要的特征项会使特征组合的分类能力下降，因此需对苹果的数字特征进行降维处理。

目前，苹果分级系统可以对苹果的尺寸、形状、颜色和外部缺陷等方面进行全面的检测，且每个方面均有大量特征，这样就需要存储大量的冗余特征信息,不能精确而简洁地描述图像。

本文着重研究形状特征，采用主成分分析的方法提取出苹果外在品质的最优特征，进而验证了苹果特征提取的可行性。

2.国内外现状

有关主成分分析（PrincipalComponentAnalysis，简称PCA）的理论与方法，K.Fukunaga早在1972年出版的专著“IntroductiontoStatisticalRecognition”中就做了系统的阐述。

Fukunaga和Young等人都曾对该方法做过较深入的研究，并讨论了作为线性特征提取方法的稳定性问题。

主成分分析（PCA）最早由Pearson于1901年提出，随后大量的文献对其作了深入的研究，使其理论逐步完善。

主成分分析方法是模式识别中常用的一种线性映射方法，是基于数据信号二阶统计特性的分析方法。

该方法将多个相关变量简化为儿个不相关变量线性组合，在保证数据信息丢失最少的原则下，经线性变换和舍弃一部分信息，以少数新的变量取代原来的多维变量，从而实现对高维变量空问到低维空问的映射。

从代数学观点看PCA的基本思想就是设法将原来众多具有一定相关性的指标，重新组合成一组新的相互无关的综合指标来代替原来的指标。

而从儿何上看，这些线性组合正是把x1，xz，...，x，构成的坐标系旋转产生的新坐标系，新坐标轴使之通过样品方差最大的方向。

或者说PCA就是寻找一个最佳了空问，当多维数据在该了空问进行投影后，所得分量具有最大方差，同时，当用主元对原始数据进行重构时，在最小均方误差意义下逼近效果最佳。

在过去的几十年里，人们对主成分分析方法作了大量的研究，并在图像识别以及故障监控和诊断等领域均有大量的应用。

主成分分析的应用研究最早主要是利用PCA良好的降维能力，可以把多维特征压缩到少数几维，这样因为减少了噪声等其他干扰成分，突出了有用的信息特征，更加有利于运用神经网络、支持向量机等智能方法进行状态分类。

杨杰等人采用PCA对润扬长江大桥北汉斜拉桥的频响函数进行了有效降维，并根据降维后的主分量重构了结构频响，误差分析表明可以用较少的主元向量来综合表征高维的结构频响函数。

pca的苹果特征提取研究，Kirby和Sirovich等人讨论了利用PCA进行特性的最优表示问题。

接着，Turk和Pentland探讨了这种表示的物理意义。

他们惊奇的发现，K-L展开后的特征向量在还原成图像矩阵时，竞然是一张张标准化的特性。

采用K-L展开表示苹果特性的本质被揭示了出来，即用一系列标准的由特征向量构成，故被形象地称为特征，即Eigenface）通过加权叠加来表示苹果特。

用这些表示系数作为苹果的特征进行分类识别。

这就是著名的特征脸（Eigenfaces）方法。

TurkandPentland在文献的实验中使用2500个苹果特图像的数据库，每类人脸包括3种不同的照明亮度、方向和尺寸的变化，对于这3种变化的识别率分别为88%,85%和64%o随后，他们又建立了一个由3000人的7562幅图片组成的图像集并按照层次等分类。

实验显示，对苹果特识别率分别为89%和88%而。

PCA在苹果特识别领域成功应用的一个重要理论基础是:

已较好地解决了协方差矩阵的特征向量的求解问题。

人脸识别是一个典型的高维小样本问题，即图像矢量的维数一般较高，比如，在ORL标准库中分辨率为112X92的图像（作为图像而言，这一分辨率并不算高），其对应的图像矢量特征空问高达10304维，在如此高维的图像空问内，按照通常的算法，计算样本的协方差矩阵的特征向量，其时空复杂度是可想而知的。

同时，在识别问题中，由于客观条件的限制，训练样本的数目一般较小，通常，训练样本的总数远远小于人脸图像矢量的维数。

针对高维小样本的情况，求解特征向量所采取算法的基本思想是，将高维的问题转化为低维的问题加以解决。

最近，杨建、杨静宇等又进一步发展了传统的线性投影分析方法，提出了直接基于矩阵的图像主成分分析和直接基于图像矩的二维线性鉴别分析方法。

利用PCA进行故障诊断的研究也是一个重要方向。

Malhi等提出一种基于PCA的特征提。

独立成份分析最早是由P.Comon在1994年提出来的，它是基于消除或减少各分量间的相关性，使它们尽可能独立的思想。

它不仅能去除二阶相关，还能去除高阶相关，适用于非高斯分布的样本模型。

缺点是不能计算独立成份的方差，也不能确定独立成份的先后次序，而且最多有一个独立源满足高斯分布。

在进行特征提取时，经常遇到小样本问题和基函数选择问题，而且在利用ICA求解时，需要一些假设条件和前提。

取方案来保证从多域特征中选择出最有效的两个特征来进行轴承状态监测的故障分类Yan利用PCA方法对不同时刻测得的固有频率数据进行提取，以消除环境因素的影响，提高识别的可靠性。

李加文提出了一种基于频域言解卷的噪声信号分离算法，先对给定的每一个频率点执行瞬时混合言解卷算法，获得噪声源的基本估计，然后再经过主成分分析和第二次言源分离，仿真实验证实该算法能有效地分离机械噪声信号。

Yoon和MacGregor提出利用PCA获取稳态时主分量空问和残差空问中的故障特性向量作为故障模式，然后计算新检测故障数据的特性向量与已知故障特性向量问的夹角，实现与故障库中故障的隔离。

Ku等为每一故障模式建立一个PCA统计模型，通过分析新检测到的故障数据在PCA模型下的统计分布特性，并与已有的故障模式进行对比，确定故障的类型或定位故障源。

杨晓楠等人提出了基于主成分分析法的概率神经网络损伤定位方法，运用该方法不仅输入矢量数目和训练时问减少，且可以极大地提高损伤定位的识别精度。

按方差最大化的准则从过程数据中获取过程的主元信息或对过程变量的协方差矩阵进行奇异值分解获得过程的主元特征信号，并以此建立基于PCA的过程统计模型。

主元特征信号的数目可按照一定的准则来确定，然后分别构造出基于主元特征了空问信息的过程统计量和基于残差了空问信息的过程监控量，最后确定正常工况下统计量的控制限，进而对过程进行实时监控。

3.课题主要内容和应用

主元分析方法是一种非常有效的方法，但PCA方法在对数据的处理过程中是根据观测数据的协方差矩阵进行计算的，只涉及到数据的协方差矩阵，即二阶统计特性，并未考虑到数据的高阶统计特性，所以变换后的数据问仍有可能存在高阶冗余信息。

目前己经提出了许多方法来提取数据特征，而且有些方法在很多实际问题中取得了比较好的效果，但是这些方法或多或少都存在一些缺陷，有些方法对训练样本有很强的先验假设，有些方法的解不唯一或不稳定，而且对于不同类型的数据，特征提取的方法也不一样。

针对不同的数据类型，大致有以下特征提取方法。

文本数据的特征提取方法主要有基于语义分析的方法、基于统计的方法和基于本体论的方法

毕业设计（论文）开题报告

２．开题报告：

一、课题的目的与意义；二、课题发展现状和前景展望；三、课题主要内容和要求；四、研究方法、步骤和措施

开题报告

一、课题的意义及目的

基于pca主成分分析（PrincipleComponentAnalysis）[1]是目前国际上提出的一种新的非线性主成分分析方，即利用核技巧对经典的主成分分析（PrinciplComponentAnalysis）进行的一种非线性推广，它能有效地捕捉数据的非线性特征[2]。

该方法引起了各个领域中的科学研究人员的重视，一方面:

特征提取一直都是模式识别、数据压缩、图像处理等领域的关键工作。

由于在很多实际问题中常常不容易找到那些最重要的特征，或受条件限制不能对它们进行测量，这就使特征选择和提取的问题复杂化而成为最困难的任务之一。

而PCA为复杂特征的提取研究提供了一种新的思路[3];另一方面:

大量的现实应用需要利用待处理对象的非线性特征才能取得更好的效果。

KPCA正是一种非线性方法，它能有效的提取非线性特征，相较于传统的一些算法而言，具有更广的实际应用及计算简便等优点。

因而，基于核的主成分分析是目前研究的一个热点问题[4]。

二、课题发展现状和前景展望

信息时代使得人类面临分析或处理各种大规模数据信息的要求，例如一个文字图像可有几千个数据，一个心电图波形也可能上儿千个数据，一个卫星遥感图像的数据量就更大了。

由于实际问题中对象的特征数量相当大，很容易就达到了儿白维甚至上千维，因此直接对这样的原始对象进行存贮和处理都导致效率低下[5]，这对很多实际问题而言就失去了实用意义。

我们注意到，针对特定的应用，并不需要利用对象的所有特征，因为有大量的特征并不能反映对象的本质，甚至有时冗余的特征会成为后续处理的障碍，所以，我们需要对原始数据进行变换，得到最能反映其本质的特征[6]，一方面将描述问题的特征维数进行削减，对大量的数据进行压缩和概括，另一方面也有利于提高后续处理的效率和性能[7]。

三、课题主要内容和要求

讨论了目前国内外基于主成分分析PCA方法的特征提取研究现状和主成分分析PCA方法的研究现状，以及本文的主要研究内容[8]。

基于pca的苹果特征提取研究，在苹果的检测分类中，分类器要求的训练样本数量随输入的特征项呈指数关系增长，重复和次要的特征项会使特征组合的分类能力下降[9]，因此需对苹果的数字特征进行降维处理。

目前，苹果分级系统可以对苹果的尺寸、形状、颜色和外部缺陷等方面进行全面的检测，且每个方面均有大量特征，这样就需要存储大量的冗余特征信息[10],不能精确而简洁地描述图像。

本文着重研究形状特征，采用主成分分析的方法提取出苹果外在品质的最优特征，进而验证了苹果特征提取的可行性[11]。

PCA算法

主成分分析（PCA）是将多指标化为少数几个综合指标的一种统计分析方法。

其关键是求原始数据协方差矩阵的特征值和特征向量[12]。

其算法如下:

（1）求出原始协方矩阵Σ;

（2）求出原始协方矩阵Σ的特征值和特征向量,并将各特征向量从大到小顺序排列,即l1≥l2≥…≥ln，这时可求出n个新的特征y1,y2,…,yn;

（3）定义第i个主分量yi的方差贡献率为:

。

前m个主分量x的累计方差贡献率为:

。

系统算法流程图

特征向量所对应的特征值越小,它与类内平均样本误差越小,所以可以忽略那些特征值大的特征向量，支持向量机SVM（SupportVectorMachine）是20世纪90年代Vapnik基于统计学习理论提出的一种新的机器学习方法。

本系统用PCA提取苹果的最优特征子空间作为支持向量机的输入向量,对图像进行分类学习，应用LSSVM分类器对红富士苹果进行识别[13]。

在这里也选用径向基函数作为内核函数时可得到相对较好的分类效果。

在采用LSSVM分类器识别的过程中，参数C和σ的取值对识别率有较大的影响。

当惩罚因子C取20，径向基函数中的σ取1.3438时，识别的正确率最大[14]。

系统算法结构如图3所示。

在实验过程中，存在一些不足：

（1）综合多特征检索可以提高效果，但要面对计算量大的缺点；

（2）图像分割问题，“螺旋编码”弱化了图像边缘对象的信息，在细粒度分割图像后，边缘图像块间的相关信息完整性糟到破坏。

如果能够加入有效的图像分割技术，首先确定重要对象的大小，相信会有助于在运算量和基因有效描述上找到一个平衡点。

这些正是将来的工作重点。

使用信息熵描述图像的物理特征，利用颜色熵和纹理熵构造解空间的编码，在此基础上，根据遗传算法提出了一种新的基于内容的图像检索方法。

通过试验初步证明了这种方法的效果，能够很好地满足用户的查询要求。

本文提出了可在计算机上快速实现的PCA算法[15]用于苹果外在品质形状特征的压缩,并用实验验证了该算法的可行性、有效性和准确性[16]。

四、研究方法、步骤和措施

第一章:

讨论了目前国内外基于主成分分析PCA方法的特征提取研究现状和主成分分析PCA方法的研究现状，以及本文的主要研究内容。

第二章:

详细论述了pca的建立的基础变换

第三章:

与传统的线性主元分析方法PCA相比，PCA优良特性进行了叙述。

第四、五章:

基于pca的苹果特征提取研究

第六章：

对本文的工作进行总结，并展望今后需进一步研究的工作。

五、参考文献

[1]B.Scholkopf,A.Smola,K-RMuller.NonlinearComponentAnalysisasaKernelEigenvalueProblem[J].NeuralComputation,2008

[2]彭辉,张长水,荣钢,等.基于变换的人脸白动识别方法[J].清华大学学报（白然科学版）,2007,37（3）:

67-70.

[3]高照锋,玛慧.基于主成分分析的图像匹配方法[J].武汉大学学报，2014

[4]蒋明,张桂林,胡若澜,等.基于主成分分析的图像匹配方法研究[J].红外与激光工程,2000,

[5}张翠平,苏光大.人脸识别技术综述[[J].中国图形图像学报，2000

[6]荆晓远，郭跃匕，杨静宇.基于奇异值特征的图像预处理及人脸识别[[J].信息与控制，1999,

[7]CheungYM.,XuL.IndependentcomponentorderinginICAtimeseriesanalysis[J].Neurocomputing,2001

[8]陈国金,梁军,钱积新.独立元分析方法及其在化工过程监控和故障诊断中的应用[J].化工学报,2003

[9]Li,R.F.andWang,X.Z.Dimensionreductionofprocess街namictrendsusingindependentcomponentanalysis[J].ComputersandChemicalEngineering,2012

[10]杨竹青,李勇,胡德文.独立成分分析方法综述[J].白动化学报，2012,

[11]王小平，曹立明．遗传算法——理论、应用与软件实现[M]．西安：

西安交通大学出版社，2002：

18-50.

[12]李红，王琳，王晓东．基于EBIR算法和遗传算法的图像信息检索[J]．西北民族大学学报（自然科学版），2005，26

（2）：

77-80.

[13]JOHNMZ．Aninformationtheoreticapproachtocontentbasedimageretrieval[D]．LouisianaStateUniversityandAgriculturalandMechanicalCollege,2010:

36-77.

[14]周明全，耿国华，韦娜．基于内容图像检索技术[M]．北京：

清华大学出版社，2007：

99-128.

[15]齐岩，卢德唐．交互式遗传算法在基于内容的图像检索中的应用[J]．中国图象图形学报，2004，9

（1）：

46-55.

[16]RRICARDODAS.T,ZHANGBaoPing，EDWARDA.F．Ageneticprogrammingframeworkforcontent-basedimageretrieval[J]．Pat-ternRecognition,2009，42

（2）：

283-292.

毕业设计（论文）开题报告

指导教师意见：

1．对“文献综述”的评语：

2．对本课题的深度、广度及工作量的意见和对设计（论文）结果的预测：

指导教师：

年月日

所在专业审查意见：

负责人：

年月日

展开阅读全文