近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx

上传人:b****7 文档编号:8992295 上传时间:2023-02-02 格式:DOCX 页数:13 大小:22.25KB
下载 相关 举报
近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx_第1页
第1页 / 共13页
近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx_第2页
第2页 / 共13页
近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx_第3页
第3页 / 共13页
近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx_第4页
第4页 / 共13页
近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx

《近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx》由会员分享,可在线阅读,更多相关《近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx(13页珍藏版)》请在冰豆网上搜索。

近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度百度概要.docx

近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度XX概要

第30卷,第4期2010年4月光谱学与光谱分析

SpectroscopyandSpectralAnalysis

V01.30.No.4,pp929—932April,2010

近红外光谱结合一类支持向量机算法检测鸡蛋的新鲜度林颢,赵杰文。

,陈全胜,蔡健荣,周平

江苏大学食品与生物工程学院,江苏镇江212013

摘要研究利用近红外光谱技术结合模式识别方法识别鸡蛋的新鲜度,在识别模型建立过程中,引入一类支持向量机(OC-SVIVl)算法解决新鲜蛋和非新鲜蛋训练样本数量不平衡问题。

首先获取鸡蛋在100004000eln-1范围内的近红外漫反射光谱,通过主成分分析方法提取光谱数据中的特征信息,优选了3个主成分作为模型的输入向量,然后采用OC-SVM区分新鲜蛋和非新鲜蛋。

在模型建立过程中,对相关参数进行了优化,试验结果显示在相同条件下,OC-SVM模型识别结果较传统的支持向量机模型好。

最优OC-SVM模型对新鲜蛋和非新鲜蛋的识别率均为80%,传统的支持向量机对新鲜度的识别率为100%,对非新鲜度的识别率却为o%。

研究结果表明利用近红外光谱快速识别鸡蛋新鲜度方法是可行的;OC-SVlM算法为训练样本数量不平衡提供了一种有效的解决方法。

关键词近红外光谱;一类支持向量机;检测;鸡蛋;新鲜度

中圉分类号:

0657.3文献标识码:

ADOI:

10.3964/j.issn.1000--0593(2010)04-0929-04

引言

鸡蛋在加工、储藏过程中,易因失水或微生物的人侵而导致新鲜度下降,以至于影响其食用价值。

鸡蛋新鲜度的下降主要是由于卵粘蛋白中二硫化基团及少量碳水化合物等化学成分变化而引起的[1。

]。

近红外(NIR)光谱技术是依据化学成分对近红外区光谱的吸收特性而进行的测定,已在多个领域得到广泛应用[3“],同时也被应用于鸡蛋新鲜度的快速无损检测。

Kemp等[5]利用近红外光谱技术结合偏最小二乘(PLs)定量分析r鸡蛋新鲜度,其相关性达到0.82。

Giunchi等[6]采用近红外光谱结合模式识别的方法定性区分了不同存储时间的鸡蛋,识别率为100%。

在以上研究中,参与建立模型的新鲜蛋和非新鲜蛋样本均比较充足,且两类样本的数量基本相同。

通常情况下,在建立模型中,训练样本中新鲜鸡蛋和非新鲜鸡蛋数量往往呈现不平衡状态。

在训练样本不平衡的情况下,少鼍样本对检测模型可提供的信息很少,传统的定量或分类模型对少量样本的检测能力较差。

一类支持向量机(one-classsupportvectormachine,0Ds、,M)是在传统的支持向量机上发展起来的一种分类方法[7],已在故障监视,金融欺诈检测等领域显示了在数据类型不平衡问题上的处理能力[8一]。

本文尝试采用近红外光谱技术结合一类支持向量机算法区分新鲜蛋和非新鲜蛋,旨在解决鸡蛋快速无损检测中样本数不平衡的分类问题。

1材料与方法

1.1试验材料

试验选用鸡蛋样本86个,通过对扫描光谱后的鸡蛋样本进行新鲜度测试,其中71个为新鲜蛋(哈夫单位值大于60),15个鸡蛋为非新鲜蛋(哈夫单位值小于60)。

为了保证模型的识别和预测能力,将71个新鲜鸡蛋样本分为两批,一批56个样本作为训练集,另一批15个独立样本作为预测集;15个非新鲜鸡蛋样本也分为两批,一批5个样本作为训练集,另一批lo个样本作为预测集。

1.2光谱数据采集

试验采用AntarisⅡ傅里叶变换近红外光谱仪(美国ThermoScientific公司)扫描鸡蛋近红外光谱。

扫描波数范围为10000~4000Cl'll~,扫描次数为32次,采样间隔为3.856酊1,这样每条光谱共有1557个变量。

光谱采集时,光纤探头紧贴着蛋壳表面,在每个蛋壳表面不同位置上选取3个点进行采集,取3次采集光谱的平均值作为该样本的原始光谱。

试验时,保持室内的温度和湿度基本一致。

图l为一个新鲜蛋和一个非新鲜蛋样本的近红外光谱。

收稿日期:

2009—05-06.修订日期:

2009-08-09

基金项目:

国家科技支撑计划项目(2006BADIIAl2)资助

作者简介:

林颢,1983年生,江苏大学食品与生物工程学院博士研究生e-mail:

linhaolt794(马163.com*通讯联系人e-mail:

zjw-205@163.corn

930

光谱学与光谱分析

第30卷

筻。

Wavenumber/cm—l

脚1

Spectraoftypicalfreshnessegg

andmffr匹hegg

samples

1:

Freshness

egg1

2:

Unfreshnessegg

1.3一类支持向量机分析方法

一类支持向量机((X:

-SVM)算法的核心思想是将原点作为负类代表,通过核函数将输入样本映射到特征空间中,然后,将其以最大间隔同原点分离[I仉1¨。

与传统的分类器不同,OC-SVM把样本分为目标样本和非目标样本,其目的是估计空间中包含目标样本的最小区域。

在构造分类器时,

0C-SⅥ“利用目标类样本的信息在保证泛化性能或其他目

标条件下,通过归纳学习得到一个能把目标类样本和非目标

类样本区分开。

对于给定数据集X={五l五∈剐}k・,为使算法具有一定鲁棒性,引入非零的松弛变量8,OC-SⅥvI目

标函数如下

min可1

11w"+击∑邑--p

(1)

_

’…

s.t.(tu垂(x1))≥p一8,8≥0

式中,v∈(o,1]是预先设定的参数,和支持向量个数密切相关。

v是全部支持向量个数的下界,称为v属性。

可以得到与此问题相应的对偶形式

1,.一

Irain专∑口faik(xf,习){

㈠”1一

(2)

s.t.0≤m≤吉,∑口j=1

对于决策函数,,当样本落在覆盖区域内部时,取值为+1;反之,取值为一1。

对于测试样本来说,依据其落在特征空间中超平面的哪一侧来决定其所属类别。

数据分析在MatlabV7.o(Mathworks。

UsA)的软件平台上完成。

2结果与分析

2.1主成分分析

由于近红外光谱信号之间存在一定相关性,造成一定量的信息冗余。

主成分分析可以避免建模中的信息冗余,在分

析中起到简化数据的目的[12]。

图2是训练集光谱矩阵前3个

主成分得分图,它表明校正集中的样本点在该三维平面上的投影。

从图2可以看出,部分新鲜蛋和非新鲜蛋在三维平面上的投影点分布比较分散,可通过主成分分析直接区分开I

另有一部分投影点则有相互交叉的区域,难以区分。

可能是由于这些新鲜蛋的新鲜度较低,与非新鲜蛋比较接近。

因此,需采用模式识别对主成分分析结果进一步分析判别。

通过分析,发现前3个主成分累积方差贡献率达99%,可反映

绝大部分原始光谱信号的特征信息,因此本研究采用了3个主成分作为OC-SⅥⅥ的输入向量。

O.5

-0.5

—1

脚2

Scorecluster

plot啪th

topthree

prmdpmcomponents

(吣)foreggsamplesin帆岫set

2.2一类支持向量机中的参数优化

一类支持向量机是将输入向量通过核函数映射到特征空间中,然后,以最大间隔将其与原点分离。

核函数的选取对模型判别结果有较大影响。

比较几种常见的核函数(线性内核、多项式内核、径向基内核),径向基内核作为非线性的核函数,可处理响应光谱信号和结果之间的非线性关系,有比

线性内核更强的处理能力,但却有很简洁的函数结构,减少

了训练过程中的复杂性[13-15]。

因此,本文选择了径向基作为一类支持向量机模型的内核函数。

在模型的建立过程中。

样本对目标类的隶属度阚值口及径向基核函数的带宽盯2对模型判别的结果有一定影响[1乱"]。

因此,在建立模型之前,需对这些参数进行优化,提高模型检测精度。

首先,对参数,和u进行大范围搜索取

值优化,初步试验结果显示,参数矿的值在20~21之间,口值在0.1~1之间时,()C-SVM模型能取得最好的结果。

然后对这两个参数进行具体优化,结果如图3显示,本文取lO个口值(从0.1~1)和10个矿值(20.1~21),步长均为0.1,以独立样本预测集的判别率优选参数。

当v=0.5,口2=20.3

隐3

Identification

ratesfromOC-SVMmodel们恤

differentvaluesof

parameter

and矿

第4期

光谱学与光谱分析

931

时,OC-SVM模型结果可取得最佳结果,其中新鲜鸡蛋和非新鲜鸡蛋样本的识别率均为son。

优化参数时,当步长取值小于0.1时,参数优化效果不再明显,对模型结果影响不大。

2.3一类和两类支持向量机分类结果比较

本研究同时采用r传统的两类支持向量机识别鸡蛋样本,对模型的相关参数也进行了优化。

其最优模型与一类支持向量机结果比较如表1所示。

从表1可以看出,两类支持向量机模型对新鲜蛋的识别率都达到了100%,但却完全无法识别独立非新鲜蛋样本。

而一类支持向量机对独立新鲜蛋和非薪鲜蛋样本的识别率均为80%。

Table1

Compm由onoftheresultsfromo雠

classandtwoclass

SVMmodels

支持向量机

预测集判别结果/%新鲜蛋

非新鲜蛋

传统的SVM是将输入的变量通过非线性映射转换到高维特征空间,然后在高维特征空间中再构造最优超平面【18—9。

SVM在训练模型时需要两类数据,超平面的划分依靠位于超平面两侧附近的支持向量样本。

在不同类别的样本出现概率大致相当时,能取得较好结果。

但当一类样本数量不足以支持超平面的划分时,这样就导致超平面过于靠近该类别样本群,分类模型严重向相反方向倾斜[20’21]。

在本研究中,两类样本数量出现较严重的不平衡,分类模型严重向

多数类别倾斜,以至于无法识别少量的非新鲜蛋样本。

在鸡蛋新鲜度的快速无损检测中,少数的非新鲜蛋样本恰是需要关注和检测的对象。

OC-SVM方法是一种单分类方法,主要关注目标类别的特点,在预测时只是判别样本是否属于目标类因而不存在两类样本的不平衡问题,预测结果也不会向多数类倾斜。

此外,OC-SVM对于不平衡类别问题的意义是,如果来自边界一侧实例样本的支持不可靠,那么就依靠可以提供很好支持的那类实例样本确定分类面L2孔23]。

因此在实际中,如果OC-svM方法用一类目标预测效果不好时,可以试图改变目标类,以期改善预测能力。

在两类样本都可用时,为了能够更加准确地刻画出划分超平面,通常会选择数

量较多的样本作为目标类。

OC-SVM依靠一类数据进行分类器训练的特点,从根本上避免了训练数据类别不平衡的影响,使得它在处理许多样本数量不平衡问题时具有比传统的两类分类器有更明显的优越性。

3结论

试验采用近红外光谱结合oC_s、册vf模式识别方法对新鲜蛋和非新鲜蛋进行快速无损检测。

在两类样本数量出现较严重的不平衡时,OC-SVM模型的性能较传统的SVM模型优越。

OC-SVM模型对新鲜蛋和非新鲜蛋的识别率都达到80%。

研究结果表明利用近红外光谱快速识别鸡蛋新鲜度方法是可行的;同时应用OC-SVM算法为鸡蛋新鲜度检测中存在的样本不平衡问题提供了一种新的解决方法,具有良好的应用前景。

文献

Suman

M,RianibG。

DalcanaleESensorsandActuatorsB,2007.125:

40.

DuttaR,HinesEL。

GardnerJ

W,eta1.MeasurementScienceandTechnology,2003,14:

190.

JIN

Xiang-jun。

ZHANGYong,XIEYun-fei,etaL(金向军,张勇,谢云飞,等).SpectroscopyandSpectralAnalysis(光谱学与光谱分

析),2009,29(3):

656.

ZOUXiao-bo,ZHAOJie-wen(邹小波.赵杰文).ChineseJournalofAnalyticalChemistry(分析化学),2006,34(9):

1291.

KempsCJ,BamelisFR,DeKetelaereB,etaLJournalofthe,ScienceoffoodandAgriculture,2006,86:

1399.GiunchiA.BerardinelliA,RagniL,etaL

JournalofFoodEngineering,2008,89:

142.

ScholkopfB。

SmolaAJ,WilliamsonRCNeuralComputation,2000,12(5):

1207.

WuRS,ChungWSExpertSystemswithApplications,2009.36:

4451.

Bicegoa

M,FigueiredoMAT.PatternRecognition,2009,42:

27.

SeholkopfB。

PlattJ.Shawe-T£lylorJ,eta1.NeuralComputation,2001,13(7):

1443.

ManevitzLM。

YousefMJournalofMachineLearningResearch,2001。

2:

139.

O’Farrell

M。

LewisaE,FlanaganaC,etaLSensorsandActuatorsB,2005,17:

104.

ChenQS,ZhaoJW,FangCH,etaLSpectrochimicaAetaPartA,2007。

66:

568.

Thissen

U。

PepersM,UsttinB,etaLChemometricsandIntelligentLaboratorySystems,2004,73:

169.

CHENBin,FENGAi—min。

CHENSong-can,etal(陈斌,冯爱民,陈松灿,等).ChineseJournalofComputers(计算机学报),2007,

30(8):

1325.FangS

F,WangMP,QiQH,eta1.Computational

Materials

Science,2008,44:

647.

Twellmanna

T,Meyer-BaeseA,LangeO。

etaLEngineeringApplicationsofArtificialIntelligence,2008,21

129.

WUCL,CHAUKW。

LIHSJournalofHydrology,2008,358:

96.

GuoS

M,ChertI。

C。

TsaiJSH.PatternRecognition,2009,42:

77.

YANDong-wei。

SUNTian-wen,YANGYan,et

al(燕东渭,孙田文.杨艳,等).JournalofAppliedMeteorological

Science(应用气象

学报),2007,18(5);676.

]]

40

0,0

加心”H坫¨"掩均加[[

932光谱学与光谱分析第30卷

[21]HUANGQian,WANGZhen,WEI1_o,etal(黄谦,王震,韦韬,等).ComputerEngineering(计算机工程),2006,32(16):

127.

[223FoodyGM,MathurA,Sanchez-HernandezC,etaLRemoteSensingofEnvironment,2006,104:

1.

IdentificationofEggFreshnessUsingNearInfraredSpectroscopyandOneClassSupportVectorMachineAlgorithm

LINHao,ZHAOJie-wen’,CHENQuan-sheng,CAIJian-rong,ZHOUPing

SchoolofFoodandBiologicalEngineering,JiangsuUniversity,Zhenjiang212013,China

AbstractNearinfrared(NIR)spectroscopycombinedwithpatternrecognitionwasattemptedtodiscriminatethefreshnessofeggs.Thealgorithmofone-classsupportvectormachine(oC-SVM)wasemployedtosolvetheclassificationproblemduetoim-balancednumberoftrainingsamples.Inthiswork,86samplesofeggs(71samplesoffresheggsand15samplesofunfresheggs)weresurveyedbyFouriertransformNIRspectroscopy.Firstly。

originalspectraofeggsinthewave-numberrangeof10000-4000cn-l-1wereacquired.Andthen,principaIcomponentanalysis(PCA)wasemployedtoextractusefulinformationfromoriginalspectraldata,andthenumberofpCswasoptimized.Finally,OC-SVMwasperformedtocalibratediscriminationmodel,andtheoptimalPCswereusedastheinputeigenvectorsofmodeLInordertoobtainagoodperformance,theregulariza-tionparameterVandparameter0ofthekernelfunctioninOC-SVMmodelwereoptimizedinbuildingmodel.TheoptimalOC-SVMmodelwasobtainedwithv=0.5and矿=20.3.ExperimentalresultshowsthatOC-SVMgotbetterperformancethancon—ventionaltwo-chSSSVMmodelunderthesamecondition.TheOC-SVMmodelwasaehievedwithidentificationratesof80forbothfresheggsandunfresheggsintheindependentpredictionset.neidentificationratesoffresheggswere100%intwo-class洲model.However,whenthetwo-classSVMmodelwasusedtOdiscriminatetheunfresheggsof,theidentifieationrates

were0%intheindependentpredictionset.Comparedwithconventionaltwo-classSVMmodel,theOC-SVMmodeIshoweditSsuperiorperformanceindiscriminationofminorityunfresheggssamples.ThisworkshowsthatitisfeasibletOidentifyeggfreshnessusingNIRspectroscopy,andOC-SVMisanexcellentchoiceinsolvingtheproblemofimbalanced

numberofsamplesintrainingset.

KeywordsNear

infraredspectroscopy;One-chsssupportvectormachine;Identification;Egg;Freshness

*Correspondingauthor

(ReceivedMay6,2009;acceptedAug.9,2009)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 农学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1