1、玉米营养品质的快速鉴定玉米营养品质的快速鉴定摘要 利用近红外反射光谱分析技术和偏最小二乘回归法和Matlab 多元线性回归法, 通过比较不同光谱范围和光谱预处理方法, 采用二阶导数光谱预处理, 在725010000cm-1、54007250cm-1和40005400cm-1谱区内建立了近红外光谱测定玉米秸秆纤维素含量的校正模型。利用100个玉米样品对所建模型的实际预测效果进行了验证, 预测值与化学值的相关系数( r )可达0. 9953, 最大相对误差仅为5. 20。结果表明, 近红外光谱技术可以快速、准确地测定玉米秸秆纤维素, 该结果对玉米秸秆材料的快速鉴定和筛选利用具有重要的意义。关键词
2、近红外光谱, 多元线性回归,玉米, 蛋白,纤维素,脂肪, 模型0引 言玉米是整株作物的主要精华部分, 是反刍动物重要的粗饲料来源和人类粮食的主要来源。玉米中蛋白、纤维素、脂肪含量是衡量其营养价值的重要指标之一。选育优良青贮玉米品种需要对玉米种子蛋白、纤维素、脂肪含量进行快速分析, 而蛋白、纤维素、脂肪的常规分析方法速度慢, 成本较高, 不适合大批样品的测定和对育种中间材料的筛选。近红外光谱分析技术具有分析快速、简便、非破坏性以及可同时进行多组分测定等优点。在国外, 近红外反射光谱技术已用于玉米自交系纤维素和体外消化率的评价, 以及玉米青贮品质联机分析。目前国内未见有近红外光谱技术用于玉米秸秆纤
3、维素含量分析的报道。因此研究用N IRS快速、准确分析玉米蛋白、纤维素、脂肪的方法, 为快速发展的我国畜牧业提供优质牧草, 具有实际意义。1问题重述玉米是生态农业的关键农作物之一,玉米中富含蛋白质、纤维素、脂肪、水溶性多糖和糖醇类等多种生理活性物质。玉米的营养品质是指玉米中所含的各种营养成分(蛋白、纤维素、脂肪等)。为了实行优质玉米的培养,需要实现玉米营养品质的快速鉴定。根据所给的数据建立数学模型解决下列问题:1、根据前100个样品的光谱响应数据和蛋白含量的生化检测值,建立单一成分的光谱分析模型;拟定模型评价指标,并讨论模型的适用范围。2、根据所建立的数学模型,估算其余26个玉米样品(编号10
4、1126)的蛋白含量。3、结合玉米的光谱响应数据和蛋白、纤维素、脂肪三种营养成分的生化检测值,设计合理的玉米营养品质快速检测方案建立数学模型;进一步利用模型估算其余26个玉米样品中蛋白、纤维素、脂肪三种营养成分含量。2模型的假设与符号的约定2.1 模型的假设与说明2.1.1 实验材料和仪器玉米样品126份, 用9FQ-235锤式粉碎机粉碎, 过0. 45 mm 粒径, 微晶纤维素250 g, 化学方法制取玉米纤维素样50 g; VECTOR22 /N 傅里叶变换近红外光谱仪, 所用软件为OPUS4. 0。仪器工作参数为: 在4000 10000 cm- 1谱区范围内, 扫描次数为390次, 分
5、辨率为8 cm- 1。图1 162个玉米样品的近红外光谱图 图2 样品最大、最小、平均的近红外光谱响应图2.2 符号的约定与说明符号符号说明A光谱响应值,即吸收光的能力v光的频率cm-1ki波长i的变量吸光系数T玉米样品温度f归一化响应率(%)R为决定系数SEE为离回归标准误Sy为化学测定值的标准差LE为化学测定值的标准误K蛋白变量系数L纤维素变量系数M脂肪变量系数3 问题一的分析与求解3.1建立单一成分的光谱分析模型将玉米粉末样盛于直径50 mm 的旋转样品池, 在4000 10000 cm- 1谱区范围内扫描, 每个样品重复装样390次。计算其平均光谱贮入计算机中。其中162个样品的近红外
6、漫反射光谱如图1所示。近红外光谱图有多处吸收峰, 可以作为定量分析的依据。纤维素含量= 酸性洗涤纤维含量- 蛋白- 脂肪含量, 酸性洗涤纤维、蛋白和脂肪含量分别采用范氏法测定。R2=lSEC2Sy2, R2lLE2Sy2为一束一定波长的单色光通过一定浓度的均匀溶液时光的吸收强度与液层的厚度(d)和溶液的浓度(c)成正比,即LgloI=kdc(k为吸光系数)。【2】光谱记录的是有机物分子中单个化学键的倍频和合频信息,主要是含氢基团XH(如C一H、OH、NH和C=O等)的信息,不同种类的化学键能形成特定的吸收光谱31.1 Matlab 多元线性回归的实现多元线性回归在 Matlab 中主要实现方法
7、如下:(1)b=regress(Y, X ) 确定回归系数的点估计值,其中: (1)【3】设:在前100个样品中随机抽取9个样品,每个样品随机抽取6组数据,每组数据包括20束不同波长的光束,取其平均波长,分别为:X1、X2、X3、X4、X5、X6,并求每组数据中的20束不同波长的平均光谱响应值。设y为蛋白的含量,具体采集并处理后的数据如下:波长样品1样品6样品11样品16样品21样品26样品31样品36样品41X1(1000-9720cm-1)0.3335540.3335540.3584770.3192060.3980640.3467660.3211480.3283460.364675X2(8
8、020-7730cm-1)0.3513650.3319840.3786990.3386290.4240270.3636640.3316540.3451350.385419X3(6960-6660cm-1)0.5758280.5442860.6144340.5528920.7049760.582490.5000480.5597730.639069X4(5890-5600cm-1)0.5327080.5058140.5705420.5168110.6574130.5410590.4673650.5176050.597403X5(5140-4840cm-1)0.7344320.6895130.765
9、6330.6946330.905620.730240.6137220.7182520.838951X6(4380-4090cm-1)0.8932660.8488170.9397560.8578271.1041660.8934350.7571590.8748061.043064y10.411.19.49.611.89.58.59.613.0表1 随机抽取的平均波长和光谱响应值分析: x1=0.333554,0.333554,0.358477,0.319206,0.398064,0.346766,0.321148,0.364675; x2=0.351365,0.331984,0.378699,0.
10、338629,0.424027,0.363664,0.331654,0.345135,0.385419; x3=0.893266,0.848817,0.939756,0.857827,1.104166,0.8934350.7571590.8748061.043064; y=10.4 ,11.1 ,9.4 ,9.6 ,11.8 ,9.5 ,8.5 ,9.6 ,13.0 由上式(1)可得 (eT为单位列向量)Matlab程序为: /输入如下命令/:x1=0.333554,0.333554,0.358477,0.319206,0.398064,0.346766,0.321148,0.364675;
11、x2=0.351365,0.331984,0.378699,0.338629,0.424027,0.363664,0.331654,0.345135,0.385419; x3=0.893266,0.848817,0.939756,0.857827,1.104166,0.8934350.7571590.8748061.043064; y=10.4 ,11.1 ,9.4 ,9.6 ,11.8 ,9.5 ,8.5 ,9.6 ,13.0 X=ones(length(y),1),x1,x2,x3; %把行向量转轶为列向量 Y=y; %把行向量转轶为列向量 b,bint,r,rint,stats=regr
12、ess(Y,X); b,bint,stats输出结果:b = 7.0135 147.4864 -222.1997 36.1899bint = -1.3250 15.3520 -178.5194 473.4922 -568.5588 124.1593 13.5480 58.8317stats =0.8788 12.0879 0.0100 0.3842因此我们可得:=7.0135 的置信区间 (-1.3250 15.3520)= 147.4864 的置信区间(-178.5194 473.4922)= -222.1997 的置信区间(-568.5588 124.1593)= 36.1899 的置信区
13、间(13.5480 58.8317)r2 = 0.9824, F =111.4792, p = 0.0000p0.05, 回归模型y=7.0135+147.4864X1-222.1997X2+ 36.1899X3成立。 (2)营养成分含量=K(波长(v)*光谱响应(A)*归一化响应率(f)/1003.1.1求蛋白的变量系数设蛋白的变量系数为K ,光谱波长v(cm-1)=10000/v (um),光谱响应为A,蛋白含量为Wd,则:Wd=K*v*AK=Wd/(v*A)利用软件拟合曲线得到变量系数和波长曲线,取6个样品的变量系数曲线,如图4:图4 6个样品蛋白的变量系数根据曲线图,可将曲线分为四个阶
14、段,分别设变量系数为K1、K2、K3和K4。K=K1=27 K2=21 K3=12 K4=6 3.1.2 求纤维素的变量系数设纤维的变量系数为L ,光谱波长v(cm-1)=10000/v (um),光谱响应为A,蛋白含量为Wd,则:Wd=L*v*AL=Wd/(v*A)利用软件拟合曲线得到变量系数和波长曲线,取6个样品的变量系数曲线,如图5:图5 6个样品纤维素的变量系数根据曲线图,可将曲线分为四个阶段,分别设变量系数为:L1、L2、L3和L4。L= L1=58 L2=48 L3=25 L4=123.1.3求脂肪的变量系数设脂肪的变量系数为M ,光谱波长v(cm-1)=10000/v (um),光谱响应为A,蛋白含量为Wd,则:Wd=M*v*AM=Wd/(v*A)利用软件拟合曲线得到变量系数和波长曲线,取3个样品的变量系数曲线,如图6:图6 3个样品脂肪的变量系数根据曲线图,可将曲线分为四个阶段,分别设变量系数为:M1、M2、M3和M4。M= M1=13 M2=10 M3=6 M4=33.2拟定模型评价指标1为了评价NIRS定标模型的定标效果和预测精度,引入以下几个参数决定系数R2:n:样本数;yf:第f个样品的预测值;Yf:第i个样品的参考值(真值);Ym:样本真值的平均值。铲接近100表示预测浓度值接近真值,若R2=1则说明存在完全拟合。当预测残差平方和人于总平方和(真值
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1