玉米营养品质的快速鉴定.docx
《玉米营养品质的快速鉴定.docx》由会员分享,可在线阅读,更多相关《玉米营养品质的快速鉴定.docx(22页珍藏版)》请在冰豆网上搜索。
![玉米营养品质的快速鉴定.docx](https://file1.bdocx.com/fileroot1/2022-10/18/f9adf913-46af-4726-b1e2-53123d0b247c/f9adf913-46af-4726-b1e2-53123d0b247c1.gif)
玉米营养品质的快速鉴定
玉米营养品质的快速鉴定
摘要利用近红外反射光谱分析技术和偏最小二乘回归法和Matlab多元线性回归法,通过比较不同光谱范围和光谱预处理方法,采用二阶导数光谱预处理,在7250~10000cm-1、5400~7250cm-1和4000~5400cm-1谱区内建立了近红外光谱测定玉米秸秆纤维素含量的校正模型。
利用100个玉米样品对所建模型的实际预测效果进行了验证,预测值与化学值的相关系数(r)可达0.9953,最大相对误差仅为5.20。
结果表明,近红外光谱技术可以快速、准确地测定玉米秸秆纤维素,该结果对玉米秸秆材料的快速鉴定和筛选利用具有重要的意义。
关键词近红外光谱,多元线性回归,玉米,蛋白,纤维素,脂肪,模型
0引言
玉米是整株作物的主要精华部分,是反刍动物重要的粗饲料来源和人类粮食的主要来源。
玉米中蛋白、纤维素、脂肪含量是衡量其营养价值的重要指标之一。
选育优良青贮玉米品种需要对玉米种子蛋白、纤维素、脂肪含量进行快速分析,而蛋白、纤维素、脂肪的常规分析方法速度慢,成本较高,不适合大批样品的测定和对育种中间材料的筛选。
近红外光谱分析技术具有分析快速、简便、非破坏性以及可同时进行多组分测定等优点。
在国外,近红外反射光谱技术已用于玉米自交系纤维素和体外消化率的评价,以及玉米青贮品质联机分析。
目前国内未见有近红外光谱技术用于玉米秸秆纤维素含量分析的报道。
因此研究用NIRS快速、准确分析玉米蛋白、纤维素、脂肪的方法,为快速发展的我国畜牧业提供优质牧草,具有实际意义。
1问题重述
玉米是生态农业的关键农作物之一,玉米中富含蛋白质、纤维素、脂肪、水溶性多糖和糖醇类等多种生理活性物质。
玉米的营养品质是指玉米中所含的各种营养成分(蛋白、纤维素、脂肪等)。
为了实行优质玉米的培养,需要实现玉米营养品质的快速鉴定。
根据所给的数据建立数学模型解决下列问题:
1、根据前100个样品的光谱响应数据和蛋白含量的生化检测值,建立单一成分的光谱分析模型;拟定模型评价指标,并讨论模型的适用范围。
2、根据所建立的数学模型,估算其余26个玉米样品(编号101~126)的蛋白含量。
3、结合玉米的光谱响应数据和蛋白、纤维素、脂肪三种营养成分的生化检测值,设计合理的玉米营养品质快速检测方案建立数学模型;进一步利用模型估算其余26个玉米样品中蛋白、纤维素、脂肪三种营养成分含量。
2模型的假设与符号的约定
2.1模型的假设与说明
2.1.1实验材料和仪器
玉米样品126份,用9FQ-235锤式粉碎机粉碎,过0.45mm粒径,微晶纤维素250g,化学方法制取玉米纤维素样50g;VECTOR22/N傅里叶变换近红外光谱仪,所用软件为OPUS4.0。
仪器工作参数为:
在4000~10000cm-1谱区范围内,扫描次数为390次,分辨率为8cm-1。
图1162个玉米样品的近红外光谱图
图2样品最大、最小、平均的近红外光谱响应图
2.2符号的约定与说明
符号
符号说明
A
光谱响应值,即吸收光的能力
v
光的频率cm-1
ki
波长i的变量吸光系数
T
玉米样品温度
f
归一化响应率(%)
R
为决定系数
SEE
为离回归标准误
Sy
为化学测定值的标准差
LE
为化学测定值的标准误
K
蛋白变量系数
L
纤维素变量系数
M
脂肪变量系数
3问题一的分析与求解
3.1建立单一成分的光谱分析模型
将玉米粉末样盛于直径50mm的旋转样品池,在4000~10000cm-1谱区范围内扫描,每个样品重复装样390次。
计算其平均光谱贮入计算机中。
其中162个样品的近红外漫反射光谱如图1所示。
近红外光谱图有多处吸收峰,可以作为定量分析的依据。
纤维素含量=酸性洗涤纤维含量-蛋白-脂肪含量,酸性洗涤纤维、蛋白和脂肪含量分别采用范氏法测定。
R2=l—SEC2/Sy2,R2≤l—LE2/Sy2
为一束一定波长的单色光通过一定浓度的均匀溶液时.光的吸收强度与液层的厚度(d)和溶液的浓度(c)成正比,即Lglo/I=kdc(k为吸光系数)。
【2】
光谱记录的是有机物分子中单个化学键的倍频和合频信息,主要是含氢基团X—H(如C一H、O—H、N—H和C=O等)的信息,不同种类的化学键.能形成特定的吸收光谱
3.1.1Matlab多元线性回归的实现
多元线性回归在Matlab中主要实现方法如下:
(1)b=regress(Y,X)确定回归系数的点估计值,其中:
(1)【3】
设:
在前100个样品中随机抽取9个样品,每个样品随机抽取6组数据,每组数据包括20束不同波长的光束,取其平均波长,分别为:
X1、X2、X3、X4、X5、X6,并求每组数据中的20束不同波长的平均光谱响应值。
设y为蛋白的含量,具体采集并处理后的数据如下:
波长
样品1
样品6
样品11
样品16
样品21
样品26
样品31
样品36
样品41
X1(1000-9720cm-1)
0.333554
0.333554
0.358477
0.319206
0.398064
0.346766
0.321148
0.328346
0.364675
X2(8020-7730cm-1)
0.351365
0.331984
0.378699
0.338629
0.424027
0.363664
0.331654
0.345135
0.385419
X3(6960-6660cm-1)
0.575828
0.544286
0.614434
0.552892
0.704976
0.58249
0.500048
0.559773
0.639069
X4(5890-5600cm-1)
0.532708
0.505814
0.570542
0.516811
0.657413
0.541059
0.467365
0.517605
0.597403
X5(5140-4840cm-1)
0.734432
0.689513
0.765633
0.694633
0.90562
0.73024
0.613722
0.718252
0.838951
X6(4380-4090cm-1)
0.893266
0.848817
0.939756
0.857827
1.104166
0.893435
0.757159
0.874806
1.043064
y
10.4
11.1
9.4
9.6
11.8
9.5
8.5
9.6
13.0
表1随机抽取的平均波长和光谱响应值
分析:
x1=[0.333554,0.333554,0.358477,0.319206,0.398064,0.346766,0.321148,0.364675];
x2=[0.351365,0.331984,0.378699,0.338629,0.424027,0.363664,0.331654,0.345135,0.385419];
x3=[0.893266,0.848817,0.939756,0.857827,1.104166,0.8934350.7571590.8748061.043064];
y=[10.4,11.1,9.4,9.6,11.8,9.5,8.5,9.6,13.0]
由上式
(1)可得(eT为单位列向量)
Matlab程序为:
/输入如下命令/:
x1=[0.333554,0.333554,0.358477,0.319206,0.398064,0.346766,0.321148,0.364675];
x2=[0.351365,0.331984,0.378699,0.338629,0.424027,0.363664,0.331654,0.345135,0.385419];
x3=[0.893266,0.848817,0.939756,0.857827,1.104166,0.8934350.7571590.8748061.043064];
y=[10.4,11.1,9.4,9.6,11.8,9.5,8.5,9.6,13.0]
X=[ones(length(y),1),x1',x2',x3'];%把行向量转轶为列向量
Y=y';%把行向量转轶为列向量
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
输出结果:
b=
7.0135
147.4864
-222.1997
36.1899
bint=
-1.325015.3520
-178.5194473.4922
-568.5588124.1593
13.548058.8317
stats=
0.878812.08790.01000.3842
因此我们可得:
=7.0135的置信区间(-1.325015.3520)
=147.4864的置信区间(-178.5194473.4922)
=-222.1997的置信区间(-568.5588124.1593)
=36.1899的置信区间(13.548058.8317)
r2=0.9824,F=111.4792,p=0.0000
p<0.05,回归模型
y=7.0135+147.4864X1-222.1997X2+36.1899X3成立。
(2)
营养成分含量=K[(波长(v)*光谱响应(A)*归一化响应率(f)]/100
3.1.1求蛋白的变量系数
设蛋白的变量系数为K,光谱波长v(cm-1)=10000/v(um),光谱响应为A,蛋白含量为Wd,则:
Wd=K*v*A→→→K=Wd/(v*A)
利用软件拟合曲线得到变量系数和波长曲线,取6个样品的变量系数曲线,如图4:
图46个样品蛋白的变量系数
根据曲线图,可将曲线分为四个阶段,分别设变量系数为K1、K2、K3和K4。
K=
K1=27K2=21K3=12K4=6
3.1.2求纤维素的变量系数
设纤维的变量系数为L,光谱波长v(cm-1)=10000/v(um),光谱响应为A,蛋白含量为Wd,则:
Wd=L*v*A→→→L=Wd/(v*A)
利用软件拟合曲线得到变量系数和波长曲线,取6个样品的变量系数曲线,如图5:
图56个样品纤维素的变量系数
根据曲线图,可将曲线分为四个阶段,分别设变量系数为:
L1、L2、L3和L4。
L=
L1=58L2=48L3=25L4=12
3.1.3求脂肪的变量系数
设脂肪的变量系数为M,光谱波长v(cm-1)=10000/v(um),光谱响应为A,蛋白含量为Wd,则:
Wd=M*v*A→→→M=Wd/(v*A)
利用软件拟合曲线得到变量系数和波长曲线,取3个样品的变量系数曲线,如图6:
图63个样品脂肪的变量系数
根据曲线图,可将曲线分为四个阶段,分别设变量系数为:
M1、M2、M3和M4。
M=
M1=13M2=10M3=6M4=3
3.2拟定模型评价指标
1.为了评价NIRS定标模型的定标效果和预测精度,引入以下几个参数
决定系数R2:
n:
样本数;yf:
第f个样品的预测值;Yf:
第i个样品的参考值(真值);Ym:
样本真值的平均值。
铲接近100%表示预测浓度值接近真值,若R2=1则说明存在完全拟合。
当预测残差平方和人于总平方和(真值