回归正交试验设计.docx
《回归正交试验设计.docx》由会员分享,可在线阅读,更多相关《回归正交试验设计.docx(42页珍藏版)》请在冰豆网上搜索。
回归正交试验设计
8回归正交试验设计
前面介绍的正交试验设计是——种很实用的试验设计方法,它能利用较少的试验次数获得较好的试验结果,但是通过正交设计所得到的优方案只能限制在已定的水平上,而不是一定试验范围内的最优方案;回归分析是一种有效的数据处理方法,通过所确立的回归方程,可以对试验结果进行预测和优化,但回归分析往往只能对试验数据进行被动的处理和分析,不涉及对试验设计的要求。
如果能将两者的优势统一起来,不仅有合理的试验设计和较少的试验次数,还能建立有效的数学模型,这正是我们所期望的。
回归正交设计(orthogonalregressiondesign)就是这样一种试验设计方法,它可以在因素的试验范围内选择适当的试验点,用较少的试验建立一个精度高、统计性质好的回归方程,并能解决试验优化问题。
8.1一次回归正交试验设计及结果分析
一次回归正交设计就是利用回归正交设计原理,建立试验指标(y)与m个试验因素x1,x2,……,xm,之间的一元回归方程:
(8-1)
或者
k=1,2,…,m-1(j≠k)(8-2)
8.1.1一次回归正交设计的基本方法
(1)确定因素的变化范围
根据试验指标y,选择需要考察的m个因素xj(j=1,2,…,m),并确定每个因素的取值范围。
设因素xj的变化范围为[xj1,xj2],分别称xj1和xj2为因素xj的下水平和上水平,并将它们的算术平均值称作因素xj的零水平,用xj0。
表示。
(8-3)
上水平与零水平之差称为因素xj的变化间距,用△j表示,即:
(8-4)
或
(8-5)
(2)因素水平的编码
编码(coding)是将xj的各水平进行线性变换,即:
(8-6)
式(8—6)中zj就是因素xj的编码,两者是一一对应的。
显然,与xj1,xj0和xj2的编码分别为-1,0和1,即zj1=-1,zj2=0,zj2=1。
一般称xj为自然变量,zj为规范变量。
因素水平的编码结果可表示成表8—1。
对因素xj的各水平进行编码的目的,是为了使每个因素的每个水平在编码空间是“平等”的,即规范变量zj的取值范围都在[1,-1]内变化,不会受到自然变量xj的单位和取值大小的影响。
所以编码能将试验结果y与因素zj(j=1,2,…,m)各水平之间的回归问题,转换成试验结果y与编码值zj之间的回归问题,从而大大简化了回归计算量。
表8-1因素水平编码表
规范变量zj
自然变量xj
x1
x2
…
xm
下水平(-1)
x11
x21
…
xm1
上水平
(1)
x12
x22
…
xm2
零水平(0)
x10
x20
…
xm0
变化间距△j
△1
△2
…
△m
(3)一次回归正交设计表
将二水平的正交表中“2”用“-1”代换,就可以得到一次回归正交设计表。
例如正交表L8(27)经过变换后得到的回归正交设计表如表8—2。
表8-2一次回归正交设计表
试验号
列号
l
2
3
4
5
6
7
1
1
1
1
1
l
l
1
2
1
l
1
-1
-1
-1
-1
3
1
-1
-1
1
1
-1
-l
4
1
-1
-1
-1
-1
1
1
5
-1
1
-1
l
-1
1
-1
6
-1
1
-1
-1
1
-1
1
7
-1
-l
l
l
-1
-1
1
8
-1
-1
1
-1
l
l
-1
代换后,正交表中的编码不仅表示因素的不同水平,也表示了因素水平数值上的大小。
从表8-2可以看出回归正交设计表具有如下特点:
1任一列编码的和为0,即:
(8-7)
所以有
,
(8-8)
2任两列编码的乘积之和等于零,即:
,
(8-9)
这些特点说明了转换之后的正交表同样具有正交性,可使回归计算大大简化。
(4)试验方案的确定
与正交试验设计类似,在确定试验方案之前,要将规范变量zj安排在一元回归正交表相应的列中,即表头设计。
例如,需考察三个因素x1、x2、x3,可选用L8(27)进行试验设计,根据正交表L8(27)的表头设计表,应将x1、x2、x3分别安排在第1、2和4列,也就是将zl,z2,z3安排在表8-2的第1、2和4列上。
如果还要考虑交互作用x1x2、x1x3,也可参考正交表L8(27)的交互作用表,将zlz2和z2z3,分别安排在表8-2的第3、5列上,表头设计结果见表8-3。
每号试验的方案由zl,z2,z3z对应的水平确定,这与正交试验是一致的。
表8-3三因素一次回归正交表
试验号
1
2
3
4
5
Z1
Z2
Z1Z2
Z3
Z1Z3
1
2
3
4
5
1
1
1
1
-1
1
1
-1
-1
1
1
1
-1
-1
-1
1
-1
1
-1
1
1
-1
l
-1
-1
6
7
8
9
10
-1
-l
-l
0
0
1
-1
-1
0
0
-1
1
1
0
0
-1
1
-1
0
0
1
-l
1
0
O
从表8-3可以看出,第3列的编码等于第1,2列编码的乘积,同样第5列的编码等于第1,4列编码的乘积,即交互作用列的编码等于表中对应两因素列编码的乘积,所以用回归正交表安排交互作用时,可以不参考正交表的交互作用表,直接根据这一规律写出交互作用列的编码,这比原正交表的使用更方便。
表8-3中的第9,10号试验称为零水平试验或中心试验。
安排零水平试验的目的是为了进行更精确的统计分析(如回归方程的失拟检验等),得到精度较高的回归方程。
当然,如果不考虑失拟检验,也可不安排零水平试验。
8.1.2一次回归方程的建立
建立回归方程,关键是确定回归系数。
设总试验次数为n,其中包括mc次二水平试验(原正交表所规定的试验)和m0次零水平试验,即:
(8-10)
如果试验结果为yi(i=1,2,…,n),根据最小二乘法原理和回归正交表的两个特点,可以得到一次回归方程系数的计算公式如下(证明略):
(8-11)
,
(8-12)
,
,
(8-13)
上述式中,zji表示zi列各水平的编码,(zjzk)i表示zjzk列各水平的编码。
需要指出的是,如果一次回归方程中含有交互作用项zjzk(j>k),则回归方程不是线性的,但交互作用项的回归系数的计算和检验与线性项zj是相同的,这是因为交互作用对试验结果也有影响,可以被看作是影响因素。
通过上述方法确定偏回归系数之后,可以直接根据它们绝对值的大小来判断各因素和交互作用的相对重要性,而不用转换成标准回归系数。
这是因为,在回归正交设计中,所有因素的水平都经过了无因次的编码变换,它们在所研究的范围内都是“平等的”,因而所求得的回归系数不受因素的单位和取值的影响,直接反映了该因素作用的大小。
另外,回归系数的符号反映了因素对试验指标影响的正负。
8.1.3回归方程及偏回归系数的方差分析
(1)无零水平试验时
首先计算各种平方和及自由度。
总平方和为:
(8-14)
其自由度为
。
根据式(4—44)和式(8—12),推导出一次项偏回归平方和的计算公式为:
(4-44)
,
(8-15)
同理可以得到交互项偏回归平方和的计算公式:
,
,
(8-16)
各种偏回归平方和的自由度都为1。
一次项偏回归平方和与交互项偏回归平方和的总和就是回归平方和:
(8-17)
所以回归平方和的自由度也是各偏回归平方和的自由度之和:
(8-18)
于是残差平方和为:
(8-19)
其自由度为:
(8-20)
如果考虑了所有的一次项和交互项,则可参照表8—4进行方差分析。
表8-4一次回归正交设计的方差分析
差异源
1
1
……
……
……
……
……
1
1
1
……
……
……
……
……
1
回归
残差
总和
在实际做试验时,往往只需要考虑几个交互作用,或者可以不考虑交互作用,所以在计算回归和残差自由度时应与实际情况相符。
如果不考虑交互作用,
,
。
值得注意的是,无论是否考虑交互作用,都不影响偏回归系数的计算公式。
经偏回归系数显著性检验,证明对试验结果影响不显著的因素或交互作用,可将其从回归方程中剔除,而不会影响到其他回归系数的值,也不需要重新建立回归方程。
但应对回归方程再次进行检验,将被剔除变量的偏回归平方和、自由度并入到残差平方和与自由度中,然后再进行相关的分析计算。
(2)有零水平试验时
如果零水平试验的次数m0≥2,则可以进行回归方程的失拟性(1ackoffit)检验。
前面对回归方程进行的显著性检验,只能说明相对于残差平方和而言,各因素对试验结果的影响是否显著。
即使所建立的回归方程是显著的,也只反映了回归方程在试验点上与试验结果拟合得较好,不能说明在整个研究范围内回归方程都能与实测值有好的拟合。
为了检验一次回归方程在整个研究范围内的拟合情况,则应安排m0(m0≥2)次零水平试验,进行回归方程的失拟性检验,或称拟合度检验(testofgoodnessoffit)。
设m0次零水平试验结果为y01,y02,…,y0m0,根据这m0次重复试验,可以计算出重复试验误差为:
(8-21)
试验误差对应的自由度为:
(8-22)
由前述知,只有回归系数α与零水平试验次数m0有关,其他各偏回归系数都只与二水平试验次数m0有关,所以增加零水平试验后回归平方和SSR没有变化,于是定义失拟平方和为:
(8-23)
或
(8-24)
可见,失拟平方和表示了回归方程未能拟合的部分,包括未考虑的其他因素及各xj的高次项等所引起的差异。
它对应的自由度为:
(8-25)
所以有:
(8-26)
(8-27)
这时
(8-28)
服从自由度为(
,
)的F分布。
对于给定的显著性水平α(一般取0.1),当
时,就认为回归方程失拟不显著,失拟平方和
是由随机误差造成的,否则说明所建立的回归方程拟合得不好,需要进一步改进回归模型,如引入别的因素或建立更高次的回归方程。
只有当回归方程显著、失拟检验不显著时,才能说明所建立的回归方程是拟合得很好的。
最后需要指出的是,回归正交试验得到的回归方程是规范变量与试验指标之间的关系式,还应对回归方程的编码值进行回代,得到自然变量与试验指标的回归关系式。
【例8-1】用石墨炉原子吸收分光光度计法测定食品中的铅,为提高测定灵敏度,希望吸光度(y)大。
为提高吸光度,讨论了xl(灰化温度/℃)、x2(原子化温度/℃)和x3(灯电流/mA)三个因素对吸光度的影响,并考虑交互作用x12,x13。
已知x1=300~700℃,x2=1800~2400℃,x3=8~10mA。
试通过回归正交试验确定吸光度与三个因素之间的函数关系式。
解:
(1)因素水平编码
因x1=300~700℃,所以其上水平x12=700,下水平x11=300,零水平
,变化间距
,以x11=300为例,对应的编码
。
同理可对其他因素水平进行编码,编码结果见表8-5。
表8-5例8-1因素水平编码表
编码zj
灰化温度xl/℃
原子化温度x2/℃
灯电流x3/mA
上水平
(1)
下水平(-1)
零水平(0)
变化间距△j
700
300
500
200
2400
1800
2100
300
10
8
9
1
(2)正交表的选择和试验方案的确定
依题意,可以选用正交表L8(27),经编码转换后,得到表8—2所示的回归正交表。
如表8-6所示,将zl、z2、z3分别安排在第1,2和4列,则第3列和第5列分别为交互作用z1z2、z2z3;列。
不进行零水平试验,故总试验次数n=8,试验结果也列在表8-6中(注:
本例的试验方案和试验结果与例6-5是完全一样的)。
表8-6例8-1三元一次回归正交设计试验方案及试验结果
试验号
z1
z2
z1z2
z3
z1z3
灰化温度xl
/℃
原子化温度x2
/℃
灯电流x3
/mA
吸光度yi
1
1
1
1
l
1
700
2400
10
0.552
2
1
l
1
-l
-1
700
2400
8
0.554
3
1
-l
-l
1
1
700
1800
10
0.480
4
1
-1
-1
-l
-l
700
1800
8
0.472
5
-1
1
-1
1
-1
300
2400
10
0.516
6
-1
1
-l
-1
l
300
2400
8
0.532
7
-l
-1
1
1
-1
300
1800
10
0.448
8
-1
-1
1
-1
1
300
1800
8
0.484
(3)回归方程的建立
依题意,m0=0,n=mc=8。
根据回归系数的计算公式,将有关计算列在表8-7中。
表8-7例8-1三元一次回归正交设计计算表
试验号
z1
z2
z1z2
z3
z1z3
y
y2
z1y
z2y
z3y
(z1z2)y
(z1z3)y
l
2
3
4
5
6
7
8
1
l
1
l
-1
-1
-1
-1
1
1
-1
-l
1
1
—1
—1
1
1
-1
-1
-1
-1
1
1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
l
-1
1
0.552
0.554
0.480
0.472
0.516
0.532
0.448
0.484
0.304704
0.306916
0.230400
0.222784
O.266256
O.283024
0.200704
0.234256
0.552
0.554
0.480
0.472
—0.516
—0.532
—0.448
—0.484
0.552
0.554
-O.480
-0.472
0.516
0.532
-0.448
-0.484
0.552
-0.554
0.480
-0.472
0.516
-0.532
0.448
-0.484
0.552
0.554
-0.480
-0.472
-0.516
-0.532
0.448
0.484
0.552
-0.554
0.480
-0.472
-0.516
0.532
-0.448
0.484
∑
4.038
2.049044
0.078
0.270
-0.046
0.038
0.058
由表8-7得:
所以回归方程为
由该回归方程中偏回归系数绝对值的大小,可以得到各因素和交互作用的主次顺序为:
x2>xl>x1x3>x3>x1x2,这与例6-5中正交试验的分析结果是一样的。
(4)方差分析
方差分析结果见表8-8。
由表8—8,对于显著性水平α=0.05,只有因素z2对试验指标y有非常显著的影响,其他因素和交互作用对试验指标都无显著影响,所以应将z1,z3,zlz3,zlz2的平方和及自由度并入残差项,然后再进行方差分析。
这时的方差分析为一元方差分析,分析结果见表8—9。
表8-8例8-1方差分析表
差异源
SS
df
MS
F
显著性
z1
0.00076l
1
0.000761
12.27
z2
0.009113
l
0.009113
146.98
﹡﹡
z3
0.000265
1
0.000265
4.27
z1z3
0.000l8l
1
0.00018l
2.92
zlz2
0.000421
1
0.000421
6.79
回归
0.010741
5
0.002148
34.65
残差e
0.000123
2
0.000062
﹡
总和
0.010864
n-1=7
注:
F0.05(1,2)=18.51,F0.01(1,2)=98.49,F0.05(5,2)=19.30,F0.01(5,2)=99.30。
表8-9例8-1第二次方差分析表
差异源
SS
df
MS
F
显著性
回归(z2)
0.009113
l
0.009113
31.21
﹡﹡
残差e
0.001751
6
0.000292
总和
0.010864
n-1=7
注:
F0.05(1,6)=5.99,F0.01(1,6)=13.74。
由表8—9可知,因素z2对试验指标y有非常显著的影响,因此原回归方程可以简化为:
可见,只有原子化温度z2对吸光度有显著影响,两者之间存在显著的线性关系,而且原子化温度取上水平时试验结果最好。
根据编码公式
,将上述线性回归方程进行回代:
整理后得到:
【例8-2】从某种植物中提取黄酮类物质,为了对提取工艺进行优化,选取三个相对重要的因素:
乙醇浓度(x1)、液固比(x2)和回流次数(x3)进行了回归正交试验,不考虑交互作用。
已知xl=60%~80%,x2=8~12,x3=1~3次。
试通过回归正交试验确定黄酮提取率与三个因素之间的函数关系式。
解:
(1)因素水平编码及试验方案的确定
表8-10例8-2因素水平编码表
编码zj
乙醇浓度/%
液固比
回流次数
-1
60
8
1
0
70
10
2
1
80
12
3
△j
10
2
1
由于不考虑交互作用,所以本例要求建立一个三元线性方程。
因素水平编码如表8-10所示。
选正交表L8(27)安排试验,将三个因素分别安排在回归正交表的第1、2、4列,试验方案及试验结果见表8-11,表中的第9、10、11号试验为零水平试验。
表8-11例8-2试验方案及试验结果
试验号
z1
z2
z3
乙醇浓度/%
液固比
回流次数
提取率y/%
1
1
1
1
80
12
3
8.0
2
1
1
-1
80
12
1
7.3
3
1
-1
1
80
8
3
6.9
4
l
-1
-l
80
8
l
6.4
5
-1
1
1
60
12
3
6.9
6
-1
1
-1
60
12
1
6.5
7
-1
-1
l
60
8
3
6.0
8
-1
-1
-1
60
8
1
5.1
9
0
0
0
70
10
2
6.6
10
0
0
0
70
10
2
6.5
11
0
0
0
70
10
2
6.6
⑵回归方程的建立
将有关计算过程列在表8-12中。
表8-12例8-2试验结果及计算表
试验号
z1
z2
z3
提取率y/%
y2
z1y
z2y
z3y
1
1
1
1
8.0
64.00
8.0
8.0
8.0
2
1
1
-1
7.3
53.29
7.3
7.3
-7.3
3
l
-1
1
6.9
47.61
6.9
-6.9
6.9
4
1
-1
-1
6.4
40.96
6.4
-6.4
-6.4
5
-1
1
1
6.9
47.61
-6.9
6.9
6.9
6
-1
1
-1
6.5
42.25
-6.5
6.5
-6.5
7
-1
-1
1
6.0
36.00
-6.0
-6.0
6.0
8
-1
-1
-1
5.1
26.01
-5.1
-5.1
-5.1
9
0
0
0
6.6
43.56
0.0
0.0
0.0
10
0
0
0
6.5
42.25
0.0
0.0
0.0
11
0
0
0
6.6
43.56
0.0
0.0
0.0
∑
72.8
487.1
4.1
4.3
2.5
由表8—12计算
回归方程为
由该回归方程偏回归系数绝对值的大小,可以得到各因素的主次顺序为:
x2>x1>x3,即液固比>乙醇浓度>回流次数。
又由于各偏回归系数都为正,所以这些影响因素取上水平时,试验指标最好。
(3)回归方程显著性检验
有关平方和的计算如下:
方差分析结果见表8—13。
表8-13例8-2方差分析表
差异源
SS
df
MS
F
显著性
z1
2.101
1
2.101
142.9
﹡﹡
z2
2.311
1
2.311
157.2
﹡﹡
z3
0.781
1
0.781
53.1
﹡﹡
回归
5.193
3
1.731
117.8
﹡﹡
残差
0.103
7
0.0147
总和
5.296
n-1=10
注:
F0.01(1,7)=12.25,F0.01(3,7)=8.45
可见,三个因素对试验指标都有非常显著的影响,所建立的回归方程也非常显著。
(4)失拟性检验
本例中,零水平试验次数m0=3,可以进行失拟性检验,有关计算如下。
检验结果表明,失拟不显著,回归模型与实际情况拟合得很好。
(5)回归方程的回代
根据编码公式:
,
,
代人上述回归方程得:
整理后得到:
8.2二次回归正交组合设计
在实际生产和科学试验中,试验指标与试验因素之间的关系往往不宜用一次回归方程来描述,所以当所建立的一元回归方程经检验不显著时,就需用二次或更高次方程来拟合。
8.2.1二次回归正交组合设计表
组合设计试验方案的确定
假设有m个试验因素(自变量)zj(j=1,2,…,m),试验指标为因变量y,则二次回归方程的一般形式为:
,
其中,
,
,
,
为回归系数,可以看出该方程共有
项,要使回归系数的估算成为可能,必要条件为试验次数
;同时,为了计算出二次回归方程的系数,每个因素至少要取3个水平,所以用一元回归正交设计的方法来安排试验,往往不能满足这一条件。
例如,当因素数m=3时,二次回归方程的项数为10,要求试验次数n≥10,如果用正交表L9(34)安排试验,则试验次数不符合要