1、回归正交实验设计归正交试验设计前面介绍的正交试验设计一种很实用的试验设计方法,它能? I用较少的试验次数获得较好的试验 结果,但是通过正交设计所得至啲优方案只能限制在已走的水平上,而不是一定试验范围内的最优方案; 回归分析是一种有效的数据处理方法,通过所确立的回归方程,可以对试验结果进行预测和优化,但回归 分析往往只能对试验数据进行被动的处理和分析,不涉及对试验设计的要求。如果能将两者的优势统一起 来,不仅有合理的试验设计和较少的试验次数,还能建立有效的数学模型,这正是我们所期望的。回归正 交设计(orthogonal regression design)就是这样一种试验设计方法,它可以在因素
2、的试验范围内选择适 当的试验点,用较少的试验建立一个精度高、统计性质好的回归方程,并能解决试验优化问题。一次回归正交试验设计及结果分析次回归正交设计就是利用回归正交设计原理,建立试验指标(y)与m个试验因素xi, X2 xm ,之间的一元回归方程:y = a + + /?2x2 + 4- bmxm (8 - 1)或者my = a + Yjhjxj+ Xbkjxkxj k=l, 2 , f m -1 (j#k ) (8 - 2)7-1 kj8.1.1 次回归正交设计的基本方法(1)确走因素的变化范围根据试验指标y ,选择需要考察的m个因素Xj (j二1,2,m),并确走每个因素的取值范围。设 因
3、素的变化范围为凶1 , Xj2,分别称Xji和Xr为因素的下水平和上水平,并将它们的算术平均值称作 因素Xj的零水平,用XjO。表示。勺度艾上水平与零水平之差称为因素为的变化间距,用勺表示r即:(8-4)xn十七丄 (8-5)(2)因素水平的编码编码(coding)是将Xj的0水平进行线性变换,即:(8-6)式(86)中可就是因素为的编码,两者是一一对应的。显然,与勺,和勺的编码分别为一1, 0和 1,即Zjl = -l,Zj2 = O, Zj2=l。一般称Xj为自然变量,Zj为规范变量。因素水平的编码结果可表示成表8lo 对因素Xj的各水平进行编码的目的,是为了使每个因素的每个水平在编码空间
4、是“平等的,即规范变 量Zj的取值范由都在1, 一 1内变化,不会受到自然变量Xj的单位和取值大小的影响。所以编码能将试验 结果y与因素Zj(j = l, 2,,m)各水平之间的回归问题,转换成试验结果y与编码值Zj之间的回归问题, 从而大大简化了回归计算量。表81因倉水平编码表规范变址ZJ自然变址XjXIx: Xm下水平(一1)XIIX21 Xml上水平(1)XI2X22 Xm2零水平(0)XioX20 Xmo变化间距厶jAi 2 m(3)次回归正交设计表将二水平的正交表中“2”用“一 1”代换,就可以得到一次回归正交设计表。例如正交表Ls(27)经过 变换后得到的回归正交设计表如表82。表
5、82 次回归正交设计表试验号列 号1934567111111112111-1-1-1-131-1-111-11411-1-1_1115-11-11-11-1611-1-11-117-1-111_1-118-1-111111代换后,正交表中的编码不仅表示因素的不同水平,也表示了因素水平数值上的大小。从表82可 以看岀回归正交设计表具有如下特点:1任一列编码的和为0,即: 可= (8-7)所以有 亏=0, 7 = 1,2,/ (88)2任两列编码的乘积之和等于零,即: SS =0, R =1,2,? 一 1()工約 (8-9)J-1这些特点说明了转换之后的正交表同样具有正交性,可使回归计算大大简化
6、。(4)试验方案的确定与正交试验设计类似,在确泄试验方案之前,要将规范变量与安排在一元回归正交表相应的列中,即 表头设计。例如,需考察三个因素心、X2、X3,可选用Lg(27)进行试验设计,根据正交表327)的表头设计表,应 将XI、X2、X3分别安排在第1、2和4列,也就是将Zi, Z2, Z3安排在表82的第1、2和4列上。如果还 要考虑交互作用XI X2、X1X3,也可参考正交表Ls(27)的交互作用表,将ZIZ2和Z2Z3,分别安排在表82的 第3、5列上,表头设计结果见表8 3。每号试验的方案由Z|, z2, Z3Z对应的水平确左,这与正交试验是 一致的。表8.3三因素一次回归正交表
7、试验号19345Ziz2Zi Z2z3乙z31111112111-i-131-1-1114111_1-15-11_11-16111-117-1-111-18-1-11-119000001000000从表8-3可以看出,第3列的编码等于第1, 2列编码的乘积,同样第5列的编码等于第1, 4列编 码的乘积,即交互作用列的编码等于表中对应两因素列编码的乘积,所以用回归正交表安排交互作用时, 可以不参考正交表的交互作用表,直接根据这一规律写出交互作用列的编码,这比原正交表的使用更方便。表8-3中的第9, 10号试验称为零水平试验或中心试验。安排零水平试验的目的是为了进行更精确的 统汁分析(如回归方程的
8、失拟检验等),得到精度较高的回归方程。当然,如果不考虑失拟检验,也可不安 排零水平试验。仃度文8.1.2 一次回归方程的建立建立回归方程,关键是确泄回归系数。设总试验次数为n,其中包括1%次二水平试验(原正交表所规 泄的试验)和mo次零水平试验,即:(8-10)如果试验结果为H (i=h 2,,n),根据最小二乘法原理和回归正交表的两个特点,可以得到一次 回归方程系数的计算公式如下(证明略):(8-11)Dmb = , j = 2M (8-12)叫b. = , j k , & = 1,2,,加一1 (813)叫上述式中,可表示Zi列各水平的编码,(ZjZk)i表示ZjZk列各水平的编码。需要指
9、出的是,如果一次回归方程中含有交互作用项ZjZk(jk),则回归方程不是线性的,但交互作用 项的回归系数的计算和检验与线性项Zj是相同的,这是因为交互作用对试验结果也有影响,可以被看作是 影响因素。通过上述方法确定偏回归系数之后,可以直接根据它们绝对值的大小来判断各因素和交互作用的相对 重要性,而不用转换成标准回归系数匚这是因为,在回归正交设汁中.所有因素的水平都经过了无因次的 编码变换,它们在所研究的范国内都是“平等的”,因而所求得的回归系数不受因素的单位和取值的影响, 直接反映了该因素作用的大小。另外,回归系数的符号反映了因素对试验指标影响的正负。8.1.3回归方程及偏回归系数的方差分析(
10、1)无零水平试验时首先计算各种平方和及自由度。总平方和为:其自由度为妨=一仁根据式(4-44)和式(8-12),推导岀一次项偏回归平方和的计算公式为:R = JsSr / SSt (444)SSj = mcbj , J = 1,2,fit (815)同理可以得到交互项偏回归平方和的计算公式:SS =叫bj , jk t 上= 1,2,_ 1 (816)各种偏回归平方和的自由度都为lo一次项偏回归平方和与交互项偏回归平方和的总和就是回归平方和:了贋文(8-17)ss厂工SS -次项+ss如项所以回归平方和的自由度也是各偏回归平方和的自由度之和:于是残差平方和为:其自由度为:期?=工妙次项+工妙交
11、互琐 (8 一SSe = SST SSR (8 19)如果考虑了所有的一次项和交互项,则可参照表8-4进行方差分析。表8J 次回归正交设计的方差分析差异源SSdfMSFZ】SS1SS,SSjMSe5SS.1SSrSS2/MSe1SS/M,SS门1SS3SSjMSe亠1込:SS/MS 2)次零水平试验,进行回归方程的失拟性检验,或称拟合度检验(test of goodness of fit)。设m次零水平试验结果为y(n,y2,,(”根据这m()次重复试验,可以计算出重复试验误差为:(8-21)sSc=(儿一$) =此一一为血】 r-l ,Wo V /-I试验误差对应的自由度为:(8-22)由前
12、述知,只有回归系数a与零水平试验次数m。有关,其他各偏回归系数都只与二水平试验次数mo 有关,所以增加零水平试验后回归平方和SSR没有变化,可见,失拟平方和表示了回归方程未能拟合的部分,包括未考虑的其他因素及各Xj的髙次项等所引起的差 异。它对应的自由度为:所以有:这时(8-28)服从自由度为(仏的F分布。对于给左的显著性水平(一般取0.1),当Fl4XXX3X3X|X2,这与例6 5中正交试验的分析结果是一样的。(4)方差分析w 1 n 4 AQ82SS.=X 7 一 一(;)=2.049044 一 = 0.010864r-l n r-l *SS、=m氏=8x 0.009752 = 0.00
13、0761552= meb; =8x 0.033752 = 0.009113553=叫 =8x 0.005752 = 0.000265SS、2 = =8x0.004752 =0.000181SS、3 = mb =8x 0.007252 = 0.000421SS r = SS + SS、+ SS3 + SSy + SSyy=0.000761+0.009113 + 0.000265 + 0.000181+ 0.000421= 0.010741SSe = SST 一 SSr = 0.010864 一 0.010741 = 0.000123方差分析结果见表88。由表8-8,对于显著性水平a =0.05,
14、只有因素z2对试验指标y有非常显著的影响,英他因素和交 互作用对试验指标都无显著影响,所以应将Z” Z3, Z,Z3, Z】Z2的平方和及自由度并入残差项,然后再进行 方差分析。这时的方差分析为一元方差分析,分析结果见表89。表88例8 1方差分析表差异源SSdfMSF显著性Z10.00076110.00076112.27Z20.00911310.009113146.98Z30.00026510.0002654.27Zl Z30.00018110.0001812.92Z1 Z20.00042110.0004216.79回归0.01074150.00214834.65残差e0.00012320.
15、000062总和0.010864n 1 =7注:Fo.o5( 1 2)=18.51, Fo.oi (19 2)=9&49 Fo.os (5 2)=19.30. Fo.oi (5 2)=99.30表89例8 1第二次方差分析表差异源SSdfMSF显著性回归(Z2)0.00911310.00911331.21 残差e0.00175160.000292总和0.010864n 1 =7注:Fo.o5( 1 6)=5.99 Fo.oi( 1 6) =1374。由表89可知,因素Z2对试验指标y有非常显著的影响,因此原回归方程可以简化为:y = 0.50475+ 0.03375z2可见,只有原子化温度Z2
16、对吸光度有显著影响,两者之间存在显著的线性关系,而且原子化温度取上水平时试脸结果最好。根据编码公式宁二喘将上述线性回归方程进行回代:475 + 0.03珂詈整理后得到:y = 0.2685 + 0.0001 125x2【例8-2 从某种植物中提取黄酮类物质,为了对提取工艺进行优化,选取三个相对重要的因素: 乙醇浓度(xj、液固比(X2)和回流次数(X3)进行了回归正交试验,不考虑交互作用。已知&=60%80%, X2=812,心=13次。试通过回归正交试验确左黄酮提取率与三个因素之间的函数关系式。解:(1)因素水平编码及试验方案的确左表810例82因素水平编码表编码习乙醇浓度/%液固比回流次数
17、-16081070102180123j109*01由于不考虑交互作用,所以本例要求建立一个三元线性方程。因素水平编码如表8-10所示。选正交 表LMU)安排试验,将三个因素分别安排在回归正交表的第1、2、4列,试验方案及试验结果见表8-11, 表中的第9、10. 11号试验为零水平试验。表811例82试验方案及试验结果试验号zlz2z3乙醇浓度/%液固比回流次数提収率y / %1111801238.02111801217.331-1180836.941-1-180816.45-111601236.96-11-1601216.57-1-1160836.08-1-11608159000701026
18、.610000701026.5110()0701026.6回归方程的建立将有关计算过程列在表812中。表8-12例8-2试验结果及计算表试验号Z1Z2Z3提取率y/%y2ziyzzyZ3y11118.()64.008.()8.()8.07*1117353.297.37.37.531-116.947.616.96.96.941-1-16.440.966.46.46.45-1116.947.61-6.96.96.96-11-16.542.25-6.56.56.57-1-116.036.00-6.0-6.06.08-1-1-1526.01-5.1-5.1-5.190006.643.560.00.00.0100006.542.250.00
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1