第18章正交设计.docx
《第18章正交设计.docx》由会员分享,可在线阅读,更多相关《第18章正交设计.docx(44页珍藏版)》请在冰豆网上搜索。
第18章正交设计
第18章正交试验设计
§18.1概述
18.1.1试验设计的必要性
18.1.2正交表
§18.2无交互作用的正交设计与数据分析
18.2.1试验的设计
18.2.2进行试验和记录试验结果
18.2.3数据的直观分析
18.2.4数据的方差分析
18.2.5因子的贡献率
18.2.6验证试验
§18.3有交互作用的正交设计与数据分析
18.3.1试验的设计
18.3.2数据的方差分析
18.3.3最佳条件的选择
§18.4避免混杂现象——表头设计的一个原则
§18.5有重复试验的情况
18.5.1数据分析
18.5.2几点补述
§18.6水平数不等时的试验设计方法
18.6.1直接选用混合水平正交表
18.6.2并列法
18.6.3拟水平法
第18章正交试验设计
§18.1概述
在6
管理中,通常有五个步骤。
在确定阶段我们已经明确了需要改进的项目,确定了项目的指标y,列出了对y可能有影响的多个因素(自变量)x1,x2,…等,在测量阶段明确了如何测量这些变量,并收集了一定量的数据,在分析阶段已经对这些数据作了一定的考察,发现了一些对y有重要影响的少量因素。
接下来便是改进阶段,需要对前面找出的少量因素进一步作出决策,它们是否对y确有影响,如果有的话,这些自变量取什么值可以使指标y达到要求,进而达到改进的目的。
在这一阶段主要可以用试验设计的方法,设计一批试验,进行试验,收集数据,通过对数据的分析来完成。
试验设计的方法有很多,常用的是正交试验设计与响应曲面方法(也称回归设计),数据分析的方法分别是方差分析法与回归分析法。
本章介绍正交设计,下一章介绍回归设计。
在试验设计中,所用到因子、水平、试验条件、指标等概念与第16章方差分析中概念相同,不再重复。
我们关注的是指标的均值。
假定在一个试验条件下,y服从正态分布
,其中均值
随试验条件的变化而变化,而方差
固定不变。
譬如在两个不同试验条件下的试验指标分别为
与
,则假定
,
。
18.1.1试验设计的必要性
在实际问题中,影响指标的因子往往有很多的,这便是多因子的试验设计问题。
多因子试验遇到的最大困难是试验次数太多,让人无法忍受。
如果有十个因子对产品质量有影响,每个因子取两个不同状态进行比较,那么就有210=1024个不同的试验条件需要比较,假定每个因子取三个不同状态比较的话,那么就有310=59049个不同的试验条件,这在实际中是办不大到的,因此我们只能从中选择一部分进行试验。
选择哪些条件进行试验十分重要,这便是试验的设计。
一个好的设计,可以通过少量试验获得较多的信息,达到试验的目的。
试验设计的方法有许多,这里介绍的正交试验设计便是其中的一种常用方法,它利用“正交表”选择进行试验的条件,并利用正交表的特点进行数据分析,找出最好的或满意的试验条件。
18.1.2正交表
正交表有许多,表18.1.1便是一张典型的正交表,记为L9(34),这里“L”是正交表的代号,“9”表示表的行数,在试验中表示用这张表安排试验的话,要做9个不同条件的试验,“4”表示表的列数,在试验中表示用这张表安排试验的话,最多可以安排4个因子,“3”表示表的主体只有3个不同的数字:
1,2,3,在试验中它代表因子水平的编号,即用这张表安排试验时每个因子应取3个不同水平。
表18.1.1L9(34)
试验号列号
1
2
3
4
1
1
1
1
1
2
1
2
2
2
3
1
3
3
3
4
2
1
2
3
5
2
2
3
1
6
2
3
1
2
7
3
1
3
2
8
3
2
1
3
9
3
3
2
1
正交表具有正交性,这是指它有如下两个特点:
(1)每列中不同的数字重复次数相同。
在表L9(34)中,每列有3个不同数字:
1,2,3,每一个各出现3次。
(2)将任意两列的同行数字看成一个数对,那么一切可能数对重复次数相同。
在表L9(34)中,任意两列有9种可能的数对:
(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一对各出现一次。
如果将试验条件看成试验空间(一切可能试验条件组成的集合)中的一个点,那么正交表的这两个特点使所选择的试验点在试验空间中的分布是均匀分散的,并将看到试验结果还具有综合可比性,这为以后的统计分析带来了便利。
§18.2无交互作用的正交设计与数据分析
试验设计与数据分析一般分四步,一是试验的设计,二是进行试验,三是数据分析,四是验证试验。
下面通过一个例子来叙述利用正交表安排试验与进行数据分析的步骤。
例18.2.1磁鼓电机是彩色录像机磁鼓组件的关键部件之一,按质量要求其输出力矩应大于210g.cm。
某生产厂过去这项指标的合格率较低,从而希望通过试验找出好的条件,以提高磁鼓电机的输出力矩。
18.2.1试验的设计
在安排试验时,一般应考虑如下几步:
1.明确试验目的在本例中试验的目的是提高磁鼓电机的输出力矩。
2.明确试验指标试验指标用来判断试验条件的好坏,在本例中直接用输出力矩作为考察指标,该指标越大表明试验条件越好,即它是一个望大特性。
3.确定因子与水平在试验前首先要分析影响指标的因子是什么,每个因子在试验中取哪些水平。
在本例中,经分析影响输出力矩的可能因子有三个,它们是:
A:
充磁量B:
定位角度C:
定子线圈匝数
并根据各因子的可能取值范围,经专业人员分析研究,决定在本试验中采用如下水平,见表18.2.1。
表18.2.1因子水平表
因子水平
一
二
三
A:
充磁量(10-4T)
900
1100
1300
B:
定位角度((π/180)rad)
10
11
12
C:
定子线圈匝数(匝)
70
80
90
4.选用合适的正交表,进行表头设计,列出试验计划
(1)选正交表:
首先根据在试验中所考察的因子水平数选择具有该水平数的一类正交表,再根据因子的个数具体选定一张表。
在本例中所考察的因子是三水平的,因此选用三水平正交表,又由于现在只考察三个因子,所以选用L9(34)即可。
(2)进行表头设计:
选定了正交表后把因子放到正交表的列上去,称为表头设计。
在不考虑交互作用的场合,可以把因子放在任意的列上,一个因子占一列。
譬如在本例中将三个因子分别置于前三列,将它写成如下的表头设计形式:
表头设计
A
B
C
列号
1
2
3
4
(3)列出试验计划:
有了表头设计便可写出试验计划,只要将因子的列中的数字换成因子的相应水平即可,不放因子的列就不予考虑。
本例的试验计划可以这样得到:
将第一列的1,2,3分别换成充磁量的三个水平900,1100,1300,将第二列的1,2,3分别换成定位角度的三个水平10,11,12,将第三列的1,2,3分别换成定子线圈匝数的三个水平70,80,90,则得试验计划(见表18.2.2)。
表中第一号试验的条件是充磁量取900×10-4T,定位角度取10×(π/180)rad,定子线圈取70匝。
其它各号试验条件类似得到。
由此可见,用正交表L9(34)安排试验共有9个不同的试验条件,它们是一起设计好的,而不是等一个试验结束后再决定下一个试验条件,因此称这样的设计为“整体设计”。
表18.2.2试验计划与试验结果
因子
充磁量
定位角度
定子线圈匝数
试验结果y
试验号
10-4T
(π/180)rad
匝
输出力矩(g.cm)
1
(1)900
(1)10
(1)70
160
2
(1)900
(2)11
(2)80
215
3
(1)900
(3)12
(3)90
180
4
(2)1100
(1)10
(2)80
168
5
(2)1100
(2)11
(3)90
236
6
(2)1100
(3)12
(1)70
190
7
(3)1300
(1)10
(3)90
157
8
(3)1300
(2)11
(1)70
205
9
(3)1300
(3)12
(2)80
140
18.2.2进行试验和记录试验结果
有了试验计划后就可以按其进行试验,并将试验结果记录在对应的试验条件后面。
例18.2.1的试验结果见表18.2.2的最后一列。
为了避免事先某些考虑不周而产生系统误差,因此试验的次序最好要随机化,这可以用抽签的方式决定,譬如用9张同样的纸,分别写上1~9,然后混乱后随机依次取出,如果依次摸到:
3,5,2,9,1,6,4,7,8,那么就先做第3号试验,再做第5号试验,…,最后做第8号试验。
此外,在试验中还应尽量避免因操作人员的不同,仪器设备的不同等引起的系统误差,尽可能使试验中除所考察的因子外的其它因素固定,在不能避免的场合可以增加一个“区组因子”。
譬如试验由三个人进行,则可以把“人”也看成一个因子,三个人便是三个水平,将其放在正交表的空白列上,那么该列的1,2,3对应的试验分别由第一、第二、第三个人去做,这样就避免了因人员变动所造成的系统误差。
尽管在一个条件下进行一次试验也可以进行数据分析,但是如果在可能的条件下,在同一条件下进行若干次重复试验,这样可以观察试验结果的稳定性,还可以对误差的方差进行估计。
此外试验要由经过专业培训的试验人员去做,试验结果要用合格的测量仪表进行测量,测量仪表要经过校正,这样测得的结果准确、可靠。
还要防止记录错误。
18.2.3数据的直观分析
在例18.2.1中考虑了三个三水平因子,其所有不同的试验条件共有27个,现在仅做了其中的9个。
试验的目的是想找出哪些因子对指标是有明显影响的,各个因子的什么样的水平组合可以使指标达到最大。
这可以利用正交表的特点进行数据分析。
仍然结合例18.2.1进行叙述。
为方便起见,把试验结果写在正交表的右边一列上(见表18.2.3),并分别用y1,y2,…,y9表示,所有计算可以在表上进行。
表18.2.3例18.2.1直观分析计算表
表头设计
A
B
C
试验号列号
1
2
3
4
y
1
1
1
1
1
160=
2
1
2
2
2
215=
3
1
3
3
3
180=
4
2
1
2
3
168=
5
2
2
3
1
236=
6
2
3
1
2
190=
7
3
1
3
2
157=
8
3
2
1
3
205=
9
3
3
2
1
140=
T1
555
485
555
T2
594
656
523
T3
502
510
573
1
185
161.7
185
2
198
218.7
174.3
3
167.3
170
191
R
30.7
57
16.7
下面介绍三种数据分析方法,这里先介绍数据的直观分析
1.寻找最好的试验条件
首先我们来看第一列,该列中的1,2,3分别表示因子A的三个水平,按水平号将数据分为三组:
“1”对应{y1,y2,y3},“2”对应{y4,y5,y6},“3”对应{y7,y8,y9}。
“1”对应的三个试验都采用因子A的一水平进行试验,但因子B的三个水平各参加了一次试验,因子C的三个水平也各参加了一次试验。
这三个试验结果的和与平均值分别为:
T1=y1+y2+y3=160+215+180=555,
1=T1/3=185
“2”对应的三个试验都采用因子A的二水平进行试验,但因子B的三个水平各参加了一次试验,因子C的三个水平也各参加了一次试验。
这三个试验结果的和与平均值分别为:
T2=y4+y5+y6=168+236+190=594,
2=T2/3=198
“3”对应的三个试验都采用因子A的三水平进行试验,但因子B的三个水平各参加了一次试验,因子C的三个水平也各参加了一次试验。
这三个试验结果的和与平均值分别为:
T3=y7+y8+y9=157+205+140=502,
3=T3/3=167.3
由以上可知,
1、
2、
3之间的差异(T1、T2、T3之间的差异也一样)只反映了因子A的三个水平间的差异,因为这三组试验条件除了因子A的水平有差异外,因子B与C的条件是一致的,所以可以通过比较这三个平均值的大小看出因子A的水平的好坏。
从这三个数据可知因子A的二水平最好,因为其指标均值最大。
这种比较方法称为“综合比较”。
以上计算的结果列在表18.2.3下方。
以上计算还可对第二、第三列上类似进行,按其中的1,2,3分别将数据分为三组,计算各自的数据和与平均,它们也都列在表18.2.3的下方。
由此可知,因子B取二水平好,因子C取三水平好。
综上可知使指标达到最大的条件是A2B2C3,即充磁量取1100×10-4T,定位角度取11(π/180)rad,定子线圈取90匝可以使输出力矩达到最大。
2.各因子对指标影响程度大小的分析
这可从各个因子的“极差”来看,这里指的一个因子的极差是该因子不同水平对应的试验结果均值的最大值与最小值的差,因为该值大的话,则改变这一因子的水平会对指标造成较大的变化,所以该因子对指标的影响大,反之,影响就小。
在本例中因子A的极差为
RA=198-167.3=30.7
对因子B、C可同样计算,它们被置于表18.2.3的最下面一行。
从三个因子的极差可知因子B的影响最大,其次是因子A,而因子C的影响最小。
3.各因子不同水平对指标的影响图
为直观起见,可以将每个因子不同水平下试验结果的均值画成一张图,例18.2.1的图见图18.2.1,从图上可以明显看出每一因子的最好水平A2,B2,C3,也可以看出各个因子对指标影响的大小,RB>RA>RC。
图18.2.1因子各水平对输出力矩的影响
18.2.4数据的方差分析
在数据的直观分析中是通过极差的大小来评价各个因子对指标影响的大小,那么极差要小到什么程度可以认为该因子对指标值已经没有显著的差别了呢?
为回答这一问题,需要对数据进行方差分析。
在方差分析中,我们假定每一试验是独立进行的,每一试验条件下的试验指标服从正态分布,这些分布的均值与试验的条件有关,可能不等,但它们的方差是相等的。
1.平方和分解
为进行方差分析,从试验结果出发。
由于试验条件的不同与试验中存在误差,因此各试验结果不同,我们可以用总偏差平方和ST去描述数据的总波动:
,
(18.2.1)
其中n是试验次数,
是试验结果的总平均,若记
,则
=T/n。
fT是ST的自由度,因为在ST中n个偏差
之和为0,因此独立个数仅为n-1个。
造成数据波动的原因可能是因子所取水平的不同,也可能是试验误差,当然也可能两者都有。
为此要把由各种原因造成的波动分别用数量表示出来。
先来看由于因子A的水平不同所引起的数据波动的度量。
仍用
1、
2、
3表示其三个水平下的试验结果的平均,用
表示试验结果的总平均。
如同在第16章方差分析中所述,我们考虑
1、
2、
3与
的偏差平方和,记为SA:
,
(18.2.2)
这里乘以3是因为每一水平重复进行了三次试验。
SA除了误差外只反映因子A的效应间的差异,即由于因子A的水平不同所引起的试验结果的波动,因此称其为因子A的偏差平方和。
由于这里的
1、
2、
3是第一列的三个数字分别对应的试验结果的平均值,因此(18.2.2)式也可以看成是第一列的偏差平方和,记为S1。
因为因子A置于第一列,故SA=S1。
是SA的自由度,因为它的三个偏差之和为0,故独立个数为2。
由于上述三个偏差也可以看成第一列的三个偏差,因此也可以记第一列的自由度为2,即
从而fA=f1。
同理可以计算其它各列的偏差平方和。
由于因子B、C分别置于第二、三列,故有SB=S2,SC=S3,fB=fC=2
第四列上没有放置因子,称为空白列。
S4仅仅反映了由误差造成的数据波动,称它为误差的偏差平方和,记为Se,即
Se=S4,fe=f4=2(18.2.3)
用代数方法可以证明,在L9(34)中总偏差平方和与各列的偏差平方和间有如下关系:
ST=S1+S2+S3+S4,fT=f1+f2+f3+f4(18.2.4)
这便是正交表L9(34)的平方和分解式。
2.F比
由于各因子的偏差平方和之间不一定具有可比性,因此为判断因子是否对指标有显著影响,要用均方和。
同方差分析中一样,称偏差平方和与其自由度的比为均方和。
用因子的均方和与误差的均方和进行比较,当
时,认为在显著性水平
上因子是显著的,其中
分别是因子的均方和与其自由度,
分别是误差的均方和与其自由度。
3.计算
我们可以通过统计软件来计算各因子的偏差平方和,也用列表的方法计算各列的偏差平方和(见表18.2.4)。
通过代数运算,可以用下式计算一列的偏差平方和与总偏差平方和:
(18.2.5)
其中n试验次数,T是所有试验数据的总和。
对于F比的计算通常列成一张方差分析表(见表18.2.5),今后我们重点是要求能看懂方差分析表,了解哪些因子对指标有显著影响。
表18.2.4例18.2.1方差分析计算表
表头设计
A
B
C
试验号列号
1
2
3
4
y
1
1
1
1
1
160
2
1
2
2
2
215
3
1
3
3
3
180
4
2
1
2
3
168
5
2
2
3
1
236
6
2
3
1
2
190
7
3
1
3
2
157
8
3
2
1
3
205
9
3
3
2
1
140
T1
555
485
555
536
T=1651
T2
594
656
523
562
=310519
T3
502
510
573
553
ST=7652.2
S
1421.6
5686.9
427.6
116.2
表18.2.5例18.2.1的方差分析表
来源
平方和S
自由度f
均方和MS
F比
因子A
1421.6
2
710.8
12.23
因子B
5686.9
2
2843.4
48.94
因子C
427.6
2
213.8
3.68
误差e
116.2
2
58.1
T
7652.2
8
F0.90(2,2)=9.0,
F0.95(2,2)=19.0
由于FA大于F0.90(2,2)=9.0,FB大于F0.95(2,2)=19.0,因此因子A与B分别在显著性水平0.10与0.05上是显著的,因子C不显著。
4.最佳条件的选择
对显著因子应该选择其最好的水平,因为其水平变化会造成指标的显著不同,而对不显著因子可以任意选择水平,实际中常可根据降低成本、操作方便等来考虑其水平的选择。
在例18.2.1中因子A与B是显著的,所以要选择其最好的水平,按前所述,应取A2B2,对因子C可以选任意水平,譬如为了节约材料可选C1。
18.2.5因子的贡献率
当试验指标不服从正态分布时,进行方差分析的依据就不充足,此时可以通过比较各因子的“贡献率”来衡量因子作用的大小。
由于
中除了因子的效应外,还包含误差,从而称
为因子的纯偏差平方和,将因子的纯偏差平方和与ST的比称为因子的贡献率。
譬如对因子A来讲,记其贡献率为
,那么
而称
为误差的贡献率。
在例18.2.1中因子与误差的贡献率如表18.2.6所示。
表18.2.6例18.2.1因子与误差的贡献率
来源
平方和S
自由度f
纯偏差平方和
贡献率(%)
因子A
1421.6
2
1305.4
17.06
因子B
5686.9
2
5570.7
72.80
因子C
427.6
2
311.4
4.07
误差e
116.2
2
464.8
6.07
T
7652.2
8
从表中可知,因子B最重要,它的水平变化引起的数据波动在总的偏差平方和中占了72.80%,其次是因子A,而因子C的水平变化引起的数据波动还不及误差引起的数据波动的贡献率大,所以因子C可以认为不重要。
18.2.6验证试验
在例18.2.1中找到的最佳条件是A2B2,即试验中的第5号试验,其试验结果确为9次试验中指标最高的。
但在实际问题中分析所得的最佳条件不一定在试验中出现,为此通常需要进行验证试验,譬如选择条件A2B2C1,该条件就不在所进行的9次试验中,它是否真的符合要求?
所以在实际中验证试验是不可少的,即使分析所得的最佳条件在试验中出现,也需要通过验证试验看其是否稳定。
譬如在例18.2.1中对条件A2B2C1进行了三次试验,结果分别为:
234,240,220,其平均值为231.3,看来该条件是满意的。
§18.3有交互作用的正交设计与数据分析
在多因子试验中,有时两个因子间还存在交互作用。
交互作用的概念同第16章方差分析中所述。
下面通过一个例子来叙述有交互作用时试验的设计与分析。
例18.3.1为提高某种农药的收率,需要进行试验。
18.3.1试验的设计
试验设计的步骤基本同上节所述,但在某些步骤上有点差异,现叙述如下:
1.明确试验目的在本例中试验目的是提高农药的收率。
2.明确试验指标在本例中用收率来表示,收率越高表示该条件越好。
3.确定试验中所考虑的因子与水平,并确定可能存在并要考察的交互作用
经分析,影响农药收率的因子有四个,它们是反应温度A、反应时间B、两种原料配比C与真空度D,根据经验反应温度与反应时间的交互作用对收率也有较大的影响,因此在本试验中还需考察交互作用A×B。
试验中所考察的因子水平见表18.3.1。
表18.3.1因子水平表
因子
一水平
二水平
A:
反应温度(℃)
60
80
B:
反应时间(小时)
2.5
3.5
C:
两种原料配比
1.1/1
1.2/1
D:
真空度(kPa)
50
60