2k因子设计的集区划分与交络课件讲义.docx
《2k因子设计的集区划分与交络课件讲义.docx》由会员分享,可在线阅读,更多相关《2k因子设计的集区划分与交络课件讲义.docx(17页珍藏版)》请在冰豆网上搜索。
2k因子设计的集区划分与交络课件讲义
授课目录
第1章简介
第2章简单比较性的实验
第3章一因子实验:
变异数分析
第4章随机化集区,拉丁方阵,与相关设计
第5章因子设计简介
第6章2k因子设计
第7章2k因子设计的集区划分与交络
第8章2水平部份因子设计
第9章3水平与混合水平因子和部份因子设计
第10章配适回归模式
第11章反应曲线法与其它制程最佳化法
第12章有随机因子之因子实验
第13章套层及分裂图设计
第14章其它设计与分析题目
第7章2k因子设计的集区划分与交络
Chap7.BlockingandConfoundinginthe2kFactorialDesign
7-1简介(Introduction)
有多种情况实验者无法在均一的条件下进行2k因子实验的所有试验,如原料不足、或故意改变实验条件,以确保处理于实际上可能遇到的状况能一样地有效(i.e.,即稳健的)。
此种情况用到的设计技巧是集区划分(Blocking),本章集中于2k因子设计的一些特殊的集区划分技巧。
7-2集区划分一个反复的2k因子设计
(BlockingaReplicated2kFactorialDesign)
假设2k因子设计反复n次,此情况与第5章讨论的完全相同,每一种不同的条件就是一个集区,而每个反复就在集区内,在各个集区(或反复)的试验以随机顺序进行。
**************
范例7-1
考虑在6-2节所描述一反应浓度(ReactionConcentration)和触媒量(Catalyst)对化学反应过(制)程合格率效果的研究。
假设单一批原料只容纳4次试验,所以,需要3批原料来进行3次反复,其中每一原料批对应到一个集区,
集区1
集区2
(1)=28
a=36
b=18
ab=31
集区3
(1)=27
a=32
b=23
ab=29
(1)=25
a=32
b=19
ab=30
B1=113
B2=106
B3=111
SSblock=
Bi2/4-y2/12=6.50
由ANOVA分析,集区效果不显著。
****************
7-32k因子设计的交络(Confoundinginthe2kFactorialDesign)
许多情况是在一个集区里进行一次完整的2k因子设计是不可能的。
交络(Confounding)是一个设计技巧,可安排一个完整的因子实验到数个集区,其中集区的大小是小于一次反复中处理组合的个数,此技巧造成某些处理效果(通常指高阶交互作用)的信息成为无法区分于(In-distinguishablefrom)或交络于(Confoundedwith)集区效果。
本章集中于2k因子设计的交络系统。
7-42k因子设计交络于2个集区
(Confoundingthe2kFactorialDesigninTwoBlocks)
假设进行一个未反复的2k因子设计,22=4种处理组合均需要一些原料,而每一批原料只够试验2个处理组合,因此共需2批原料,倘将原料批视成集区,则须指订4种处理组合中的2种到每一个集区里。
=集区1试验
A
+
B
-
+
-
=集区2试验
(a)
集区1
集区2
(1)
ab
a
b
几何上视之
(b)置于2集区里的4个试验
图7-12集区之2k因子设计
上图(a)显示相对对角的处理组合被安置到不同的集区,图(b)视出集区1包含处理组合
(1)与ab、集区2包含处理组合a与b,当然,在集区里处理组合的试验顺序是随机决定的,且随机决定集区顺序。
则A与B的主效果(与似无发生集区般)为,
A=[ab+a-b-
(1)]/2
B=[ab+b-a-
(1)]/2
A与B均无受到集区划分的影响,因为上式中各有来自每个集区的一个正的与一个负的处理组合,亦即,集区1与集区2之间的任何差异均被抵消矣。
续考虑AB交互作用效果
AB=[ab+
(1)-a-b]/2
因2个正号的处理组合[ab与
(1)]在集区1里、而2个负号的处理组合[a与b]在集区2里,集区效果与AB交互作用效果是完全相等的,亦即,AB是交络于集区。
此理由可从2k设计的正负符号表明显视出,
处理
组合
因子效果
A
B
AB
(1)
+
-
-
+
a
+
+
-
-
b
+
-
+
-
ab
+
+
+
+
这作法可用来交络任何效果(A,B或AB)于集区。
如
(1)与b指订到集区1及a与ab指订到集区2,则A的主效果将被交络于集区。
一般是将最高阶交互作用效果交络于集区。
上述作法可用来交络任何2k设计于2个集区。
建构集区的其它方法
(OtherMethodsforConstructingtheBlocks)
此为利用线性组合,
L=1x1+2x2+…+kxk(7-1)
其中xi是出现在处理组合中第i个因子的水平,与i是要被交络的效果中第i个因子的幂次(Exponent)。
对2k系统,i=0或1,及xi=0(低水平)或xi=1(高水平)。
式(7-1)称之为定义对比(DefiningContrast),会产生相同L(Mod2)的可能值只有0与1,如此指订2k个处理组合正好到2个集区里。
兹考虑23设计而且交络ABC于集区,在此x1对应A、x2对应B、x3对应C,与1=2=3=1,因此,对应于ABC的定义对比为,
L=x1+x2+x3
因此处理组合
(1)在(0,1)的符号表示下为000;所以,
L=1(0)+1(0)+1(0)=0=0(Mod2)
同理,处理组合a为100;所以,
L=1
(1)+1(0)+1(0)=1=1(Mod2)
故
(1)与a将分属不同的集区。
对于其它的处理组合,
b:
L=1(0)+1
(1)+1(0)=1=1(Mod2)
ab:
L=1
(1)+1
(1)+1(0)=2=0(Mod2)
c:
L=1(0)+1(0)+1
(1)=1=1(Mod2)
ac:
L=1
(1)+1(0)+1
(1)=2=0(Mod2)
bc:
L=1(0)+1
(1)+1
(1)=2=0(Mod2)
abc:
L=1
(1)+1
(1)+1
(1)=3=1(Mod2)
所以,
(1),ab,ac,bc属于集区1;a,b,c,abc属于集区2,这与用正负符号表所产生的设计完全相同。
另一种建构这些设计的方法,包含处理组合
(1)的集区称之为主集区(PrincipalBlock),在此集区里的处理组合有一个很有用的群理论性质(Group-TheoreticProperty),即它们以乘法Mod2的运算而形成之一”群”(Group),此意谓着主集区内的任何元素[除
(1)外]可由主集区内任2个元素(处理组合)相乘法的Mod2得到,如ABC交络之23设计在2个集区的主集区,
abac=a2bc=bc;abbc=ab2c=ac;
acbc=abc2=ab
因此主集区的元素为
(1),ab,ac,bc。
而另一集区,可由一个非主集区的元素(处理组合)乘以主集区的每一个元素Mod2产生。
其中,b是在另一集区里,故另一集区的元素为,
b
(1)=b;bab=ab2=a;bac=abc;
bbc=b2c=c
其结果与先前得到的一致。
误差的估计(EstimationofError)
当因子数目很小时(2k,LevelFactor),如k=2或3,通常有必要反复实验以获得一个误差估计值。
如23因子实验必须以2个集区来进行且ABC被交络,实验者决定反复设计4次,如下图,
集区1
集区2
(1)
ac
ab
bc
abc
a
b
c
反复1
集区1
集区2
(1)
ac
ab
bc
abc
a
b
c
反复2
集区1
集区2
(1)
ac
ab
bc
abc
a
b
c
反复3
集区1
集区2
(1)
ac
ab
bc
abc
a
b
c
反复4
图7-3反复4次ABC被交络之23设计
此设计总共32个观测值和31个自由度,有8个集区即7个自由度,此7个自由度分解为A=B=C=AB=BC=AC=ABC=1,而误差平方为反复与因子效果(A,B,C,AB,AC,BC)之二者交互作用。
考虑视交互作用为零且将其均方作为误差估计值的作法是成立的,此均方误差可以检定主效果与2-因子交互作用效果。
ANOVA---反复4次且交络ABC之23设计
变源
自由度
反复
3
集区(ABC)
1
ABC的误差(反复集区)
3
A,B,C,AB,AC,BC各
1
误差(反复效果)
18
总和
31
倘实验资源允许反复的交络设计,较佳方式是稍微以不同方式来设计各个反复的集区,此方式包括在每个反复中交络不同的效果,使得所有的效果都能有一些信息,此法称之为部分交络(PartialConfounding)。
倘k不算太小,即k4,且只一次反复时,实验者常假设高阶交互作用效果是可忽略的,并将其平和合并为误差。
范例7-2
回顾再续范例6-2,一个化学产品于一压力槽内生产,在实验工厂进行因子实验来研究产品的过滤比率(FiltrationRate),4个因子为温度(A)、压力(B)、甲醛浓度(C)、与搅拌速度(D),各因子均有2水平,单次反复。
有兴趣于极大化过滤比率。
用此实验来说明一个未反复设计集区划分与交络的概念,假设24=16种处理组合无法利用一批原料进行所有的试验,实验者由一批原料可以试验8个处理组合,所以一个24交络于2个集区的设计是适当的,且交络最高阶交互作用效果(ABCD)于集区。
-
+
D
A
B
C
集区1
集区2
(1)=25
ab=45
ac=40
bc=60
ad=80
bd=25
cd=55
abcd=76
a=71
b=48
c=68
d=43
abc=65
bcd=70
acd=86
abd=1044
******************
假设二批原料中有一批的质量低劣,造成所有的反应值均比用另一批原料所得值低20,即原始反应值减去20,低劣质量原料是集区1与良好质量原料批为集区2。
计算结果,
◎4个主效果、6个2-因子交互作用效果、4个3-因子交互作用效果的估计值均与无集区效果的例6-2所得之效果估计值完全相同。
当划出这些效果估计值的常态机率图时,因子A、C、D与AC、AD交互作用为显著重要效果。
◎ABCD交互作用效果的估计值原为1.375,但在此实验其估计值为-18.625,因ABCD交络于集区,ABCD交互作用效果的估计值是原1.375加上区集效果(-20),即ABCD=1.375+(-20)=-18.625。
集区效果亦可由二个集区平均反应差得之,即
集区效果=
=406/8–555/8=-18.625
所以,此效果真正估计=集区+ABCD
◎此实验倘非以集区方式进行,且前8次试验均减去20,则结果可能会非常不同。
7-52k因子设计交络于4个集区
(Confoundingthe2kFactorialDesigninFourBlocks)
建构一个交络于4个集区而每个集区有2k-2个观测值的2k因子设计是有可能的,这种设计对于因子个数k4而集区大小却相当小时特别有效。
兹考虑25设计,如每个集区只能容纳8次试验,则需要4个集区,选出2个效果交络于集区,如ADE与BCE,此二个效果所对应之定义对比为,
L1=x1+x4+x5
L2=x2+x3+x5
则每一个处理组合会产生一个L1(Mod2)与L2(Mod2)的特定成对值,即(L1,L2)=(0,0),(0,1),(1,0),或(1,1),产生相同的(L1,L2)值的处理组合将被指订至同一集区,如,
L1=0,L2=0
(1),ad,bc,abcd,ab,ace,cde,bde
L1=1,L2=0a,d,abc,bcd,be,abde,ce,acde
L1=0,L2=1b,abd,c,acd,abce,ae,bcde,de
L1=1,L2=1e,ade,bce,ab,abcde,bd,ac,cd
L1=0
L2=0
(1)abc
adace
bccde
abcdbde
abe
dabde
abccebcdacde
Block1
L1=1
L2=0
Block2
L1=1
L2=1
babce
abdae
cbcde
acdde
eabcde
adebd
bceacabcd
Block4
L1=0
L2=1
Block3
图7-5交络ADE,BCE与ABCD之4个集区之25设计
仔细思量,除了ADE与BCE外,尚有另一个效果被集区交络,因4个集区有3个自由度,而ADE与BCE各有1个自由度,明显地另有一个1个自由度的效果亦被交络矣,此即ADE与BCE的广义交互作用(GeneralizedInteraction),其定义为ADE与BCE的乘积Mod2,因此,ADE与BCE的广义交互作用为(ADE)(BCE)=ABCDE2=ABCD,且亦交络于集区。
注意,对某个特定集区里的任何2个效果的符号相乘(e.g.,ADE与BCE)带来该集区另一个效果的符号(即ABCD)。
因此,ADE,BCE与ABCD都是交络于集区。
由25设计的正负符号,可知处理组合被指派至集区如下
处理组合在
ADE的符号
BCE的符号
ABCD的符号
集区1
-
-
+
集区2
+
-
-
集区3
-
+
-
集区4
+
+
+
在上节7-4中提及之主集区的群理论性质仍成立,主集区里的2个处理组合的乘积产生主集区里的另一个元素,亦即,如,
adbc=abcd;abebde=ab2de2=ad
要建构另一集区,则选一个不在主集区里之处理组合(如b)与主集区里的处理组合乘以b,则,
b
(1)=b;bad=abd;
bbc=c;babcd=acd
如此会产生集区3里之8个处理组合。
实务上,主集区可以从定义对比与群理论性质得到,而其它集区之处理组合由上述方法决定。
建构一个4集区的2k设计的一般步骤:
◎选择2效果与集区交络,自然会有第3个效果(即是前2个的广义交互作用)与集区交络,
◎利用2个定义对比(L1,L2)与主集区的群理论性质来建构所要的设计,
◎在选择交络于集区之效果时务必谨慎,以免有兴趣的效果被交络。
牺牲3因子交互作用的信息比牺牲2因子交互作用更合意
(ADE与BCEABCD;ABCDE与ABDCE)
7-62k因子设计交络于2p个集区
(Confoundingthe2kFactorialDesignin2pBlocks)
上述方法可扩至建构一个交络于2p(p另外,恰有2p-p-1个其它效果亦被交络,即初选之p个独立效果的广义交互作用,当然,选出p个独立交络效果时须谨慎,以免一些有兴趣之效果被交络矣。
这些设计之统计分析,即所有效果平方和的计算如无集区划分般,而集区平方和则为被交络效果平方和之和。
假设建构一个26设计而交络在23=8个集区,且每个集区有8个试验,兹选ABEF,ABCD,与ACE作为p=3个独立将被集区交络之效果,同时亦有2p-p-1=23-3-1=4效果被交络,即这些为3个(ABEF,ABCD,与ACE)之广义交互作用,则为,
(ABEF)(ABCD)=A2B2CDEF=CDEF
(ABEF)(ACE)=A2BCE2F=BCF
(ABCD)(ACE)=A2BC2DE=BDE
(ABEF)(ABCD)(ACE)=A3B2CDE2F=ADF
7-7部份交络(PartialConfounding)
除非实验者有一个误差的事先估计值,或假设某些交互作用可忽略,否则必须反复设计以得到一个误差的估计值,
如23因子实验必须以2个集区来进行且ABC被交络,实验者决定反复设计4次,如下图,
集区1
集区2
(1)
ac
ab
bc
abc
a
b
c
反复1
集区1
集区2
(1)
ac
ab
bc
abc
a
b
c
反复2
集区1
集区2
(1)
ac
ab
bc
abc
a
b
c
反复3
集区1
集区2
(1)
ac
ab
bc
abc
a
b
c
反复4
图7-3反复4次的ABC被交络之23设计
由上图(7-3)与其ANOVA表知,交互作用ABC的信息是完全丧失,因每次反复中ABC均与集区交络,此称之为完全交络(CompletelyConfounded)。
图7-6部份交络之23设计
如上图(7-6),仍是23因子实验,反复设计4次,但每次反复所交络的交互作用却不一样,如,
◎反复1交络ABC、反复2交络AB、反复3交络BC、反复4交络AC,
◎ABC的信息可由反复2,3,4数据得知、AB的信息可由反复1,3,4数据得知、AC的信息可由反复1,2,4数据得知、AC的信息可由反复1,2,3资料得知。
称此可得到3/4信息的交互作用,因为4次反复中有3次反复无被交络,Yates(1937)称比值3/4为交互作用的相对信息(RelativeInformationfortheConfoundedEffect),此设计称之为部分交络(PartialConfounding)。
另其ANOVA表如下,
ANOVA---反复4次且比值3/4交络之23设计
变源
自由度
反复
3
反复内的集区[或ABC(rep.1)+AB(rep.2)+BC(rep.3)+AC(rep.4)]
4
A,B,C各
1
AB(从反复1,3,4)
1
AC(从反复1,2,3)
1
BC(从反复1,2,4)
1
ABC(从反复2,3,4)
1
误差
17
总和
31
***************
范例7-3---一个部份交络之23设计
考虑范例6-1,探讨有关碳酸百分比(A)、操作压力(B)、速度(C),对碳酸饮料充填高度影响之研究,假设每一批糖浆只能测试4种处理组合,因此,每一次23设计之反复须在2个集区里进行,计反复2次,反复
交络ABC、反复
交络AB,其资料如下,
交络ABC
(1)=-3
ab=2
ac=2
bc=1
a=0
b=-1
c=-1
abc=6
反复I
交络AB
(1)=-1
c=0
ab=3
abc=5
a=1
b=0
ac=1
bc=1
反复II
经ANOVA分析,三个主效果均显著的。
**********************