方差分析.docx
《方差分析.docx》由会员分享,可在线阅读,更多相关《方差分析.docx(77页珍藏版)》请在冰豆网上搜索。
![方差分析.docx](https://file1.bdocx.com/fileroot1/2022-11/24/c10006f8-6822-4504-b107-85d47ba7aa49/c10006f8-6822-4504-b107-85d47ba7aa491.gif)
方差分析
一、单因素方差分析
1.完全窗口介绍
单因素方差分析的完全窗口管理通过Analyze菜单中的CompareMeans由One-WayANOVA菜单项调用。
(1)主对话框
按Analyze→ComparedMeans→One-WayAnova的顺序单击。
就可以打开“单因素方差分析”主对话框,如图1所示。
图1“单因素方差分析”对话框
(2)因变量框
在主对话框中可以看到因变量框(DependentList),该框中列出主要分析的所有因变量。
要从左源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。
可以有多个因变量。
(3)因素框
在主对话框中可以看到因素框(Factor),该框中列出了因素。
要从左边源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。
因素同样也是分组变量,必须满足只取有限个水平的条件。
(4)Contrast对话框
在主对话框中单击【Contrast】键,即可打开“Contrast”对话框,如图2所示。
在该框中指定一种要用t检验来检验的priori对比,可以进行均值的多项式比较。
图2多项式比较对话框
该框中各项意义如下:
①Polynomial复选框
选总该框,将进行均值的多项式比较。
均值的多项式比较是指包括两个或更多个均值的比较。
选中该框,并在其后的参数框中选定阶数,Linear是一阶,即是线性模型,Quadratic是二阶,Cubic是三阶,最高可到五阶。
②Coefficients参数
在该框中输入多项式的各组均值的系数,方法是在Coefficients中输入一个系数,单击【Add】按钮,Coefficients框中的系数就进入下面的方框中。
依次输入各组的均值的系数,在方形框中形成一列数值。
因素变量分为几组,就输入几个系数。
例如多项式只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0。
考虑另一种情况,如果只包括第一组与第二组的均值,则只要输入两个系数,第三、第四个可以不输入。
可以同时建立多个多项式,一个多项式的一组系数输入结束,按【Next】按钮,这时看到Coefficients参数框被清空,准备接受下一组数据。
如果要修改以前的系数,可以按【Previous】按钮,回到前一组系数。
找到要修改的系数后,可看到该系数显示在编辑框中,可以在此进行修改,修改后单击【Change】按钮,在下面的系数显示框中就出现了正确的系数值。
也可以删除选中的系数后,单击【Remove】按钮即可。
③CoefficientTotal栏
该栏显示每组系数的总和,例如,输入第一个系数1,该栏显示1;输入第二个系数2,该栏显示3;输入第三个系数4,该栏显示7。
(5)PostHoc对话框
在主对话框中,单击【PostHoc】按钮,即可进入PostHocMultipleComparisons对话框,如图3所示。
在该对话框中可以选择进行多中比较的方法。
图3多重比较对话框
该框中各项意义如下:
①方差相等时(Equalvarianceassumed),有如下选择方法:
●Least-significantdifference(LSD)复选框
用t检验完成相同组间成对均值的比较,对多重比较错误率不进行调整。
●Bonferroni(LSDMOD)复选框
用t检验完成组间成对均值的比较,但通过设置每个检验的误差率来控制整个误差率。
因此,看到的显著值是多重比较完成后的调整值。
●Sidak复选框
用t检验完成多重配对比较,为多重比较调整显著值,但它比Bonferroni方法的界限要小。
●Scheffe复选框
对所有可能的组合进行同步进入的均值配对比较。
这种检验被用来检查组间均值的所有可能的线性组合而不只是成对组合。
●R-E-G-WF复选框
Ryan-Einot-Gabriel–WelschF的简写,用F检验进行多重比较。
●R-E-G-WQ复选框
是Ryan-Einot-Gabriel–Welschrangetest的简写,在StudentizedRange分布下进行多重比较。
●S-N-K复选框
是StudentNewman-Keuls的简写,用StudentizedRange分布进行所有各组均值间的配对比较。
如果各组样本含量相等,还将用逐步过程进行齐次子集(差异较小的子集)的均值配对比较。
各组均值按从大到小的顺序排列,最先比较最极端的差异。
●TUKEY复选框
是Tukey`shonestlysignificantdifference的简写,用StudentizedRange统计量进行所有组间均值的配对比较,用所有配对比较集合的误差作为实验误差率。
●TUKEY`s-b复选框
用StudentizedRange统计量进行所有组间均值的配对比较,其临界值是前两种检验(TUKEY和S-N-K)的相应值的平均值。
●Duncan复选框
是Duncan`smultiplerangetest的简写,进行配对比较时,使用的逐步顺序与Student-Newman-Keuls检验的顺序一样,但是,并不是给每一个检验设定一个误差率,而是给所有的检验的误差率设定一个临界值。
●Hochberg`sGT2复选框
用Studentized最大系数进行比较检验和范围检验,与Tukey`shonestlysignificantdifference类似。
●Gabriel复选框
使用Studentized最大系数进行配对比较检验,在单元数不等时,该方法比Hochberg`sGT2更为有效。
可见,当单元数变化很大时,这种检验更加自由。
●Waller-Dunca复选框
使用t检验进行多重比较检验,使用贝叶斯逼近。
选中该框后,在其下的Type1/Type2RrrorRation参数框中输入参数,规定k比率,也就是第一类、第二类误差比。
●Dunnett复选框
用t检验进行配对比较,方法是指定一组,其他各组与它比较。
选中此方法,其下的ControlCategory参数框和Test栏都被激活。
在ControlCategory参数框中,选择指定的组,有两个选项,Last选择最后一组,First选择第一组。
在Test栏中选择t检验的方法,2-sides是双侧检验,小于Control是左侧检验,大于Control是右侧检验。
②方差不相等时(Equalvariancenotassumed),检验方法共有四种:
●Tamhane`sT2复选框
选中该框,用t检验进行配对比较。
●Dunnett`sT3复选框
选中该框,用Studentized最大系数进行配对比较检验。
●Games-Howell复选框
这种方法有时比较自由。
●Dunnett`sC复选框
选中该框,用StudentizedRange统计量进行配对比较检验。
③Significancelevel参数框
在主对话框中单击【Options】按钮,展开“Options”对话框如图4所示。
在该框中规定输出统计量,并规定缺失值的处理方式。
图4Options对话框
①Statistics栏
该栏中规定要输出统计量。
●Descriptive复选框
选中该框,要求输出描述统计量,包括观测量树木、均值、最小值、最大值、标准差、标准误差,各组中每个因变量的95%的置信区间。
●Homogeneity-of-variance复选框
选中该框,要求用Levene检验进行方差一致性检验。
②Meansplot复选框
选中该框,输出均值分布图,即根据各组均数描绘出因变量的分布情况。
③MissingValues栏
在该栏中选择缺失值的处置方式,有两个选项:
●Excludecasesanalysisbyanalysis
选中该框,在检验变量中含缺失值的观测将不被计算。
●Excludecaseslistwise
选中该框,在任何一个变量中含有缺失值的观测都将不做计算。
例题分析:
例1某灯泡厂用四种不同配料方案制成的等丝,生产了四批灯泡。
在每批灯泡中随机地抽取若干个灯泡测其使用寿命(单位:
小时),数据列于表1中。
现在想知道,对于这四种灯丝生产的灯泡,其寿命有无显著差异。
表1灯泡使用寿命
灯丝
灯泡1
灯泡2
灯泡3
灯泡4
灯泡5
灯泡6
灯泡7
灯泡8
甲
1600
1610
1650
1680
1700
1700
1780
乙
1500
1640
1400
1700
1750
丙
1640
1550
1600
1620
1640
1600
1740
1800
丁
1510
1520
1530
1570
1640
1680
在该例中,可设灯泡的使用寿命为因变量,灯丝的配料为因子,四种配料方案为四水平,这是单因子四水平的试验。
如果这四种配料方案制成的灯丝,其灯泡的使用寿命没有显著差异,则可以从中挑选一种既经济又方便的配料方案;如果这四种配料方案制成的灯丝,其灯泡的使用寿命存在显著差异,则希望从中挑选一种配料方案,以对提高灯泡的使用寿命更为有利。
1.不使用选择项操作步骤
(1)在数据窗口建立数据文件,定义两个变量并输入数据,如图5所示。
这两个变量是:
图5数据编辑窗口
●filament变量,数值型,取值1、2、3、4分别代表甲、乙、丙、丁,格式为F1.0,标签为“灯丝”。
●hours变量,数值型,其值为灯泡的使用寿命,单位是小时,格式为F4.0,标签为“灯泡使用寿命”。
(2)按Analyze→ComparedMeans→OneWayAnova的顺序单击,打开“单因素方差分析”主对话框,如图6所示。
图6主对话框
(3)从左边源变量框中选取变量hours,然后按向右的箭头,所选取的变量hours即进入DependentList框中。
(4)从左边源变量框中选取变量filament,然后按向右的箭头,所选取的变量filament即进入Factor框中。
(5)在主对话框中,单击【OK】提交运行。
2.输出结果及分析
表2就是输出结果,使用系统默认值进行分析。
表2灯泡使用寿命的单因素方差分析结果
ANOVA
灯泡使用寿命
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
39776.456
3
13258.819
1.638
.209
WithinGroups
178088.929
22
8094.951
Total
217865.385
25
该表各部分说明如下:
第一列:
方差来源,BetweenGroups是组间变差,WithinGroups是组内变差,Total是总变差。
第二列:
离差平方和。
第三列:
自由度。
第四列:
均方。
第五列:
F值。
第六列:
显著值:
是F统计量的p值,这里为0.209。
由于显著值0.209大于0.05,所以在置信水平0.95下不能否定零假设,也就是说四种灯丝生产的灯泡,起平均使用寿命没有显著差异。
例2对例1作进一步说明。
例1使用窗口分析的系统默认值,得到了一些基本的结论,在很多情况下要想知道更多的结论,就必须使用选择项。
3.使用选择项操作步骤
(1)在数据窗打开数据文件。
(2)按Analyze→ComparedMeans→OneWayAnova的顺序单击,打开“单因素方差分析”主对话框。
(3)从左边源变量框中选取变量hours,然后按向右箭头,所选取的变量hours即进入DependentList框中。
(4)从左边源变量框中选取变量filament,然后按向右箭头,所选取的变量filament即进入Factor框中。
(5)在主对话框中单击【Contrast】,打开“Contrast”对话框,在该框中选择多项式比较,选择一次多项式比较各组均值,共指定两组多项式系数。
●系数依次为1、-1、-1、1,这是检验灯丝对灯泡使用寿命的影响及甲、丁效应和与乙、丙效应和是否有显著差异。
●系数依次为1、-1、1、-1,这是检验灯丝对灯泡使用寿命的影响及甲、丙效应和与乙、丁效应和是否有显著差异。
(6)在主对话框中单击【PostHoc】,打开“PostHocMultipleComparisons”对话框,在该框中选择多重比较。
●在EqualVarianceAssumed栏中,选择LSD、Duncan两种方法。
●在EqualVarianceNotAssumed栏中,选择Tamhane`sT2方法。
(7)在主对话框中单击【Options】,打开“Options”对话框,输出统计量选择项。
●选中Descriptive复选框,要求输出描述统计变量。
●选中Homogeneity-of-variance复选框,要求用Levence检验进行方差一致性检验。
●选中Meansplot复选框,输出均数分布图,即根据各组均数描述出因变量的分布情况。
●选中Excludecasesanalysisbyanalsis框,在检验变量中含有缺失值的观测将不被计算。
(8)在主对话框中,单击【OK】提交运行。
4.输出结果及分析
表3是描述统计量表,给出了四种灯丝分组的样本含量N、均值Mean、标准差Std.Deviation、标准误差Std.Error、95%的置信区间、最小值Minimun、最大值Maximum。
表3描述性统计量表
Descriptives
灯泡使用寿命
N
Mean
Std.Deviation
Std.Error
95%ConfidenceIntervalforMean
Minimum
Maximum
LowerBound
UpperBound
甲
7
1674.29
61.61
23.28
1617.31
1731.26
1600
1780
乙
5
1598.00
144.98
64.84
1417.98
1778.02
1400
1750
丙
8
1648.75
81.67
28.87
1580.47
1717.03
1550
1800
丁
6
1575.00
70.07
28.61
1501.46
1648.54
1510
1680
Total
26
1628.85
93.35
18.31
1591.14
1666.55
1400
1800
表4是方差一致性检验结果,从显著值来看,p大于0.05,说明各组的方差在0.05的显著水平上没有显著性差异,即方差具有一致性。
这个结论在选择多重比较的方法时将作为一个依据。
表4方差一致性检验
TestofHomogeneityofVariances
灯泡使用寿命
LeveneStatistic
df1
df2
Sig.
2.840
3
22
.061
表5是单因素方差分析结果,与使用系统默认方式的结果表2比较,多了三行,分别是未加权Unweighted、加权Weighted线性项和加权项与组间偏差平方和的差19873,23,同时给出了自由度、均方、F值、显著值。
表5单因素方差分析结果
ANOVA
灯泡使用寿命
SumofSquares
df
MeanSquare
F
Sig.
Between(Combined)
GroupsLineartermUnweighted
Weoghted
Deviation
39776.46
19629.56
19939.23
198397.23
3
1
1
2
13258.819
19629.556
19939.231
9918.613
1.638
2.425
2.463
1.225
.209
.134
.131
.313
WithinGroups
178088.929
22
8094.951
Total
217865.385
25
表6是对比系数表,列出了两组多项式的系数。
表6对比系数
ContrastCoefficients
Contrast
灯丝
甲
乙
丙
丁
1
1
-1
-1
1
2
1
-1
1
-1
表7是多项式比较结果,各列的内容说明如下:
表7多项式比较结果
ContrastTests
Contrast
ValueofContrast
Std.Error
t
df
Sig.(2-tailed)
灯泡使用寿命
Assumeequalvariances
1
2.54
71.67
.035
22
.972
2
150.04
71.67
2.093
22
.048
Doesnotassumeequalvariances
1
2.54
79.99
.032
8.709
.975
2
150.04
79.99
1.876
8.709
.095
表8是用LSD法和Tamhane`sT2法进行均值多重比较的结果。
在上面从多重比较对话框中挑选选择项的过程中,在Equalvarianceassumed框中选择了LSD,在Equalvariancenotassumed中挑选了Tamhane`sT2。
而在本例中,从表4可知,方差可以认为是相等的,所以只看LSD这栏即可。
从结果中可看出,各组均值间都没有显著性差异。
表8LSD和Tamhane`sT2法进行均值多重比较的结果
MultipleComparisons
DependentVariable:
灯泡使用寿命
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
(I)灯丝
(J)灯丝
LowerBound
UpperBound
LSD
甲
乙
76.29
52.68
.162
-32.97
185.54
丙
25.54
46.56
.589
-71.03
122.11
丁
99.29
50.06
.060
-4.52
203.10
乙
甲
-76.29
52.68
.162
-185.54
32.97
丙
-50.75
51.29
.333
-157.12
55.62
丁
23.00
54.48
.677
-89.99
135.99
丙
甲
-25.54
46.56
.589
-122.11
71.03
乙
50.75
51.29
.333
-55.62
157.12
丁
73.75
48.59
.143
-27.02
174.52
丁
甲
-99.29
50.06
.060
-203.10
4.52
乙
-23.00
54.48
.677
-135.99
89.99
丙
-73.75
48.59
.143
-174.52
27.02
Tamhane
甲
乙
76.29
52.68
.900
-211.57
364.14
丙
25.54
46.56
.985
-89.67
140.74
丁
99.29
50.06
.127
-20.79
219.36
乙
甲
-76.29
52.68
.900
-364.14
211.57
丙
-50.75
51.29
.985
-331.78
230.28
丁
23.00
54.48
1.000
-259.42
305.42
丙
甲
-25.54
46.56
.985
-140.74
89.67
乙
50.75
51.29
.985
-230.28
331.78
丁
73.75
48.59
.452
-54.55
202.05
丁
甲
-99.29
50.06
.127
-219.36
20.79
乙
-23.00
54.48
1.000
-305.42
259.42
丙
-73.75
48.59
.452
-202.05
54.55
表9是Duncan法进行均值多重比较的结果。
各栏的意义如下:
第一列:
列出甲、乙、丙、丁各组。
第二列:
按Duncan取渐渐增大的Range值进行比较而分的子集。
第三列:
Duncan值。
由于各组样本含量不等,计算均值用的是调和平均数的样本量6.304。
最后一列列出了显著值为0.085大于0.05,说明各组方差具有一致性。
表9Duncan法进行的均值多重比较结果
灯泡使用寿命
N
Subsetforalpha=.05
灯丝
1
Duncan
甲
6
1575.00
乙
5
1598.00
丙
8
1648.75
丁
7
1674.29
Sig.
.085
Meansforgroupsinhomogeneoussubsetsaredisplayed.
aUsesHarmonicMeanSampleSize=6.304.
bThegroupsizesareunequal.Theharmonicmeanofthegroupsizesisused.TypeIerrorlevelsarenotguaranteed.
图7是均值分布图,以灯丝为横轴,以灯泡使用的平均时间为纵轴,从这个图上可以看出各组今值的分布。
图7均值分布图
二、多因素方差分析
1.简单介绍
本节所讲的单因变量多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的回归分析和方差分析,这个过程可以检验不同组之间均数由于受不同因素影响是否有差异的问题,即可以分析每一个因素的作用,也可以分析各因素之间的交互作用,还可以分析协方差和协方差交互作用。
2.完全窗口分析
多因素方差分析可以完全通过窗口管理实现其功能,这对于用户来说是非常方便的。
在“Analyze”菜单中打开“G