SPSS170在生物统计学中的应用实验五方差分析报告 六简单相关与回归分析报告.docx
《SPSS170在生物统计学中的应用实验五方差分析报告 六简单相关与回归分析报告.docx》由会员分享,可在线阅读,更多相关《SPSS170在生物统计学中的应用实验五方差分析报告 六简单相关与回归分析报告.docx(34页珍藏版)》请在冰豆网上搜索。
SPSS170在生物统计学中的应用实验五方差分析报告六简单相关与回归分析报告
SPSS在生物统计学中的应用
——实验指导手册
实验五:
方差分析
一、实验目标与要求
1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理
2.掌握方差分析的过程。
3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。
二、实验原理
在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。
例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。
为此引入方差分析的方法。
方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。
若存在显著差异,则说明该因素对各总体的影响是显著的。
方差分析有3个基本的概念:
观测变量、因素和水平。
●观测变量是进行方差分析所研究的对象;
●因素是影响观测变量变化的客观或人为条件;
●因素的不同类别或不通取值则称为因素的不同水平。
在上面的例子中,农作物的产量和商品的销量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。
在方差分析中,因素常常是某一个或多个离散型的分类变量。
⏹根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;
⏹根据因素个数,可分为单因素方差分析和多因素方差分析。
在SPSS中,有One-wayANOVA(单变量-单因素方差分析)、GLMUnivariate(单变量多因素方差分析);GLMMultivariate(多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。
本节仅练习最为常用的单变量方差分析。
三、实验演示容与步骤
㈠单变量-单因素方差分析
单因素方差分析也称一维方差分析,对两组以上的均值加以比较。
检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。
并可以进行两两组间均值的比较,称作组间均值的多重比较。
主要采用One-wayANOVA过程。
采用One-wayANOVA过程要求:
因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。
若对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用RepeatedMeasure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。
【例6.1】欲比较四种饲料对仔猪增重效果的优劣,随机选取了性别、年龄、体重相同,无亲缘关系的20头猪,随机分为4组,每组5头,分别饲喂一种饲料所得增重数据如下在。
试利用这些数据对4种饲料对仔猪增重效果的差异进行检验。
饲料
日增重(g)
均值
A
57
37
54
42
60
50
B
13
39
41
33
19
29
C
13
15
13
29
20
18
D
18
24
38
22
13
23
合计
600
μ=
=30
打开数据文件“单因素方差分析数据-1.xls”。
在SPSS中实验该检验的步骤如下:
♦步骤1:
选择菜单【分析】→【比较均值】→【单因素方差分析】,依次将观测变量销量移入因变量列表框,将因素变量地区移入因子列表框。
图5.1One-WayANOVA对话框
♦单击两两比较按钮,如图5.2,该对话框用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。
方差分析的原假设是各个因素水平下的观测变量均值都相等,备择假设是各均值不完全相等。
假如一次方差分析的结果是拒绝原假设,我们只能判断各观测变量均值不完全相等,却不能得出各均值完全不相等的结论。
各因素水平下观测变量均值的更为细致的比较就需要用多重比较检验。
图5.2两两比较对话框
假定方差齐性选项栏中给出了在观测变量满足不同因素水平下的方差齐性条件下的多种检验方法。
✧LSD。
使用t检验执行组均值之间的所有成对比较。
对多个比较的误差率不做调整。
✧Bonferroni。
使用t检验在组均值之间执行成对比较,但通过将每次检验的错误率设置为实验性质的错误率除以检验总数来控制总体误差率。
这样,根据进行多个比较的实情对观察的显著性水平进行调整。
✧Sidak。
基于t统计量的成对多重比较检验。
Sidak调整多重比较的显著性水平,并提供比Bonferroni更严密的边界。
✧Scheffe。
为均值的所有可能的成对组合执行并发的联合成对比较。
使用F取样分布。
可用来检查组均值的所有可能的线性组合,而非仅限于成对组合。
✧R-E-G-WF。
基于F检验的Ryan-Einot-Gabriel-Welsch多步进过程。
✧R-E-G-WQ。
基于学生化围的Ryan-Einot-Gabriel-Welsch多步进过程。
✧S-N-K.使用学生化的围分布在均值之间进行所有成对比较。
它还使用步进式过程比较具有相同样本大小的同类子集的均值对。
均值按从高到低排序,首先检验极端差分。
✧Tukey。
使用学生化的围统计量进行组间所有成对比较。
将试验误差率设置为所有成对比较的集合的误差率。
✧Tukey'sb。
使用学生化的围分布在组之间进行成对比较。
临界值是Tukey's真实显著性差异检验的对应值与Student-Newman-Keuls的平均数。
✧Duncan。
使用与Student-Newman-Keuls检验所使用的完全一样的逐步顺序成对比较,但要为检验的集合的错误率设置保护水平,而不是为单个检验的错误率设置保护水平。
使用学生化的围统计量。
✧Hochberg'sGT2。
使用学生化最大模数的多重比较和围检验。
与Tukey's真实显著性差异检验相似。
✧Gabriel。
使用学生化最大模数的成对比较检验,并且当单元格大小不相等时,它通常比Hochberg'sGT2更为强大。
当单元大小变化过大时,Gabriel检验可能会变得随意。
✧Waller-Duncan。
基于t统计的多比较检验;使用Bayesian方法。
✧Dunnett。
将一组处理与单个控制均值进行比较的成对多重比较t检验。
最后一类是缺省的控制类别。
另外,您还可以选择第一个类别。
双面检验任何水平(除了控制类别外)的因子的均值是否不等于控制类别的均值。
<控制检验任何水平的因子的均值是否小于控制类别的均值。
>控制检验任何水平的因子的均值是否大于控制类别的均值。
这里选择最常用的LSD检验法、S-N-K检验法、Duncan检验法。
未假定方差齐性选项栏中给出了在观测变量不满足方差齐性条件下的多种检验方法。
✧Tamhane'sT2。
基于t检验的保守成对比较。
当方差不相等时,适合使用此检验。
✧Dunnett'sT3。
基于学生化最大值模数的成对比较检验。
当方差不相等时,适合使用此检验。
✧Games-Howell。
有时会变得随意的成对比较检验。
当方差不相等时,适合使用此检验。
✧Dunnett'sC。
基于学生化围的成对比较检验。
当方差不相等时,适合使用此检验。
这里选择Tamhane’sT2检验法、Dunnett'sT3检验法。
Significancelevel输入框中用于输入多重比较检验的显示性水平,默认为5%。
♦单击【选项】按钮,弹出options子对话框,如图所示。
在对话框中选中描述性复选框,输出不同因素水平下观测变量的描述统计量;选择方差同质性检验复选框,输出方差齐性检验结果;选中均值图复选框,输出不同因素水平下观测变量的均值直线图。
图5.3“选项”子对话框
✧统计量。
Ø描述性。
计算每组中每个因变量的个案数、均值、标准差、均值的标准误、最小值、最大值和95%置信区间。
Ø固定和随机效果。
显示固定效应模型的标准差、标准误和95%置信区间,以及随机效应模型的标准误、95%置信区间和成分间方差估计。
Ø方差同质性检验。
计算Levene统计量以检验组方差是否相等。
该检验独立于正态的假设。
ØBrown-Forsythe。
计算Brown-Forsythe统计量以检验组均值是否相等。
当方差相等的假设不成立时,这种统计量优于F统计量。
ØWelch。
计算Welch统计量以检验组均值是否相等。
当方差相等的假设不成立时,这种统计量优于F统计量。
✧均值图。
显示一个绘制子组均值的图表(每组的均值由因子变量的值定义)。
✧缺失值。
控制对缺失值的处理。
Ø按分析顺序排除个案。
给定分析中的因变量或因子变量有缺失值的个案不用于该分析。
而且,也不使用超出为因子变量指定的围的个案。
Ø按列表排除个案。
因子变量有缺失值的个案,或包括在主对话框中的因变量列表上的任何因变量的值缺失的个案都排除在所有分析之外。
如果尚未指定多个因变量,那么这个选项不起作用。
♦在主对话框(单因素方差分析对话框)中点击ok按钮,可以得到单因素分析的结果。
实验结果分析:
表5.1资料描述性统计表
Descriptives
日增重(g)
N
Mean
Std.Deviation
Std.Error
95%ConfidenceIntervalforMean
Minimum
Maximum
LowerBound
UpperBound
1
5
50.00
9.975
4.461
37.61
62.39
37
60
2
5
29.00
12.410
5.550
13.59
44.41
13
41
3
5
18.00
6.782
3.033
9.58
26.42
13
29
4
5
23.00
9.381
4.195
11.35
34.65
13
38
Total
20
30.00
15.424
3.449
22.78
37.22
13
60
表5.2方差齐性检验表
TestofHomogeneityofVariances
TestofHomogeneityofVariances
日增重(g)
LeveneStatistic
df1
df2
Sig.
1.322
3
16
.302
表5.3单因素方差分析结果
ANOVA
日增重(g)
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
2970.000
3
990.000
10.219
.001
WithinGroups
1550.000
16
96.875
Total
4520.000
19
表5.4多重比较检验结果-LSD法、Tamhane法、DunnettT3法
MultipleComparisons
DependentVariable:
日增重(g)
(I)饲料
(J)饲料
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
LSD
1
2
21.000*
6.225
.004
7.80
34.20
3
32.000*
6.225
.000
18.80
45.20
4
27.000*
6.225
.001
13.80
40.20
2
1
-21.000*
6.225
.004
-34.20
-7.80
3
11.000
6.225
.096
-2.20
24.20
4
6.000
6.225
.349
-7.20
19.20
3
1
-32.000*
6.225
.000
-45.20
-18.80
2
-11.000
6.225
.096
-24.20
2.20
4
-5.000
6.225
.434
-18.20
8.20
4
1
-27.000*
6.225
.001
-40.20
-13.80
2
-6.000
6.225
.349
-19.20
7.20
3
5.000
6.225
.434
-8.20
18.20
Tamhane
1
2
21.000
7.120
.111
-4.02
46.02
3
32.000*
5.394
.003
12.52
51.48
4
27.000*
6.124
.014
5.76
48.24
2
1
-21.000
7.120
.111
-46.02
4.02
3
11.000
6.325
.570
-12.99
34.99
4
6.000
6.957
.960
-18.66
30.66
3
1
-32.000*
5.394
.003
-51.48
-12.52
2
-11.000
6.325
.570
-34.99
12.99
4
-5.000
5.177
.934
-23.48
13.48
4
1
-27.000*
6.124
.014
-48.24
-5.76
2
-6.000
6.957
.960
-30.66
18.66
3
5.000
5.177
.934
-13.48
23.48
DunnettT3
1
2
21.000
7.120
.094
-3.24
45.24
3
32.000*
5.394
.003
13.21
50.79
4
27.000*
6.124
.012
6.38
47.62
2
1
-21.000
7.120
.094
-45.24
3.24
3
11.000
6.325
.481
-11.93
33.93
4
6.000
6.957
.933
-17.86
29.86
3
1
-32.000*
5.394
.003
-50.79
-13.21
2
-11.000
6.325
.481
-33.93
11.93
4
-5.000
5.177
.896
-22.86
12.86
4
1
-27.000*
6.124
.012
-47.62
-6.38
2
-6.000
6.957
.933
-29.86
17.86
3
5.000
5.177
.896
-12.86
22.86
*.Themeandifferenceissignificantatthe0.05level.
表5.5多重比较检验结果-Student-Newman-Keulsa法、Duncana法
日增重(g)
饲料
N
Subsetforalpha=0.05
1
2
Student-Newman-Keulsa
3
5
18.00
4
5
23.00
2
5
29.00
1
5
50.00
Sig.
.212
1.000
Duncana
3
5
18.00
4
5
23.00
2
5
29.00
1
5
50.00
Sig.
.112
1.000
Meansforgroupsinhomogeneoussubsetsaredisplayed.
a.UsesHarmonicMeanSampleSize=5.000.
图5.4均值图
㈡单变量-多因素方差分析
例7.1为了比较3种不同饲料配方对4种不同品种的增重效果,从每个品种猪中随机抽取了3头体重相同的仔猪,分别随机饲喂不同的饲料,3个月后的增重效果(kg/头)如下。
试分析不同饲料和品种对仔猪增重的影响。
品种
饲料
合计
平均
1
2
3
Ti.
Xi.
A
52
53
52
156
52
B
56
57
58
171
57
C
45
49
47
141
47
D
42
44
43
129
43
合计T.j
194
203
200
597
平均X.j
48.5
50.75
50
49.75
打开数据文件“两因素方差分析数据-无重复数据.xls”。
在SPSS中实验该检验的步骤如下:
♦步骤1:
选择菜单【分析】→【一般线性模型】→【单变量...】,弹出“单变量”对话框
图5.5“单变量”对话框
依次将观测变量“增重”销量移入因变量列表框,将因素变量“品种”、“饲料”移入固定因子列表框。
◆单击【模型】按钮,弹出“模型”对话框,如图5.6
图5.6“模型”对话框
●指定模型:
Ø全因子模型包含所有因子主效应、所有协变量主效应以及所有因子间交互。
它不包含协变量交互。
Ø选择定制可以仅指定其中一部分的交互或指定因子协变量交互。
必须指定要包含在模型中的所有项。
●因子与协变量。
列出因子与协变量。
●模型:
模型取决于数据的性质。
选择定制之后,您可以选择分析中感兴趣的主效应和交互效应。
●平方和:
计算平方和的方法。
对于没有缺失单元的平衡或非平衡模型,类型III平方和方法最常用。
●在模型中包含截距:
模型常包含截距。
如果您可以假设数据穿过原点,则可以排除截距。
●构建项:
对于选定因子和协变量:
Ø交互。
创建所有选定变量的最高级交互项。
这是缺省值。
Ø主效应。
为每个选定的变量创建主效应项。
Ø所有二阶。
创建选定变量的所有可能的二阶交互。
Ø所有三阶。
创建选定变量的所有可能的三阶交互。
Ø所有四阶。
创建选定变量的所有可能的四阶交互。
Ø所有五阶。
创建选定变量的所有可能的五阶交互。
●平方和:
对于该模型,您可以选择平方和类型。
类型III最常用,并且是缺省类型。
Ø类型I:
此方法也称为平方和分级解构法。
在模型中,每一项只针对它前面的那项进行调整。
类型I平方和常用于:
平衡ANOVA模型,其中任何主效应在任何一阶交互效应之前指定,任何一阶交互效应在任何二阶交互效应之前指定,依此类推。
多项式回归模型,其中任何低阶项在任何高阶项之前指定。
纯嵌套模型,其中第一个指定的效应嵌套在第二个指定的效应中,第二个指定的效应嵌套在第三个指定的效应中,依此类推。
(此嵌套形式只能通过使用语法来指定。
)
Ø类型II:
此方法在为所有其它“相应的”效应进行调节的模型中计算某个效应的平方和。
相应的效应是指,与所有效应(不包含正被检查的效应)相对应的效应。
类型II平方和方法常用于:
平衡ANOVA模型。
任何只有主要因子效应的模型。
任何回归模型。
纯嵌套设计。
(此嵌套形式能通过使用语法来指定。
)
Ø类型III:
缺省类型。
此方法在设计过以下形式计算某个效应的平方和:
为任何不包含该效应的其他效应,以及任何与包含该效应正交的效应(如果存在)调整的平方和。
类型III平方和具有一个主要优点,那就是只要可估计性的一般形式保持不变,平方和对于单元频率就保持不变。
因此,我们常认为此类平方和对于不带缺失单元格的不平衡模型有用。
在不带缺失单元的因子设计中,此方法等同于Yates加权均值平方方法。
类型III平方和法常用于:
任何在类型I和类型II中列出的模型。
任何不带空白单元的平衡或非平衡模型。
Ø类型IV:
此方法针对存在缺失单元的情况设计。
对于设计中的任何效应F,如果任何其它效应中不包含F,则类型IV=类型III=类型II。
当F包含在其它效应中时,则类型IV将F中的参数中正在进行的对比相等地分配到所有较高水平的效应。
类型IV平方和法常用于:
任何在类型I和类型II中列出的模型。
任何带有空白单元的平衡或非平衡模型。
◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【对比】按钮,弹出“单变量:
对比”对话框,可对指定的因子变量不同水平进行多种方式的比较,
图5.7“单变量:
对比”对话框
由于生物统计学的分析,主要是对每个影响因子的不同水平进行多重比较,及交互作用检验,在“模型”、“两两对比”、“选项”三项中进行选择设置即可满足需要,故此项通常保持默认设置,即不做相关对比。
◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【绘制】按钮,弹出“单变量:
轮廓图”对话框,可对指定的因子变量之间是否存在交互作用进行直观分析。
可任选一个因子作为水平轴取值,对另一个因子的不同水平取值的线性变化进行显示,若呈现“平行”相,则说明两个因子没有交互作用,若呈现“交叉相”,则说明两个因子有交互作用。
将“品种”选入水平轴框,将“饲料”选入单图框,点击“添加”,将所做选择确定。
图5.8“单变量:
轮廓图”对话框
◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【两两比较】按钮,弹出“单变量:
观测均值的两两比较”对话框,可对指定的因子变量各水平之间因变量均值的显著差异性进行检验,只有在方差分析表明该变量的不同水平间的差异主要是处理效应的前提下,此项比较才有意义。
图5.9“单变量:
观测均值的两两比较”对话框
选择最常用的LSD检验法、S-N-K检验法、Duncan检验法。
◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【保存】按钮,弹出“单变量:
保存”对话框,可以在数据编辑器中将模型预测的值、残差和相关测量另存为新变量。
这些变量中有许多可用于检查关于数据的假设。
要保存供另一SPSSStatistics会话中使用的值,您必须保存当前数据文件。
图5.10“单变量:
保存”对话框
由于生物统计学的分析,通常不对此项做选择,保持默认设置。
◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【选项】按钮,弹出“单变量:
选项”对话框。
此对话框中有一些可选统计量。
统计量是使用固定效应模型计算的。
图5.11“单变量:
选项”对话框
估计边际均值:
选择您需要的单元中的总体边际均值估计的因子和交互作用。
为协变量(如果存在)调整这些均值。
比较主效应。
对于主体间和主体因子,为模型中的任何主效应提供估计边际均值未修正的成对比较。
只有在“显示以下项的均值”列表中选择了主效应的情况下,此项才可用。
置信区间调节。
选择最小显著性差异(LSD)、Bonferroni或对置信区间和显著性的Sidak调整。
此项只有在选择了比较主作用的情况下才可用。
输出:
Ø描述统计:
以生成所有单元中的所有因变量的观察到的均值、标准差和计数。
Ø功效估计:
给出了每个作用和每个参数估计值的偏eta方值。
eta方统计量描述总变异性中可归因于某个因子的部分。
Ø检验效能:
当基于观察到的值设置备用假设时,选择检验效能可获取检验的效能。
Ø参数估计:
选择参数估计可