spass方差分析实验报告.docx
《spass方差分析实验报告.docx》由会员分享,可在线阅读,更多相关《spass方差分析实验报告.docx(16页珍藏版)》请在冰豆网上搜索。
spass方差分析实验报告
实验主题
专业统计软件应用
实验题目
方差分析
实训时间
2011学年2学期15周(2011年5月30日—31日)
学生姓名
官其虎
学号
2009211467
班级
0360901
实训地点
信息管理实验室
设备号
B25
指导教师
刘进
一实验目的
事件的发生往往与多个因素有关,但各个因素对事件发生的中的用作用是不一样的,而且同一因素的不同水平对事件发生的影响也是不同的。
如农业研究中土壤、肥料、日照时间等因素对某种农作物产量的影响,不同饲料对牲畜体重增长的效果等,都可以使用该方差分析方法来解决。
理解和学会使用方差分析方法来解决问题。
二实验内容
第一题:
某农场为了比较4种不同品种的小麦产量的差异,选择土壤条件基本相同的土地,分成16块,将每一个品种在4块试验田上试种,测得小表亩产量(kg)的数据如表6.17所示(数据文件为data6-4.sav),试问不同品种的小麦的平均产量在显著性水平0.05和0.01下有无显著性差异。
(数据来源:
《SPSS实用统计分析》郝黎仁,中国水利水电出版社)
表6.17小麦产量的实测数据
品种
A1
A2
A3
A4
产量
277.
244.2
249.2
273
76.4
249.5
244.2
240.9
271
236.8
252.8
257.4
272.4
239
251.4
266.5
a)本题的实验原理:
单因素方差分析
b)实验步骤:
第1步分析:
由于有一个因素(品种),而且是4种品种。
故不能用独立样本T检验(仅适用两组数据),这里可用单因素方差分析;
第2步数据的组织:
分成两列,一列是小麦的产量,另一列是小麦品种(分别用A1,A2,A3,A4标识);
第3步方差相等的齐性检验:
由于方差分析的前提是各个水平下(这里是不同的饲料folder影响下的产量)的总体服从方差相等的正态分布。
其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。
因此必须对方差相等的前提进行检验。
点开Options,选中Homogeneityofvariancetest(方差齐性检验)。
第四步把显著性水平改为0.01重复前面三个步骤。
c)结果及分析:
(1)不同品种的奇性检验结果
TestofHomogeneityofVariances
产量
LeveneStatistic
df1
df2
Sig.
3.593
3
12
.046
(2)几种品种的方差检验结果
ANOVA
产量
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
2263.482
3
754.494
12.158
.001
WithinGroups
744.715
12
62.060
Total
3008.197
15
(3)描述统计量表
Descriptives
产量
N
Mean
Std.Dviation
Std.Error
5%ConfidenceIntervalforMean
Minimum
Maximum
LowerBound
UpperBound
A1
4
274.3250
3.11702
1.55851
269.3651
279.2849
271.00
277.50
A2
4
242.6250
5.80136
2.90068
233.3937
251.8563
236.80
249.50
A3
4
249.6500
3.31612
1.65806
244.3733
254.9267
245.20
252.80
A4
4
259.4500
13.92372
6.96186
237.2943
281.6057
240.90
273.00
Tota
16
256.5125
14.16144
3.54036
248.9664
264.0586
236.80
277.50
(4)多重比较结果
MultipleComparisons
产量
LSD
(I)品种
(J)品种
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
A1
A2
31.70000*
5.57044
.000
19.5631
43.8369
A3
24.67500*
5.57044
.001
12.5381
36.8119
A4
14.87500*
5.57044
.020
2.7381
27.0119
A2
A1
-31.70000*
5.57044
.000
-43.8369
-19.5631
A3
-7.02500
5.57044
.231
-19.1619
5.1119
A4
-16.82500*
5.57044
.011
-28.9619
-4.6881
A3
A1
-24.67500*
5.57044
.001
-36.8119
-12.5381
A2
7.02500
5.57044
.231
-5.1119
19.1619
A4
-9.80000
5.57044
.104
-21.9369
2.3369
A4
A1
-14.87500*
5.57044
.020
-27.0119
-2.7381
A2
16.82500*
5.57044
.011
4.6881
28.9619
A3
9.80000
5.57044
.104
-2.3369
21.9369
*.Themeandifferenceissignificantatthe0.05level.
(5)均值折线图
(6)分析:
根据方差分析的多重比较结果,分别进行了两两比较,以A2品种与A1
、A3、A4的比较为例。
A2品种与A1、A3、A4种的均值相差分别为-31.70000、-7.02500、-16.82500,而且所有的相伴概率sig=0.000<0.05,这说明了A2种与
其他三种饲料均具有显著性差异,而且从产量均值的差异上看MeanDifference(I-J)均低于其他3种品种,说明A2种的效果没有其他品种的效果好。
第二题:
某公司希望检测四种类型的轮胎A,B,C,D的寿命(由行驶的里程数决定),见表6.18(单位:
千英里)(数据文件为data6-5.sav),其中每种轮胎应用在随机选择的6辆汽车上。
在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异?
(数据来源:
《统计学(第三版)》,M.R.斯皮格尔,科学出版社)
表6.18四种轮胎的寿命数据
A
33
38
36
40
31
35
B
32
40
42
38
30
34
C
31
37
35
33
34
30
D
29
34
32
30
33
31
1本题的实验原理:
单因素方差分析
单因互方差分析(One-wayANOVA)称为一维方差分析,它检验由单一因素影响的一个(或几个相互独立的)因变量,由因素各水平分组的均值之间的差异,是否具有统计意义,或者说它们是否来源于同一总体。
2实验步骤:
第1步分析:
由于有一个因素(不同的轮胎),而且是4种品种。
故不能用独立样本T检验(仅适用两组数据),这里可用单因素方差分析;
第2步数据的组织:
分成两列,一列是轮胎的寿命,另一列是四种类型的轮胎(分别用A、B、C、D标识);
第3步方差相等的齐性检验:
由于方差分析的前提是各个水平下(这里是不同的饲料folder影响下的产量)的总体服从方差相等的正态分布。
其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。
因此必须对方差相等的前提进行检验。
点开Options,选中Homogeneityofvariancetest(方差齐性检验)。
3实验结果
(1)不同类型轮胎的奇性检验结果
TestofHomogeneityofVariances
里程
LeveneStatistic
df1
df2
Sig.
3.088
3
20
.050
(2)几种类型轮胎的方差检验结果
ANOVA
里程
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
77.500
3
25.833
2.388
.099
WithinGroups
216.333
20
10.817
Total
293.833
23
(3)均值折线图
(4)分析:
从均值折线图上反映出来四种轮胎相互之间均存在显著性差异,从效果来看B种最好,D种最差。
第三题:
将4种不同的水稻品种A1,A2,A3,A4安排在面积相同的4种不同土质的地块B1,B2,B3,B4中试种,测得各地块的产量(kg)如表6.19(数据文件为data6-6.sav),试分别在显著性水平为0.05和0.01下检验不同水稻品种、不同土质及二者交互作用对水稻产量的影响。
(数据来源:
《SPSS实用统计分析》郝黎仁,中国水利水电出版社)
表6.19四种水稻的产量数据
B1
B2
B3
B4
A1
135
120
147
132
A2
154
129
125
125
A3
125
129
120
133
A4
115
124
119
123
1、本题实验原理:
双因素方差分析
如果同时研究两个或多个因子对试验结果(对单一的因变量)的影响,就称为双因子方差分析(Two-wayANOVA)。
2、实验步骤:
第1步分析:
需要研究显著性水平为0.05和0.01下检验不同水稻品种、不同土质及二者交互作用对水稻产量的影响,这是一个多因素(双因素)方差分析问题。
第2步按Analyze|GeneralLinearModel|Univariate的步骤打开Univariate对话框。
并将“产量”变量移入DependentVariable框中,将“品种”和“土质”移入FixedFactor(s)中,
第3步单击Options,由于方差分析的前提上方差相等,故应进行方差齐性检验,选中“Homogeneitytests”,
第4步通过以上步骤只能判断两个控制变量的不同水平是否对观察变量产生了显著影响。
如果想进一步了解究竟是哪个组与其他组有显著的均值差别,就需要在多个样本均数间两两比较。
(这与前面的单因素方差分析一致)。
打开Univariate:
PostHocMultipleComparisonsforObservedMeans对话框,在其中选出需要进行比较分析的对话框,这里选“品种”,再选择一种方差相等时的检验模型和不相等时的检验模型(这样两种情况均可应对
第5步选择建立多因素方差分析的模型种类。
打开Model对话框,本例用默认的Fullfactorial模型。
这种模型将观察变量总的变异平方和分解为多个控制变量对观察变量的独立部分、多个控制变量交互作用部分以及随机变量影响部分
第6步以图形方式展示交互效果。
如果各因素间无交互效果,则各个水平对应的图形应近于平行,否则相交。
点开Plots,选两个变量之交互作用,
第7步对控制变量各个水平上的观察变量的差异进行对比检验。
选择Contrasts对话框,对两种因素均进行对比分析,方法用Simple方法,并以最后一个水平的观察变量均值为标准。
(选择Contrasts方式后需单击Change进行确认)
第8步运行结果及分析。
完成以上设置后单击OK运行对其结果及分析
3、实验结果:
(1)分组描述表
Between-SubjectsFactors
ValueLabel
N
水稻
1
A1
4
2
A2
4
3
A3
4
4
A4
4
土地
1
B1
4
2
B2
4
3
B3
4
4
B4
4
(2)多因素方差分析及交互检验结果表
TestsofBetween-SubjectsEffects
DependentVariable:
产量
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
1571.938a
15
104.796
.
.
Intercept
263939.062
1
263939.062
.
.
rice
474.687
3
158.229
.
.
soil
94.688
3
31.563
.
.
rice*soil
1002.562
9
111.396
.
.
Error
.000
0
.
Total
265511.000
16
CorrectedTotal
1571.938
15
a.RSquared=1.000(AdjustedRSquared=.)
(3)交互影响折线图
(4)分析:
有最终的交互影响折线图来看,A2品种在B1土地上种植最终的产量最高。
第四题:
某超市将同一种商品做3种不同的包装(A)并摆放在3个不同的货架区(B)进行销售试验,随机抽取3天的销售量作为样本,具体资料见表6.20。
要求检验:
在显著性水平0.05下商品包装、摆放位置及其搭配对销售情况是否有显著性影响。
(数据来源:
《应用统计学》耿修林,科学出版社;数据文件:
data6-7.sav)
表6.20销售样本资料
B1
B2
B3
A1
5,6,4
6,8,7
4,3,5
A2
7,8,8
5,5,6
3,6,4
A3
3,2,4
6,6,5
8,9,6
1、本题实验原理:
协方差分析
协方差分析是利用线性回归的方法消除因素的影响后进行的方差比较。
就是说先从因变量的总偏差平方和中去除协变量对因变量的回归平方和,再对残差平方和进行分解,进行方差分析。
例如考虑药物对患者某个生化指标变化的影响,要比较实验组与对照组该指标的匀值是否有显著性差异以确定药物的有效性,可能要考虑患者病程的长短、年龄以及原指标水平对疗效的影响。
要消除这些因素的影响,考虑药物疗效,才是科学的分析方法。
这些混杂的因素变量称为协变量。
2、实验步骤:
第1步分析:
就应该用到协方差分析。
第2步将不同货架作为协变量。
第3步其它设置与多因素方差分析大同小异。
第4步主要结果及分析,
3、实验结果:
(1)分组描述表
Between-SubjectsFactors
ValueLabel
N
包装
1
A1
9
2
A2
9
3
A3
9
摆放位置
1
B1
9
2
B2
9
3
B3
9
(2)因素方差分析及交互检验结果表
TestsofBetween-SubjectsEffects
DependentVariable:
销量
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
65.407a
8
8.176
7.612
.000
Intercept
822.259
1
822.259
765.552
.000
casing
.963
2
.481
.448
.646
place
3.185
2
1.593
1.483
.253
casing*place
61.259
4
15.315
14.259
.000
Error
19.333
18
1.074
Total
907.000
27
CorrectedTotal
84.741
26
a.RSquared=.772(AdjustedRSquared=.670)
(3)交互影响折线图
(4)分析:
由交互影响折线图可以看到,把A2包装的商品放在B1货架上和把Z3包装的商品放在B3货架上销售量最高。
第五题:
研究杨树一年生长量与施用氮肥和钾肥的关系。
为了研究这种关系,一共进行了18个样地的栽培实验,测定杨树苗的一年生长量、初始高度、全部实验条件(包括氮肥量和钾肥量)及实验结果(杨树苗的生长量)数据如表6.21,请在显著水平0.05下检验氮肥量、钾肥量及树苗初始高度中哪些对杨树的生长有显著性影响。
(数据来源:
《生物数学模型的统计学基础》李勇,科学出版社;数据文件:
data6-8.sav)
表6.21杨树栽培试验数据
序号
氮肥量
钾肥量
树苗初高
生长量
序号
氮肥量
钾肥量
树苗初高
生长量
1
少
0
4.5
1.85
10
多
0
6.5
2.15
2
少
0
6
2
11
多
0
6
1.99
3
少
0
4
1.6
12
多
0
6.5
2.06
4
少
12.5
6.5
2
13
多
12.5
4
1.93
5
少
12.5
7
2.04
14
多
12.5
6
2.1
6
少
12.5
5
1.91
15
多
12.5
5.5
2.15
7
少
25
7
2.4
16
多
25
5
4.2
8
少
25
5
4.25
17
多
25
6
2.3
9
少
25
5
2.1
18
多
25
5.5
4.25
1、实验原理:
多因素方差分析
如果同时研究两个或多个因子对试验结果(对单一的因变量)的影响,就称为双因子方差分析(Two-wayANOVA)。
2、实验步骤:
同第三题的步骤差不多,只是在DependentVariable框中选择多个控制变量。
3、实验结果:
①方差齐性检验结果
Levene'sTestofEqualityofErrorVariancesa
DependentVariable:
生长量
F
df1
df2
Sig.
1.752
5
10
.211
Teststhenullhypothesisthattheerrorvarianceofthedependentvariableisequalacrossgroups.
a.Design:
Intercept+氮肥量+钾肥量+树苗初高+氮肥量*钾肥量*树苗初高
②协变量与因变量交互作用检验
TestsofBetween-SubjectsEffects
DependentVariable:
生长量
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
.444a
7
.063
10.052
.002
Intercept
.672
1
.672
106.437
.000
氮肥量
9.313E-5
1
9.313E-5
.015
.906
钾肥量
.019
2
.010
1.504
.279
树苗初高
.127
1
.127
20.158
.002
氮肥量*树苗初高
.001
1
.001
.118
.740
钾肥量*树苗初高
.016
2
.008
1.243
.339
Error
.051
8
.006
Total
67.448
16
CorrectedTotal
.495
15
a.RSquared=.898(AdjustedRSquared=.809)
③协方差分析主要结果
TestsofBetween-SubjectsEffects
DependentVariable:
生长量
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
.429a
4
.107
17.771
.000
Intercept
1.006
1
1.006
166.755
.000
氮肥量
.048
1
.048
8.030
.016
钾肥量
.267
2
.134
22.174
.000
树苗初高
.159
1
.159
26.285
.000
Error
.066
11
.006
Total
67.448
16
CorrectedTotal
.495
15
a.RSquared=.866(AdjustedRSquared=.817)
(3)对结果的分析:
①由协变量与因变量交互作用检验结果可以看出,氮肥量与树苗初高的交互作用项Sig=0.74>0.05,且钾肥量与树苗初高的交互作用项Sig=0.339>0.05,因此认为氮肥量和钾肥量与树苗初高之间没有交互作用,因此,可用协方差分析来处理。
②由协方差分析的主要结果可以看出,钾肥量Sig=0.000<0.05,树苗初高Sig=0.000<0.05,说明钾肥量和树苗初高对杨树的生长有显著性影响,而氮肥量Sig=0.16>0.05,说明氮肥量对杨树的生长没有显著性影响。
实训的心得与体会
通过本次实验用spass统计分析软件来进行方差分析后,感觉统计学中的很多问题不再像以前那么陌生了,同时也感觉统计学不再是想象中那么困难,之前学习统计学最怕的就是对数据进行求解与分析,现在使用这款软件后,让我从之前对统计学的陌生转变为熟悉,从此,在解决统计方面的问题又多了一项解决的工具:
spss。
在本章学习了用spss软件方差分析后,我学会了单因素、双因素及多因素的方差分析。
进一步,在掌握了关键因素,如品种、施肥量等以后,还需要对不同的施肥量进行对比分析,研究究竟哪个品种的产量的产量高,施肥