方差分析2 实验报告.docx
《方差分析2 实验报告.docx》由会员分享,可在线阅读,更多相关《方差分析2 实验报告.docx(19页珍藏版)》请在冰豆网上搜索。
方差分析2实验报告
评分
实验报告
课程名称生物医学统计分析
实验名称方差分析2
专业班级
姓名
学号
实验日期
实验地点
2015—2016学年度第2学期
一、实验目的
巩固掌握前次实验方差分析中的:
1.均数差别的显著性检验2.分离各有关因素并估计其对总变异的作用3.分析因素间的交互作用4.方差齐性检验。
学习利用协方差分析消除混杂因素对分析指标的影响。
二、实验环境
1、硬件配置:
处理器:
Intel(R)Core(TM)i7-3770CPU@3.40GHz3.40GHz
安装内存(RAM):
4.00GB系统类型:
64位操作系统
2、软件环境:
IBMSPSSStatistics19.0软件
三、实验内容
(包括本实验要完成的实验问题及需要的相关知识简单概述)
(1)课本第四章的例4.5-4.9运行一遍,注意理解结果;
(2)然后将课本第五章的例5.1-5.2运行一遍,注意理解结果。
三、实验结果与分析
例4.5
输出结果:
表1不同温度、产蛋期、鸡群对蛋鸡产蛋量影响的方差分析结果(主体间效应的检验)
因变量:
产蛋量
源
III型平方和
df
均方
F
Sig.
校正模型
82.880a
12
6.907
4.584
.007
截距
12056.040
1
12056.040
8001.796
.000
产蛋期
27.360
4
6.840
4.540
.018
鸡群
22.160
4
5.540
3.677
.035
温度
33.360
4
8.340
5.535
.009
误差
18.080
12
1.507
总计
12157.00
25
校正的总计
100.960
24
a.R方=.821(调整R方=.642)
分析:
1)本实验主要是为了研究5种不同温度对蛋鸡产蛋量的影响,但由于不同的鸡群和产蛋期对产蛋量也有较大的影响,因此我们选用拉丁方设计;
2)本实验由于我们选中了“描述性统计”和“Tukey的多重比较方法”,因此输出结果中还有输出样本的描述统计量和产蛋期、鸡群和温度的多重比较结果,但由于本次实验主要是分析3种因素对产蛋量的影响,并不研究到影响因素的具体细化部分,因此我们只选取主体间效应的检验部分进行分析;
3)根据表1可知:
产蛋期间的
,鸡群间的
因此说明不同产蛋期和不同鸡群对产蛋量具有显著的影响;而温度间的
因此说明不同温度对产蛋期具有极显著的影响。
4)拉丁方设计要求每个区组的组数和试验因素的处理数都必须相等,且应假定3个因素之间不存在交互作用,因此在本次实验中需选择主效应模型。
例4.6
输出结果:
表2两种饲料对产奶量影响的方差分析表(主体间效应的检验)
因变量:
产奶量
源
III型平方和
df
均方
F
Sig.
校正模型
76.050a
11
6.914
7.577
.004
截距
4651.250
1
4651.250
5097.260
.000
饲料A
30.258
1
30.258
33.159
.000
时期C
.162
1
.162
.178
.685
个体B
45.630
9
5.070
5.556
.012
误差
7.300
8
.912
总计
4734.600
20
校正的总计
83.350
19
a.R方=.912(调整R方=.792)
分析:
1)本实验主要是为了研究新配方饲料对产奶量的影响,故设立了对照组与其进行对比,但由于试验的奶牛个体之间以及试验期间的差异都对试验结果有影响,为了尽可能地消除这种影响,因此我们选择
交叉设计法;
2)本实验由于我们选中了“描述性统计”,因此输出的结果中还有描述统计量,由于数据量过大,因此我们没有把运行结果粘贴过来,但我们可以从描述性统计量表得出不同饲料在不同时期和不同个体间的均值和标准差;
3)根据表2可知,饲料间的
说明新配方饲料与对照饲料对平均产奶量的影响差异极显著,这里表现为新配方饲料的平均产奶量极显著高于对照饲料的平均产奶量。
且我们可以看出按照
交叉设计方法进行试验的结果中已经较大的消除预饲期对试验结果的影响,但不同奶牛之间对产奶量的影响还是极为显著,因此消除效果并不好;
4)在
交叉设计资料中,因子间的交互作用包括在误差项,分析时应注意不要引入交互作用,应选择主效应模型。
且本实验只分为两组,故不需要作均数间的多重比较。
例4.7
输出结果:
表3补饲配方、用量、食盐对增重影响的方差分析表(主体间效应的检验)
因变量:
增重
源
III型平方和
df
均方
F
Sig.
校正模型
86.787a
6
14.464
2.000
.370
截距
41629.601
1
41629.601
5757.013
.000
配方A
5
.429
2
28.714
3.971
.201
用量B
15.109
2
7.554
1.045
.489
食盐C
14.249
2
7.124
.985
.504
误差
14.462
2
7.231
总计
41730.850
9
校正的总计
101.249
8
a.R方=.857(调整R方=.429)
分析:
1)因为要全面对补饲配方、用量、食盐3个因素进行实验,规模会很大,因此我们选用
正交表进行正交设计,以减小试验规模,并且不使信息损失得太多;
2)本实验由于我们选中了“描述性统计”,因此输出的结果中还有描述统计量,由于数据量过大,因此我们没有把运行结果粘贴过来,但我们可以从描述性统计量表得出不同配方在不同用量和不同食盐内的均值和标准差;
3)据表3可知,配方间的
用量间的
,
食盐间的
说明不同配方、不同用量、不同食盐对增重皆没有影响;
4)本实验还对补饲配方、用量、食盐采用S-N-K法进行多重比较,但由于数据量过大,因此我们没有粘贴过来,但我们从输出结果可以看出不同配方、不同用量、不同食盐间位于同一列,因此它们的均数之间不存在差异;
5)因为本实验是无重复观察值无交互作用,因此选择主效应模型。
例4.8
输出结果:
表4温度、菌系、培养时间对根瘤菌生长影响的方差分析表主体间效应的检验
因变量:
根瘤菌数
源
III型平方和
df
均方
F
Sig.
校正模型
306045.833a
9
34005.093
35.052
.000
截距
1.563E7
1
1.563E7
16114.567
.000
A
86877.778
2
43438.889
44.776
.000
B
209211.111
2
104605.556
107.825
.000
空列
86.111
2
43.056
.044
.957
C
5669.444
2
2834.722
2.922
.112
重复组
4201.389
1
4201.389
4.331
.071
误差
7761.111
8
970.139
总计
1.595E7
18
校正的总计
313806.944
17
a.R方=.975(调整R方=.947)
表5各温度间根瘤菌数均数的两两比较
Student-Newman-Keulsa,b
A
N
子集
1
2
3
6
834.17
2
6
972.50
1
6
989.17
Sig.
1.000
.381
已显示同类子集中的组均值。
基于观测到的均值。
误差项为均值方(错误)=970.139。
a.使用调和均值样本大小=6.000。
b.Alpha=.05。
表6各菌系间根瘤菌数均数的两两比较
Student-Newman-Keulsa,b
B
N
子集
1
2
3
2
6
835.83
1
6
877.50
3
6
1082.50
Sig.
1.000
1.000
1.000
已显示同类子集中的组均值。
基于观测到的均值。
误差项为均值方(错误)=970.139。
a.使用调和均值样本大小=6.000。
b.Alpha=.05。
表7各培养时间内根瘤菌数的两两比较
Student-Newman-Keulsa,b
C
N
子集
1
2
6
915.83
3
6
923.33
1
6
956.67
Sig.
.118
已显示同类子集中的组均值。
基于观测到的均值。
误差项为均值方(错误)=970.139。
a.使用调和均值样本大小=6.000。
b.Alpha=.05。
分析:
1)因为本实验目的在于考察温度、菌系、培养时间的主效应并筛选最佳组合,因此我们选用
正交表进行分析;
2)本实验由于我们选中了“描述性统计”,因此输出的结果中还有描述统计量,由于数据量过大,因此我们没有把运行结果粘贴过来,但我们可以从描述性统计量表得出不同温度在不同菌系和不同培养时间内的均值和标准差;
3)根据表4可知,温度间的
说明不同温度对根瘤菌的生长有极显著影响;菌系间的
,说明不同菌系对根瘤菌的生长也具有极显著的影响;而时间间的
说明不同培养时间对根瘤菌的生长不具有显著影响。
正交表中的第三列(空列)为各因子互相效应一部分数量的混杂,题中预先估计因子间无互作,这一列便可作误差看待,可与表中的误差项合并,以增加自由度。
合并后的误差自由
温度间的
菌系间的
时间间的
。
4)由于不同培养时间对根瘤菌的生长作用不明显,因此我们应考察不同温度、菌系根瘤菌均数的多重比较结果,选出最优组合,根据表5、表6、和表7我们不仅可以得出不同时间的根瘤菌均数差异不大、低温度和高中温度的根瘤菌均数差异大和三个菌系间的根瘤菌数均数差异大,还可以看出选择高温度和丙菌类为最优组合。
例4.9
输出结果:
表8主体间效应的检验
因变量:
试验结果
源
III型平方和
df
均方
F
Sig.
校正模型
6627.625a
5
1325.525
23.003
.042
截距
55278.125
1
55278.125
959.273
.001
A
1431.125
1
1431.125
24.835
.038
B
21.125
1
21.125
.367
.606
AB
4950.125
1
4950.125
85.902
.011
C
210.125
1
210.125
3.646
.196
BC
15.125
1
15.125
.262
.659
误差
115.250
2
57.625
总计
62021.000
8
校正的总计
6742.875
7
a.R方=.983(调整R方=.940)
分析:
1)因为本实验不仅研究A、B、C三种成分对发酵培养基的影响,且A与B、B与C中存在交互作用,因此试验采用
正交表进行设计;
2)本实验由于我们选中了“描述性统计”,因此输出的结果中还有描述统计量,由于数据量过大,因此我们没有把运行结果粘贴过来,但我们可以从描述性统计量表得出每一种成分或成分组合在其他成分内的均值和标准差;
3)表8为F检验的结果,其中A因素的
,说明A因素对抗生素有显著的影响;交互作用A
B的
,说明A
B的交互作用对抗生素有显著的影响;而B、C因素以及B
C交互作用的F值分别为0.367,3.646,0.262,P值分别为0.606,0.196,0.659,均大于0.05,说明B、C因素以及B
C交互作用对抗生素没有显著的影响,故应对A与B的水平组合进行多重比较,一选出A与B因子的最优水平组合;
4)由于本例各因子只有两个水平,组数少于3,故无法进行均数间的两两比较。
例5.1
输出结果:
表9描述性统计量
因变量:
末重y
处理组
均值
标准偏差
N
dimension1
1
11.8167
.94660
12
2
10.8417
1.32353
12
3
12.0667
1.66697
12
4
11.1500
1.51927
12
总计
11.4687
1.43485
48
表10误差方差等同性的Levene检验a
因变量:
末重y
F
df1
df2
Sig.
.663
3
44
.579
检验零假设,即在所有组中因变量的误差方差均相等。
a.设计:
截距+初生重x+处理组
表11协方差分析结果表
因变量:
末重y
源
III型平方和
df
均方
F
Sig.
校正模型
59.295a
4
14.824
17.013
.000
截距
2.092
1
2.092
2.401
.129
初生重x
47.615
1
47.615
54.645
.000
处理组
20.435
3
6.812
7.817
.000
误差
37.468
43
.871
总计
6410.310
48
校正的总计
96.763
47
a.R方=.613(调整R方=.577)
表12参数估计
因变量:
末重y
参数
B
标准误差
t
Sig.
95%置信区间
下限
上限
截距
2.840
1.156
2.457
.018
.509
5.171
初生重x
7.200
.974
7.392
.000
5.236
9.164
[处理组=1]
-1.973
.522
-3.778
.000
-3.027
-.920
[处理组=2]
-1.238
.401
-3.086
.004
-2.048
-.429
[处理组=3]
-.163
.408
-.400
.691
-.986
.660
[处理组=4]
0a
.
.
.
.
.
a.此参数为冗余参数,将被设为零。
表13各处理组的校正50日龄平均重
因变量:
末重y
处理组
均值
标准误差
95%置信区间
下限
上限
dimension1
1
10.339a
.335
9.663
11.016
2
11.074a
.271
10.527
11.621
3
12.149a
.270
11.605
12.693
4
12.312a
.312
11.683
12.942
a.模型中出现的协变量在下列值处进行评估:
初生重x=1.3156.
表14各处理组的校正50日龄平均重多重比较
因变量:
末重y
(I)处理组
(J)处理组
均值差值(I-J)
标准误差
Sig.a
差分的95%置信区间a
下限
上限
dimension1
1
dimension2
2
-.735
.446
.107
-1.634
.164
3
-1.810*
.436
.000
-2.688
-.931
4
-1.973*
.522
.000
-3.027
-.920
2
dimension2
1
.735
.446
.107
-.164
1.634
3
-1.075*
.382
.007
-1.845
-.305
4
-1.238*
.401
.004
-2.048
-.429
3
dimension2
1
1.810*
.436
.000
.931
2.688
2
1.075*
.382
.007
.305
1.845
4
-.163
.408
.691
-.986
.660
4
dimension2
1
1.973*
.522
.000
.920
3.027
2
1.238*
.401
.004
.429
2.048
3
.163
.408
.691
-.660
.986
基于估算边际均值
a.对多个比较的调整:
最不显著差别(相当于未作调整)。
*.均值差值在.05级别上较显著。
分析:
1)因为本实验的初生重对分析试验结果会造成影响,且是成组设计,因此我们选择单向分组资料的协方差分析;
2)由表9可知,4个处理组未校正50日龄平均重分别为11.8167,10.841,12.066,7,和11.1500;标准差分别为0.94660,1.32353,1.66697和1.51927;
3)表10位方差齐性检验结果,其中
因此说明在0.05的显著水平上,可以认为各组方差无显著差异;
4)表11为协方差分析结果,其中初生重的
说明仔猪初生重与50日龄重间存在极显著的线性回归关系,说明初生重对50日龄重有极显著的影响,因而有必要进行协方差分析,即利用线性回归关系来校正50日龄重,并对校正后的50日龄重作方差分析。
且其中经校正后的处理组的
,说明不同处理组间的50日龄重有极显著的差异,故须进一步检验不同处理组间的差异显著性,即进行多重比较;
5)表12为参数估计的结果,其中因变量(50日龄重)对协变量(初始体重)的回归系数B=7.200,两者成正相关关系,即初始体重越大,则50日龄重会随之越大;
6)表13为4个处理组校正50日龄的平均重、标准误差及相应的置信区间。
4个处理组校正50日龄平均重分别为10.339,11.074,12.149和12.312;标准误分别为0.335,0.271,0.270,和0.312。
表下方的提示表明该校正50日龄平均重是按初生重均为1.3156kg的情形计算的;
7)表14为4个处理组校正50日龄的平均重多重比较结果。
结果表明:
饲粮2、饲粮3与对照饲粮、饲粮1比较,其校正50日龄的平均重间存在极显著差异;饲粮2与饲粮1,对照饲粮3与饲粮4之间无显著差异,因此可知4种饲粮以饲粮2、饲粮3的增重效果为好。
例5.2
输出结果:
表15主体间效应的检验
因变量:
产量y
源
III型平方和
df
均方
F
Sig.
校正模型
2003.155a
8
250.394
57.810
.000
截距
17.271
1
17.271
3.987
.071
品种
1561.447
4
390.362
90.125
.000
区组
4.966
3
1.655
.382
.768
株数x
220.355
1
220.355
50.874
.000
误差
47.645
11
4.331
总计
19574.000
20
校正的总计
2050.800
19
a.R方=.977(调整R方=.960)
表16各品种组的校正平均产量
因变量:
产量y
品种
均值
标准误差
95%置信区间
下限
上限
A
23.691a
1.499
20.393
26.990
B
34.923a
1.075
32.557
37.289
C
31.154a
1.172
28.575
33.734
D
16.232a
1.318
13.331
19.132
E
42.000a
1.041
39.710
44.290
a.模型中出现的协变量在下列值处进行评估:
株数x=12.00.
表17各品种组的校正平均产量多重比较表
因变量:
产量y
(I)品种
(J)品种
均值差值(I-J)
标准误差
Sig.a
差分的95%置信区间a
下限
上限
dimension1
A
dimension2
B
-11.232*
1.679
.000
-14.927
-7.536
C
-7.463*
2.187
.006
-12.276
-2.650
D
7.460*
2.393
.010
2.193
12.727
E
-18.309*
1.824
.000
-22.324
-14.293
B
dimension2
A
11.232*
1.679
.000
7.536
14.927
C
3.768*
1.679
.046
.073
7.464
D
18.691*
1.824
.000
14.676
22.707
E
-7.077*
1.496
.001
-10.370
-3.784
C
dimension2
A
7.463*
2.187
.006
2.650
12.276
B
-3.768*
1.679
.046
-7.464
-.073
D
14.923*
1.496
.000
11.630
18.216
E
-10.846*
1.567
.000
-14.295
-7.396
D
dimension2
A
-7.460*
2.393
.010
-12.727
-2.193
B
-18.691*
1.824
.000
-22.707
-14.676
C
-14.923*
1.496
.000
-18.216
-11.630
E
-25.768*
1.679
.000
-29.464
-22.073
E
dimension2
A
18.309*
1.824
.000
14.293
22.324
B
7.077*
1.496
.001
3.784
10.370
C
10.846*
1.567
.000
7.396
14.295
D
25.768*
1.679
.000
22.073
29.464
基于估算边际均值
*.均值差值在.05级别上较显著。
a.对多个比较的调整:
最不显著差别(相当于未作调整)。
分析:
1)由于本实验是随机分组,因此选用双向资料协方差分析;
2)表15为方差分析结果。
结果表明,协变量株数的
说明株数与产量间存在极显著