SPSS软件分析5方差分析作业.docx
《SPSS软件分析5方差分析作业.docx》由会员分享,可在线阅读,更多相关《SPSS软件分析5方差分析作业.docx(28页珍藏版)》请在冰豆网上搜索。
SPSS软件分析5方差分析作业
实验五SPSS的方差分析
1*统计**班邵***201******
(二)实践性实验
(1)一家管理咨询公司为不同的客户进行人力资源管理讲座,每次讲座的内容基本上是一样的,但讲座的听课者有高级管理者、中级管理者、低级管理者。
该咨询公司认为,不同层次的管理者对两座的满意度是不同的。
对听完讲座后的满意度随机调查中,不同层次管理者的满意度评分如下(1~10分,10代表非常满意),取显著性水平
,试用单因素方差分析判断管理者的水平是否会导致评分的显著性差异?
如有差异,具体什么差异?
描述
管理者满意度
N
均值
标准差
标准误
均值的95%置信区间
极小值
极大值
下限
上限
高级
5
7.60
.894
.400
6.49
8.71
7
9
中级
7
8.86
.900
.340
8.03
9.69
8
10
低级
6
5.83
1.472
.601
4.29
7.38
4
8
总数
18
7.50
1.689
.398
6.66
8.34
4
10
此表为对不同水平管理者满意度的基本描述统计量及95%的置信区间,此表表明对中级管理者的满意度最高,对高级管理者的满意度次之,对低级管理者满意度最低。
方差齐性检验
管理者满意度
Levene统计量
df1
df2
显著性
1.324
2
15
.296
此处采用方差齐性检验
假设:
对不同水平下管理者的满意度的方差相同。
对不同水平下的管理者的满意度的方差齐性检验为1.324,概率p值为0.296,如果显著水平设为0.05,由于概率p值大于显著水平,不能拒绝原假设,认为对不同水平下管理者的满意度的方差相同。
故满足方差分析的前提要求。
ANOVA
管理者满意度
平方和
df
均方
F
显著性
组间
(组合)
29.610
2
14.805
11.756
.001
组内
18.890
15
1.259
总数
48.500
17
采用单因素方差分析。
假设:
对不同水平的管理者的满意度没有显著差异。
此表为管理者的不同等级对对管理者的满意度的单因素方差分析结果。
可以看出观测变量满意度的总离差平方和是48.5,如果考虑“管理者的不同等级”单因素的影响,则销售额总变差中,不同水平可解释的变差为29.61,抽样误差引起的变差为18.89,他们的方差(平均变差),分别为14.805,1.259.相除所得的F统计量的观测值为11.756,对应的P值近似为0,给定显著水平为0.05,由于概率p值小于显著水平,则拒绝原假设,认为对不同水平的管理者的满意有显著差异。
多重比较
因变量:
管理者满意度
(I)水平
(J)水平
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
LSD
高级
中级
-1.257
.657
.075
-2.66
.14
低级
1.767*
.680
.020
.32
3.22
中级
高级
1.257
.657
.075
-.14
2.66
低级
3.024*
.624
.000
1.69
4.35
低级
高级
-1.767*
.680
.020
-3.22
-.32
中级
-3.024*
.624
.000
-4.35
-1.69
Bonferroni
高级
中级
-1.257
.657
.225
-3.03
.51
低级
1.767
.680
.060
-.06
3.60
中级
高级
1.257
.657
.225
-.51
3.03
低级
3.024*
.624
.001
1.34
4.71
低级
高级
-1.767
.680
.060
-3.60
.06
中级
-3.024*
.624
.001
-4.71
-1.34
Tamhane
高级
中级
-1.257
.525
.118
-2.80
.28
低级
1.767
.722
.112
-.38
3.91
中级
高级
1.257
.525
.118
-.28
2.80
低级
3.024*
.690
.007
.95
5.10
低级
高级
-1.767
.722
.112
-3.91
.38
中级
-3.024*
.690
.007
-5.10
-.95
*.均值差的显著性水平为0.05。
\采用多重比较检验
原假设:
对不同水平管理者的满意度没有显著差别。
此表显示了两两管理者水平下对管理者满意度均值的检验结果。
可以看出,尽管在理论上各种检验方法对抽样分布标准误的定义不同,此种软件全部采用了LSD方法的中标准误。
因此各种方法计算的前两列计算结果完全相同。
表中没有给出检验统计量的观测值,他们都是相等的。
表中第三列式检验统计量在不同分布下的概率p值,可以发现各种方法在检验敏感度上的差异。
此题用LSD方法。
给定显著水平为0.05,高级管理者和中级管理者检验的概率p值为0.075,大于显著水平,因此接受原假设,认为对高级管理者和中级管理者的满意度与他们的水平没有关系。
给定显著水平为0.05,高级管理者和低级管理者检验的概率p值为0.02,小于显著水平,因此拒绝原假设,认为对高级管理者和低级管理者的满意度与他们的水平有关系。
给定显著水平为0.05,中级管理者和低级管理者检验的概率p值为0.007,小于显著水平,因此不能接受原假设,认为对中级管理者和低级管理者的满意度与他们的水平有关系。
单因素方差分析
管理者满意度
平方和
df
均方
F
显著性
组间
(组合)
29.610
2
14.805
11.756
.001
线性项
未加权的
8.512
1
8.512
6.759
.020
加权的
10.074
1
10.074
7.999
.013
偏差
19.536
1
19.536
15.513
.001
组内
18.890
15
1.259
总数
48.500
17
采用趋势检验
原假设:
管理者的不同水平和对管理者的满意度是零线性相关。
趋势检验时,将观测变量的组间差作进一步的细分,分解为可被管理者的水平线性解释的变差以及不可被管理者水平线性解释的变差,(第四行19.536=29.61-10.074)。
其中,可被管理者水平线性解释的变差实质是,观测变量(对管理者的满意度)为被解释变量,控制变量(管理者水平)为解释变量的一元线性回归分析中的回归平方和部分。
体现了解释变量对被解释变量的线性贡献程度。
对应第五列的F值(7.999)是回归平方和的均方(10.074)除以组离差平方和的均方(1.259)的结果。
对应概率得的p值为0.013,给定显著水平为0.05,p值小于显著水平,所以拒绝原假设,认为管理者的不同水平和对管理者的满意度不是零线性相关,即是说管理者的不同水平和对管理者的满意度是线性相关。
此图为对不同管理者水平满意度的均值折线图,从图表可知,管理者水平和对管理者的满意度之间没有明显的线性相关关系。
管理者满意度
水平
N
alpha=0.05的子集
1
2
Student-Newman-Keulsa,b
低级
6
5.83
高级
5
7.60
中级
7
8.86
显著性
1.000
.074
TukeyHSDa,b
低级
6
5.83
高级
5
7.60
中级
7
8.86
显著性
1.000
.167
Scheffea,b
低级
6
5.83
高级
5
7.60
7.60
中级
7
8.86
显著性
.051
.192
将显示同类子集中的组均值。
a.将使用调和均值样本大小=5.888。
b.组大小不相等。
将使用组大小的调和均值。
将不保证I类错误级别。
采用单因素分析-两两比较的各种方法
此表示各种方法划分的相似子集,可以看到,表中的前两种方法划分是一致的,第三种方法与前两种方法大致一致。
给定显著水平为0.05的情况下。
首先观察S-N-K方法的结果,均值为5.83的组(低级管理者的满意度)与其他两组的均值有显著不同(其相似度可能性小于0.05),被划分出来,形成两个相似性子集。
在第一个相似(自身)的概率为1,第二组相似的可能性大于0.05,为0.074,。
其次观察Tukey HSD方法的结果,均值为5.83的组(低级管理者的满意度)与其他两组的均值有显著不同(其相似度可能性小于0.05),被划分出来,形成两个相似性子集。
在第一个相似(自身)的概率为1,第二组相似的可能性大于0.05,为0.167,。
首先观察Scheffe方法的结果,均值为5.83的组(低级管理者的满意度)和均值为7.60(高级管理者的满意度)与均值为8.86的组(中级管理者的满意度)和均值为7.60(高级管理者的满意度)均值有显著不同(其相似度可能性小于0.05),被划分出来,形成两个相似性子集。
在第一个相似(自身)的概率为0.051,第二组相似的可能性大于0.05,为0.192,。
总之,如果从管理者水平角度选择,则不应选择低级管理者。
可考虑高级管理者和中级管理者结合的方式。
对比系数
对比
水平
高级
中级
低级
1
1
-1
0
对比检验
对比
对比值
标准误
t
df
显著性(双侧)
管理者满意度
假设方差相等
1
-1.26
.657
-1.913
15
.075
不假设等方差
1
-1.26
.525
-2.394
8.805
.041
采用先验对比检验
假设:
对高级管理者和中级管理者的满意度没有显著差异。
上表为不同管理者水平先验对比检验的系数说明,下表为高级管理者和中级管理者整体效果对比检验结果。
根据前面的方差齐性检验可以得知,这两组方差近似相等,所以我们看第一行。
给定显著水平为0.05,由于t统计量的概率p(0.075)值大于显著水平,不应该拒绝原假设,接受原假设,认为对高级管理者和中级管理者的满意度没有显著差异。
(2)一家超市连锁店的老板进行一项研究,确定超市所在的位置和竞争者的数量对销售额是否有显著影响。
获得的月销售额数据(单位:
万元)见下表。
取显著性水平
,试用单因素和多因素方差分析全面分析竞争者的数量和超市的位置对销售额的影响。
单因素方差分析---竞争者的数量与销售额
描述
销售额
N
均值
标准差
标准误
均值的95%置信区间
极小值
极大值
下限
上限
0
9
30.44
8.575
2.858
23.85
37.04
18
45
1
9
29.56
7.316
2.439
23.93
35.18
17
39
2
9
42.56
11.876
3.959
33.43
51.68
26
59
3个以上
9
38.56
9.369
3.123
31.35
45.76
24
53
总数
36
35.28
10.590
1.765
31.69
38.86
17
59
此表为对不同竞争者的销售额的基本描述统计量及95%的置信区间,此表表明竞争者有两个的销售额最高,竞争者为三个以上的销售额接近于竞争者为2的销售额。
竞争者为1的销售额少,没有竞争者的销售额比竞争者为1的销售额稍微好一点。
方差齐性检验
销售额
Levene统计量
df1
df2
显著性
1.224
3
32
.317
此处采用方差齐性检验
假设:
对不同竞争者的销售额方差相同。
对不同竞争者的销售额的方差齐性检验为1.224,概率p值为0.317,如果显著水平设为0.01,由于概率p值大于显著水平,不能拒绝原假设,对不同竞争者的销售额方差相同。
故满足方差分析的前提要求。
ANOVA
销售额
平方和
df
均方
F
显著性
组间
1078.333
3
359.444
4.040
.015
组内
2846.889
32
88.965
总数
3925.222
35
采用单因素方差分析。
假设:
对有不同竞争者数目的销售额没有显著差异。
此表为不同竞争者数目的销售额的单因素方差分析结果。
可以看出观测变量销售额的总离差平方和是3925.222,如果考虑“竞争者的数目”单因素的影响,则销售额总变差中,不同竞争者数目可解释的变差为1078.333,抽样误差引起的变差为2848.889,他们的方差(平均变差),分别为359.444,88.965.相除所的观测值为4.04,对应的P值近似为0.015,给定显著水平为0.01,由于概率p值大于显著水平,则不能拒绝原假设,认为对有不同竞争者数目的销售额没有显著差异。
多重比较
因变量:
销售额
(I)竞争者数量
(J)竞争者数量
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
TukeyHSD
0
1
.889
4.446
.997
-11.16
12.94
2
-12.111*
4.446
.048
-24.16
-.06
3个以上
-8.111
4.446
.281
-20.16
3.94
1
0
-.889
4.446
.997
-12.94
11.16
2
-13.000*
4.446
.030
-25.05
-.95
3个以上
-9.000
4.446
.200
-21.05
3.05
2
0
12.111*
4.446
.048
.06
24.16
1
13.000*
4.446
.030
.95
25.05
3个以上
4.000
4.446
.805
-8.05
16.05
3个以上
0
8.111
4.446
.281
-3.94
20.16
1
9.000
4.446
.200
-3.05
21.05
2
-4.000
4.446
.805
-16.05
8.05
采用多重比较检验-TukeyHSD方法
原假设:
对有不同竞争者数目的销售额没有显著差异。
此表显示了两两有不同竞争者的地方销售额的检验结果。
可以看出,尽管在理论上各种检验方法对抽样分布标准误的定义不同,此种软件全部采用了LSD方法的中标准误。
因此各种方法计算的前两列计算结果完全相同。
表中没有给出检验统计量的观测值,他们都是相等的。
表中第三列式检验统计量在不同分布下的概率p值,可以发现各种方法在检验敏感度上的差异。
给定显著水平为0.01,0个竞争者和1个竞争者检验的概率p值为0.997,大于显著水平,因此接受原假设,认为对有0个竞争者数目和1个竞争者数目的销售额没有显著差异。
给定显著水平为0.01,0个竞争者和2个竞争者检验的概率p值为0.048,大于显著水平,因此接受原假设,认为对有0个竞争者数目和2个竞争者数目的销售额没有显著差异。
给定显著水平为0.01,0个竞争者和3个竞争者以上检验的概率p值为0.281,大于显著水平,因此接受原假设,认为对有0个竞争者数目和3个竞争者数目以上的销售额没有显著差异。
给定显著水平为0.01,1个竞争者和2个竞争者以上检验的概率p值为0.030,大于显著水平,因此接受原假设,认为对有1个竞争者数目和2个竞争者数目的销售额没有显著差异。
给定显著水平为0.01,1个竞争者和3个竞争者以上检验的概率p值为0.200,大于显著水平,因此接受原假设,认为对有1个竞争者数目和3个竞争者数目以上的销售额没有显著差异。
给定显著水平为0.01,2个竞争者和3个竞争者以上检验的概率p值为0.805,大于显著水平,因此接受原假设,认为对有2个竞争者数目和3个竞争者数目以上的销售额没有显著差异。
综上,对有不同竞争者数目的销售额没有显著差异。
单因素方差分析---超市位置与销售额
描述
销售额
N
均值
标准差
标准误
均值的95%置信区间
极小值
极大值
下限
上限
位于市内小区
12
42.33
8.217
2.372
37.11
47.55
30
59
位于写字楼
12
37.67
10.325
2.981
31.11
44.23
22
53
位于郊区
12
25.83
4.988
1.440
22.66
29.00
17
33
总数
36
35.28
10.590
1.765
31.69
38.86
17
59
此表为对不同地区的销售额的基本描述统计量及95%的置信区间,此表表明位于市内小区的销售额最高,位于郊区的销售额少,位于写字楼的销售额处于中间水平。
方差齐性检验
销售额
Levene统计量
df1
df2
显著性
4.769
2
33
.015
此处采用方差齐性检验
假设:
对不同地区的销售额方差相同。
对不同地区的销售额的方差齐性检验为1.224,概率p值为0.317,如果显著水平设为0.01,由于概率p值大于显著水平,不能拒绝原假设,对不同地区的销售额方差相同。
故满足方差分析的前提要求。
ANOVA
销售额
平方和
df
均方
F
显著性
组间
1736.222
2
868.111
13.087
.000
组内
2189.000
33
66.333
总数
3925.222
35
采用单因素方差分析。
假设:
对不同地区的销售额没有显著差异。
此表为不同地区的销售额的单因素方差分析结果。
可以看出观测变量销售额的总离差平方和是3925.222,如果考虑“地区”单因素的影响,则销售额总变差中,不同竞争者数目可解释的变差为1736.222,抽样误差引起的变差为2189.000,他们的方差(平均变差),分别为868.111,66.333.相除所的观测值为13.087,对应的P值近似为0,给定显著水平为0.01,由于概率p值小于显著水平,则拒绝原假设,认为不同地区的销售额有显著差异。
多重比较
因变量:
销售额
(I)超市位置
(J)超市位置
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
TukeyHSD
位于市内小区
位于写字楼
4.667
3.325
.351
-3.49
12.83
位于郊区
16.500*
3.325
.000
8.34
24.66
位于写字楼
位于市内小区
-4.667
3.325
.351
-12.83
3.49
位于郊区
11.833*
3.325
.003
3.67
19.99
位于郊区
位于市内小区
-16.500*
3.325
.000
-24.66
-8.34
位于写字楼
-11.833*
3.325
.003
-19.99
-3.67
*.均值差的显著性水平为0.05。
采用多重比较检验-TukeyHSD方法
原假设:
对不同地区的销售额没有显著差异。
此表显示了两两有不同地区的地方销售额的检验结果。
可以看出,尽管在理论上各种检验方法对抽样分布标准误的定义不同,此种软件全部采用了LSD方法的中标准误。
因此各种方法计算的前两列计算结果完全相同。
表中没有给出检验统计量的观测值,他们都是相等的。
表中第三列式检验统计量在不同分布下的概率p值,可以发现各种方法在检验敏感度上的差异。
给定显著水平为0.01,位于市内中心和位于写字楼检验的概率p值为0.351,大于显著水平,因此接受原假设,认为位于市内中心和位于写字楼的销售额没有显著差异。
给定显著水平为0.01,位于市内中心和位于郊区检验的概率p值为0,小于显著水平,因此不能接受原假设,认为位于市内中心和位于郊区的销售额有显著差异。
给定显著水平为0.01,位于写字楼和位于郊区检验的概率p值为0.003,小于显著水平,因此不能接受原假设,认为位于写字楼和位于郊区检验的销售额有显著差异。
综上,位于市内中心和位于写字楼的销售额没有显著差异。
位于市内中心和位于郊区的销售额,位于写字楼和位于郊区有显著差异。
多因素方差分析-超市位置-竞争者数量-销售额
误差方差等同性的Levene检验a
因变量:
销售额
F
df1
df2
Sig.
.755
11
24
.678
检验零假设,即在所有组中因变量的误差方差均相等。
a.设计:
截距+wz+jz
原假设:
所有组中因变量的误差方差均相等。
F的观测值为0.755,对应的p值为0.678,给定的显著水平位0.01,由于p值大于显著水平,所以接受原假设,认为所有组中因变量的误差方差均相等。
主体间效应的检验
因变量:
销售额
源
III型平方和
df
均方
F
Sig.
校正模型
3317.889a
11
301.626
11.919
.000
截距
44802.778
1
44802.778
1770.472
.000
wz
1736.222
2
868.111
34.305
.000
jz
1078.333
3
359.444
14.204
.000
wz*jz
503.333
6
83.889
3.315
.016
误差
607.333
24
25.306
总计
48728.000
36
校正的总计
3925.222
35
a.R方=.845(调整R方=.774)
采用多因素方差分析-饱和模型
假设:
超市位置和竞争数量对观测变量没有显著影响。
表中,第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果;第三列为自由度,第四列为均方;第五列为F检验统计量的观测值;第六列是检验统计量的概率p值。
可以看到,观测变量的总变差SST为48728.000,它被分解为四个部分,分别是超市位置引起的变差,竞争者数目引起的变差,超市位置与竞争这数目交互影响引起的变差,以及随机因素引起的变差引起的变差。
这些变差除以各自的自由度后,得到各自的均方,并可以计算出个F检验统计量的观测值和在一定自由度下的概率P值。
Fx1,Fx2,Fx1*x2,的概率p分别为:
0,0,0.016,给定的显著水平为0.01,由于Fx1,Fx2,的概率p值小于显著水平,则拒绝原假设可以认为超市位置和竞争数量对观测变量有