实验报告2基于SPSS的假设检验方差分析非参数检验.docx
《实验报告2基于SPSS的假设检验方差分析非参数检验.docx》由会员分享,可在线阅读,更多相关《实验报告2基于SPSS的假设检验方差分析非参数检验.docx(14页珍藏版)》请在冰豆网上搜索。
实验报告2基于SPSS的假设检验方差分析非参数检验
中央财经大学
实验报告
实验项目名称假设检验、方差分析、非参数检验
所属课程名称统计学
实验类型设计型、综合型实验
实验日期2014年4月
成绩
实验报告
数据准备。
从500个人中随机抽取大约30%。
1、用SPSSStatistics软件进行参数估计和假设检验。
(以下假设检验中限制性水平设为5%)
(1)计算总体中上月平均工资95%的置信区间(分析描述统计探索)。
下表为SPSS软件进行对“平均工资”变量进行描述统计分析所得。
从表中可以直接得到95%置信区间为【2118.79,2277.21】
统计量
标准误
(元)
均值
2198.00
40.083
均值的95%置信区间
下限
2118.79
上限
2277.21
5%修整均值
2202.96
中值
2200.00
方差
241002.685
标准差
490.920
极小值
800
极大值
3700
范围
2900
四分位距
600
偏度
-.042
.198
峰度
.713
.394
(2)检验能否认为总体中上月平均工资等于2000元。
(单个样本t检验)
单个样本检验
检验值=2000
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
(元)
4.940
149
.000
198.000
118.79
277.21
根据题目要求,这里采用双侧假设。
零假设和备择假设为:
H0=2000,H1≠2000。
由上表得,p=0.000<0.05=α,所以,拒绝原假设,即可以认为中体中上月平均工资不等于2000元
(3)检验能否认为男生的平均工资大于女生。
(两个独立样本t检验)
组统计量
性别
N
均值
标准差
均值的标准误
(元)
男生
67
2422.39
438.254
53.541
女生
83
2016.87
457.144
50.178
独立样本检验
方差方程的Levene检验
均值方程的t检验
差分的95%置信区间
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
下限
上限
(元)
假设方差相等
.004
.952
5.501
148
.000
405.521
73.712
259.856
551.185
假设方差不相等
5.526
143.655
.000
405.521
73.379
260.478
550.563
检验的零假设和备择假设为:
H0:
男生的平均工资不大于女生
H1:
男生的平均工资大于女生
如上表所示,方差检验的p值等于0.092>0.05,因此不拒绝方差相等的原假设,认为男女平均工资的方差相等。
所以t检验选取方差相等的一列,其中双侧检验的p值为0.000,因此右侧检验的p值为0.000/2=0.000<0.05(显著性水平),所以拒绝原假设,因此认为男生的平均工资大于女生。
(4)一些学者认为,由于经济不景气,学生的平均工资今年和去年相比没有显著提高。
检验这一假说。
(匹配样本t检验)。
成对样本检验
成对差分
t
df
Sig.(双侧)
均值
标准差
均值的标准误
差分的95%置信区间
下限
上限
对1
上月工资-去年同月工资
-1.333
190.368
15.543
-32.047
29.381
-.086
149
.932
H0:
μ1-μ2≤0;H1:
μ1>μ2
双侧检验的p值为0.932,,因此右侧检验为0.466>0.05。
所以不拒绝原假设,即学生的平均工资今年和去年相比没有显著提高
2、方差分析。
(1)使用单因素方差分析的方法检验:
能否认为不同学科的上月平均工资相等。
如果不能认为全相等,请做多重比较。
描述
(元)
N
均值
标准差
标准误
均值的95%置信区间
极小值
极大值
下限
上限
经济类
44
2215.91
537.411
81.018
2052.52
2379.30
800
3100
管理类
58
2182.76
485.631
63.767
2055.07
2310.45
1000
3600
其他类
48
2200.00
461.727
66.644
2065.93
2334.07
1200
3700
总数
150
2198.00
490.920
40.083
2118.79
2277.21
800
3700
ANOVA
(元)
平方和
df
均方
F
显著性
组间
27777.743
2
13888.871
.057
.945
组内
3.588E7
147
244092.668
总数
3.591E7
149
H0:
不同学科的上月平均工资相等;H1:
不同学科的上月平均工资不全相等。
由上表得,P值为0.945>0.05,因此拒绝零假设,即不同学科的上月平均工资不全相等。
所以再进行多重比较:
多重比较
(元)
LSD
(I)学科
(J)学科
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
经济类
管理类
33.150
98.773
.738
-162.05
228.35
其他类
15.909
103.116
.878
-187.87
219.69
管理类
经济类
-33.150
98.773
.738
-228.35
162.05
其他类
-17.241
96.404
.858
-207.76
173.28
其他类
经济类
-15.909
103.116
.878
-219.69
187.87
管理类
17.241
96.404
.858
-173.28
207.76
H0:
两类差异不显著;H1:
两类差异显著
由上表得,经济类和管理类:
p=0.738>0.05;经济类和其他类:
p=0.878>0.05;
管理类和其他类:
p=0.858>0.05。
因此拒绝原假设,任意两类差异都是显著的。
(2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。
主体间因子
值标签
N
性别
0
男生
67
1
女生
83
学科
1
经济类
44
2
管理类
58
3
其他类
48
描述性统计量
因变量:
(元)
性别
学科
均值
标准偏差
N
男生
经济类
2547.37
335.606
19
管理类
2368.00
452.512
25
其他类
2378.26
491.710
23
总计
2422.39
438.254
67
女生
经济类
1964.00
529.056
25
管理类
2042.42
468.395
33
其他类
2036.00
370.675
25
总计
2016.87
457.144
83
总计
经济类
2215.91
537.411
44
管理类
2182.76
485.631
58
其他类
2200.00
461.727
48
总计
2198.00
490.920
150
主体间效应的检验
因变量:
(元)
源
III型平方和
df
均方
F
Sig.
校正模型
6.613E6
5
1322539.017
6.501
.000
截距
7.218E8
1
7.218E8
3547.603
.000
性别
6353215.528
1
6353215.528
31.228
.000
学科
75318.176
2
37659.088
.185
.831
性别*学科
480288.831
2
240144.415
1.180
.310
误差
2.930E7
144
203449.340
总计
7.606E8
150
校正的总计
3.591E7
149
a.R方=.184(调整R方=.156)
(1)“性别”显著性影响性:
H0:
“性别”对“上月工资”无显著性差异;H1:
“性别”对“上月工资”有显著性差异。
由上表得,“性别”对“上月工资”p=0.000<0.05,因此拒绝原假设,不同性别的上月工资有显著性差异。
(1)“学科”显著性影响性:
H0:
“学科”对“上月工资”无显著性差异;H1:
“学科”对“上月工资”有显著性差异。
由上表得,“学科”对“上月工资”p=0.831>0.05,因此不拒绝原假设,不同学科的上月工资无显著性差异。
(3)“性别”与“学科”交互作用的显著性影响:
H0:
“性别”与“学科”交互作用对“上月工资”无显著性差异;
H1:
“性别”与“学科”交互作用对“上月工资”有显著性差异。
由上表得,“性别”与“学科”交互作用对“上月工资”p=0.310>0.05,因此不拒绝原假设,“性别”与“学科”交互作用对“上月工资”无显著性差异。
3、非参数检验。
(1)用非参数检验方法检验能否认为男生和女生上月工资的中位数相等。
使用非参数检验的两个独立样本的Wlicoxon秩和检验:
检验的零假设和备择假设如下:
H0:
男性和女性的上月收入的中位数相等;
H1:
男性和女性的上月收入的中位数不相等。
秩
性别
N
秩均值
秩和
上月工资
0
67
94.92
6359.50
1
83
59.83
4965.50
总数
150
检验统计量a
上月工资
Mann-WhitneyU
1479.500
WilcoxonW
4965.500
Z
-4.931
渐近显著性(双侧)
.000
a.分组变量:
性别
根据表一,男性上月收入的平均秩是94.92,女性为59.83,说明从样本上看男性的上月收入的中位数高于女性。
从表二看,WilcoxonW统计量为4965.5,表二中显示渐进显著性(双侧检验)的p值为0.000<显著性水平0.05,拒绝原假设,结论是男性和女性的上月收入中位数不相等。
(2)用非参数检验方法检验学生上月工资和去年同月工资的中位数是否有显著变化。
使用非参数检验中的两个相关样本的Wilcoxon符号秩检验:
检验的零假设和备择假设如下:
H0:
上月工资与去年同月工资之差的中位数为0;
H1:
上月工资与去年同月工资之差的中位数不为0。
秩
N
秩均值
秩和
去年同月工资-上月工资
负秩
66a
64.68
4269.00
正秩
65b
67.34
4377.00
结
19c
总数
150
a.去年同月工资<上月工资
b.去年同月工资>上月工资
c.去年同月工资=上月工资
检验统计量b
去年同月工资-上月工资
Z
-.126a
渐近显著性(双侧)
.900
精确显著性(双侧)
.903
精确显著性(单侧)
.451
点概率
.003
a.基于负秩。
b.Wilcoxon带符号秩检验
频率
N
去年同月工资-上月工资
负差分a
66
正差分b
65
结c
19
总数
150
a.去年同月工资<上月工资
b.去年同月工资>上月工资
c.去年同月工资=上月工资
检验统计量a
去年同月工资-上月工资
Z
.000
渐近显著性(双侧)
1.000
精确显著性(双侧)
1.000
精确显著性(单侧)
.500
点概率
.069
a.符号检验
表二采用渐进分布(正态分布)的Z值(-1.26)、p值(0.900),以及精确检验的p值(0.903)。
由于其p值远远大于0.05,显然不能拒绝原假设,也就是说上月工资和去年同月工资的中位数没有有显著变化。
表三和表四是符号检验的结果。
表三表明有差值序列中有66个负数,65个正数;表四表明采用精确检验(二项分布)计算的双侧检验的p值为1.0,也不能拒绝原假设。
(3)用非参数检验方法不同学科学生平均学分绩点的中位数是否相等。
使用非参数检验中的多个独立样本的Kruskal-Wallis检验:
检验的零假设和备择假设为:
H0:
三个学科平均学分绩点的中位数相等;
H1:
三个学科平均学分绩点的中位数不相等.
秩
学科
N
秩均值
平均学分绩点
1
44
76.18
2
58
75.12
3
48
75.33
总数
150
检验统计量a,b,c
平均学分绩点
卡方
.016
df
2
渐近显著性
.992
a.KruskalWallis检验
b.分组变量:
学科
c.由于没有足够内存,无法计算某些或所有精确显著性。
由表一得,各组的平均值分别为76.18、75.12、75.33。
表二表明,Kruskal-Wallis检验中使用χ2分布进行近似计算式的χ2统计量为0.016,自由度为2,相应的p值为0.992>0.05(显著性水平),所以不能拒绝原假设,即三个学科平均学分绩点的中位数相等。
(4)检验学生的上月工资是否服从正态分布。
使用非参数检验的单样本K-S检验:
原假设和备择假设为:
H0:
学生的上月工资服从正态分布;
H1:
学生的上月工资不服从正态分布。
单样本Kolmogorov-Smirnov检验
上月工资
N
150
正态参数a,,b
均值
2198.00
标准差
490.920
最极端差别
绝对值
.085
正
.072
负
-.085
Kolmogorov-SmirnovZ
1.044
渐近显著性(双侧)
.226
a.检验分布为正态分布。
b.根据数据计算得到。
由上表得,Dmax统计量的值为0.072,相应的p值为0.226>0.05(显著性水平),所以不能拒绝原假设,即学生的上月工资服从正态分布。
(5)检验学生对专业的满意程度是否为离散的均匀分布。
使用非参数检验中的一个样本的K-S检验中的均匀检验:
零假设和备择假设为:
H0:
学生对专业的满意程度为离散的均匀分布
H1:
学生对专业的满意程度不是离散的均匀分布
单样本Kolmogorov-Smirnov检验
对专业的满意度
N
150
均匀参数a,,b
极小值
1
极大值
5
最极端差别
绝对值
.367
正
.057
负
-.367
Kolmogorov-SmirnovZ
4.491
渐近显著性(双侧)
.000
a.检验分布为均匀分布。
b.根据数据计算得到。
根据上表,Dmax统计量的值为4.491,p值为0.000<0.05(显著性水平),所以拒绝原假设,即学生对专业的满意程度不是离散的均匀分布。