spss练习作业具体步骤要点.docx
《spss练习作业具体步骤要点.docx》由会员分享,可在线阅读,更多相关《spss练习作业具体步骤要点.docx(22页珍藏版)》请在冰豆网上搜索。
spss练习作业具体步骤要点
一、调查问卷
二、用SPSSStatistics软件进行描述统计分析
1、某地区经济增长率的时间序列图形。
解:
第一步:
数据来源,如图1
图1某地区经济增长率xls截图图2Spss软件制作过程截图
第二步:
将数据输入SPSS软件之中,如图2,制作某地区经济增长率的时间序列图形,如图3。
图3某地区1990—2012年经济增长率的时间序列图
第三步,从图中可以看出,某地区随时间的变化经济增长率变化趋势较大。
2、用SPSSStatistics进行描述统计分析
解:
第一步,按照题目中的要求,随机选取了148个数据,如图4部分数据:
图4Spss随机数据截图
第二步,根据要求,对上月工资进行描述统计分析,主要包括描述数据的集中趋势、离散程度(见表1),绘制直方图(见图5)。
表1上月工资描述统计表(单位:
元)
集中趋势
离散趋势
均值
2925
极小值
1500
中值
2900
极大值
4800
众数
2900
全距
3300
和
432900
标准差
496.364
偏度
0.165
峰度
1.238
数据总计
148
图5上月工资直方图
第三步,分析数据的统计分布状况。
首先,从集中趋势来,上个月平均工资2925元,其中众数和中数也都在2900元,这说明大部分工资水平在2900左右。
其次,从离散趋势来看,最高工资4800元,最低工资1500元,最高工资和最低工资相差3300元,标准差为496.364,相差较大。
最后,从直方图来看和评述统计表来看,工资在2900元以上的占多数。
可以的该地区整体工资水平大于平均值的占多数,该地区工资水平相对较高。
峰度为1.238,偏度为0.165符合正态分布。
三、用SPSSStatistics软件进行参数估计和假设检验及回归分析
1、计算总体中上月平均工资95%的置信区间(见表3)。
解:
总体中上月平均工资分布未知,但是样本容量大于30,且已知标准误,所以通过SPSS分析得出总体中上月平均工资95%的置信区间,见表3,假设;
H0:
总体中上月平均工资95%的不在此在此区间
H1:
总体中上月平均工资95%的在此区间
表3总体中上月平均工资95%的置信区间
均值95%的置信区间
下限
2844.37
Sig.(双侧)
上限
3005.63
0.000
答,总体中上月平均工资095的置信区间为[2844.37,3005.63],p=0.000<0.01,作出这样的推论正确的概率为0.95,错误的概率为0.05。
2、检验能否认为总体中上月平均工资等于2000元。
解:
在本案例中,要检验样本中上月平均工资与总体中上月平均工资(为已知值:
2000元)是否存在差异,即某一样本数据与某一确定均值进行比较。
虽然不知道总体分布是否正态,但样本较大(N>30),可以运用单样本T检验.通过SPSS检验结果见(表4、表5)
设;Ho:
H1:
其中,μ表示总体中上月平均工资
表4单个样本统计量
N
均值
标准差
均值的标准误
上月工资
148
2925.00
496.364
40.801
表5单个样本检验
t
df
Sig.(双侧)
均值差值
检验值
上月工资
22.671
147
0.000
925.000
2000
答:
作出结论,均值差值为925,t=22.671,p=0.000<0.01,所以拒绝原假设,接受备择假设,即否认总体中上月的平均工资等于2000元。
3、检验能否认为男生的平均工资大于女生
解:
两个样本均来自于正态分布的总体且男女上月工资独立,可以进行独立样本T检验,(见表6、表7)
表6组统计量
性别
N
均值
标准差
均值的标准误
上月工资
男生
73
3156.16
442.840
51.831
女生
75
2700.00
441.129
50.937
假设1:
H0:
H1:
其中,
从表7中方差方程的Levene检验可以看出,F=0.101,P=0.751>0.05,所以不能拒绝原假设,可以认为两组数据无显著差异,所以应该选择方差相等下的T检验。
表7独立样本检验
方差方程的Levene检验
T检验
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
上月工资
假设方差相等
0.101
0.751
6.277
146
0.000
456.164
72.667
假设方差不相等
6.277
145.859
0.000
456.164
72.670
假设2:
H0:
H1:
其中μ1代表男生总体平均数,μ2代表女生总体平均数,下同
作出结论:
从表6、表7中可以看出,男生有73人,平均工资3156.16元,女生75人,平均工资2700.00元。
t=6.277,且p=0.000<0.001所以拒绝原假设,接受备择假设,差异极显著。
根据表6,可以最后得出结论,男生平均工资大于女生的结论。
4、一些学者认为,由于经济不景气,学生的平均工资今年和去年相比没有显著提高。
检验这一假说。
解:
根据题意可知,需要进行相关样本T检验,设:
H0:
μ1≤μ2
H1;μ1>μ2同上
表8相关样本T检验
均值
标准差
均值标准误
T
df
相关系数
sig
上月工资
2925
496.364
40.801
去年同月工资
2721.62
447.296
36.767
上月工资&去年同月工资
203.378
183.101
15.501
13.531
147
0.93
0.000
通过表8可知,t=13.531,P=0.000<0.01,所以拒绝原假设,接受备择假设,即学生的平均工资今年和去年相比有显著提高。
5、方差分析。
(1)使用单因素方差分析的方法检验:
能否认为不同学科的上月平均工资相等。
如果不能认为全相等,请做多重比较。
解:
第一步,提出假设,H0:
不同学科上月的平均工资是相同的
H1:
至少有两门学科上个月的平局工资是相同的
经过SPSS软件计算,见表9,
表9三门学科上月工资水平方差分析表
平方和
df
均方
F
显著性
组间
372977.879
2
186488.939
0.754
0.472
组内
3.584E7
145
247203.601
总数
3.622E7
147
第二步,决策,F=0.754,P=0.472>0.05,接受H0,拒绝H1,三者之间没有显著性差异。
可以认为不同学科上月工资水平相同。
第三步,多重比较,经过Levene检验(见表10),p=0.724,方差没有显著性差异,方差齐性,经过LSD检验(见表11),P值均大于0.05,所以可以得出同样的结论,三门学科的上月工资水平没有差异。
表10方差齐性检验
Levene统计量
df1
df2
显著性
.323
2
145
0.724
表11多重比较
(I)学科
(J)学科
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
LSD
1
2
-112.348
99.458
.261
-308.92
84.23
3
-111.912
108.528
.304
-326.41
102.59
2
1
112.348
99.458
.261
-84.23
308.92
3
.436
98.038
.996
-193.33
194.20
3
1
111.912
108.528
.304
-102.59
326.41
2
-.436
98.038
.996
-194.20
193.33
(2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。
解:
第一步,提出假设,H0:
性别和学科对上月工资水平没有影响
H1:
性别和学科同时对上月工资水平有影响
第二步,经过SPSS计算,见表12,
表12主体间效应的检验
源
df
均方
F
Sig.
校正模型
5
1603013.899
8.071
.000
性别
1
7202158.042
36.263
.000
学科
2
153037.863
.771
.465
性别*学科
2
7642.822
.038
.962
总计
148
第三步,作出决策
性别因素P=0.000<0.01,在0.01水平上差异显著,所以拒绝原假设,接受备择假设,即性别因素对工资水平有显著性影响,和前面结果一致。
学科因素P=0.465>0.05,在0.05水平上差异不显著,所以接受原假设,拒绝备择假设,即学科因素对上月工资水平没有影响,和前面结果一致。
性别*学科p=0.962>0.05,在0.05水平上差异不显著,所以接受原假设,拒绝备择假设,即学科和性别因素同时对上月工资水平没有影响。
6、非参数检验。
(1)用非参数检验方法检验能否认为男生和女生上月工资的中位数相等。
解:
第一步,采用wilcoxon符号秩检验中位数 ,选择的原设与备择假设如下:
H0:
男生与女生上月工资的中位数相等;
H1:
男生与女生上月工资的中位数不相等 。
第二步,通过SPSS软件计算,见表13、14
表13检验男女生上月工资中位数是否相等wilcoxon秩和检验中秩和的计算结果
N
秩均值
秩和
上月工资
男生
73
94.67
6911.00
女生
75
54.87
4115.00
总数
148
表14wilcoxon秩和检验的检验统计量和p值
上月工资
Mann-WhitneyU
1265.000
WilcoxonW
4115.000
Z
-5.663
渐近显著性(双侧)
.000
精确显著性(双侧)
.000
精确显著性(单侧)
.000
点概率
.000
第三步,男生上月工资的平均秩为41.33,女生上月工资的平均秩是19.84,说明从样本看男生上月工资的中位数要高于女生。
用正态分布计算时的M=1265.000,W=4115.000,Z=-5.663,p=0.000<0.01,可以拒绝原假设,认为男生与女生上月工资中位数不相等。
若进行单侧检验:
H0:
男生月收入中位数小于女生月收入的中位数;H1:
男生月收入中位数大于于女生月收入的中位数。
P值为0.000,可以拒绝原假设。
H0:
男生月收入中位数大于女生月收入的中位数;H1:
男生月收入中位数小于女生月收入的中位数。
P值为1-0.000/2=1,接受原假设。
因此可以认为男生上月工资中位数大于女生上月工资中位数。
(2)用非参数检验方法检验学生上月工资和去年同月工资的中位数是否有显著变化。
解:
第一步,采用非参数检验中的两个相关样本样本,选择的原假设与备择假设如下:
H0:
上月工资与去年同月工资差值为0
H1:
上月工资与去年同月工资差值不为0
第二步,通过SPSS软件计算,结果如表15、16
表15wilcoxon秩和检验中秩和的计算结果
N
秩均值
秩和
去年同月工资-上月工资
负秩
106
65.46
6938.50
正秩
13
15.50
201.50
结
29
总数
148
表16wilcoxon秩和检验的检验统计量和p值
去年同月工资-上月工资
Z
-8.990
渐近显著性(双侧)
.000
第三步,作出结论,由于此样本为大样本,应该采用渐近显著性的p值(0.000),小于0.01,拒绝原假设,接受备择假设,则可以认为上月工资与去年同月工资有显著差别。
(3)用非参数检验方法不同学科学生平均学分绩点的中位数是否相等。
解:
第一步,采用Kruskal-Wallis检验不同学科学生平均学分绩点的中位数是否相等,原假设和备择假设设置如下:
H0:
不同学科学生平均学分绩点的中位数相等;
H1:
不同学科学生平均学分绩点的中位数不相等
第二步,通过SPSS软件计算结果如表17、18;
表17Kruskal-Wallis检验中计算的各组平均秩
学科
N
秩均值
平均学分绩点
经济类
41
69.39
管理类
64
75.73
其他
43
77.53
总数
148
表18Kruskal-Wallis检验的检验统计量和p值
平均学分绩点
卡方
.851
df
2
渐近显著性
.653
第三步,作出结论,因为p=0.653>0.05,不可拒绝原假设,认为三个学科平均学分绩点的中位数没有显著差异.。
(4)检验学生的上月工资是否服从正态分布。
解:
第一步,样本是否来自正态分布,可用单样本K-S检验,原假设和备择假设设置如下
H0:
学生的上月工资服从正态分布
H1:
学生的上月工资不服从正态分布
第二步,通过SPSS软件计算结果如表19
表19单样本Kolmogorov-Smirnov检验
上月工资
N
148
Kolmogorov-SmirnovZ
0.981
渐近显著性(双侧)
0.291
第三步,作出结论,p=0.291,大于0.05,不能拒绝原假设,也就是说能认为此样本来自正态分布。
(5)检验学生对专业的满意程度是否为离散的均匀分布
第一步,采用卡方分布进行检验,H0:
学生对专业的满意程度服从离散的均匀分布
H1:
学生对专业的满意程度不服从离散的均匀分布
第二步,通过SPSS软件计算结果表20、21
表20不同专业满意度频数与期望频数
观察数
期望数
残差
非常不满意
4
29.6
-25.6
不满意
17
29.6
-12.6
基本满意
45
29.6
15.4
比较满意
52
29.6
22.4
非常满意
30
29.6
.4
总数
148
表21卡方分布检验计算结果和相应的p值
对专业的满意度
卡方
52.473a
df
4
渐近显著性
0.000
第三步,作出结论,因为p=0.000,小于0.01,可以拒绝原假设,接受备择假设认为学生对专业的满意程度不服从离散的均匀分布。
7、回归分析。
(1)计算上月工资与平均学分绩点的相关系数并作假设检验。
解:
第一步,假设如下:
H0:
H1:
第二步,通过SPSS计算,见表22
表22上月工资与平均学分绩点的相关性
Pearson相关性
显著性(双侧)
N
平均学分绩点—去年同月工资
.763**
0.000
148
第三步,根据计算相关系数为0.763,P=0.000<0.01,所以可以拒绝原假设,在0.01水平上二者显著相关。
(2)以上月工资为因变量,平均学分绩点为自变量做回归分析,分析模型的拟合效果和假设检验的结果。
(第一次抽样无法做回归分析,需要重新抽样)
解:
第一步,假设1,H0:
回归模型无意义,H1:
回归模型有意义
假设2,Ho;常量为H1:
常量不等于0
假设3,Ho:
平均学分绩点的系数为0,H1:
平均学分绩点的系数不等于0
第二步,通过SPSS分析,见表23、24、25
表23模型汇总
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.764a
.584
.581
346.581
2.163
表24回归模型
模型
平方和
df
均方
F
Sig.
1
回归
2.273E7
1
2.273E7
189.216
.000a
残差
1.622E7
135
120118.458
总计
3.894E7
136
表25模型回归系数表
模型
B
t
Sig.
1
(常量)
-661.720
269.159
-2.458
.015
平均学分绩点
1177.971
85.636
13.756
.000
图6
图7
图8
说明:
图6为残差的直方图,图中残差的分布基本均匀
图7为残差的正态P-P概率图,图中散点基本呈直线趋势,且并未发现异常点
图8残差是否有随标准化预测值增大而改变的趋势。
从图中可以看出分布基本均匀,可以认为残差的方差是齐性的
第三步,作出结论,从表23中可以看出此表为拟合模型的拟合优度的情况,其中R方为0.584,Durbin-Watson统计量为2.163,比较接近2,可以认为残差之间相互独立。
从表24中可以到F=189.216.P=0.000,可以认为这个回归模型是有统计意义的。
从表25中可以得到模型的常量为-661.720,平均学分点的系数为1177.971,通过以上综合分析,最后得出的模型为:
月工资=-661.720+1177.971*平均学分绩点
(3)以上月工资为因变量,平均学分绩点和性别为自变量做回归分析,分析模型的拟合效果和假设检验的结果。
解:
第一步,假设1,H0:
回归模型无意义,H1:
回归模型有意义
假设2,Ho;常量为H1:
常量不等于0
假设3,Ho:
平均学分绩点的系数为0,H1:
平均学分绩点的系数不等于0
第二步,通过SPSS计算可以得出表26、27、28、29,
表26模型汇总c
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.914b
.835
.832
219.020
1.887
表27回归模型
模型
平方和
df
均方
F
Sig.
1
回归
3.252E7
2
1.626E7
338.928
.000
残差
6427926.055
134
47969.597
总计
3.894E7
136
表28模型回归系数
模型
B
t
Sig.
1
(常量)
-137.317
174.010
-.789
.431
平均学分绩点
1098.030
54.406
20.182
.000
性别
-537.566
37.633
-14.285
.000
表29共线性诊断a
模型
维数
特征值
条件索引
1
1
2.616
1.000
2
.378
2.629
3
.006
21.027
第三步,作出结论,从表26中可以看出此表为拟合模型的拟合优度的情况,其中调整R方为0.835,Durbin-Watson统计量为1.887,比较接近2,可以认为残差之间相互独立。
从表24中可以到F=338.928,.P=0.000,可以认为这个回归模型是有统计意义的。
从表25中可以得到模型的常量为-137.317,P=0.431>0.05,所以在统计学中,没有意义。
平均学分点的系数为1098.030,性别的系数为-537.566,通过以上综合分析,最后得出的模型为:
月工资=-537.566*性别+1098.030*平均学分绩点
图9
图10
图11
说明:
图9为残差的直方图,图中残差的分布基本均匀
图10为残差的正态P-P概率图,图中散点基本呈直线趋势,且并未发现异常点
图11残差是否有随标准化预测值增大而改变的趋势。
从图中可以看出分布基本均匀,可以认为残差的方差是齐性的
(4)在
(2)和(3)模型中你会选择哪一个模型用于预测?
为什么?
假设一名男生的平均学分绩点为3.5,试预测他的上月工资的点估计值和区间估计。
解:
(2)中模型的R方等于0.584,(3)中模型的R方等于0.835,R方越大,所以选择(3)中的模型作为预测模型。
假设一名男生的平均学分绩点为3.5,根据(3)中的模型公式:
月工资=-537.566*性别+1098.030*平均学分绩点=-537.566*0+1098.030*3.5=3843.105,
其置信区间为3843.105+/-219.02,结果为【3624.085,4062.125.】