1、spss练习作业具体步骤要点一、调查问卷二、用SPSS Statistics软件进行描述统计分析 1、某地区经济增长率的时间序列图形。 解:第一步:数据来源,如图1 图1 某地区经济增长率xls截图 图2 Spss软件制作过程截图 第二步:将数据输入SPSS软件之中,如图2,制作某地区经济增长率的时间序列图形,如图3。 图3某地区19902012年经济增长率的时间序列图 第三步,从图中可以看出,某地区随时间的变化经济增长率变化趋势较大。 2、用SPSS Statistics进行描述统计分析解:第一步,按照题目中的要求,随机选取了148个数据,如图4部分数据:图4 Spss随机数据截图第二步,根
2、据要求,对上月工资进行描述统计分析,主要包括描述数据的集中趋势、离散程度(见表1),绘制直方图(见图5)。 表1 上月工资描述统计表(单位:元)集中趋势离散趋势均值2925极小值1500中值2900极大值4800众数2900全距3300和432900标准差496.364偏度0.165峰度1.238数据总计148 图5 上月工资直方图 第三步,分析数据的统计分布状况。首先,从集中趋势来,上个月平均工资2925元,其中众数和中数也都在2900元,这说明大部分工资水平在2900左右。其次,从离散趋势来看,最高工资4800元,最低工资1500元,最高工资和最低工资相差3300元,标准差为496.364
3、,相差较大。最后,从直方图来看和评述统计表来看,工资在2900元以上的占多数。可以的该地区整体工资水平大于平均值的占多数,该地区工资水平相对较高。峰度为1.238,偏度为0.165符合正态分布。三、用SPSS Statistics软件进行参数估计和假设检验及回归分析 1、计算总体中上月平均工资95%的置信区间(见表3)。解:总体中上月平均工资分布未知,但是样本容量大于30,且已知标准误,所以通过SPSS分析得出总体中上月平均工资95%的置信区间,见表3, 假设; H0:总体中上月平均工资95%的不在此在此区间 H1:总体中上月平均工资95%的在此区间表3 总体中上月平均工资95%的置信区间均值
4、95%的置信区间下限2844.37Sig.(双侧)上限3005.630.000 答,总体中上月平均工资095的置信区间为2844.37,3005.63,p=0.00030),可以运用单样本T检验.通过SPSS检验结果见(表4 、表5) 设; Ho: H1: 其中,表示总体中上月平均工资 表4 单个样本统计量N均值标准差均值的标准误上月工资1482925.00496.36440.801 表5 单个样本检验tdfSig.(双侧)均值差值检验值 上月工资22.6711470.000925.000 2000 答:作出结论,均值差值为925,t=22.671,p=0.0000.05,所以不能拒绝原假设,
5、可以认为两组数据无显著差异,所以应该选择方差相等下的T检验。表7独立样本检验方差方程的 Levene 检验T检验FSig.tdfSig.(双侧)均值差值标准误差值上月工资假设方差相等0.1010.7516.2771460.000456.16472.667假设方差不相等6.277145.8590.000456.16472.670假设2: H0: H1: 其中1代表男生总体平均数,2代表女生总体平均数,下同 作出结论:从表6、表7中可以看出,男生有73人,平均工资3156.16元,女生75人,平均工资2700.00元。t=6.277,且p=0.0000.001 所以拒绝原假设,接受备择假设,差异极
6、显著。根据表6,可以最后得出结论,男生平均工资大于女生的结论。4、一些学者认为,由于经济不景气,学生的平均工资今年和去年相比没有显著提高。检验这一假说。 解: 根据题意可知,需要进行相关样本T检验,设: H0:12 H1;12 同上表8 相关样本T检验均值标准差均值标准误Tdf相关系数sig上月工资2925496.36440.801去年同月工资2721.62447.29636.767上月工资&去年同月工资203.378183.10115.50113.5311470.930.000 通过表8可知,t=13.531,P=0.0000.05,接受H0,拒绝 H1,三者之间没有显著性差异。可以认为不同
7、学科上月工资水平相同。第三步,多重比较,经过Levene检验(见表10),p=0.724,方差没有显著性差异,方差齐性,经过LSD检验(见表11),P值均大于0.05,所以可以得出同样的结论,三门学科的上月工资水平没有差异。 表10 方差齐性检验Levene 统计量df1df2显著性.32321450.724 表11 多重比较(I) 学科(J) 学科均值差 (I-J)标准误显著性95% 置信区间下限上限LSD12-112.34899.458.261-308.9284.233-111.912108.528.304-326.41102.5921112.34899.458.261-84.23308.
8、923.43698.038.996-193.33194.2031111.912108.528.304-102.59326.412-.43698.038.996-194.20193.33(2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。 解: 第一步,提出假设,H0:性别和学科对上月工资水平没有影响 H1:性别和学科同时对上月工资水平有影响 第二步,经过SPSS计算,见表12, 表12主体间效应的检验源df均方FSig.校正模型51603013.8998.071.000性别17202158.04236.263.000学科2153037.863.77
9、1.465性别 * 学科27642.822.038.962总计148 第三步,作出决策 性别因素P=0.0000.05,在0.05水平上差异不显著,所以接受原假设,拒绝备择假设,即学科因素对上月工资水平没有影响,和前面结果一致。性别 * 学科p=0.9620.05,在0.05水平上差异不显著,所以接受原假设,拒绝备择假设,即学科和性别因素同时对上月工资水平没有影响。6、非参数检验。(1)用非参数检验方法检验能否认为男生和女生上月工资的中位数相等。 解:第一步,采用wilcoxon符号秩检验中位数,选择的原设与备择假设如下: H0:男生与女生上月工资的中位数相等; H1:男生与女生上月工资的中位
10、数不相等。 第二步,通过SPSS软件计算,见表13、14 表13 检验男女生上月工资中位数是否相等wilcoxon秩和检验中秩和的计算结果N秩均值秩和上月工资男生7394.676911.00女生7554.874115.00总数148表14 wilcoxon秩和检验的检验统计量和p值上月工资Mann-Whitney U1265.000Wilcoxon W4115.000Z-5.663渐近显著性(双侧).000精确显著性(双侧).000精确显著性(单侧).000点概率.000 第三步,男生上月工资的平均秩为41.33,女生上月工资的平均秩是19.84,说明从样本看男生上月工资的中位数要高于女生。用
11、正态分布计算时的M=1265.000,W=4115.000,Z=-5.663,p=0.0000.05,不可拒绝原假设,认为三个学科平均学分绩点的中位数没有显著差异.。(4)检验学生的上月工资是否服从正态分布。 解:第一步,样本是否来自正态分布,可用单样本K-S检验,原假设和备择假设设置如下 H0:学生的上月工资服从正态分布 H1:学生的上月工资不服从正态分布 第二步,通过SPSS软件计算结果如表19表19 单样本 Kolmogorov-Smirnov 检验上月工资N148Kolmogorov-Smirnov Z0.981渐近显著性(双侧)0.291 第三步,作出结论,p=0.291,大于0.0
12、5,不能拒绝原假设,也就是说能认为此样本来自正态分布。(5)检验学生对专业的满意程度是否为离散的均匀分布第一步,采用卡方分布进行检验,H0:学生对专业的满意程度服从离散的均匀分布 H1:学生对专业的满意程度不服从离散的均匀分布第二步,通过SPSS软件计算结果表20、21 表20 不同专业满意度频数与期望频数观察数期望数残差非常不满意429.6-25.6不满意1729.6-12.6基本满意4529.615.4比较满意5229.622.4非常满意3029.6.4总数148表21 卡方分布检验计算结果和相应的p值对专业的满意度卡方52.473adf4渐近显著性0.000第三步,作出结论,因为p=0.
13、000,小于0.01,可以拒绝原假设,接受备择假设认为学生对专业的满意程度不服从离散的均匀分布。7、回归分析。(1)计算上月工资与平均学分绩点的相关系数并作假设检验。 解:第一步,假设如下:H0: H1: 第二步,通过SPSS计算,见表22 表22 上月工资与平均学分绩点的相关性Pearson 相关性显著性(双侧)N平均学分绩点去年同月工资.763*0.000148 第三步,根据计算相关系数为0.763,P=0.0000.05,所以在统计学中,没有意义。平均学分点的系数为1098.030,性别的系数为-537.566,通过以上综合分析,最后得出的模型为: 月工资=-537.566*性别+109
14、8.030*平均学分绩点图9图10图11说明: 图9为残差的直方图,图中残差的分布基本均匀 图10 为残差的正态P-P概率图,图中散点基本呈直线趋势,且并未发现异常点 图11 残差是否有随标准化预测值增大而改变的趋势。从图中可以看出分布基本均匀,可以认为残差的方差是齐性的(4)在(2)和(3)模型中你会选择哪一个模型用于预测?为什么?假设一名男生的平均学分绩点为3.5,试预测他的上月工资的点估计值和区间估计。解:(2)中模型的R方等于0.584,(3)中模型的R方等于0.835,R方越大,所以选择(3)中的模型作为预测模型。假设一名男生的平均学分绩点为3.5,根据(3)中的模型公式:月工资=-537.566*性别+1098.030*平均学分绩点=-537.566*0+1098.030*3.5=3843.105,其置信区间为3843.105+/-219.02,结果为【3624.085,4062.125.】
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1