spss案例大数据分析报告Word文档格式.doc
《spss案例大数据分析报告Word文档格式.doc》由会员分享,可在线阅读,更多相关《spss案例大数据分析报告Word文档格式.doc(12页珍藏版)》请在冰豆网上搜索。
1
.998**
.991**
.995**
显著性(单侧)
.000
.001
平方与叉积的和
1.300E7
4000739.197
4039135.855
2468266.142
协方差
3250108.892
1000184.799
1009783.964
617066.535
.985**
.994**
1235103.975
1238672.922
760246.419
308775.994
309668.230
190061.605
.996**
1279080.565
775005.410
319770.141
193751.352
473179.063
118294.766
**.在.01水平(单侧)上显著相关。
表2相关系数矩阵
从表2中可以看出家庭设备用品及服务与食品、衣着之间相关系数分别为0.995、0.994,反映家庭设备用品及服务与食品、衣着之间存在显著的相关关系。
说明食品与衣着对家庭设备用品及服务条件的好转有显著的作用,此外食品与衣着之间,食品与居住之间,居住与衣着之间的相关系数分别为0.998、0.991、0.985,这说明他们之间也存在着显著的相关关系。
在这里还要提一下相关系数旁边的两个星号的意思,它表示显著性水平α为0.01时仍拒绝原假设,一个星号则表示显著性水平α为0.05时可拒绝原假设。
因此,两个星号比一个星号拒绝原假设犯错误的可能性更小。
(B)下面是做的回归分析
表3给出了进入模型和被剔除的变量的信息。
从表中我们可以看出所有3个自变量都进入模型,说明我们的解释变量都是显著并且是有解释力的。
表4给出了模型整体拟合效果的概述,模型的拟合优度系数为1.000,反映了因变量于自变量之间具有高度显著的线性关系。
表里还显示了R平方以及经调整的R值估计标准误差
表5给出了方差分析表我们可以看到模型的设定检验F统计量的值为411.727,显著性水平的P值为0.036。
表6给出了回归系数表和变量显著性检验的T值。
我们发现变量“食品”的T值太小,没有达到显著性水平,因此我们要将这个变量剔除。
从这里我们也可以看出模型虽然通过了设定检验,但很有可能不能通过变量的显著性检验。
输入/移去的变量
模型
输入的变量
移去的变量
方法
居住,衣着,食品a
.
输入
a.已输入所有请求的变量。
表3变量进入/剔除信息表
模型汇总
R
R方
调整R方
标准估计的误差
1.000a
.999
.997
19.56464
a.预测变量:
(常量),居住,衣着,食品。
表4模型概述表
Anovab
平方和
df
均方
F
Sig.
回归
472796.288
3
157598.763
411.727
.036a
残差
382.775
总计
4
b.因变量:
家庭设备用品及服务
表5方差分析表
系数a
非标准化系数
标准系数
t
B
标准误差
试用版
(常量)
86.022
42.902
2.005
.295
-.160
.133
-.838
-1.204
.441
.674
.349
1.090
1.934
.304
.458
.141
.752
3.256
.190
a.因变量:
表6回归系数表
残差统计量a
极小值
极大值
标准偏差
预测值
118.2242
901.6300
343.80092
-11.58816
7.57571
.00000
9.78232
标准预测值
-1.076
1.202
1.000
标准残差
-.592
.387
.500
表7残差统计表
表7给出了残差分析表,表中显示了预测值、残差、标准化预测值、标准化残差的最小值、最大值、均值、标准偏差及样本容量等数据。
根据概率的3西格玛原则,标准化残差的绝对值最大为0.387,小于3,说明样本数据中没有奇异值。
表8残差分布直方图
表8给出了模型的直方图。
由于我们在模型中始终假设残差服从正态分布,因此我们可以从这图中直观地看出回归后的实际残差是否符合我们的假设。
从回归残差的直方图与附于图上的正态分布曲线相比较,可以认为残差的分布不是明显地服从正态分布。
尽管这样也不能盲目的否定残差服从正态分布的假设,因为我们用了进行分析的样本太小,样本容量仅为5。
(C)spss参数检验分析(单样本t检验)
1.单样本t检验。
在这里我选择的是转移性收入这个变量做的分析,推断转移性收入的平均值是否为2200元,下面是分析后输出的结果。
单个样本统计量
均值的标准误
转移性收入
2420.4600
2221.14998
993.32847
表9转移性收入的基本描述统计结果
单个样本检验
检验值=2200
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
.222
.835
220.46000
-2537.4620
2978.3820
表10转移性收入单样本t检验结果
由表9可知,五个年份的转移性收入的平均值为2420.4600元,标准差为2221.14元,均值的标准误差为993.32。
从表10中可以看出,该问题应采用双尾检验,因此比较α/2和p/2,也就是比较α和Ρ。
如果α给0.05,由于Ρ大于α,因此不应
拒绝原假设,不能认为转移性收入的平均值与2200有显著差异。
(D)比率分析
案例处理摘要
计数
总数
排除的
工资性收入/平均每人全部年收入的比率统计量
.714
平均数绝对值偏差
.048
离散系数
.068
方差系数
均值居中
8.7%
中值居中
表11案例处理摘要
表12工资性收入的比率分析结果
表11是案例处理摘要,表12显示的是工资性收入的比率分析结果,从表12可以看出五个年份的工资性收入占平均每人全部年收入的比率的均值为0.714,也就是说,五个年份的城镇居民平均每人全部年收入中的71.4%为工资性收入,由此可见工资性收入对城镇居民生活状况改善的重要性。
(E)因子分析
在这里先将分析后得到的结果展示如下:
相关矩阵a
医疗保健
相关
.998
.991
.995
.986
.985
.994
.981
.996
.990
a.此矩阵不是正定矩阵。
表13相关系数矩阵
公因子方差
初始
提取
.988
提取方法:
主成份分析。
表14公因子方差
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
4.965
99.300
2
.027
.538
99.838
.006
.118
99.956
.002
.044
100.000
3.718E-17
7.436E-16
表15解释的总方差
表16因子的碎石图
表18成分得分系数矩阵
成份矩阵a
提取方法:
主成分分析法。
a.已提取了1个成份。
成份得分系数矩阵
.201
.200
家庭设备用品