spss案例大数据分析报告Word文档格式.doc

资源描述

spss案例大数据分析报告Word文档格式.doc

《spss案例大数据分析报告Word文档格式.doc》由会员分享，可在线阅读，更多相关《spss案例大数据分析报告Word文档格式.doc（12页珍藏版）》请在冰豆网上搜索。

spss案例大数据分析报告Word文档格式.doc

.998**

.991**

.995**

显著性（单侧）

.000

.001

平方与叉积的和

1.300E7

4000739.197

4039135.855

2468266.142

协方差

3250108.892

1000184.799

1009783.964

617066.535

.985**

.994**

1235103.975

1238672.922

760246.419

308775.994

309668.230

190061.605

.996**

1279080.565

775005.410

319770.141

193751.352

473179.063

118294.766

**.在.01水平（单侧）上显著相关。

表2相关系数矩阵

从表2中可以看出家庭设备用品及服务与食品、衣着之间相关系数分别为0.995、0.994，反映家庭设备用品及服务与食品、衣着之间存在显著的相关关系。

说明食品与衣着对家庭设备用品及服务条件的好转有显著的作用，此外食品与衣着之间，食品与居住之间，居住与衣着之间的相关系数分别为0.998、0.991、0.985，这说明他们之间也存在着显著的相关关系。

在这里还要提一下相关系数旁边的两个星号的意思，它表示显著性水平α为0.01时仍拒绝原假设，一个星号则表示显著性水平α为0.05时可拒绝原假设。

因此，两个星号比一个星号拒绝原假设犯错误的可能性更小。

（B）下面是做的回归分析

表3给出了进入模型和被剔除的变量的信息。

从表中我们可以看出所有3个自变量都进入模型，说明我们的解释变量都是显著并且是有解释力的。

表4给出了模型整体拟合效果的概述，模型的拟合优度系数为1.000，反映了因变量于自变量之间具有高度显著的线性关系。

表里还显示了R平方以及经调整的R值估计标准误差

表5给出了方差分析表我们可以看到模型的设定检验F统计量的值为411.727，显著性水平的P值为0.036。

表6给出了回归系数表和变量显著性检验的T值。

我们发现变量“食品”的T值太小，没有达到显著性水平，因此我们要将这个变量剔除。

从这里我们也可以看出模型虽然通过了设定检验，但很有可能不能通过变量的显著性检验。

输入／移去的变量

模型

输入的变量

移去的变量

方法

居住,衣着,食品a

输入

a.已输入所有请求的变量。

表3变量进入/剔除信息表

模型汇总

R方

调整R方

标准估计的误差

1.000a

.999

.997

19.56464

a.预测变量:

（常量）,居住,衣着,食品。

表4模型概述表

Anovab

平方和

均方

Sig.

回归

472796.288

157598.763

411.727

.036a

残差

382.775

总计

b.因变量:

家庭设备用品及服务

表5方差分析表

系数a

非标准化系数

标准系数

标准误差

试用版

（常量）

86.022

42.902

2.005

.295

-.160

.133

-.838

-1.204

.441

.674

.349

1.090

1.934

.304

.458

.141

.752

3.256

.190

a.因变量:

表6回归系数表

残差统计量a

极小值

极大值

标准偏差

预测值

118.2242

901.6300

343.80092

-11.58816

7.57571

.00000

9.78232

标准预测值

-1.076

1.202

1.000

标准残差

-.592

.387

.500

表7残差统计表

表7给出了残差分析表，表中显示了预测值、残差、标准化预测值、标准化残差的最小值、最大值、均值、标准偏差及样本容量等数据。

根据概率的3西格玛原则，标准化残差的绝对值最大为0.387,小于3，说明样本数据中没有奇异值。

表8残差分布直方图

表8给出了模型的直方图。

由于我们在模型中始终假设残差服从正态分布，因此我们可以从这图中直观地看出回归后的实际残差是否符合我们的假设。

从回归残差的直方图与附于图上的正态分布曲线相比较，可以认为残差的分布不是明显地服从正态分布。

尽管这样也不能盲目的否定残差服从正态分布的假设，因为我们用了进行分析的样本太小，样本容量仅为5。

（C）spss参数检验分析（单样本t检验）

1.单样本t检验。

在这里我选择的是转移性收入这个变量做的分析，推断转移性收入的平均值是否为2200元，下面是分析后输出的结果。

单个样本统计量

均值的标准误

转移性收入

2420.4600

2221.14998

993.32847

表9转移性收入的基本描述统计结果

单个样本检验

检验值=2200

Sig.（双侧）

均值差值

差分的95%置信区间

下限

上限

.222

.835

220.46000

-2537.4620

2978.3820

表10转移性收入单样本t检验结果

由表9可知，五个年份的转移性收入的平均值为2420.4600元，标准差为2221.14元，均值的标准误差为993.32。

从表10中可以看出，该问题应采用双尾检验，因此比较α/2和p/2，也就是比较α和Ρ。

如果α给0.05，由于Ρ大于α，因此不应

拒绝原假设，不能认为转移性收入的平均值与2200有显著差异。

（D）比率分析

案例处理摘要

计数

总数

排除的

工资性收入/平均每人全部年收入的比率统计量

.714

平均数绝对值偏差

.048

离散系数

.068

方差系数

均值居中

8.7%

中值居中

表11案例处理摘要

表12工资性收入的比率分析结果

表11是案例处理摘要，表12显示的是工资性收入的比率分析结果，从表12可以看出五个年份的工资性收入占平均每人全部年收入的比率的均值为0.714，也就是说，五个年份的城镇居民平均每人全部年收入中的71.4%为工资性收入，由此可见工资性收入对城镇居民生活状况改善的重要性。

（E）因子分析

在这里先将分析后得到的结果展示如下：