收藏

下载资源加入VIP,免费下载

spss案例数据分析.docx

上传人：b****8 文档编号：29574456 上传时间：2023-07-24 格式：DOCX 页数：12 大小：41.71KB

下载相关举报

spss案例数据分析.docx_第1页

第1页 / 共12页

spss案例数据分析.docx_第2页

第2页 / 共12页

spss案例数据分析.docx_第3页

第3页 / 共12页

spss案例数据分析.docx_第4页

第4页 / 共12页

spss案例数据分析.docx_第5页

第5页 / 共12页

点击查看更多>>

资源描述

spss案例数据分析.docx

《spss案例数据分析.docx》由会员分享，可在线阅读，更多相关《spss案例数据分析.docx（12页珍藏版）》请在冰豆网上搜索。

spss案例数据分析.docx

spss案例数据分析

Spss期末作业

关于我国城镇居民消费结构及趋势的数据分析

本次分析采用的数据来源于《中国统计年鉴—2011》，我选用的是其中的第十篇章—人民生活下的城镇居民家庭基本情况的相关数据，用以研究城镇居民消费结构及其趋势。

（附数据部分截图）

（A）下面是我对该数据做的相关分析。

表一给出的是基本的描述性统计图，表中显示各个变量的全部观测量的均值、标准差和观测值总数N，表2给出的是相关系数矩阵表，其中显示4个变量两两之间的pearson相关系数，以及关于相关关系等于零的假设的单侧显著性检验概率。

描述性统计量

均值

标准差

N

食品

2744.0660

1802.80584

5

衣着

775.8200

555.67616

5

居住

694.1920

565.48222

5

家庭设备用品及服务

488.2500

343.94006

5

表1 描述性统计表

相关性

食品

衣着

居住

家庭设备用品及服务

食品

Pearson相关性

1

.998**

.991**

.995**

显著性（单侧）

.000

.001

.000

平方与叉积的和

1.300E7

4000739.197

4039135.855

2468266.142

协方差

3250108.892

1000184.799

1009783.964

617066.535

N

5

5

5

5

衣着

Pearson相关性

.998**

1

.985**

.994**

显著性（单侧）

.000

.001

.000

平方与叉积的和

4000739.197

1235103.975

1238672.922

760246.419

协方差

1000184.799

308775.994

309668.230

190061.605

N

5

5

5

5

居住

Pearson相关性

.991**

.985**

1

.996**

显著性（单侧）

.001

.001

.000

平方与叉积的和

4039135.855

1238672.922

1279080.565

775005.410

协方差

1009783.964

309668.230

319770.141

193751.352

N

5

5

5

5

家庭设备用品及服务

Pearson相关性

.995**

.994**

.996**

1

显著性（单侧）

.000

.000

.000

平方与叉积的和

2468266.142

760246.419

775005.410

473179.063

协方差

617066.535

190061.605

193751.352

118294.766

N

5

5

5

5

**.在.01水平（单侧）上显著相关。

表2 相关系数矩阵

从表2中可以看出家庭设备用品及服务与食品、衣着之间相关系数分别为0.995、0.994，反映家庭设备用品及服务与食品、衣着之间存在显著的相关关系。

说明食品与衣着对家庭设备用品及服务条件的好转有显著的作用，此外食品与衣着之间，食品与居住之间，居住与衣着之间的相关系数分别为0.998、0.991、0.985，这说明他们之间也存在着显著的相关关系。

在这里还要提一下相关系数旁边的两个星号的意思，它表示显著性水平α为0.01时仍拒绝原假设，一个星号则表示显著性水平α为0.05时可拒绝原假设。

因此，两个星号比一个星号拒绝原假设犯错误的可能性更小。

（B）下面是做的回归分析

表3给出了进入模型和被剔除的变量的信息。

从表中我们可以看出所有3个自变量都进入模型，说明我们的解释变量都是显著并且是有解释力的。

表4给出了模型整体拟合效果的概述，模型的拟合优度系数为1.000，反映了因变量于自变量之间具有高度显著的线性关系。

表里还显示了R平方以及经调整的R值估计标准误差

表5给出了方差分析表我们可以看到模型的设定检验F统计量的值为411.727，显著性水平的P值为0.036。

表6给出了回归系数表和变量显著性检验的T值。

我们发现变量“食品”的T值太小，没有达到显著性水平，因此我们要将这个变量剔除。

从这里我们也可以看出模型虽然通过了设定检验，但很有可能不能通过变量的显著性检验。

输入／移去的变量

模型

输入的变量

移去的变量

方法

1

居住,衣着,食品a

.

输入

a.已输入所有请求的变量。

表3变量进入/剔除信息表

模型汇总

模型

R

R方

调整R方

标准估计的误差

1

1.000a

.999

.997

19.56464

a.预测变量:

（常量）,居住,衣着,食品。

表4 模型概述表

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

472796.288

3

157598.763

411.727

.036a

残差

382.775

1

382.775

总计

473179.063

4

a.预测变量:

（常量）,居住,衣着,食品。

b.因变量:

家庭设备用品及服务

表5 方差分析表

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

（常量）

86.022

42.902

2.005

.295

食品

-.160

.133

-.838

-1.204

.441

衣着

.674

.349

1.090

1.934

.304

居住

.458

.141

.752

3.256

.190

a.因变量:

家庭设备用品及服务

表6 回归系数表

残差统计量a

极小值

极大值

均值

标准偏差

N

预测值

118.2242

901.6300

488.2500

343.80092

5

残差

-11.58816

7.57571

.00000

9.78232

5

标准预测值

-1.076

1.202

.000

1.000

5

标准残差

-.592

.387

.000

.500

5

a.因变量:

家庭设备用品及服务

表7 残差统计表

表7给出了残差分析表，表中显示了预测值、残差、标准化预测值、标准化残差的最小值、最大值、均值、标准偏差及样本容量等数据。

根据概率的3西格玛原则，标准化残差的绝对值最大为0.387,小于3，说明样本数据中没有奇异值。

表8 残差分布直方图

表8给出了模型的直方图。

由于我们在模型中始终假设残差服从正态分布，因此我们可以从这张图中直观地看出回归后的实际残差是否符合我们的假设。

从回归残差的直方图与附于图上的正态分布曲线相比较，可以认为残差的分布不是明显地服从正态分布。

尽管这样也不能盲目的否定残差服从正态分布的假设，因为我们用了进行分析的样本太小，样本容量仅为5。

（C）spss参数检验分析（单样本t检验）

1.单样本t检验。

在这里我选择的是转移性收入这个变量做的分析，推断转移性收入的平均值是否为2200元，下面是分析后输出的结果。

单个样本统计量

N

均值

标准差

均值的标准误

转移性收入

5

2420.4600

2221.14998

993.32847

表9 转移性收入的基本描述统计结果

单个样本检验

检验值=2200

t

df

Sig.（双侧）

均值差值

差分的95%置信区间

下限

上限

转移性收入

.222

4

.835

220.46000

-2537.4620

2978.3820

表10 转移性收入单样本t检验结果

由表9可知，五个年份的转移性收入的平均值为2420.4600元，标准差为2221.14元，均值的标准误差为993.32。

从表10中可以看出，该问题应采用双尾检验，因此比较α/2和p/2，也就是比较α和Ρ。

如果α给0.05，由于Ρ大于α，因此不应

拒绝原假设，不能认为转移性收入的平均值与2200有显著差异。

（D）比率分析

案例处理摘要

计数

总数

5

排除的

0

总计

5

工资性收入/平均每人全部年收入的比率统计量

均值

.714

平均数绝对值偏差

.048

离散系数

.068

方差系数

均值居中

8.7%

中值居中

8.7%

表11案例处理摘要

表12工资性收入的比率分析结果

表11是案例处理摘要，表12显示的是工资性收入的比率分析结果，从表12可以看出五个年份的工资性收入占平均每人全部年收入的比率的均值为0.714，也就是说，五个年份的城镇居民平均每人全部年收入中的71.4%为工资性收入，由此可见工资性收入对城镇居民生活状况改善的重要性。

（E）因子分析

在这里先将分析后得到的结果展示如下：

相关矩阵a

食品

衣着

居住

家庭设备用品及服务

医疗保健

相关

食品

1.000

.998

.991

.995

.986

衣着

.998

1.000

.985

.994

.981

居住

.991

.985

1.000

.996

.996

家庭设备用品及服务

.995

.994

.996

1.000

.990

医疗保健

.986

.981

.996

.990

1.000

a.此矩阵不是正定矩阵。

表13相关系数矩阵

公因子方差

初始

提取

食品

1.000

.995

衣着

1.000

.991

居住

1.000

.994

家庭设备用品及服务

1.000

.997

医疗保健

1.000

.988

提取方法：

主成份分析。

表14 公因子方差

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

4.965

99.300

99.300

4.965

99.300

99.300

2

.027

.538

99.838

3

.006

.118

99.956

4

.002

.044

100.000

5

3.718E-17

7.436E-16

100.000

提取方法：

主成份分析。

表15 解释的总方差

表16 因子的碎石图

表18成分得分系数矩阵

成份矩阵a

成份

1

家庭设备用品及服务

.999

食品

.997

居住

.997

衣着

.995

医疗保健

.994

提取方法:

主成分分析法。

a.已提取了1个成份。

成份得分系数矩阵

成份

1

食品

.201

衣着

.200

居住

.201

家庭设备用品及服务

.201

医疗保健

.200

提取方法:

主成分分析法。

旋转法:

具有Kaiser标准化的正交旋转法。

构成得分。

表17 成分矩阵

表13是原有变量的相关系数矩阵。

可以看出：

大部分的相关系数都较高，各变量呈较强的线性关系，能够从中提取公共因子，适合进行因子分析。

表14是因子分析的初始解，显示了所有变量的共同度数据。

第一列是因子分析初始解下的变量共同度，它表明：

对原有5个变量如果采用主成分分析方法提取所有特征根（5个），那么原有变量的所有方差都可被解释，变量的共同度均为1（原有变量标准化后的方差为1）。

事实上，因子个数小于原有变量的个数才是因子分析的目标，所以不可能提取全部特征根；第二列是在按指定提取条件（这里为特征根大于1）提取特征根时的共同度。

表15中：

第一列是因子编号，以后三列组成一组，每组中数据项的含义依次是特征根值、方差贡献率。

表16是因子的碎石图，横坐标为因子数目，纵坐标为特征根。

可以看到：

第一个因子的特征根值很高，对解释原有变量的贡献最大；第二个以后的因子特征根值都较小，对解释原有变量的贡献很小，已经成为可被忽略的“高山脚下的碎石”，因此提取一个因子是合适的。

表17显示的是因子成分矩阵，是因子分析的核心内容。

由表可以看出5个变量在第一个因子上的载荷都很高，意味着它们与第一个因子的相关程度高，第一个因子很重要。

另外还可以看出：

因子的实际含义比较模糊。

表18是成分得分系数矩阵。

展开阅读全文

相关资源

猜你喜欢

相关搜索

当前位置：首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1