统计分析城镇居民人均全年家庭收入来源论文Word下载.docx

资源描述

统计分析城镇居民人均全年家庭收入来源论文Word下载.docx

《统计分析城镇居民人均全年家庭收入来源论文Word下载.docx》由会员分享，可在线阅读，更多相关《统计分析城镇居民人均全年家庭收入来源论文Word下载.docx（17页珍藏版）》请在冰豆网上搜索。

统计分析城镇居民人均全年家庭收入来源论文Word下载.docx

Total

Percent

100.0%

.0%

aSquaredEuclideanDistanceUndefinederror#14704-Cannotopentex

通过观察上表，我们可以看出，在整个聚类过程中，描述我国城镇居民人均全年家庭收入来源状况的31个样品都参与了聚类分析过程，没有遗失或未参与的样品。

这充分说明此次聚类分析已经对全部31个样品的各项指标进行了相似聚类，不需要再利用判别分析再进行二度聚类。

2.凝聚顺序表

AgglomerationSchedule

Stage

ClusterCombined

Coefficients

StageClusterFirstAppears

NextStage

Cluster1

Cluster2

.062

.068

.092

.154

.206

.232

.330

.350

.355

.421

.623

.727

.886

.887

.979

1.049

1.120

1.502

1.785

2.215

2.231

2.828

3.235

4.069

7.279

8.069

9.167

11.625

18.908

26.157

该图表明了31个样品的聚类过程首先将距离最近的样品编号12和17聚为一类，对应的下一步为第7步。

再将14与12、17的样品聚为一类，对应的下一步为第12步，即将编号为22的样品也归入类。

以此类推，共采用了30步将31个样品并为一类。

3.聚类树状图

******HIERARCHICALCLUSTERANALYSIS******

DendrogramusingAverageLinkage（BetweenGroups）

RescaledDistanceClusterCombine

CASE0510152025

LabelNum+---------+---------+---------+---------+---------+

安徽12

湖北17

江西14

四川23

重庆22

河南16

宁夏30

河北3

吉林7

贵州24

广西20

云南25

海南21

湖南18

辽宁6

内蒙古5

山东15

山西4

陕西27

黑龙江8

青海29

甘肃28

新疆31

西藏26

北京1

上海9

天津2

福建13

广东19

江苏10

浙江11

从中可以看出可以大致分为两类。

北京，上海，天津，福建，广东，江苏，浙江分为一类，其余的分为一类。

第一类的城市都是经济相对比较发达，城镇居民平均每人全年家庭各种收入来源收入较高。

第二类为经济次发达和经济不发达地区。

总的来说，我国东部沿海地区和一些中西部发达地区的城镇居民通过各个收入来源所得收入较高，而广大西部地区的城镇居民人均全年家庭收入还有待提高。

四.主成分分析

主成分分析也称主分量分析，是一种将多个指标化为少数几个综合指标的统计分析

方法。

在经济问题研究中，为了全面、系统地分析问题，我们必须考虑众多对某经济过程

有影响的因素，这些因素在统计学中被称为指标，也成为变量，每个指标都在不同程度上

反映了所研究问题的某些信息，但是指标之间彼此有一定的相关性，因而所得的统计数据

在一定程度上反映的信息有重叠。

主成分分析可将相关的指标化成不相关的指标，避免了

信息重复带来的虚假性。

此外，主成分分析能用较少的变量反应更多的问题，减少计算量

的同时也简化了问题。

1.描述统计量表

DescriptiveStatistics

Mean

Std.Deviation

AnalysisN

可支配收入

23218.6268

5844.43724

工资性收入

16560.5987

4674.41838

经营净收入

2195.4848

872.41461

财产性收入

592.6190

399.48740

转移性收入

6123.2806

1968.26092

由上表第二栏均值可以看出，2012年我国31个省市自治区的城镇居民人均全年家庭的可支配收入的平均数为23218.6268元；

工资性收入的平均数为16560.5987元；

经营净收入的平均数为2195.4848元；

财产性收入的平均数为592.6190；

转移性收入的平均数为6123.2806。

由第三栏可看出我国城镇居民人均全年家庭各个收入来源的标准差分别为5844.43724、4674.41838、872.41461、399.48740、1968.26092。

从中可以看出城镇居民的收入来源是不均衡的。

由第四栏参与计算的观测量数可以得知，此次统计分析的样品数量为我国31个省市自治区的城镇居民收入来源的各项指标。

2.相关系数矩阵

CorrelationMatrix

Correlation

1.000

.951

.444

.550

.808

.251

.471

.663

.704

.246

.201

上表是5个指标变量经过标准化后的相关系数矩阵，首先我们可以看出各变量与自身的关系是毋庸置疑的。

其次，各个指标间也存在一定的相关性。

比如：

可支配收入与工资性收入的相关系数高达0.951，可支配收入与经营净收入间的相关系数为0.444，可支配收入与财产性收入的相关系数为0.550等。

总的来说，多数指标变量间具有很强的相关性。

3.各特征根的方差贡献

TotalVarianceExplained

Component

InitialEigenvalues

ExtractionSumsofSquaredLoadings

%ofVariance

Cumulative%

3.177

63.544

1.197

23.939

87.483

.447

8.936

96.419

.177

3.544

99.963

.002

.037

100.000

ExtractionMethod:

PrincipalComponentAnalysis.

上表是相关系数矩阵的特征值以及相应的方差贡献。

通过主成分分析过程，我们从众多指标中提取出了两个主成分因子，这两个主成分因子的特征值分别为3.177和1.197；

它们的各因子方差贡献率分别为63.544%和23.939%；

累计贡献率为87.483%，大于85%的经验准则要求。

4.因子碎石图

从因子碎石图可以看出，趋势图在第二个因子以后趋于平稳，所以保留两个因子即可。

5.因子载荷矩阵

ComponentMatrix（a）

.972

-.217

.880

-.313

.614

.682

.706

.604

.763

-.471

上表为未经旋转的因子载荷矩阵。

将每个因子载荷向量除以相应的特征值的平方根，可得到主成分的计算公式为：

F1=0.545x1+0.494x2+0.344x3+0.396x4+0.43x5

F2=-0.198x1-0.286x2+0.623x3+0.552x4-0.43x5

五.因子分析

因子分析是主成分分析的推广，它也是一种把多个相关变量（指标）化为少数几个不相关变量的统计分析方法。

因子分析的目的不仅是找出公因子，更重要的是知道每个公因子的意义。

但是用其他方法求解所求出的公因子解，各因子的典型代表变量不很突出，因而容易使因子的意义含糊不清，不便于对因子进行解释。

为此必须对因子载荷矩阵进行旋转，使得因子载荷的平方按列向0和1两级转化，达到其简化结构的目的。

1.描述性统计量

可支配总收入

由上表第二栏均值可以看出，2012年我国31个省市自治区的城镇居民人均全年家庭的可支配收入的平均数为23218.6268元；

CorrelationMatrix

上表是5个指标变量经过标准化后的相关系数矩阵，首先我们可以看出各变量与自身的关系是毋庸置疑的。

3.相关系数矩阵的逆矩阵

InverseofCorrelationMatrix

337.902

-230.311

-53.265

-19.076

-103.586

159.473

37.025

11.632

69.049

10.633

1.228

15.659

3.816

6.643

33.790

4.KMO和Bartlett检验

KMOandBartlett'

sTest

Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.

.361

Bartlett'

sTestofSphericity

Approx.Chi-Square

205.854

Sig.

.000

P值小于0.05，拒绝原假设，说明不是单位矩阵，可以做因子分析。

5.各变量共同度

Communalities

Initial

Extraction

.991

.873

.843

.863

.804

上表表示了各变量的共同度，5个变量的共同度都在0.8以上，共同度越大，公因子对指标解释的越多。

所有公因子对可支配总收入解释了99.1%,所有公因子对工资性收入解释了87.3%，公因子对经营净收入解释了84.3%，公因子对财产性收入解释了86.3%，公因子对转移性收入解释了80.4%。

6.特征根的方差贡献

TotalVarianceExplained

RotationSumsofSquaredLoadings

2.552

51.046

1.822

36.438

上表是相关系数矩阵的特征值以及相应的方差贡献。

通过分析，我们从众多指标中提取出了两个因子，这两个因子的特征值分别为3.177和1.197；

7.碎石图

从中可以看出，趋势图在两个因子后趋于平稳，所以保留两个因子。

8.因子载荷矩阵和旋转后的因子载荷矩阵

ComponentMatrix（a）

RotatedComponentMatrix（a）

.925

.367

.904

.236

.125

.910

.244

.896

.039

载荷矩阵表明了公因子与原始指标间的关系，系数越大，关系越密切。

旋转前，第一因子与x1,x2,x5关系较密切，第二因子与x3,x4关系较密切。

旋转后与旋转前没有什么区别。

9.因子得分系数矩阵

ComponentScoreCoefficientMatrix

.022

.376

-.061

-.160

.580

-.100

.542

.420

-.191

可得出公因子和综合得分及排名：

地区

第一因子

第二因子

综合因子

得分

排名

上海

3.18919

-0.55235

2.63684

北京

2.86945

-0.90849

1.96096

天津

1.75411

-1.15349

0.60062

浙江

1.18873

2.49192

3.68065

江苏

0.89253

0.7152

1.60773

广东

0.34956

2.13656

2.48612

辽宁

0.16433

0.06075

0.22508

陕西

0.04359

-1.28745

-1.24386

山东

0.03549

0.52843

0.56392

重庆

0.02576

-0.12088

-0.09512

福建

-0.01707

2.39961

2.38254

山西

-0.08585

-1.11941

-1.20526

安徽

-0.28047

-0.05947

-0.33994

湖北

-0.30873

-0.15661

-0.46534

内蒙古

-0.37741

0.43366

0.05625

河北

-0.37884

-0.27215

-0.65099

青海

-0.41001

-1.28954

-1.69955

展开阅读全文