统计分析城镇居民人均全年家庭收入来源论文Word下载.docx
《统计分析城镇居民人均全年家庭收入来源论文Word下载.docx》由会员分享,可在线阅读,更多相关《统计分析城镇居民人均全年家庭收入来源论文Word下载.docx(17页珍藏版)》请在冰豆网上搜索。
Total
N
Percent
31
100.0%
.0%
31
aSquaredEuclideanDistanceUndefinederror#14704-Cannotopentex
通过观察上表,我们可以看出,在整个聚类过程中,描述我国城镇居民人均全年家庭收入来源状况的31个样品都参与了聚类分析过程,没有遗失或未参与的样品。
这充分说明此次聚类分析已经对全部31个样品的各项指标进行了相似聚类,不需要再利用判别分析再进行二度聚类。
2.凝聚顺序表
AgglomerationSchedule
Stage
ClusterCombined
Coefficients
StageClusterFirstAppears
NextStage
Cluster1
Cluster2
1
12
17
.062
7
2
4
27
.068
18
3
.092
9
14
23
.154
5
16
30
.206
6
20
25
.232
10
.330
8
24
.350
13
.355
21
.421
11
28
29
.623
22
.727
.886
.887
15
.979
1.049
1.120
1.502
19
1.785
26
2.215
2.231
2.828
3.235
4.069
7.279
8.069
9.167
11.625
18.908
26.157
该图表明了31个样品的聚类过程首先将距离最近的样品编号12和17聚为一类,对应的下一步为第7步。
再将14与12、17的样品聚为一类,对应的下一步为第12步,即将编号为22的样品也归入类。
以此类推,共采用了30步将31个样品并为一类。
3.聚类树状图
******HIERARCHICALCLUSTERANALYSIS******
DendrogramusingAverageLinkage(BetweenGroups)
RescaledDistanceClusterCombine
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
安徽12
湖北17
江西14
四川23
重庆22
河南16
宁夏30
河北3
吉林7
贵州24
广西20
云南25
海南21
湖南18
辽宁6
内蒙古5
山东15
山西4
陕西27
黑龙江8
青海29
甘肃28
新疆31
西藏26
北京1
上海9
天津2
福建13
广东19
江苏10
浙江11
从中可以看出可以大致分为两类。
北京,上海,天津,福建,广东,江苏,浙江分为一类,其余的分为一类。
第一类的城市都是经济相对比较发达,城镇居民平均每人全年家庭各种收入来源收入较高。
第二类为经济次发达和经济不发达地区。
总的来说,我国东部沿海地区和一些中西部发达地区的城镇居民通过各个收入来源所得收入较高,而广大西部地区的城镇居民人均全年家庭收入还有待提高。
四.主成分分析
主成分分析也称主分量分析,是一种将多个指标化为少数几个综合指标的统计分析
方法。
在经济问题研究中,为了全面、系统地分析问题,我们必须考虑众多对某经济过程
有影响的因素,这些因素在统计学中被称为指标,也成为变量,每个指标都在不同程度上
反映了所研究问题的某些信息,但是指标之间彼此有一定的相关性,因而所得的统计数据
在一定程度上反映的信息有重叠。
主成分分析可将相关的指标化成不相关的指标,避免了
信息重复带来的虚假性。
此外,主成分分析能用较少的变量反应更多的问题,减少计算量
的同时也简化了问题。
1.描述统计量表
DescriptiveStatistics
Mean
Std.Deviation
AnalysisN
可支配收入
23218.6268
5844.43724
工资性收入
16560.5987
4674.41838
经营净收入
2195.4848
872.41461
财产性收入
592.6190
399.48740
转移性收入
6123.2806
1968.26092
由上表第二栏均值可以看出,2012年我国31个省市自治区的城镇居民人均全年家庭的可支配收入的平均数为23218.6268元;
工资性收入的平均数为16560.5987元;
经营净收入的平均数为2195.4848元;
财产性收入的平均数为592.6190;
转移性收入的平均数为6123.2806。
由第三栏可看出我国城镇居民人均全年家庭各个收入来源的标准差分别为5844.43724、4674.41838、872.41461、399.48740、1968.26092。
从中可以看出城镇居民的收入来源是不均衡的。
由第四栏参与计算的观测量数可以得知,此次统计分析的样品数量为我国31个省市自治区的城镇居民收入来源的各项指标。
2.相关系数矩阵
CorrelationMatrix
Correlation
1.000
.951
.444
.550
.808
.251
.471
.663
.704
.246
.201
上表是5个指标变量经过标准化后的相关系数矩阵,首先我们可以看出各变量与自身的关系是毋庸置疑的。
其次,各个指标间也存在一定的相关性。
比如:
可支配收入与工资性收入的相关系数高达0.951,可支配收入与经营净收入间的相关系数为0.444,可支配收入与财产性收入的相关系数为0.550等。
总的来说,多数指标变量间具有很强的相关性。
3.各特征根的方差贡献
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
%ofVariance
Cumulative%
3.177
63.544
1.197
23.939
87.483
.447
8.936
96.419
.177
3.544
99.963
.002
.037
100.000
ExtractionMethod:
PrincipalComponentAnalysis.
上表是相关系数矩阵的特征值以及相应的方差贡献。
通过主成分分析过程,我们从众多指标中提取出了两个主成分因子,这两个主成分因子的特征值分别为3.177和1.197;
它们的各因子方差贡献率分别为63.544%和23.939%;
累计贡献率为87.483%,大于85%的经验准则要求。
4.因子碎石图
从因子碎石图可以看出,趋势图在第二个因子以后趋于平稳,所以保留两个因子即可。
5.因子载荷矩阵
ComponentMatrix(a)
.972
-.217
.880
-.313
.614
.682
.706
.604
.763
-.471
上表为未经旋转的因子载荷矩阵。
将每个因子载荷向量除以相应的特征值的平方根,可得到主成分的计算公式为:
F1=0.545x1+0.494x2+0.344x3+0.396x4+0.43x5
F2=-0.198x1-0.286x2+0.623x3+0.552x4-0.43x5
五.因子分析
因子分析是主成分分析的推广,它也是一种把多个相关变量(指标)化为少数几个不相关变量的统计分析方法。
因子分析的目的不仅是找出公因子,更重要的是知道每个公因子的意义。
但是用其他方法求解所求出的公因子解,各因子的典型代表变量不很突出,因而容易使因子的意义含糊不清,不便于对因子进行解释。
为此必须对因子载荷矩阵进行旋转,使得因子载荷的平方按列向0和1两级转化,达到其简化结构的目的。
1.描述性统计量
可支配总收入
由上表第二栏均值可以看出,2012年我国31个省市自治区的城镇居民人均全年家庭的可支配收入的平均数为23218.6268元;
CorrelationMatrix
上表是5个指标变量经过标准化后的相关系数矩阵,首先我们可以看出各变量与自身的关系是毋庸置疑的。
3.相关系数矩阵的逆矩阵
InverseofCorrelationMatrix
337.902
-230.311
-53.265
-19.076
-103.586
159.473
37.025
11.632
69.049
10.633
1.228
15.659
3.816
6.643
33.790
4.KMO和Bartlett检验
KMOandBartlett'
sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.361
Bartlett'
sTestofSphericity
Approx.Chi-Square
205.854
df
Sig.
.000
P值小于0.05,拒绝原假设,说明不是单位矩阵,可以做因子分析。
5.各变量共同度
Communalities
Initial
Extraction
.991
.873
.843
.863
.804
上表表示了各变量的共同度,5个变量的共同度都在0.8以上,共同度越大,公因子对指标解释的越多。
所有公因子对可支配总收入解释了99.1%,所有公因子对工资性收入解释了87.3%,公因子对经营净收入解释了84.3%,公因子对财产性收入解释了86.3%,公因子对转移性收入解释了80.4%。
6.特征根的方差贡献
TotalVarianceExplained
RotationSumsofSquaredLoadings
2.552
51.046
1.822
36.438
上表是相关系数矩阵的特征值以及相应的方差贡献。
通过分析,我们从众多指标中提取出了两个因子,这两个因子的特征值分别为3.177和1.197;
7.碎石图
从中可以看出,趋势图在两个因子后趋于平稳,所以保留两个因子。
8.因子载荷矩阵和旋转后的因子载荷矩阵
ComponentMatrix(a)
RotatedComponentMatrix(a)
.925
.367
.904
.236
.125
.910
.244
.896
.039
载荷矩阵表明了公因子与原始指标间的关系,系数越大,关系越密切。
旋转前,第一因子与x1,x2,x5关系较密切,第二因子与x3,x4关系较密切。
旋转后与旋转前没有什么区别。
9.因子得分系数矩阵
ComponentScoreCoefficientMatrix
.022
.376
-.061
-.160
.580
-.100
.542
.420
-.191
可得出公因子和综合得分及排名:
地区
第一因子
第二因子
综合因子
得分
排名
上海
3.18919
-0.55235
2.63684
北京
2.86945
-0.90849
1.96096
天津
1.75411
-1.15349
0.60062
浙江
1.18873
2.49192
3.68065
江苏
0.89253
0.7152
1.60773
广东
0.34956
2.13656
2.48612
辽宁
0.16433
0.06075
0.22508
陕西
0.04359
-1.28745
-1.24386
山东
0.03549
0.52843
0.56392
重庆
0.02576
-0.12088
-0.09512
福建
-0.01707
2.39961
2.38254
山西
-0.08585
-1.11941
-1.20526
安徽
-0.28047
-0.05947
-0.33994
湖北
-0.30873
-0.15661
-0.46534
内蒙古
-0.37741
0.43366
0.05625
河北
-0.37884
-0.27215
-0.65099
青海
-0.41001
-1.28954
-1.69955