多元统计分析案例分析.docx
《多元统计分析案例分析.docx》由会员分享,可在线阅读,更多相关《多元统计分析案例分析.docx(14页珍藏版)》请在冰豆网上搜索。
![多元统计分析案例分析.docx](https://file1.bdocx.com/fileroot1/2022-10/10/53e795be-4b36-4b33-bd31-b280f0a2a16a/53e795be-4b36-4b33-bd31-b280f0a2a16a1.gif)
多元统计分析案例分析
一、对我国30个省市自治区农村居民生活水平作聚类分析
1、指标选择及数据:
为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进展考察。
因此选取以下指标:
农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。
现从2010年的调查资料中抽取30个样本,指标数据如下:
地区
农产品价格指数〔上年=100〕
农村住宅投资〔亿元〕
农村居民消费水平〔元〕
农村居民生活消费支出合计〔元〕
农村居民家庭人均纯收入〔元〕
耕地面积2021
〔万公顷〕
农村私营企业就业人数〔万人〕
98.27
93.04
12886
9254.8
13262
231.7
153.9
XX
103.03
48.31
7814
4936.7
10075
441.1
8.0
XX
99.70
441.75
3867
3844.9
5958
6317.3
80.9
XX
100.43
168.71
4500
3663.9
4736
4055.8
51.7
XX
99.83
33.17
4486
4460.8
5530
7147.2
18.4
XX
102.90
162.05
5739
4489.5
6908
4085.3
99.5
XX
103.77
71.65
4663
4147.4
6237
5534.6
21.2
XX
98.07
126.45
4536
4391.2
6211
11830.1
42.8
XX
102.23
2.12
13609
10210.5
13978
244.0
258.4
XX
99.92
284.55
8196
6542.9
9118
4763.8
569.8
XX
100.25
513.75
9878
8928.9
11303
1920.9
398.3
XX
99.08
412.48
4447
4013.3
5285
5730.2
105.9
XX
98.04
176.35
6879
5498.3
7427
1330.1
113.1
XX
96.81
236.53
4397
3911.6
5789
2827.1
173.2
XX
101.23
566.90
5733
4807.2
6990
7515.3
273.6
XX
99.07
729.47
4061
3682.2
5524
7926.4
137.7
XX
96.30
210.06
4758
4090.8
5832
4664.1
66.4
XX
90.61
298.41
4513
4310.4
5622
3789.4
104.5
XX
94.95
337.44
5880
5515.6
7890
2830.7
124.4
XX
89.25
248.80
3561
3455.3
4543
4217.5
89.0
XX
101.91
26.22
3846
3446.2
5275
727.5
5.3
XX
88.99
80.12
3652
3624.6
5277
2235.9
36.7675
XX
96.94
456.10
4748
3897.5
5087
5947.4
140.3
XX
96.11
137.22
2926
2852.5
3472
4485.3
25.4
XX
96.50
158.97
3603
3398.3
3952
6072.1
41.3
XX
95.83
151.79
3683
3793.8
4105
4050.3
1.7
XX
100.22
97.33
2975
2942.0
3425
4658.8
22.0
XX
94.61
63.63
3684
3863
542.7
10.5
11.4
XX
99.39
29.51
3894
4675
1107.1
43.6
16.7
XX
92.87
79.35
3590
3457.9
4643
4124.6
18.7
数据来源:
?
中国统计年鉴2021?
.
2、将数据进展标准化变换:
地区
农产品价格指数〔上年=100〕
农村住宅投资〔亿元〕
农村居民消费水平〔元〕
农村居民生活消费支出合计〔元〕
农村居民家庭人均纯收入〔元〕
耕地面积2021
〔万公顷〕
农村私营企业就业人数〔万人〕
0.09
-0.67
2.82
2.53
2.37
-1.36
0.37
XX
1.33
-0.91
0.92
0.15
1.30
-1.29
-0.78
XX
0.47
1.24
-0.56
-0.46
-0.07
0.84
-0.21
XX
0.65
-0.25
-0.33
-0.56
-0.48
0.02
-0.44
XX
0.50
-0.99
-0.33
-0.12
-0.21
1.15
-0.70
XX
1.30
-0.29
0.14
-0.10
0.25
0.03
-0.06
XX
1.52
-0.78
-0.26
-0.29
0.02
0.56
-0.68
XX
0.04
-0.48
-0.31
-0.15
0.01
2.84
-0.51
XX
1.12
-1.16
3.09
3.06
2.60
-1.36
1.20
XX
0.52
0.38
1.06
1.04
0.98
0.28
3.66
XX
0.61
1.64
1.69
2.35
1.71
-0.75
2.31
XX
0.30
1.08
-0.35
-0.36
-0.30
0.63
-0.01
XX
0.04
-0.21
0.57
0.46
0.42
-0.97
0.05
XX
-0.28
0.12
-0.36
-0.42
-0.13
-0.42
0.52
XX
0.86
1.93
0.14
0.08
0.27
1.28
1.32
XX
0.30
2.82
-0.49
-0.55
-0.22
1.43
0.24
XX
-0.42
-0.03
-0.23
-0.32
-0.11
0.24
-0.32
XX
-1.89
0.46
-0.32
-0.20
-0.18
-0.07
-0.02
XX
-0.77
0.67
0.19
0.47
0.57
-0.42
0.14
XX
-2.24
0.19
-0.68
-0.67
-0.54
0.08
-0.14
XX
1.04
-1.03
-0.57
-0.68
-0.30
-1.18
-0.81
XX
-2.31
-0.74
-0.64
-0.58
-0.30
-0.64
-0.56
XX
-0.25
1.32
-0.23
-0.43
-0.36
0.71
0.26
XX
-0.46
-0.42
-0.92
-1.00
-0.90
0.18
-0.65
XX
-0.36
-0.31
-0.66
-0.70
-0.74
0.75
-0.52
XX
-0.54
-0.34
-0.63
-0.48
-0.69
0.02
-0.83
XX
0.60
-0.64
-0.90
-0.96
-0.92
0.24
-0.67
XX
-0.85
-0.83
-0.63
-0.45
-1.88
-1.44
-0.76
XX
0.39
-1.01
-0.55
0.00
-1.69
-1.43
-0.71
XX
-1.30
-0.74
-0.67
-0.67
-0.51
0.05
-0.70
3、用K-均值聚类法对样本进展分类如下:
聚类成员
案例号
地区
聚类
距离
1
1
1069.19
2
XX
2
3060.35
3
XX
3
920.65
4
XX
4
1506.42
5
XX
3
577.12
6
XX
2
2453.89
7
XX
3
1487.95
8
XX
3
5006.41
9
XX
1
2094.38
10
XX
2
2853.42
11
XX
1
3015.14
12
XX
3
1204.49
13
XX
2
1612.46
14
XX
4
1880.40
15
XX
3
2088.55
16
XX
3
1282.27
17
XX
3
2230.15
18
XX
4
2053.35
19
XX
2
1119.98
20
XX
4
1412.14
21
XX
4
2541.05
22
XX
4
1423.51
23
XX
3
1138.14
24
XX
4
2025.41
25
XX
3
2196.63
26
XX
4
1127.91
27
XX
4
2123.67
28
XX
4
4568.60
29
XX
4
4247.12
30
XX
4
1360.50
分四类的情况下,最终分类结果如下:
第一类:
、XX、XX。
第二类:
XX、、XX、、XX、XX、XX、XX。
第三类:
XX、XX、XX、XX、XX、XX、XX、XX、XX、XX、XX。
第四类:
XX、XX、XX、XX、XX、XX、XX、XX、XX、XX、。
从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。
二、判别分析
针对以上分类结果进展判别分析。
其中将XX作作为待判样本。
判别结果如下:
案例数目
实际组