成都的宜居性的相关分析 数学建模Word格式文档下载.docx
《成都的宜居性的相关分析 数学建模Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《成都的宜居性的相关分析 数学建模Word格式文档下载.docx(28页珍藏版)》请在冰豆网上搜索。
我们建立了一个评价一座城市是否是宜居城市的模型,通过该模型能够清楚的看到城市综合指数,来判断一座城市是否是宜居城市。
问题2:
哪些因素对成都的宜居性影响最大?
分析此问题时,我们根据问题一筛选出对城市宜居性影响程度较大的几项因素,如自然环境,经济收入水平,人文环境等。
然后根据这几项因素设计了调查问卷,发放给学校及周边居民进行调查,将返回的结果进行筛选,去除无效问卷。
最终根据得到的问卷结果进行统计分析,得出对城市宜居性的影响最大的因素。
3、基本假设
[1]因为数据均来自政府网站,所以我们假设每个城市的数据有很高的准确度
[2]因为我们所搜集的各项指标基本涵盖了居民生活的各个方面,所以我们假设我们搜集各项指标可以准确全面的反应成都市的宜居指数。
[3]进行聚类分析时,因为我们搜集的城市具有一定的代表性,所以假设所比较的若干城市可以代表我国城市宜居性建设的各水平。
[4]进行聚类分析时,假设各城市2011年的各项指标可以准确地反映其宜居程度。
[5]假设我们得到的调查问卷结果可以反映居民的整体意见。
4、符号说明
把我们对成都依据性分析涉及到的34项指标记为X1、X2、X3·
·
X34,这34个指标所构成的多维随机向量为:
X=(X1,X2,…X24),
将P个指标标准化后记为:
ZX=(ZX1,ZX2,⋯ZX34),
相关系数矩阵记为R。
那么求得的主成分可以表示为:
F1=u11ZX1+u12ZX2+⋯+u1(34)ZX(34);
F2=u21ZXl+u22ZX2+⋯+u2(34)ZX(34x);
……
F34=u(34)1ZXl+u(34)2ZX2+⋯+u(34)(34)ZX(34x);
其中:
Ui’-=(ui1,ui2,⋯,ui34),F=(F1,F2,⋯,F34)’,
那么上式可以表示为:
F=U’ZX,
其中U是正交阵。
5、模型的建立与求解
5.1用主成分分析法分析成都的宜居性
5.1.1数据预处理
(1)数据缺失
由于分析本问题所需的34项指标中,2002年的地方财政预算内支出(亿元),全民健身路径(条),货物进出口总额(百万美元),道路交通等效声级dB(A),环境噪声等效声级dB(A),年空气质量优良率(%),以及全年交通事故(件)和2003年的货物进出口总额(百万美元)数据缺失,且这些数据均是呈增加或减少趋势,所以我们采用SPSS软件的替换缺失值功能,按临近点的线性趋势进行缺失值替换。
(2)数据异常
因为我们所需数据均是来自各政府网站上查询的年鉴及发展公告,数据具有很高的可信度,所以没有发现数据异常现象。
(3)数据标准化
由于采用的各项指标具有不同的量纲,如生产总值(亿元)和第三产业占GDP比例(百分数),所以,为了消除变量间的量纲关系,从而使数据具有可比性,将数据化为均值为0,方差为1的标准化数据,所以我们采用Z标准化。
标准化后得到的数据记为ZX=(ZX1,ZX2,⋯ZX34);
5.1.2用主成分分析法分析各项指标
将处理好的数据导入SPSS软件中,采用因子分析法对数据进行处理,得到方差贡献表部分数据如下(全部数据见附录):
表5-1方差贡献表
组件
起始特征值
撷取平方和载入
循环平方和载入
总计
变异的%
累加%
1
23.734
69.806
20.787
61.139
2
5.012
14.741
84.548
7.622
22.418
83.557
3
1.976
5.812
90.360
2.232
6.565
90.122
4
1.179
3.469
93.829
1.260
3.707
5
.739
2.172
96.001
6
.494
1.453
97.455
7
.417
1.226
98.681
8
.339
.997
99.678
9
.110
.322
100.000
通过对上表的分析,我们可以看出,我们从所建立的25个指标中提取'
了4个主成分。
第一主成分所反映的指标信息最多,第二、三、四依次次之。
第一主成分的方差贡献率为0.69806,第二主成分的方差贡献率为0.14741,第三主成分的方差贡献率为0.05812,第四主成分的方差贡献率为0.03469,它们的累积贡献率达到了93.829%,足以反映原始指标中的25个指标所代表的信息。
记初始特征根和主成分贡献率分别为:
初始特征根:
λ1=23.734λ2=5.012λ1=1.976λ2=1.179
主成分贡献率:
r1=69.806%r2=14.741%r3=5.812%r4=3.469%
我们继续分析计算主成分与P个标准化后的指标之间的旋转矩阵,结果如下表所示:
表5-2主成分旋转矩阵
元件
1
2
3
4
生产总值(亿元)
.960
.244
.003
.128
第三产业增加值(亿元)
.959
.255
.044
第三产业占GDP比重(百分之)
.514
.604
.519
-.143
年末总人口(万人)
.808
.576
-.067
.091
人均GDP(美元)
-.272
-.875
.087
.130
人均收入(元)
.922
.356
-.073
.103
在岗职工平均工资(元)
.917
.378
-.060
.084
农村人民纯收入(元)
.948
.284
-.018
.126
年末城镇登记失业率(1比百分之)
.513
.709
.066
.139
居民消费价格总水平较去年上涨(百分之)
.342
.282
-.341
.760
住宅商品房平均销售价格(0.001比元平方米)
-.700
-.695
.133
-.083
地方财政预算内收入亿元
.954
-.051
.142
城乡居民储蓄年末余额(亿元)
.939
.297
.088
固定电话用户数(万户)
-.032
.905
.067
.184
旅客运输量(万人)
.826
-.169
.230
-.127
社会商品零售总额(亿元)
.963
.248
.029
.099
普通高等学校在校学生数(万人)
.748
.645
-.117
.082
剧场、影剧院数个
-.886
-.347
.009
移动电话用户(万户)
.888
.438
.120
集中式饮用水水源地水质达标率(百分之)
.114
-.384
.876
-.081
居民最低生活保障已保人数(万人)
-.691
-.378
.040
城镇基本养老保险人数(万人)
.936
.326
.076
每千人社会福利机构数(个)
-.850
-.496
-.036
每千人卫生机构数(个)
-.021
-.898
-.031
每千人邮局数(处)
-.812
-.530
.182
-.010
每千人私人汽车拥有量(辆)
.972
.195
-.034
.065
每千人医院、卫生院数(个)
-.512
-.692
.329
.039
每千人执业助理医师数人(个)
.990
.005
.026
.053
地方财政预算内支出亿元
.970
.031
-.061
-.177
道路交通等效声级(1比dBA)
-.320
-.539
.376
.560
环境噪声等效声级(1比dBA)
.833
.109
-.187
-.142
年空气质量优良率(百分之)
.675
-.262
-.643
.074
每千人全民健身路径(条)
.962
.027
-.175
每千人年交通事故发生次数(1比件)
.147
-.138
-.076
通过对上表的分析,我们可以看到:
第一主成分的方差贡献率最大,说明他对宜居城市的建设和评价的作用也最大。
第一个主成分主要反映临汾市居民的生活消费水平、及居民生活的舒适程度以及城市居民的交通、生活安全等这些指标上。
如生产总值,第三产业增加值,年末总人口,人均收入,在岗职工平均工资,农村人民纯收入,住宅商品房平均销售价格,地方财政预算内收入,城乡居民储蓄年末余额,旅客运输量,社会商品零售总额,普通高等学校在校学生数,剧场、影剧院数,移动电话用户,居民最低生活保障已保人数,城镇基本养老保险人数,每千人社会福利机构数,每千人邮局数,每千人私人汽车拥有量,每千人执业助理医师数人,地方财政预算内支出,环境噪声等效声级,年空气质量优良率,每千人全民健身路径,每千人年交通事故发生次数。
第二主成分的方差贡献率次之,主要反映的是经济和卫生方面的问题,如第三产业占GDP比重,人均GDP,年末城镇登记失业率,固定电话用户数,每千人卫生机构数,每千人医院、卫生院数。
第三主成分和第四主成分贡献率最小,反映的了居民消费水平和健康方面问题,如居民消费价格总水平较去年上涨,集中式饮用水水源地水质达标率,道路交通等效声级(1比dBA)。
5.1.3计算特征向量矩阵(主成分表达式的系数)
将上一步分析中得到的初始因子载荷矩阵(具体表格见附录)中的四列数据输入到SPSS软件的数据编辑窗口(设V1、V2、V3、V4),然后对其按下述公式计算得到特征向量矩阵即主成分表达式的系数。
Fi=Vi/SQR(λi);
i=1,2,3,4;
得到的主成分表达式的系数矩阵如下表:
表5-3特征向量矩阵
F1
F2
F3
F4
0.201
0.07
0.004
0.091
0.071
0.036
0.083
0.137
-0.084
0.468
-0.057
0.2
-0.095
0.03
0.042
-0.121
0.303
-0.118
0.155
0.204
0.011
-0.021
0.054
0.205
0.003
-0.006
0.039
0.203
0.05
-0.002
0.086
0.154
-0.185
0.147
0.113
0.098
-0.111
-0.285
0.612
-0.19
0.168
-0.012
-0.023
0.202
-0.032
0.095
0.055
0.072
0.106
0.067
-0.359
0.196
0.162
0.138
0.241
0.115
-0.087
0.026
0.195
-0.138
0.013
0.025
-0.196
-0.01
0.014
0.048
0.021
0.076
0.274
0.522
0.089
-0.079
-0.392
-0.128
-0.029
0.028
-0.009
0.034
-0.202
0.061
0.017
-0.078
0.365
-0.08
-0.198
0.087
0.046
0.052
0.088
0.029
-0.156
0.219
0.097
0.119
0.187
0.173
-0.018
0.032
0.185
0.156
-0.04
-0.192
-0.103
0.184
0.085
0.59
0.167
-0.11
-0.181
0.146
-0.511
-0.058
0.181
0.175
0.069
-0.16
0.193
0.096
-0.083
-0.116
5.1.4计算主成分得分矩阵(主成分得分)
将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分函数的表达式:
Zi=Fi1*zX1+Fi2*zX2+..+Fi(34)*zX(34);
i=1,2,…,10;
(其中,zXi为标准化后的数据)
将数据按上述公式用excel软件处理后,便可得到每年的主成分得分矩阵,结果如下表:
表5-4主成分得分矩阵
年份
第一主成分(Z1)
第二主成分(Z2)
第三主成分(Z3)
第四主成分(Z4)
2002
-5.61986
3.34896
-0.46393
-2.01629
2003
-5.70552
1.912
-0.47194
1.52947
2004
-4.6185
0.24782
-0.18518
0.81346
2005
-3.11877
-1.97709
2.18401
0.55353
2006
-1.13966
-2.23122
1.44011
-0.28952
2007
0.71191
-2.90008
-1.87806
-0.41625
2008
1.80258
-1.84891
-2.27346
0.2619
2009
3.73279
-0.50432
0.72057
-1.45798
2010
5.87666
1.14372
1.10451
0.13844
2011
8.0784
2.80911
-0.17663
0.88326
5.1.5计算综合宜居指数
在得出各主成分的得分矩阵之后,我们就可以计算出综合成分得分,即综合宜居指数。
综合主成分得分的计算方法:
Z=r1*Z1+r2*Z2+r3*Z3+r4*Z4;
(Z:
综合主成分得分;
ri:
主成分贡献率;
Zi:
主成分i得分)
得出最后结果如下:
表5-5历年宜居综合指数
年份
综合指数
-3.5
-3.7
-3.2
-2.32
-1.1
-0.1
0.86
2.52
4.34
6.07
图5-1年份—宜居指数表
由上图我们可以看出,2002至2011年成都的综合宜居指数呈上升趋势,在2003年最低,而且增长速度呈逐年加快趋势。
。
分析
5.2用系统聚类法分析成都宜居性
以上我们采用的主成分分析法对成都历年的宜居性进行了纵向比较,但单单只有成都市自己的数据还不足以说明问题,所以我们再将成都与其他主要城市进行横向比较来分析成都的宜居性问题。
5.2.1对各主要城市数据进行聚类分析
将各城市数据导入SPSS软件进行系统聚类分析,得到的树桩连接图如下
图5-2树状图
分析上图我们可以得到,在于成都相似的13个城市中,有7个都曾获得过宜居城市的称号,比例达53.8%,而另外与成都不相似的13个城市中,只有4个曾获得过宜居城市的称号,比例只有30.8%;
如果进一步分析的话,会发现,在与成都最为相似的四个城市中,除了武汉外,另外三个:
南京,长沙,合肥都曾获得过宜居城市的称号,比例达75%。
所以我们有理由相信成都也是一座宜居城市。
5.3探讨哪些因素对成都的宜居性影响最大
5.3.1居民调查简述
本调查侧重于居民对宜居城市的主观评价,共发放500份问卷调查,收获有效问卷样本数439份。
调查对象为18岁以上60岁以下的居民。
问卷主要是对宜居城市影响因素进行重要程度的排序,尽量反映我国城市发展特色和居住的各个方面,在此基础上进行城市宜居性的满意度调查。
5.3.2宜居城市影响重要性排序
本调查对上述提及的宜居城市建设影响因素进行适当的可评价性调整,整理为自然环境等九大因素。
在问卷中居民填写的是九大类影响要素间的排序,当一个因素被选为重要性靠前的问卷越多,就说明居民认为其对城市宜居性影响越大,因此在统计上以各个要素被选为1至9各排序重要性的问卷数占总数的比例来确定要素的权重值本调查对上述提及的宜居城市建设影响因素进行适当的可评价性调整,整理为自然环境等九大因素。
在问卷中居民填写的是九大类影响要素间的排序,当一个因素被选为重要性靠前的问卷越多,就说明居民认为其对城市宜居性影响越大,因此在统计上以各个要素被选为1至9各排序重要性的问卷数占总数的比例来确定要素的权重值。
表5-6基于居民调查的宜居城市影响因素权重值
因素
一
二
三
四
五
六
七
八
九
自然环境
28
14
13
10
经济收入水平
20
31