多元统计分析2.docx
《多元统计分析2.docx》由会员分享,可在线阅读,更多相关《多元统计分析2.docx(19页珍藏版)》请在冰豆网上搜索。
多元统计分析2
课程设计
题目:
湖北省各地区经济差
异的多元统计分析
学院:
理学院
专业:
数学与应用数学
班级:
数学09—
(1)班
学生姓名:
学生学号:
2009026206
指导教师:
周永芳
2012年6月29日
多元统计课程设计任务书
姓名
学号
2009026206
指导教师
设计题目
湖北省各地区经济差异的多元统计分析
理论要点
研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。
设计目标
利用因子分析对各个地区的综合经济实力进行比较分析,然后再利用方差分析对各个地区的整体实力进行比较,为湖北今后的经济发展提供一些比较科学的发展方案。
研究方法步骤
⑴将原始数据标准化,以消除变量间在数量级和量纲上的不同。
⑵求标准化数据的相关矩阵;
⑶求相关矩阵的特征值和特征向量;
⑷计算方差贡献率与累积方差贡献率;
⑸确定因子:
预期结果
得出分析结果,湖北今后的经济发展提出一些比较科学的发展方案。
发展的方案和发展趋势大
计划与进步的安排
第一步(1-2天)分析题目,查找资料
第二步(3-4天)针对性学习相关知识,整理思路。
第三步(5-6天)编写程序
第四步(7天)用程序计算,写出结论
参考资料
[1]中国统计年鉴2004年.中国统计出版社.
[2]何晓群编著.《多元统计分析》.中国人民大学出版社2004年版.
[3]宇传华编.《SPSS与统计分析》.电子工业出版社2007年版.
[4]罗积玉邢瑛.经济统计分析方法__2012
填写时间
2012年6月29日
摘要
本文通过多元统计分析的方法,对湖北省各地区主要的经济指标进行因子分析和方差分析,进而可以得出湖北省12个城市的经济发展水平的差异,由因子分析的结果可知,这12个城市的综合经济实力从大到小的排名依次为武汉、宜昌、襄樊、黄石、荆州、十堰、鄂州、荆门、随州、孝感、黄冈、咸宁。
由方差分析的结果可知,以武汉为中心,根据地理位置将这12个城市划分为四个地区:
武汉以东的地区(黄石、鄂州、黄冈)、武汉以南的地区(孝感、荆州)、武汉以西的地区(宜昌、荆门、随州)、武汉以北的地区(十堰、襄樊、咸宁)这四个地区的经济发展趋于稳定。
根据分析的结果我们可以为湖北省经济的稳步发展出一份薄力。
关键词:
经济指标,因子分析,方差分析
目录
湖北省各地区经济差异的多元统计分析1
1引言1
2分析方法介绍1
2.1因子分析1
2.1.2因子分析的模型1
2.1.3因子分析的步骤2
2.2方差分析3
3问题分析3
4数据处理过程3
4.1因子分析的结果5
4.2方差分析结果8
5总结及建议9
参考文献11
湖北省各地区经济差异的多元统计分析
1引言
近几年湖北省经济得到了快速发展,但发展中还是碰到了很多问题,各个城市的经济水平还存在很大的差异,为了准确弄清楚湖北省主要的12个城市的经
济差异,我们利用因子分析对各个地区的综合经济实力进行比较分析,然后再利
用方差分析对各个地区的整体实力进行比较,为湖北今后的经济发展提供一些比
较科学的发展方案。
2分析方法介绍
2.1因子分析
因子分析模型是主成分分析的推广。
它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。
相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系;因此,因子分析的出发点是原始变量的相关剧增。
因子分析的思想始于1904年查尔斯·斯皮尔曼对学生考试成绩的研究。
近年来,随着电子计算机的高速发展,人们将因子分析的理论成功地应用于心理学、医院、气象、地质、经济学等各个领域,也使得因子分析的理论和方法更加丰富。
2.1.1基本思想
因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变
量之间相关性较高,而不同组的变量间的相关性则较低。
每组变量代表一个基本
结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。
对于
所研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线形函数,另一部分是与公共因子无关的特殊因子。
2.1.2因子分析的模型
①查尔斯·斯皮尔曼提出因子分析时用到的例子
①一般因子分析模型:
设有n个样品,每个样品观察p个指标,这p个指标之间有较强的相关性(要求p个指标相关性较强的理由是很明确的,只有相性较强才能从原始变量中提取出“公共”因子)。
为了便于研究,并消除由于观测量纲的差异及数量级不同所造成的影响,将样本观测数据进行标准化处理,使标准化后的变量均值为0,方差为1。
2.1.3因子分析的步骤
①确定因子载荷:
主成分法、主轴因子法、最小二乘法、极大似然法、α因子提取法等。
由于这些方法求解因子载荷的出发点不同,所得的结果也不完全相同,为此我们就本论文所用到的主成分法寻找公共因子的方法做详细介绍。
主成分寻找公共因子的方法如下:
假定从相关阵出发求解主成分,没有p个变量,则我们可以找出p个主成分。
将所得的p个主成分按由大到小的顺序排列,记为
则主成分与原始变量之间存在如下关系式:
(1)
式中,
为随机向量X的相关矩阵的特征值所对应的特征向量的分量,因为特γ征向量之间彼此正交,从X到Y的转换关系是可逆的,很容易得出由Y到X的转换关系为:
(2)
我们对上面每一等式只保留前m个主成分而把后面的部分用代替,则㈡式可变为:
(3)
这个式子在形式上已经与因子模型相一致,且
之间相互独立,为了把
转化成合适的公因子,现在要做的工作只是把
主成分变为方差为1的变量。
为完成此变换,必须将
除以其标准差(即为特征根的平方根
。
于是,令
则㈢式变为:
(4)
这与因子模型完全一致,这样,就得到了载荷A矩阵和一组初始公因子(未旋
转)。
②因子旋转:
因子旋转分为正交旋转与斜交旋转,正交旋转由初始载荷矩阵A左乘一正交阵而得到。
经过正交旋转而得到的新的公因子仍然保持彼此独立的性质。
而斜交旋转则放弃了因子之间彼此独立这个限制,因而可能达到更为简洁的形式,其实际意义也更容易解释。
但不论是正交旋转还是斜交旋转,都应当使新的因子载荷系数要么尽可能地接近与零,要么尽可能地远离零。
③因子得分:
因子得分就是公共因子在每一个样品点上的得分。
根据因子得分我们可以知道那个城市的经济发展水平要高,那个城市的经济发展水平要底。
2.2方差分析
方差分析的基本思想是根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值的大小确定P值,作出统计推断方差分析的检验假设H0为各样本来自均数相等的总体,H1为各总体均数不等或不全相等。
若不拒绝H0时,可认为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。
理论上,此时的组间变异与组内变异应相等,两者的比值即统计量F为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于1。
若拒绝H0,接受H1时,可认为各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。
此时的组间变异远大于组内变异,两者的比值即统计量F明显大于1。
在实际应用中,当统计量F值远大于1且大于某界值时,拒绝H0,接受H1,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用方差分析的用途①两个或多个样本均数间的比较;②分析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的假设检验;⑤两样本的方差齐性检验等。
3问题分析
我们给出2003年湖北省12个城市的主要经济指标,借助这些指标体系对湖北省12个城市的经济差异作出分析。
然后以武汉为中心,根据地理位置将12个城市划分为四个地区:
武汉以东的地区(黄石、鄂州、黄冈)、武汉以南的地区(孝感、荆州)、武汉以西的地区(宜昌、荆门、随州)、武汉以北的地区(十堰、襄樊、咸宁),用方差分析对这四个地区的经济进行分析比较。
4数据处理过程
下表给出的是2003年湖北省12个城市的主要经济指标,为了得出它们的
经济的差异,我用多元统计方法里面的因子分析和方差分析对这些数据进行处
理。
表1湖北省12个城市的经济指标
武汉黄石十堰宜昌襄樊鄂州
116621797136********005233276724145671257000
28043685065646530974079494735242
31177840836287568915902614874070224
42439891413739612392268252712
547201318042500513450329236
61334493814746923080769145231924749001525809
7755021642360269730551223
813299713139********108135********4921517867
963644596642615450102324766
106228215394188315700184********25293657
11169546829337842291104869323523407
12542.7929.6433.2667.3373.7634.32
1342733093050522285992389514535953241888
1474986176181181693072810125240
1532476795761003108523
16651320011220523284297877
1734577969638016933105412301
18875162605069208917218738116
19490530172332418523499267703130
2044841364600399721139025127833120
212623328464838
注:
数据来源于《2004年中国统计年鉴》
其中1—地区生产总值(单位:
万元)2—地方财政一般预算内收入(单位:
万元)3—地方财政一般预算内支出(单位:
万元)4—当年合同外资金额(单
位:
万美元)5—环境污染治理投资额(单位:
万元)6—工业总产值(单位:
万元)7—建成区绿化覆盖面积(单位:
公顷)8—产品销售收入(单位:
万元)
9—邮政业务总量(单位:
万元)10—固定资产投资完成额(单位:
万元)11
—房地产开发投资完成额(单位:
万元)12—商品房屋销售面积(单位:
万平
方米)13—全年新增固定资产(单位:
万元)14—全年供水总量(单位:
万立
方米)15—年末实有铺装道路总面积(单位:
万平方米)16—园林绿地面积(单
位:
公顷)17—工业废水排放总量(单位:
万吨)18—液化石油气供气总量(单
位:
吨)19—高等学校学生数(单位:
人)20—各类专业技术人员(单位:
万
人)21—医院、卫生院数(单位:
个)
4.1因子分析的结果
由于经济指标太多,不利于我们进行问题的分析,因此我们需要对其进行降维处理。
用spss软件可得到上述经济指标的相关系数矩阵,除了少数指标之间的相关性较低外,其他指标之间均有较强的相关性(全部大于0.3),故可以做因子分析
表2相关系数矩阵
表3总方差解释解释表
从表中我们可以看到,当保留五个公共因子时,公共因子可以解释原始变量90.931%的方差,这样就把一个二十一维的问题降至五维。
同时spss软件还给出了因子载荷矩阵,见下表:
表4因子分析的成分矩阵
由上表可以写出特殊因子忽略不计时的因子模型,以第一行为例,有:
标准化地区生产总值≈0.967×fac1+0.143×fac2+0.004×fac3-0.002×fac4+0.010×fac5此时所得未旋转的公因子实际意义不好解释,对公因子进行方差最大化旋转,得到其旋转矩阵:
从上表可以看到,旋转后因子载荷矩阵发生了很大的变化。
第一个公共因子基本上反映了地区生产总值与其他行业的信息,大体可以解释为一个城市的综合经济实力以及经济发展的创新能力。
第二个因子主要集中了第二产业的信息,可以解释为第二产业对经济的贡献。
第三个因子也集中了第二产业的部分信息,但较第二因子而言,它对经济的贡献没第二因子重要。
第四个公共因子主要集中了各地区公共支出的信息,可以解释为各地区公共支出对经济的影响。
由于第五个公因子不好解释,故我们在这不作解释。
事实上,这与我们客观存在的事实是相符合的。
对原始的二十一个指标提取共因子后,就可以通过分析少数几个公因子来对个城市进行比较研究了。
利用spss软件可以得到各个城市的经济水平在五个公共因子上的得分,同时也可以得到各个城市的经济水平在五个公共因子上的秩的排序(由于武汉明显比其他城市的各项指标要高出很多,故武汉的综合经济实力是最强的,所以我们在对各城市的经济水平进行综合排名时除去武汉,此举是实用可行的)。
下表即给出了因子得分表以及各城市经济水平在各个公共因子上的排序和综合排名。
由于我们只需要研究其综合经济实力,故各因子水平上的排名我们不作过多的说明。
由下表我们可以得出这11个城市的综合经济实力从大到小的排名依次为宜昌、襄樊、黄石、荆州、十堰、鄂州、荆门、随州、孝感、黄冈、咸宁。
表6因子得分表
FAC1_1FAC2_1FAC3_1FAC4_1FAC5_1RFAC1_1
黄石0.07473-0.088991.90908-0.77653-1.152323
十堰-0.424332.15839-1.293710.040570.526937
宜昌2.84656-0.41248-0.650160.10302-0.045211
襄樊0.43304.190781.510810.851650.553052
鄂州-0.170040.90176-0.44378-1.07731-1.594075
荆门-0.71969-0.232650.794790.362310.5075811
孝感-0.3712-0.7971-0.29784-0.304130.128946
荆州-0.09454-0.302630.186-0.203731.951814
黄冈-0.47779-1.17413-0.42057-0.420540.377188
咸宁-0.5308-0.6258-0.71687-1.02574-0.110559
续表
RFAC2_1RFAC3_1RFAC4_1RFAC5_1yRy
黄石419100.141183
十堰11153-0.054395
宜昌79471.385281
襄樊22220.649122
鄂州371111-0.160736
荆门5334-0.276017
孝感10576-0.357179
荆州6461-0.009854
黄冈11685-0.4781510
咸宁910108-0.5297211
随州8819-0.309558
4.2方差分析结果
接下来我们利用方差分析对我们题中的四个地区的经济进行分析,看各个地区的经济是否有显著性差异。
用spss软件得到下面的多变量检验表:
表7方差分析的多元检验表
上表给出了几个统计量,由Sig.值可以看到,无论从哪个统计量来看,四个地区的经济没有显著性差异。
由此可知,湖北除武汉以为各个地区发展是均衡的。
接着用spss软件可以得到每个公共因子的分析结果,见下表,由表可以看到,五个公共因子的Sig.值分别为0.828,0.336,0.941,0.194及0.216,说明四个地区在五个公共因子上也没有显著性差别。
由因子分析的数据处理过程我们可以看到,湖北省主要的12个城市的综合经济实力是有差别的,武汉市具有雄厚的经济实力,作为特大城市,武汉的总体发展水平雄居榜首。
近几年,武汉市在加快经济建设、努力培植新的经济增长点的同时,在交通运输邮电通讯、城市基础设施等方面取得了超常规发展。
目前,武汉市形成了集铁路、公路、水路、航空运输于一体的立体综合运输体系,货物吞吐能力大大增强;城市建设己形成了以内环线为中心、中环开通、外环初显雏形的联结三镇的交通网络。
从得分情况看,武汉市人口与劳动力子系统、经济规模、居民收入和消费水平、科技、教育与文化等子系统与其他城市相比遥遥领先,其“块头”优势为省内乃至华中地区诸城市所无与伦比。
地级城市综合实力层次性明显。
从数据处理的十个地级市情况看,大体可分两个层次。
第一层次为宜昌、黄石、襄樊、荆州、十堰等
市。
这类城市虽有名次之分,但综合实力相当,呈现齐头并进之势。
处理的结果表明:
宜昌市“人口与劳动力”、“经济发展”、“环境和基础设施”等三个子系统均位居地级市前列,黄石市“经济发展”和“环境与基础设施”得分第二,襄樊市“人口与劳动力”名次较前,居第二位,十堰市的“社会发展”系统得分则占居鳌头。
但各子系统得分较为均衡当属宜昌市。
评价情况表明,这些城市在促进两个文明建设方面各有建树,有些方面取得了较大的实效。
从第二层次看,荆门、鄂州、孝感、黄冈和咸宁等市的综合实力相对偏弱,
5总结及建议
由因子分析的数据处理过程我们可以看到,湖北省主要的12个城市的综合
经济实力是有差别的,武汉市具有雄厚的经济实力,作为特大城市,武汉的总体
发展水平雄居榜首。
近几年,武汉市在加快经济建设、努力培植新的经济增长点
的同时,在交通运输邮电通讯、城市基础设施等方面取得了超常规发展。
目前,
武汉市形成了集铁路、公路、水路、航空运输于一体的立体综合运输体系,货物
吞吐能力大大增强;城市建设己形成了以内环线为中心、中环开通、外环初显雏
形的联结三镇的交通网络。
从得分情况看,武汉市人口与劳动力子系统、经济规
模、居民收入和消费水平、科技、教育与文化等子系统与其他城市相比遥遥领先,
其“块头”优势为省内乃至华中地区诸城市所无与伦比。
地级城市综合实力层次性明显。
从数据处理的十个地级市情况看,大体可
分两个层次。
第一层次为宜昌、黄石、襄樊、荆州、十堰等市。
这类城市虽有名
次之分,但综合实力相当,呈现齐头并进之势。
处理的结果表明:
宜昌市“人口
与劳动力”、“经济发展”、“环境和基础设施”等三个子系统均位居地级市前列,黄石市“经济发展”和“环境与基础设施”得分第二,襄樊市“人口与劳动力”名次较前,居第二位,十堰市的“社会发展”系统得分则占居鳌头。
但各子系统得分较为均衡当属宜昌市。
评价情况表明,这些城市在促进两个文明建设方面各有建树,有些方面取得了较大的实效。
从第二层次看,荆门、鄂州、孝感、黄冈和咸宁等市的综合实力相对偏弱,在全国评价中属三类或四类城市。
但通过近几年的发展,总体实力正在上升,有些系统得分有较大提高。
如荆门市经济发展较快,该系统得分位居全省第四,鄂州市“社会发展”,子系统得分也居第四名。
但综合考察表明,在“人口与劳动力”、“社会发展”、“经济发展”和“环境与基础设施”四个系统中,这些城市有的在某一方面较为突出,而其他方面则得平平;有的部分系统得分较高但因少数系统得分过低而拖了“后腿”。
说明在城市均衡发展、协调进步方面还有很多工作要做。
由方差分析的数据处理结果我们可以看到,以武汉为中心,根据地理位置将这12个城市划分为四个地区:
武汉以东的地区(黄石、鄂州、黄冈)、武汉以南的地区(孝感、荆州)、武汉以西的地区(宜昌、荆门、随州)、武汉以北的地区(十堰、襄樊、咸宁)这四个地区的经济发展趋于稳定。
为此我们对湖北省各个城市今后的发展作出如下的建议:
我省城市化水平在全国居中上游水平,城市化道路变小城镇主导为大城市主导具有较好条件。
湖北城市化的发展方针应该是:
充分发挥特大城市优势,壮大完善大城市,因地制宜发展中小城市,择优发展小城镇。
充分发挥特大城市优势。
就是充分发挥首位城市武汉的作用。
武汉作为目前我省唯一的特大城市,也是华中和长江中游地区最大城市,应在城市化中发挥龙头作用。
壮大完善大城市。
宜昌、襄樊、荆州、黄石4个现有50万以上市区非农业人口的大城市要进一步壮大规模,完善功能。
其中,宜昌、襄樊要加快向100万人口的特大城市迈进的步伐,为我省西部地区的城市化和区域经济发展发挥“发动机”和“推进器”的作用。
因地制宜发展中小城市。
我省中等城市规模偏小,小城市实力也很弱。
从我省实际出发,要因地制宜发展中小城市。
十堰、荆门、鄂州等几个条件较好的中等城市要积极向大城市发展,其中十堰要尽快建成大城市。
要力争建设一批城区聚居人口在20万以上的中等城市和城区聚居人口在10—20万的小城市。
从经济发展角度讲,应鼓励所有县级市向中等城市发展,实行公平竞争。
目前已经设立地级市的城市和直管市,要努力发展经济,搞好城市建设,健全城市功能,壮大综合实力,建成名副其实的中等城市。
要鼓励和支持一批区位条件好、发展潜力大的县级市和县建成中等城市或小城市江汉平原对武汉市具有极其重要的战略价值。
武汉因江汉平原而兴,也必然不能脱离江汉平原而发展。
江汉平原是湖北省的富庶之地,原来评为“十强县市”十之八九在江汉平原,它们在武汉以西形成半月形拱己之势,在经济发展战略上和功能分工上比较容易与武汉市实现一体化发展格局,成为武汉进一步发展可依托的厚实的腹地。
在江苏省,为什么省会南京的经济实力会被省内的苏州、无锡超过,一个很重要的原因就在于南京周围都是较穷的农村,而苏南农村自改革开放以来则是全国最富饶的地区,形成连片中小城市群,所以苏州、无锡具有坚实的腹地,具有了超越南京的基础和条件。
现在搞的“武汉都市圈”主要包括东部地区,江汉平原只覆盖了东半部,而江汉平原最主要的两个城市荆州、荆门没有包括进去,其理由是这两个城市空间距离与武汉远一些。
实际上,高速公路到荆州只需2个半小时,这比到天门的时间不会长多少。
而2002年9月长荆铁路通车后,武汉到荆门的距离被“拉”直了,而且“十一五”期间,武汉到荆门的高速修通之后,往来会更方便,所需时间与到荆州相同。
因此,建议将荆州、荆门两市纳入“武汉大都市圈”范围,以利江汉平原的整体发展,构成武汉市完整的腹地,实现武汉市与江汉平原的良性互助,共同发展,早日形成在全国具有较大影响的城市密集区。
其次,还要建设宜昌都市区和襄樊都市区。
武汉都市区覆盖鄂东地区和江汉平原,宜昌都市区覆盖鄂西南,襄樊都市区覆盖鄂西北地区。
要通过三大都市区的建设,优化我省区域城镇布