主成分分析在国家经济中的应用.doc
《主成分分析在国家经济中的应用.doc》由会员分享,可在线阅读,更多相关《主成分分析在国家经济中的应用.doc(13页珍藏版)》请在冰豆网上搜索。
主成分分析在国家经济中的应用
摘要
现代经济效益程度的好坏已经逐渐成为衡量一个区域或国家现代化程度和综合竞争力的重要标志。
本文利用SPSS软件对影响全国30个省市经济效益的因素进行主成分分析,分析结果表明:
在全国30个省市经济指标中,相互重叠现象严重,其中国内生产、固定资产、工业产值,职工工资、居民消费之间有明显的相关关系且程度很高,最大达到0.951。
国内生产,固定资产,工业产值对全国经济效益的影响在8个经济指标中的比重较大为46.939%。
关键词:
SPSS,经济效益,主成分分析
ApplicationofPrincipalComponentAnalysisintheEconomy
Abstract:
Moderneconomiclevelofqualityhasgraduallybecomeanimportantsymboltomeasurearegionoracountrymodernizationdegreeandthecomprehensivecompetitiveness.PrincipalcomponentanalysiswasperformedusingSPSSsoftwarefactorsonthe30provincesandcitiesnationwideeconomicbenefits,theresultsshowthat:
in30provincesandcitiesnationwideeconomicindicators,overlappingphenomenonisserious,ofwhichdomesticproduction,fixedassets,industrialoutput,wages,consumerrelationshipbetweentheobviousandthedegreeisveryhigh,upto0.951.Domesticproduction,industrialoutputvalueoffixedassets,influencenationaleconomicbenefitsinthe8economicindicatorsofalargerproportionof46.939%
.Keywords:
SPSS,Economicbenefit,Principalcomponentanalysis
目录
一、引 言……………………………………………………………………1
二、主成分分析法……………………………………………………………1
(一)主成分分析法的功能…………………………………………………1
(二)主成分分析法…………………………………………………………1
1.主成分分析法的概念………………………………………………1
2.主成分分析法的基本原理…………………………………………2
3.主成分分析法的步骤………………………………………………3
三、主成分分析法的实际应用…………………………………………………4
(一)主成分分析在全国经济中的应用……………………………………4
1.数据的选取………………………………………………………4
2.数据处理以及计算结果…………………………………………5
(二)结果分析………………………………………………………………7
四、结论………………………………………………………………………8
参考文献……………………………………………………………………9
一、引 言
经济的快速增长对全国的经济的发展越来越重要,越来越受到关注,成为衡量一个国家地区现代化程度和综合竞争力的重要标志。
同时国内生产、居民消费、固定资产、职工工资、货物周转、消费价格、商品零售、工业产值等一系列因素影响着我国的经济发展。
它们对经济增长的影响以及它们之间的共同作用已经成为了经济领域的一个重要研究重点。
本文在构建经济发展综合指标体系的基础上,运用多元统计分析中的主成分分析方法,对全国31个省市经济发展的现状进行了综合评价,为全国的经济主管部门制定相应政策提供一定的理论依据,旨在提高全国整体经济发展水平。
二、主成分分析法
(一)主成分分析法的功能
在用统计分析方法研究多变量的问题时,变量太多就会增加课题的复杂性。
所以人们就希望尽量使变量个数减少而得到的信息较多。
在很多情况下,变量之间是有一定的相关关系的。
当两个变量之间有相关关系时,可以解释为这两个变量反映此课题的信息有一定的重复。
主成分分析法是将原先提出的所有变量,建立尽可能少几个新变量,使这些新变量是没有相关性的,并且这些新变量在反映课题的信息方面尽可能保持原有的信息。
(二)主成分分析法
1.主成分分析法的概念
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principalcomponentsanalysis,PCA)是一种简化数据集的技术。
它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
2.主成分分析法的基本原理
主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。
假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:
如何从这么多变量的数据中抓住地理事物的内在规律性呢?
要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。
为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。
那么,这些综合指标(即新变量)应如何选取呢?
显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。
如果记原来的变量指标为,它们的综合指标——新变量指标为,(m≤p)。
则
在
(2)式中,系数lij由下列原则来决定:
(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;
(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。
这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。
其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。
在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。
3.主成分分析的计算步骤
通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:
(1)计算相关系数矩阵
在公式(3)中,(i,j=1,2,…,p)为原来变量与的相关系数,其计算公式为
因为R是实对称矩阵(即rij=rji),所以只需计算其上三角元素或下三角元素即可。
(2)计算特征值与特征向量
首先解特征方程|λI-R|=0求出特征值λi(i=1,2,…,p),并使其按大小顺序排列,即λ1≥λ2≥…,≥λp≥0;然后分别求出对应于特征值λi的特征向量ei(i=1,2,…,p)。
(3)计算主成分贡献率及累计贡献率
。
一般取累计贡献率达85-95%的特征值,所对应的第一,第二……第m(m≤p)个主成分。
(4)计算主成分载荷
(5)
由此可以进一步计算主成分得分:
Z=(6)
三、主成分分析法的实际应用
(一)主成分分析在全国经济中的应用
1.数据的选取
经济的快速增长对全国的经济的发展越来越重要,越来越受到关注,成为衡量一个国家地区现代化程度和综合竞争力的重要标志。
同时国内生产、居民消费、固定资产、职工工资、货物周转、消费价格、商品零售、工业产值等一系列因素影响着我国的经济发展。
以全国31个省市经济发展为例来研究我国的经济发展中的主要经济发展因素。
选取的指标为:
国内生产(x1)、居民消费(x2)、固定资产(x3)、职工工资(x4)、货物周转(x5)、消费价格(x6)、商品零售(x7)、工业产值(x8)(具体选取的原始数据见表1所示)
表1全国30个省市经济主要指标
2.数据处理以及计算结果
对原始数据进行标准化处理。
计算特征值,方差以及各指标的相关系数矩阵。
笔者利用SPSS软件对数据进行处理,特征值、方差的结果如表2所示,相关系数矩阵的特征根等相关的结果如下表所示。
表2描述性统计量值
表3相关系数矩阵
表4变量共同度表
表5总方差分析表
表6碎石图
表7因子载荷矩阵
(二)结果分析
由碎石图可以看出,横坐标表示第几主成分,纵坐标表示特征根的值,在第四个特征根处变得比较特平缓,表明可以提取三个主成分。
提取主成分。
如表5所示,提取3个特征值主成分,着3个主成分的累积贡献率达到89.584%,表明提取的前3个主成分可以基本反映全部的6个指标所具有的的信息,能在一定程度上说明我国经济发展的综合因素。
由表7得出相关系数矩阵的特征值,进行主成分的表达式可以表述为:
F1=0.236zx1+0.162zx2+0.243zx3+0.124zx4+0.129zx5-0.135zx6-0.165zx7+0.219zx8
F2=0.175zx1-0.272zx2+0.073zx3-0.329zx4+0.336zx5+0.115zx6+0.271zx7+0.194zx8
F3=0.100zx1+0.223zx2+0.174zx3+0.303zx4-0.227zx5+0.656zx6+0.360zx7+0.174zx8
四、结论
提取主成分的原则上要求公因子方差的各个数值尽可能接近,亦即要求它们的方差极小,当公因子方差完全相等时,它们的方差为0,这就达到完美状态。
实际应用中,只要公因子方差数值彼此接近(不相差太远)就行了。
从上面给出的结果可以看出:
提取3个主成分的时候,居民消费的公因子方差偏小,这暗示提取3个主成分,居民消费方面的信息可能有较多的损失。
国内生产总值、固定资产投资和工业产值在第一主成分上载荷较大,亦即与第一主成分的相关系数较高;职工工资和货物周转量在第二主成分上的载荷绝对值较大,即负相关程度较高;消费价格指数在第三主成分上的载荷较大,即相关程度较高。
在全国30个省市经济指标中,相互重叠现象严重,其中国内生产、固定资产、工业产值