ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:437.39KB ,
资源ID:11126931      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/11126931.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(主成分分析法在我国居民生活质量状况多元统计分析.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

主成分分析法在我国居民生活质量状况多元统计分析.docx

1、主成分分析法在我国居民生活质量状况多元统计分析多元统计分析课程设计报告学生姓名:峰学 号:090 090鹤090学 院:理学院班 级:数学0题 目:主成分分析法在我国居民生活质量状况综合评价中的应用 指导教师: 辰 职称: 教 授 红 讲 师 2012 年 12 月 7 日一、问题分析1.1 问题及背景 人均GDP达到1000美元,标志着我国居民生活水平迈上了一个新台阶,我国经济步入了一个崭新的发展时期。然而,我国地域辽阔,人口众多,地区间经济发展很不平衡,城乡差距明显,经济发展的非均衡性已经严重威胁到我国经济的持续、健康发展。若不妥善处理,将会成为制约我国经济发展的瓶颈因素。事实上,东、中、

2、西部地区的经济发展差距已是众所周知,并引起中央政府和有关部门的广泛重视。但在地区间经济发展差距的背后,东、中、西部地区居民的生活质量究竟存在着多大的差距却鲜为人知。随着生产力水平的不断提高,我国居民生活水平不断提高,生活质量也在不断改善。但是,受各地生产力发展水平不平衡的影响,我国各地居民的生活质量也表现为不平衡。利用主成分分析法对我国31个省市、自治区居民的生活状况进行评价分析。为全面分析各地居民生活状况,可选取如下指标体系进行反应:职工人均工资、人均居住面积、城市人均用水普及量、城市煤气普及量、人均拥有道路面积、人均绿地公共面积、批发零售贸易商品销售总额、旅游外汇收入。对我国居民生活质量问

3、题的研究不仅是社会经济发展的客观要求,也是我国全面建设小康社会的迫切需要 城市居民生活质量的评价体系,是依据中国城市居民生活的特征,并参阅国内外生活质量评价研究的大量成果后构建的,集中体现了研究者的专业知识和对生活质量评价体系的理论构思,具有主观色彩,因此,有必要对理论遴选的评价指标进行隶属度分析、相关分析和辨别力分析等实证筛选,以增强评价指标的科学性、合理性和可操作性。1.2 数据 图1 数据来源:中国统计年鉴2009二、主成分分析方法基本原理2.1 主成分分析定义 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们

4、必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。2.2 主成分分析法方法简介 主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。在实际课题中,为了全面分析问题,往往提出很多与此有

5、关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来

6、代替原来的指标。主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var()越大,表示包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取即选第二个线性组合,为了有效地反映原来信息,已有的信息就不需要再出现在中,用数学语言表达就是

7、要求,则称为第二主成分,依此类推可以构造出第三、第四,第P个主成分。 其中为X的协方差阵的特征值所对应的特征向量,是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响。,R为相关系数矩阵,、是相应的特征值和单位特征向量,。进行主成分分析主要步骤如下:1. 指标数据标准化;2. 指标之间的相关性判定;3. 确定主成分个数m;4. 主成分表达式; 5. 主成分命名; 其中Li为p维正交化向量,之间互不相关且按照方差由大到小排列,则称为X的第I个主成分。设X的协方差矩阵为,则必为半正定对称矩阵,求

8、特征值(按从大到小排序)及其特征向量,可以证明,所对应的正交化特征向量,即为第I个主成分所对应的系数向量,而的方差贡献率定义为,通常要求提取的主成分的数量k满足。2.3主成分分析主要目的 主成分分析主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。三、问题求解 第一步:录入数据,有以下变量:职工人均工资,人均居住面积,城市人口用水普及量,城市煤气普及量,人均拥有道路面积,人均绿

9、地公共面积,批发零售贸易商品销售总额,旅游外汇收入,见图2 图2 第二步:选择功能模块 图3 第三步:将变量添加到Varicrible图4 第四步:输入信息图5 图6 图7 图8 第五步:单击“OK”按钮,完成运算。 图9四、结果分析 CommunalitiesInitialExtraction人均工资1.000.730居住面积1.000.598人均用水1.000.636煤气普及1.000.794人均道路1.000.776人均绿地1.000.771商品总额1.000.883旅游外汇1.000.653分析:第一列是列出八个原始变量,第二列是根据主成分分析初始解计算出变量共同度,第三列是是根据主成

10、分分析最终解计算出变量共同度,这时由于因子变量个数少于原始变量个数,因此每个变量的共同度必然小于1。例如,第一行中0.730表示m个因子变量共同解释掉原始变量“人均工资”方差72.2%。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulativ

11、e %13.95549.43849.4383.95549.43849.4383.87448.41948.41921.88623.58173.0191.88623.58173.0191.96824.60073.0193.88311.03384.0514.4635.78389.8345.4425.53095.3646.2302.87498.2397.0931.16499.4038.048.597100.000Extraction Method: Principal Component Analysis.分析:上表为SAS输出结果,从上表可以看出特征值和和贡献率。从上表可以看出公共因子对原变量总体的

12、描述情况。可以看出前2个公共因子的的贡献率达到73.019%,所以提取2个公共因子就可以反映原变量的大部分信息。分析:上图为公共因子碎石图,它的横坐标为公共因子数,纵坐标为公共因子的特征值。可以看出前2个公共因子的特征值变化非常明显,到2个以后趋于平稳。所以得出提取2个公共因子可以对原变量的信息描述有显著作用。这与Communalities的结论也相符合。Component Score Coefficient MatrixComponent12人均工资.216-.272居住面积.200-.010人均用水.173.134煤气普及.187.170人均道路-.068.460人均绿地.018.426商

13、品总额.249-.064旅游外汇.213-.040分析:该表格是因子得分矩阵,这是根据回归年算法计算出来的因子得分函数的系数,根据这个表格可得下面的因子得分函数 SAS将根据2个因子得分函数自动计算样本的2个因子得分,并且2个因子作为新变量,保存到SAS窗口中。 第一主成分在人均拥有道路面积的系数上为负,其他为正,而且职工人居工资、人均居住面积、批发零售贸易商品销售总额、旅游外汇收入的系数绝对值比较大,说明第一主成分代表了我国居民生活质量状况针对职工人居工资、人均居住面积、批发零售贸易商品销售总额、旅游外汇收入和其他居民生活质量状况的反应指标之间的差异。第二主成分在职工人均工资、人均居住面积、

14、批发零售贸易商品销售总额、旅游外汇收入的系数上为负,其他为正,而且人均拥有道路面积和人居绿地公共面积的系数的绝对值比较大,说明第二主成分代表了我国居民生活质量状况针对人均公共设施需求(人均拥有道路面积和人居绿地公共面积)和其他居民生活质量状况的反应指标之间的差异。主成分得分表分析,主成分得分表如下:北 京 2.27203-1.59501湖 北 0.0893450.607727天 津1.892352-0.862534湖 南 -0.13126-0.10477河 北 0.0436240.949832广 东 1.5306770.25892山 西 -0.39209-0.59951广 西 -0.34558

15、-0.02902内蒙古 -1.024830.27295海 南 -1.14739-0.16167辽 宁 0.231639-0.0096重 庆 -0.05216-0.04335吉 林 -0.67003-0.10225四 川 -0.46073-0.29735黑龙江 -0.84319-0.37942贵 州 -0.89657-1.69898上 海 2.912851-2.06156云 南 -0.47307-0.26378江 苏 1.278212.209529西 藏 -0.51009-1.42896浙 江 1.5369490.598395陕 西 -0.171010.279638安 徽 -0.234120.5

16、36068甘 肃 -1.14588-0.75339福 建 0.6148810.674815青 海 -0.131770.07707江 西 -0.150910.670515宁 夏 -0.853010.566148山 东 0.4306192.655349新 疆 -0.498540.006558河 南 -0.80858-0.83491 五、总 结 第一主成得分较高的有北京、天津、上海、江苏、浙江、辽宁,这几个省份都是经济比较发达的地区,第一主成分代表的意义为我国居民生活质量状况针对职工人居工资、人均居住面积、批发零售贸易商品销售总额、旅游外汇收入和其他居民生活质量状况的反应指标之间的差异。 第二主成得

17、分较高的有山东、河北、陕西等地,由于第二主成分代表的意义为我国居民生活质量状况针对人均消费品普及量及人均公共设施需求,由此可见这几个地区非常注重人均公共设施需求及人均消费品普及量这些方面。六、课程设计心得体会 通过此次课程设计,使我更加扎实的掌握了有关主成分分析法在我国居民生活质量状况综合评价中的应用方面的知识,在设计过程中虽然遇到了一些问题,但经过一次又一次的思考,一遍又一遍的检查终于找出了原因所在,也暴露出了前期我在这方面的知识欠缺和经验不足。实践出真知,通过亲自动手制作,使我们掌握的知识不再是纸上谈兵。过而能改,善莫大焉。在课程设计过程中,我们不断发现错误,不断改正,不断领悟,不断获龋最

18、终的检测调试环节,本身就是在践行“过而能改,善莫大焉”的知行观。这次课程设计终于顺利完成了,在设计中遇到了很多问题,最后在老师的指导下,终于游逆而解。在今后社会的发展和学习实践过程中,一定要不懈努力,不能遇到问题就想到要退缩,一定要不厌其烦的发现问题所在,然后一一进行解决,只有这样,才能成功的做成想做的事,才能在今后的道路上劈荆斩棘,而不是知难而退,那样永远不可能收获成功,收获喜悦,也永远不可能得到社会及他人对你的认可!参考文献1 高惠璇应用多元统计分析北京:北京大学出版社,20052 高惠璇实用统计方法与SAS系统北京:北京大学出版社,20013 汪远征,徐雅静SAS 软件与系统应用北京:机

19、械工业出版社20014 梅长林数据分析方法北京:高等教育出版社,2006源程序 data CH12/princomp.sas ;input group RJGZ JZMJ RJYS MQPJ RJDL RJLD SPZE LYWH;card; 56328 38.7 100 100 6.21 8.56 25832.4 4459 41748 28.31 100 100 14.39 8.92 9900.4 100124756 30.71 99.97 97.11 14.49 9.49 3976.5 27426114 21.47 82.03 74.25 12. 76 11.1 2127.9 577277

20、29 26.39 96.89 92.38 9.95 9.37 8927.80 1526 23486 21.94 88.63 84.82 10.39 9.20 3040.4 211 23046 21.72 84.24 79.45 9.28 9.46 2276.4 87056565 62.3 100 100 4.63 7.82 29712.5 497231667 44.05 99.88 98.23 20.28 13.11 20543.2 3880 34146 60.48 99.7 97.72 15.2 9.6 18270 3024 26363 29.88 95.11 87.6 14.15 9.29

21、 3755.4 45425702 46.13 97.47 97.23 112.05 10.42 5743.4 239421000 37.56 96.49 90.18 11.06 10.6 1340.3 25226404 32.98 99.39 98.5 19.6 14.2 11775.8 139124816 31.69 85.56 66.91 9.90 8.2 4483.3 37422739 39.04 97.88 90.9 13.03 9.4 6183.6 44324870 40.72 94.57 84.26 12.01 7.96 2638.3 61733110 27.89 93.97 93

22、.94 11.65 11.46 22348.8 9175 25660 31.75 92.87 84.04 11.83 8.61 1998.6 602 21864 22.84 83.87 72.81 12.05 9.0 734.6 314 26985 35.03 93.20 90.87 9.49 9.62 2891.2 450 25038 34.94 88.09 81.09 10.78 8.74 4105.7 15424602 25.27 88.69 67.82 6.22 6.16 1076.5 11724030 27.44 95.22 76.1 12.09 7.62 3075.8 1008 4

23、7280 23.97 86.59 74.80 143.46 5.64 64.10 3125942 29.00 96.65 89.55 12.67 8.71 2487.4 66024017 19.87 87.85 65.32 10.37 7.87 1526 1630983 19.78 100 94.78 11.16 8.53 286.90 1030719 23.06 87.25 75.68 17.82 11 489.3 324687 22.78 92.82 88.61 12.47 7.912 863.3 136run;/程序文件:CH12/princomp.sas */proc princomp data=mylib.ch12_income out=income_out; /*把原始数据和主成分得分放入数据集var RJGZ JZMJ RJYS MQPJ RJDL RJLD SPZE LYWH;run;

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1