ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:172.94KB ,
资源ID:7503514      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7503514.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(多元统计分析案例分析.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

多元统计分析案例分析.docx

1、多元统计分析案例分析一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从年的调查资料中抽取个样本,指标数据如下:地区农产品价格指数(上年=100)农村住宅投资(亿元)农村居民消费水平(元)农村居民生活消费支出合计(元)农村居民家庭人均纯收入(元)耕地面积2008(万公顷)农村私营企业就业人数(万人) 北 京98.27 93.04 1288

2、6 9254.8 13262 231.7 153.9 天 津103.03 48.31 7814 4936.7 10075 441.1 8.0 河 北99.70 441.75 3867 3844.9 5958 6317.3 80.9 山 西100.43 168.71 4500 3663.9 4736 4055.8 51.7 内蒙古99.83 33.17 4486 4460.8 5530 7147.2 18.4 辽 宁102.90 162.05 5739 4489.5 6908 4085.3 99.5 吉 林103.77 71.65 4663 4147.4 6237 5534.6 21.2 黑龙江

3、98.07 126.45 4536 4391.2 6211 11830.1 42.8 上 海102.23 2.12 13609 10210.5 13978 244.0 258.4 江 苏99.92 284.55 8196 6542.9 9118 4763.8 569.8 浙 江100.25 513.75 9878 8928.9 11303 1920.9 398.3 安 徽99.08 412.48 4447 4013.3 5285 5730.2 105.9 福 建98.04 176.35 6879 5498.3 7427 1330.1 113.1 江 西96.81 236.53 4397 391

4、1.6 5789 2827.1 173.2 山 东101.23 566.90 5733 4807.2 6990 7515.3 273.6 河 南99.07 729.47 4061 3682.2 5524 7926.4 137.7 湖 北96.30 210.06 4758 4090.8 5832 4664.1 66.4 湖 南90.61 298.41 4513 4310.4 5622 3789.4 104.5 广 东94.95 337.44 5880 5515.6 7890 2830.7 124.4 广 西89.25 248.80 3561 3455.3 4543 4217.5 89.0 海 南

5、101.91 26.22 3846 3446.2 5275 727.5 5.3 重 庆88.99 80.12 3652 3624.6 5277 2235.9 36.7675 四 川96.94 456.10 4748 3897.5 5087 5947.4 140.3 贵 州96.11 137.22 2926 2852.5 3472 4485.3 25.4 云 南96.50 158.97 3603 3398.3 3952 6072.1 41.3 陕 西95.83 151.79 3683 3793.8 4105 4050.3 1.7 甘 肃100.22 97.33 2975 2942.0 3425

6、4658.8 22.0 青 海94.61 63.63 3684 3863 542.7 10.5 11.4 宁 夏99.39 29.51 3894 4675 1107.1 43.6 16.7 新 疆92.87 79.35 3590 3457.9 4643 4124.6 18.7 数据来源:中国统计年鉴2010、将数据进行标准化变换:地区农产品价格指数(上年=100)农村住宅投资(亿元)农村居民消费水平(元)农村居民生活消费支出合计(元)农村居民家庭人均纯收入(元)耕地面积2008(万公顷)农村私营企业就业人数(万人) 北 京0.09 -0.67 2.82 2.53 2.37 -1.36 0.37

7、 天 津1.33 -0.91 0.92 0.15 1.30 -1.29 -0.78 河 北0.47 1.24 -0.56 -0.46 -0.07 0.84 -0.21 山 西0.65 -0.25 -0.33 -0.56 -0.48 0.02 -0.44 内蒙古0.50 -0.99 -0.33 -0.12 -0.21 1.15 -0.70 辽 宁1.30 -0.29 0.14 -0.10 0.25 0.03 -0.06 吉 林1.52 -0.78 -0.26 -0.29 0.02 0.56 -0.68 黑龙江0.04 -0.48 -0.31 -0.15 0.01 2.84 -0.51 上 海1.

8、12 -1.16 3.09 3.06 2.60 -1.36 1.20 江 苏0.52 0.38 1.06 1.04 0.98 0.28 3.66 浙 江0.61 1.64 1.69 2.35 1.71 -0.75 2.31 安 徽0.30 1.08 -0.35 -0.36 -0.30 0.63 -0.01 福 建0.04 -0.21 0.57 0.46 0.42 -0.97 0.05 江 西-0.28 0.12 -0.36 -0.42 -0.13 -0.42 0.52 山 东0.86 1.93 0.14 0.08 0.27 1.28 1.32 河 南0.30 2.82 -0.49 -0.55

9、-0.22 1.43 0.24 湖 北-0.42 -0.03 -0.23 -0.32 -0.11 0.24 -0.32 湖 南-1.89 0.46 -0.32 -0.20 -0.18 -0.07 -0.02 广 东-0.77 0.67 0.19 0.47 0.57 -0.42 0.14 广 西-2.24 0.19 -0.68 -0.67 -0.54 0.08 -0.14 海 南1.04 -1.03 -0.57 -0.68 -0.30 -1.18 -0.81 重 庆-2.31 -0.74 -0.64 -0.58 -0.30 -0.64 -0.56 四 川-0.25 1.32 -0.23 -0.4

10、3 -0.36 0.71 0.26 贵 州-0.46 -0.42 -0.92 -1.00 -0.90 0.18 -0.65 云 南-0.36 -0.31 -0.66 -0.70 -0.74 0.75 -0.52 陕 西-0.54 -0.34 -0.63 -0.48 -0.69 0.02 -0.83 甘 肃0.60 -0.64 -0.90 -0.96 -0.92 0.24 -0.67 青 海-0.85 -0.83 -0.63 -0.45 -1.88 -1.44 -0.76 宁 夏0.39 -1.01 -0.55 0.00 -1.69 -1.43 -0.71 新 疆-1.30 -0.74 -0.6

11、7 -0.67 -0.51 0.05 -0.70 、用均值聚类法对样本进行分类如下:聚类成员案例号地区聚类距离1北 京 1 1069.19 2天 津 2 3060.35 3河 北 3 920.65 4山 西 4 1506.42 5内蒙古 3 577.12 6辽 宁 2 2453.89 7吉 林 3 1487.95 8黑龙江 3 5006.41 9上 海 1 2094.38 10江 苏 2 2853.42 11浙 江 1 3015.14 12安 徽 3 1204.49 13福 建 2 1612.46 14江 西 4 1880.40 15山 东 3 2088.55 16河 南 3 1282.27

12、17湖 北 3 2230.15 18湖 南 4 2053.35 19广 东 2 1119.98 20广 西 4 1412.14 21海 南 4 2541.05 22重 庆 4 1423.51 23四 川 3 1138.14 24贵 州 4 2025.41 25云 南 3 2196.63 26陕 西 4 1127.91 27甘 肃 4 2123.67 28青 海 4 4568.60 29宁 夏 4 4247.12 30新 疆 4 1360.50 分四类的情况下,最终分类结果如下:第一类:北京、上海、浙江。第二类:天津、辽宁、福建、甘肃、江苏、广东。第三类: 浙江、河北、内蒙古、吉林、 黑龙江、安

13、徽、山东、河南、湖北、四川、云南。第四类:山西、青海、宁夏、新疆 、重庆、贵州、陕西、湖南、广西、江西、。从分类结果上看,根据年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。二、判别分析针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:案例数目实际组预测组p1110.9982220.5753330.9974440.3615330.8366220.2347330.7878330.0979110.52110220.43911110.48612330.99213220.73914440.41515330.24416330.4061733

14、0.38718440.42119220.33320440.9521440.28522440.45323330.95124440.3372534*0.27826440.63227440.27828440.22229440.12430440.981*. 错误分类的案例从上可知,只有一个地区判别组和原组不同,回代率为96%。下面对新疆进行判别:已知判别函数系数和组质心处函数如下:标准化的典型判别式函数系数函数123农产品价格指数0.180.3980.394农村住宅投资0.4930.687-0.197农村居民价格水平0.0870.3620.243生活消费支出1.0040.094-0.817人均纯收入0

15、.381-0.2820.565耕地面积-0.0411.019-0.235就业人数-0.631-0.7420.802组质心处的函数函数组号123110.678-0.369-0.62821.747-0.7511.1753-0.9621.899-0.0324-2.595-1.177-0.306判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7 Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7 Y3=0.394x1-0.1

16、97x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7将西藏的指标数据代入函数得:Y1=-1.08671 Y2=-0.62213 Y3=-0.84188计算Y值与不同类别均值之间的距离分别为:D1=138.5182756D2=12.11433124D3=7.027544292D4=2.869979346经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。三,因子分析:分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。经spss软件分析结果如下:(1)各指标的相关系数阵:从中可以看出,大部分指标的相关系数都比较高,各变量

17、之间的线性关系较明确,能够从中提取公共因子,适合因子分子。(2)检验:由上表可知:巴特利特球度检验统计量的观测值为145.585.相应的概率p接近为0.如果显著性水平a为0.05,由于显著性水平小于0.05,拒绝零假设,认为相关系数矩阵与单位阵有显著差异,同时,KOM值为0.701,根据Kaiser给出的度量标准可知原有变量适合进行因子分析(3)各指标的贡献率如下表:从中可以看出,各个指标的贡献率都在百分之五十之上比较高。从上表中可以看出,第一个因子的特征根为3.449.解释原有五个变量总方差的68%,累积方差贡献率为68.973%。第二个因子的特征根为0.863,解释原有变量总方差17.34

18、%,累计方差贡献率为86.313%。(4)碎石图:(5)因子载荷阵如下:由上表可知,各指标在第一个因子上的载荷比较高,说明第一个因子很重要;第二个因子与原有变量的相关性较小,它对原有变量的解释作用不显著。为便于对各因子进行命名,对因子载荷阵实施正交旋转。旋转之后的因子载荷阵:(6)从上表可见,每个因子只有几个指标的因子载荷较大,因此可根据上表进行分类。将五个指标按高载荷分成两类:四,主成分分析:(1)各指标间的相关系数矩阵如下表所示:可以看到有些指标之间的相关性较强,如果直接进行综合分析会造成信息重叠,所以用主成分分析将多个指标化成几个不相关的综合指标。(2)求相关矩阵的特征值和特征向量:从上

19、表可知,前两个特征值累计贡献率已达86.313%。说明前两个主成分基本包含了全部指标具有的信息。因此,取前两个特征值,并计算相应的特征向量:(3)由上述因子分子的因子载荷阵计算主成分的特征向量阵为:所以,前两个主成分为:第一个主成分:F1=0.135112 X1+0.280371X2+ 0.276022X3+0.271383X4+0.211366X5第二个主成分:F2=1.018454X1-0.059977X2-0.144175X3-0.044983X4-0.297578X5在第一主成分中第二、三、四个指标的系数较大,这三个指标起主要作用,刻划了农居民的收入支出状况的综合指标。在第二主成分中,

20、第一个指标系数较大,是农产品价格水平指标。(4)因子得分:根据上表写出以下因子得分函数:F1=-0.193农产品价格指数+0.285农村居民消费+0.307消费支出+0.272家庭人均纯收入+0.293就业人数 F2=1.009农产品价格指数+0.031农村居民消费-0.051消费支出+0.041家庭人均纯收入-0.218就业人数(5)综合评价:以两个因子的方差贡献率为权数,综合评价模型为:Z=0.63997F1+0.22315F2(旋转之后的方差贡献率)F1=0.135112 X1+0.280371X2+ 0.276022X3+0.271383X4+0.211366X5F2=1.018454

21、X1-0.059977X2-0.144175X3-0.044983X4-0.297578X5将各地区指标值代入上式得到各地区农村生活水平的综合值及排名:(6)对结果进行分析:从中可以看出,各地区的农村居民生活水平存在差异。其中,北京、上海、浙江、江苏地区的综合评价值排名前列,说明这几个城市农村居民的生活水平比较高。主要表现在农民收入水平和消费水平两个方面。这几个城市属于沿海地区,经济比较发达,工农业发展遥遥领先于其他地区。其次,天津、山东、福建、辽宁、广东综合评价值相对较低。不过也处于全国前十的地位。青海、贵州、广西、重庆、新疆、甘肃、陕西、云南等几个地区农村居民生活水平发展比较落后。原因是这些地区大多位于中国中西部,地理位置不佳,交通不便,经济发展水平不高,进而影响到农村经济的发展。农村居民收入水平和消费水平均比较低。因此,要提高这些地区农民的生活水平,政府应该加大这些地区的基础设施建设,提高这些地区农村居民的收入水平。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1