统计基于各省份农村居民消费结构的统计分析毕业论文.docx
《统计基于各省份农村居民消费结构的统计分析毕业论文.docx》由会员分享,可在线阅读,更多相关《统计基于各省份农村居民消费结构的统计分析毕业论文.docx(21页珍藏版)》请在冰豆网上搜索。
统计基于各省份农村居民消费结构的统计分析毕业论文
编号
58
河南大学
数学与信息科学学院
2013~2014学年第二学期
统计软件和模型
A
实验论文
题目
基于各省份农村居民消费结构的统计分析
姓名
牛建永
学号
1122313252
年级
2011级
专业
计算机科学与技术
成绩
合分人
基于各省份农村居民消费结构的统计分析
牛建永
摘要针对农村居民消费状况,利用2012年各地区农村居民家庭平均每人生活消费支出数据,首先采用多元统计分析方法中的因子分析进行分析,用定义的深度函数和一般意义上的综合评价指标函数对其进行综合得分,根据综合得分结果对地区农村居民人均消费进行个案排秩和分类。
得出北京,上海,浙江位居消费水平前三甲。
最后用对应分析方法分析各地区居民具体的消费方式及消费的比例。
得出我国经济发达省区,浙江广东,江苏,福建等农村居民消费食品,居住,家庭设备,交通通讯为主;而天津,吉林,内蒙古,黑龙江等农村居民消费衣着,医疗保健,文教娱乐为主;北京,上海城市发达,农村居民消费水平高,几乎在所有方面消费都很高。
而西藏甘肃,云南,贵州农村居民消费水平相似,在各个方面消费几乎都较低。
关键词农村居民消费支出深度函数因子分析对应分析
1研究背景及目的
在中国改革开放的30多年里,中国的面貌发生了翻天覆地的变化,中国在众多领域取得了举世瞩目的成就,在经济方面更是令国人感到骄傲和自豪,中国已达到世界第二大经济体。
我们知道投资,消费和出口是拉动经济的三驾马车,而消费水平不仅反映了当前的经济发展水平,还关系着社会经济活动的众多方面。
我国居民消费方式也在发生着巨大变化。
在居民全部消费支出的八项指标中,各项支出所占比例均有变化,生活质量整体有着显著的提高[1]。
随着经济全球化进程的加速,我们应抓住新一轮的发展机遇,迎接新的挑战,创造新的辉煌业绩。
周所周知,周国国土面积较大,但各种资源分布很不均匀,城乡地区间贫富差距较大,消费水平差异更是很惊人。
在过去的几十年里,中国一直靠投资和出口来发展自己的经济,内需不足。
为缩小差距,实现中国经济又好又快的发展,在《中共中央关于制定国民经济和社会发展第十二个五年规划的建议》中,强调“构建扩大内需长效机制,促进经济增长向依靠消费、投资、出口协调拉动转变。
”“把扩大消费需求作为扩大内需的战略重点,进一步释放城乡居民消费潜力,逐步使我国国内市场总体规模位居世界前列。
”由于农村居民消费水平分占据着重要的地位,在此情形下,析中国农村居民消费水平具有很重要的意义。
研究目的:
通过分析中国农村居民消费水平情况,我们可以定性的得出发达地区和欠发达地区农村居民消费差距以及各地区在各消费方式下的消费比例,根据结果,我们可以向政府的经济政策提供宝贵的建议。
2研究方法
该研究采用的指标有:
食品,衣着,居住,家庭设备,交通通信,文教娱乐,医疗保健,其他等八项指标。
分析方法:
因子分析,对应分析,深度分析等。
基本思路:
先把数据进行标准化,已消除单位和数量级的影响,接着进行因子分析,根据数据结果进行综合排名,然后在进行对应分析,出各地区在各消费方式下的消费情况进行归类。
该研究采用的数据是《2012年各地区农村居民家庭平均每人生活消费支出》,数据摘自《中国统计年鉴2013》11-24C。
3实证分析
3.1因子分析
因子分析(FactorAnalysis)的概念是由英国著名统计学家,心理学家查尔斯.皮尔逊(Chales.S.Pearson)于1904年提出的。
它的基本思想是通过对变量的相关系数矩阵的内部结构进行分析,从中找出少数几个能够控制原始变量的因子(选区公共因子的原则是尽可能包含更多的原始变量信息),建立因子分析模型,利用公共因子在现原始变量之间的相关关系,达到简化变量,降低变量维数和对原始变量再解释及命名的目的。
原始变量是可观测的显在变量,而因子一般是不可观测的潜在变量[2]。
设有m个原始变量,表示为x1,x2…,xm,根据因子分析的要求,假设这些变量已经标准化(均值为0,标准差为1),假设m个变量可以有n个因子f1,f2…,fn表示为线性组合,即
上式为因子分析的数学模型,如果利用矩阵形式则表示为
。
其中
为可观测的n维变量向量,它的每一分量表示一个指标或变量;
称为因子向量,每一个分量表示一个因子,由于它们出现在每个原始变量的线性表达式中,所以称为公共因子;矩阵A为因子载荷矩阵,其元素
称为因子载荷;称为特殊因子,
表示原始变量中不能由因子解释的部分,均值为0[3]。
KMO判断标准:
0.9非常适合。
0.8适合。
0.7一般。
0.6不太适合。
KMO<0.5:
不适合。
表1KMO和Bartlett的检验结果
(1)利用SPSS软件,先对15个指标的原始数据进行标准化处理,已消除量纲和数量级的影响,并得到各指标之间的相关系数矩阵R.
(2)KMO和Bartlett的检验,如表1所示,KMO的取值为0.780,表明变量间有相关性,数据可以做因子分析。
Bartlett检验的Sig.值为0.000,说明数据来自正态总体,适合进一步分析。
表2初始解释总方差
图1碎石图
(3)由表2知,只有一个因子特征值大于1,用一个因子来解释原始变量效果不太理想。
从图1中也可以看出,有两个因子解释原始变量较为合适。
故把“抽取选项设置”对话框中特征值大于1选项改为要提取的因子为2。
如图所示。
“抽取选项设置”对话框
表3初始共同度
表4共同度
表5解释总方差
(4)有表3-表5知,提取两个因子效果较好。
各个指标信息损失较少。
前两个公因子的方差总和占所有主成分方差的87.130%,可见选取前两个因子已足够替代原来的变量。
(5)由表6知,初始因子载荷阵因子含义不明显,为此利用方差最大旋转,得到旋转后的因子载荷阵(如表7)。
表6成分矩阵
表7旋转成分矩阵
(7)这样每个因子就很明确了。
根据表7知,可将指标分为两类。
第一个因子在衣着,医疗保健,文教育乐,其他,交通通讯上有较大的载荷,这些指标反映的是农村居民通常满足家庭基本消费后才考虑的消费方式,因此命名为生活附加因子。
第二个因子在指标食品,家庭设备,居住上有较大的载荷,而这个因子反映的是家庭基本消费,故命名为基本因子。
图2也可以说明此分类比较合理。
图2农村居民消费支出成分图
表8因子得分矩阵
表9成分得分协方差矩阵
通过表8可得:
F1(附加因子)=-0.532*食品+0.598*衣着+(-0.121)*居住+(-0.180)*家庭设备+0.027*交通通信+0.260*文教娱乐+0.568*医疗保健+0.154*其他
F2(基本因子)=0.731*食品+(-0.417)*衣着+0.314*居住+0.385*家庭设备+0.182*交通通信+(-0.057)*文教娱乐+(-0.387)*医疗保健+0.043*其他
通过表9可见,各因子之间是正交的,即相互之间彼此独立。
3.2因子后续分析
(1)当我们获得了各城市在两个公因子的得分后,就可以利用因子得分进行分类和排序。
我们可以利用计算变量和排序来进行各城市的经济综合得分计算和排名,具体操作如图所示。
结论分析:
观察“RF”一列,可以看出,北京、上海,浙江,是综合实力得分超过1的城市。
江苏,天津综合得分在0.5—1之间。
消费额也较大。
它们构成农村居民消费前5强。
西藏,贵州,云南,甘肃和海南农村居民消费水平远低于它们的平均消费水平。
(2)深度分析作为一种多维的排序方法,已经被广泛应用于多元回归,聚类判别,风险度量等众多领域。
统计深度函数为多维数据提供了一种从深度中心向外的排序方法,有深度函数的性质可知,靠近中心的数据深度较大,远离中心的数据深度较小。
得到的综合得分函数越小,说明排名越靠前,反之亦然。
从2个因子得分可以看出,由于西藏的2各因子明显处于最低水平,利用这个特点,以西藏的因子Z深度中心,定义这里的深度函数为:
其中
为定义的加权欧氏距离,即
其中
为样本
在因子
上的得分,
为第k个因子的方差贡献率,而
即数列
的中位数[4]。
(3)运用EXCEL可以算出和
,
和
值,通过深度函数计算出的综合得分结果如图所示。
结论分析:
由RPDZiZ一列可以看出北京,上海,浙江农村居民消费居于前三甲,与江苏,广东构成前5。
西藏,云南,甘肃,贵州农村居民消费水平较低。
说明:
“RF”一列和“RPDZiZ”一列均采用个案排秩而得出的结果,具体操作如图所示。
3.3对应分析
对应分析是R型因子与Q型因子分析的结合,他也是利用降维的思想已达到简化数据结构的目的,不过,与因子分析不同的是,他同时对数据表中的行与列将进行处理,寻求以低维图形表示数据表中行与列之间的关系。
对应分析首先由理查森(Richardson)和库德(Kuder)在1933年提出,后来有法国统计学家让—保罗.贝内泽(Jean-PaulBenzecri)和日本统计学家林知己夫(HayashiChikio)对该方法进行了详细的论述而使其得到了发展[5]。
(1)首先建立新变量如图所示
(2)用消费值进行加权,操作如图所示。
(3)打开“对应分析”工具条,点选Model,在出现的对话框中选择数据标准化方法,点选Euclidean,再选择Columntotalsareequalizedandmeansareremoved选项。
其余选项默认。
点击OK运行。
如图所示。
其余工具条默认。
表10对应表
表11行轮廓表
表12列轮廓表
表13结果汇总表
表13给出了行和列记分的关系,ProportionofInertia是惯量比例,代表各维度分别解释总惯量的比例及累计百分比,从中可以看出第一维和第二维的惯量比例占总惯量的88.4%,因此可以选取两维来进行分析。
图3行列得分图
结论分析:
从图中可以看出,我国经济发达省区,浙江,广东,江苏,福建等农村居民消费食品,居住,家庭设备,交通通讯为主;而天津,吉林,内蒙古,黑龙江等农村居民消费衣着,医疗保健,文教娱乐为主;北京,上海城市发达,消费水平高,几乎在所有方面消费都很高。
而西藏甘肃,云南,贵州消费水平相似,在给个方面消费都较低。
从我国目前的消费结构来看,大部分地区农村居民仍然以消费住房,医疗,食品,家庭设备方面,在城市发达地区,消费在住房,交通通讯,文教娱乐方面。
随着我国社会经济的不断发展和进步,这种消费差异会逐渐减小,甚至会趋于一致。
4结论
本文利用了多种统计学的方法对各地区进行了统计分析,总体上来说,从分析结果和中国现状来看,北京,上海农村居民消费一枝花,沿海地区农村居民消费也相当高,主要用在居住,家庭设备,交通通讯方面;西部地区经济相对落后,自然农村居民消费相对比较低。
其他地区农村居民消费水平一般,主要用在衣着,医疗保健,文教娱乐方面。
虽然通过分析得出了一般结论,但由于人为上的主观原因,在对待一些问题上,还可能存在一些偏差,因此此结论只能作为粗略的一般结论。
除此之外,此结论用的数据是2012年各地区农村居民平均消费的数据,故此结论只能说明2012年的结果。
5参考文献
[1]王娟.基于面板数据的中国农村居民消费支出的实证研究[J].市场经济与价格,2011(4).
[2]张红兵.SPSS宝典[M].北京.电子工业出版社,2007.
[3]李雪,王莉华.辽宁石油化工大学学报[J].2008.6.28(4).
[4]范迎军,袁永生.暨南大学学报[J].2013.2.34
(1).
[5]何晓群.多元统计分析[M].中国人民大学出版社,2012.1.(3).
6附表
本文数据选自2013年中国统计年鉴11-24c
表1