1、题目基于R对国内各省市区主要经济指标的相关性分析与回归分析 2基于R对国内各省、市、区GDP与主要经济指标的回归分析学号:* 姓名: 杨 治 峰 班级:地矿学院(“三矿”专业) 摘要: 基于对2012年国内生产总值的数据分析,找出我国GDP 与多个指标,尤其是对投资、消费、出口等基本指标的依赖关系,运用相关分析和回归分析方法,建立回归模型,找出我国GDP的增长受社会固定资产依赖性较强,尤其是东部的山东省,也受制于出口收入,而我国消费水平依然不高的问题并为之提出改进措施和经济发展的预测,对国家各地区经济的科学发展建言献策关键词: R语言、相关分析、回归分析、中国GDP 1 引言在当前复杂多变的国
2、际经济形势下,我国国民生产总值(GDP)依然保持较快发展,国民生产总值是一个综合指标,依赖于多个指标的良性组合。世界各国都十分重视GDP结构问题的研究。本文基于对2012年国内生产总值的数据分析,找出我国GDP 与多个指标,尤其是对投资、消费、出口等基本指标的依赖关系,建立回归模型,尝试着探索出我国GDP 存在的结构性问题和不足之处,并为之提出改进措施和经济发展的预测,对国家各地区经济的科学发展建言献策!2.数据与分析方法2.1.数据描述性统计2.1.1.数据源的格式化处理R软件在读入excel数据源的时候,必须先对数据源进行格式化处理和调整才可以达到R软件的读取标准。如表头的单行单列、文字间
3、空格符号的消除等,调整完后,依据个人习惯将数据存入txt文本格式,命名为“ryuan.txt”。2.1.2.数据的读取 A=read.table(ryuan.txt,header=T) A#解析变量成y,x1,x2,x3,x4,x5,x6,x7,;X=A,c(1,4,2,9,6,8,3)Xy=A,c(1)#地区生产总值(亿元)yy2=A,c(4)#人均地区生产总值(元)y2x1=A,c(2)#社会固定资产投资(亿元)x1x2=A,c(9)#出口总额(亿美元)x2x3=A,c(6)#城镇人均消费支出(元)x3x4=A,c(8)#农民人均消费支出(元)x4x5=x3+x4#各地区人均消费总额(元)
4、x5x6=A,c(3)#各地区居民消费价格指数x6B=data.frame(地区生产总值(亿元)=y,社会固定资产投资(亿元)=x1,出口总额(亿美元)=x2,各地区人均总额(元)=x5)2.1.3.对读入的数据进行描述性统计。根据研究需要,先将数据进行结构性分析,找出解释变量和被解释变量,并将其按列抽取出来,做解析变量,方便之后分析统计工作对变量的调取。再通过R软件的强大功能对数据进行相关的的描述性统计,初步了解选取数据的各项指标,如数据类型、数据量纲等,可以清晰的看到数据如各行和各列的和、最大值、最小值、平均值、数据排序、数据方差、标准差、判断数据是否符合正态分布,更利于对数据的整体把握,
5、找到自己想要了解的特定的数据属性。2.2数据可视化2.2.1.定量变量分析定量变量的基本特征,最简单的展现定量数据的图形应该属于直方图hist函数Hist(y)#国内生产总值的直方图定量变量间的关系,描述两个变量之间的关系的最有用的指令是散点图plot的函数,他是R中最强大的绘图函数。plot(y,x1,plot(y,x1,cex=1.3,lwd=2,col=2,pch=15,xlab=地区生产总值(亿元),ylab=社会固定资产投资(亿元))) #地区生产总值与社会固定资产投资散点图从上图可以看出,国民生产总值与社会固定资产投资有较强的相关关系,国民生产总值增加,社会固定资产也相应增加。pl
6、ot(x3,x4,cex=1.6,lwd=3,col=6,xlab=城镇人均消费支出(元),ylab=农民人均消费支出(元)) #城镇人均消费支出与农民人均消费支出从上图可以看出,城镇居民人均消费支出于农民人均消费支出也呈现很强的线性相关关系,城镇居民人均消费支出增加,农民人均消费支出也增加,表明全国人均消费支出各地区同步增长,当然我们也可以看到全国各地区域间消费差距较大,城乡之间消费差距较大,甚至是数倍的差距。同理,我们依次可以做出国民生产总值与出口总额、社会人均消费、居民消费价格乃至整个的散点矩阵图。并从散点图形中判别出相关关系。pairs(C,cex=1.5,lwd=2,pch=16,c
7、ol=4)#多元线性相关散点矩阵图 cor(C)#多元线性相关系数矩阵 地区生产总值 社会固定资产投资 出口总额 各地区人均总额地区生产总值 1.0000000 0.8838913 0.7970525 0.4771797社会固定资产投资 0.8838913 1.0000000 0.4593596 0.1895959出口总额 0.7970525 0.4593596 1.0000000 0.6163032各地区人均总额 0.4771797 0.1895959 0.6163032 1.0000000boxplot(X)#箱尾图箱尾图可以较清晰地表示出数据的分布特征,从上图可以看出,每项指标都有异常值
8、,在GDP总值里,广东、江苏、山东名列三甲;在人均生产总值里,天津特别突出,远高于其他省份。在人均消费支出里,北京、上海二市突出出来。新疆在消费价格指数位方面是唯一的异常值,表明其在本方面表现为全国最高!barplot(y,main=全国各地区GDP条形图,col=rainbow(8))#条形图条形图是一种非常直观的数据表达形式,从本图中可以形象的看出全国各省市GDP数据大小。广东、江苏、山东条形最高,产值最大。barplot(apply(X,2,mean)#均值条形图均值条形图统通常比较各变量在不同观察单位上的均值变化大小,本图对地区生产总值、人均生产总值、社会固定资产投资、出口总额、人均消
9、费支出、居民消费价格指数七项指标作均值表示。pie(y,main=全国各地区GDP份额饼状图)#饼状图饼状图功能类似条形图,直观形象的表现数据。本图中以全国GDP为整个饼状图,把各省市当做各个饼图的份额,从饼块的大小上清晰地查阅到各省占全国的份额。广东、江苏、山东占全国GDP份额最大,新疆、贵州、甘肃地区密集在一起不可显示,说明GDP份额较小。faces(X,ncol.plot=7)#脸谱图effect of variables: modified item Var height of face 地区生产总值.亿元. width of face 人均地区生产总值.元. structure of
10、 face 社会固定资产投资.亿元. height of mouth 出口总额.亿美元. width of mouth 城镇人均消费支出.元. smiling 农民人均消费支出.元. height of eyes 居民消费价格指数 width of eyes 地区生产总值.亿元. height of hair 人均地区生产总值.元. width of hair 社会固定资产投资.亿元. style of hair 出口总额.亿美元. height of nose 城镇人均消费支出.元. width of nose 农民人均消费支出.元. width of ear 居民消费价格指数 height
11、 of ear 地区生产总值.亿元. 脸谱图将每个指标用人的某一部位的形状或大小来表示,利用P个指标数值就可以勾勒出一个人的脸谱,而脸谱之间的差异性反映了所对应的样本之间的差异特征。从本图中可以看到GDP较高的省份脸部各部位都较大,例如广东、江苏、山东、浙江。stars(X,full=T,lwd=1,draw.segments=T,key.loc=c(19,2)#星象图星相图将每个变量的各个观察单位的数值表示为一个图形,n个观察单位就有就有n个图,每个图的每个角表示每个变量。2.3.数据的基本相关分析,以此揭示所选取数据集数据基本结构关系;线性相关分析是用相关系数来表示两个变量间相互的线性关系
12、,并判断其密切程度的统计方法。 社会固定资产投资与地区生产总值相关性分析及假设检验cor(y,x1)r= 0.8838913 cor.test(y,x1) Pearsons product-moment correlationdata: y and x1t = 10.1774, df = 29, p-value = 4.422e-11alternative hypothesis: true correlation is not equal to 095 percent confidence interval: 0.7710392 0.9429128sample estimates: cor 0
13、.8838913 建立检验假设:H0:p=0,H10(=0.05)计算相关系数t的值计算t值和p值做结论由于p=4.422e-110.05,由于在显著性水平上拒绝H0,接受H1,可认为社会固定资产投资与地区生产总值呈正的线性关系。同理,我们得到:出口总额与地区生产总值相关系数并假设检验cor(y,x2)1 0.7970525人均地区生产总值与地区生产总值相关系数并假设检验cor(y,y2)1 0.3970403各地区人均消费值与地区生产总值相关系数并假设检验cor(y,x5)1 0.4771797居民消费价格指数与地区生产总值相关系数并假设检验cor(y,x6)1 -0.3576302城镇人均
14、消费支出与农民人均消费支出相关系数并假设检验cor(x3,x4)1 0.9131506相关分析结论如下:1.我国各地GDP与社会固定资产投资、出口总额、人均消费支出等呈现正线性相关性,其中与社会固定资产投资相关性最强,出口收入次之,说明我国GDP的增长受社会固定资产依赖性较强,也受制于出口收入,尤其是在沿海省份表现尤为突出。而良性的GDP增长需要国民消费的增长,这既符合我国继续扩大内需,促进消费的政策,也有利于我国节约资源,保证经济稳定的需要。2.城镇居民消费与农村人均消费同步增长,是我国各地经济快速发展的积极信号,尤其是广阔的农村市场对消费的潜力巨大。我国应当继续保障农民的医疗、教育、社会保
15、障的投入,使农民不再有后顾之忧,真正的开发广阔的农村消费市场,是我国经济继续腾飞的有力保证和新的引擎。3.居民消费价格指数与地区生产总值相关系数成负线性相关。尤其是在西部和边疆地区,其地区生产总值较低物价却较高,不利于当地居民生活条件的改善。总体因为受当地受地理条件限制和生产方式落后致使经济发展,而交通不便运输成本较高是其物价较高的主因。建议政府加大这些地区的交通运输业的发展,提高地区生产自己能力,降低物价,提高人民生活水平。2.4.多元线性回归分析回归模型是通过回归分析研究多个变量之间的依存关系,将变量区分为自变量和因变量,并研究确定自变量和因变量之间的具体关系的方程式。分析中所形成的这种关系式成为回归模型。在实际生活中,常会遇到一个因变量与多个自变量的数量关系的问题,故要建立多元回归模型。本案
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1