基于SAS分析北京市GDP影响因素的研究.docx

上传人:b****5 文档编号:12067752 上传时间:2023-04-16 格式:DOCX 页数:28 大小:248.76KB
下载 相关 举报
基于SAS分析北京市GDP影响因素的研究.docx_第1页
第1页 / 共28页
基于SAS分析北京市GDP影响因素的研究.docx_第2页
第2页 / 共28页
基于SAS分析北京市GDP影响因素的研究.docx_第3页
第3页 / 共28页
基于SAS分析北京市GDP影响因素的研究.docx_第4页
第4页 / 共28页
基于SAS分析北京市GDP影响因素的研究.docx_第5页
第5页 / 共28页
点击查看更多>>
下载资源
资源描述

基于SAS分析北京市GDP影响因素的研究.docx

《基于SAS分析北京市GDP影响因素的研究.docx》由会员分享,可在线阅读,更多相关《基于SAS分析北京市GDP影响因素的研究.docx(28页珍藏版)》请在冰豆网上搜索。

基于SAS分析北京市GDP影响因素的研究.docx

基于SAS分析北京市GDP影响因素的研究

基于SAS分析北京市GDP影响因素的研究

一、前言

北京是中华人民共和国的首都、直辖市和国家中心城市,是全国的政治、文化、科教和国际交往中心,是世界著名的古都和现代国际城市。

2011年全年北京市实现地区生产总值(GDP)16000.4亿元,按可比价格计算,比上年增长8.1%,其中人均GDP达到80394元人民币,按年平均汇率折合12447美元;2011年年末,北京市常住人口突破2000万大关,达2018.6万人;2011年12月,北京居民消费价格指数(CPI)同比上涨4.4%。

按2010年世界银行划分世界上不同国家和地区的贫富程度标准来看,北京实现的人均GDP已处于上中等富裕国家地区的上游,接近富裕国家地区的水平。

2012年北京市实现地区生产总值17801亿元,按可比价格计算,比上年增长7.7%,增幅比上年略低0.4个百分点。

北京市人均地区生产总值86024元,折合13686美元。

加快文化创意产业集聚区建设,支持文化企业重组、改造和上市,预计文化创意产业总收入超过9000亿元,增长20%以上。

国内外旅游人数达到2.1亿人次,旅游总收入3216.2亿元。

第三产业比重为75.7%。

更新淘汰老旧机动车22.4万辆,新增纯电动车1100辆,单位地区生产总值能耗、水耗和主要污染物排放量继续全面下降。

北京是综合性产业城市,综合经济实力保持在全国前列,第三产业规模居中国大陆第一。

2012年总部经济发展能力第1名。

初步核算,2013年实现地区生产总值19500.6亿元,比上年增长7.7%。

其中,第一产业增加值161.8亿元,增长3%;第二产业增加值4352.3亿元,增长8.1%;第三产业增加值14986.5亿元,增长7.6%。

按常住人口计算,北京市人均地区生产总值达到93213元。

三次产业结构由2012年的0.8:

22.7:

76.5变为0.8:

22.3:

76.9。

作为首都第一个大规模整体定向开发的金融功能区,进过十几年的发展,金融街已经成为中国的金融决策监管中心、资产管理中心、金融支付结算中心、金融信息中心:

金融街集中了中国人民银行、中国银监会、中国证监会、中国保监会等中国最高等金融决策和监管机构,几乎所有有关中国金融的重大决策都在这里酝酿、讨论和最终形成,是中国金融业最具影响力的金融中心区。

 

二、理论背景

为了在更高层次上发展北京市的经济,关注北京市GDP是必要的。

GDP是按市场价格计算的国内生产总值的简称,它是一个国家(地区)所有常住单位在一定时期内生产活动的最终成果。

GDP是国民经济核算的核心指标,也是衡量一个国家或地区经济状况和发展水平的重要指标。

而影响到业GDP的因素是多方面。

例如,居民消费、政府消费性支出、政府购买、出口、居民收入、投资等。

为了实证对GDP具体影响因素,以便于我们根据实证结果,提出政策性建议,针对北京市目前的发展情况,本文选取了1978年到2011年的时序数据作为研究的范围,以北京市GDP为被解释变量,并选取固定资本形成总额、社会消费品零售总额、出口总额为解释变量。

研究影响GDP的影响因素可以进一步证实其反映出了人民生活水平,生活质量的提高;也可以反映出北京市经济的脉象,便于北京市更好的发展。

三、建立模型

本模型是通过对北京市1978—2011年数据进行研究

确定模型所包含的变量,因变量(被解释变量)为GDP(Y单位:

亿元),自变量(被解释变量)有3个,固定资本形成总额(X1单位:

亿元)社会消费品零售总额(X2单位:

亿元)出口总额(X3单位:

亿美元)

确定模型的数据形式,我们先假设数学模型为:

四、实验方法

本次研究主要是分析自变量和因变量的关系以及找出合适的模型,并且运用时间序列的方法对社会消费品零售总额进行预测分析。

我们先用SAS对我们假定的模型

对变量X1,X2,X3分析,看看它们与Y的关系(运用的方法的逐步回归和主成分法)然后在GDP进行时间序列分析,最后预测未来3年的数据。

 

五、数据来源

1.数据来源于中国知网

2.数据引入

年份

GDP(亿元)Y

固定资本形成总额(亿元)X1

社会消费品零售总额(亿元)X3

出口总额(亿美元)X5

1978

82.65

18.55

25.2

8.65

1979

93.01

23.91

29.08

12.21

1980

103.53

25.56

34.64

15.42

1981

107.96

25

38.04

15.37

1982

114.11

32.36

39.76

14.24

1983

123.42

38.27

44.63

14.27

1984

147.53

48.67

52.17

12.34

1985

175.78

67.6

64.12

11.53

1986

194.74

75.89

81.39

12.55

1987

220.12

81.63

95.57

15.17

1988

259.71

96.85

121.28

16.83

1989

283.49

95.43

134.3

16.86

1990

310.95

98.03

139.88

17.86

1991

342.65

144.19

159.44

16.06

1992

411.04

185.12

181.2

17.52

1993

538.94

246.16

227.42

19.42

1994

732.89

345.46

303.37

24.00

1995

931.97

417.95

375.64

29.98

1996

1121.93

491.9

470.04

40.49

1997

1264.63

556.43

535.02

50.18

1998

1374.6

640.15

587.12

54.99

1999

1500.95

631.92

657.28

63.32

2000

1701.88

695.1

736.63

86.29

2001

1919.09

805.34

832.7

95.02

2002

2150.76

926.65

941.36

115.95

2003

2578.03

1180.54

922.27

143.74

2004

3110.97

1446.49

1044.78

208.65

2005

3905.64

1739.4

1190.06

274.15

2006

4462.74

2087.24

1356.79

335.40

2007

5252.76

2615.09

1603.74

381.61

2008

6719.01

3594

2078.7

422.29

2009

7521.85

5077.89

2430.83

299.85

2010

9224.46

6468.54

2902.55

375.17

2011

11307.3

8069.94

3395.06

444.98

 

六、SAS操作

1.逐步回归法

逐步回归的基本思想是:

首先在待选的M个变量中选择一个对因变量影响最大的自变量,这可以通过因变量与每一自变量进行回归得到的F值来判断。

若最大的F值在给定的显著性水平下是显著的,则该变量被选中,否则选元结束。

第二步,在剩下的M-1个变量中再选择一个变量加入到模型中,这可以通过偏F检验来判断。

偏F统计量为:

其中

,表示模型已存在变量

的条件下新加入变量

对因变量的贡献。

若最大的偏F统计量在给定的显著性水平下是显著的,则对应的自变量则被加入到模型中,否则不再加入其它变量,选元结束。

第三步,对已在模型中的每个变量进行显著性检验。

若检验不显著,则去掉该变量,再重复进行第二步和第三步,否则保留该变量,重复进行第二步和第三步,这一过程一直进行到待选的全部自变量根据给定的显著性水平没有一个再能被选入模型或排除出刚构成的回归模型为止。

输入程序:

dataexp3;

inputYX1X2X3@@;

cards;

82.6518.5525.28.65

93.0123.9129.0812.21

103.5325.5634.6415.42

107.962538.0415.37

114.1132.3639.7614.24

123.4238.2744.6314.27

147.5348.6752.1712.34

175.7867.664.1211.53

194.7475.8981.3912.55

220.1281.6395.5715.17

259.7196.85121.2816.83

283.4995.43134.316.86

310.9598.03139.8817.86

342.65144.19159.4416.06

411.04185.12181.217.52

538.94246.16227.4219.42

732.89345.46303.3724.00

931.97417.95375.6429.98

1121.93491.9470.0440.49

1264.63556.43535.0250.18

1374.6640.15587.1254.99

1500.95631.92657.2863.32

1701.88695.1736.6386.29

1919.09805.34832.795.02

2150.76926.65941.36115.95

2578.031180.54922.27143.74

3110.971446.491044.78208.65

3905.641739.41190.06274.15

4462.742087.241356.79335.40

5252.762615.091603.74381.61

6719.0135942078.7422.29

7521.855077.892430.83299.85

9224.466468.542902.55375.17

11307.38069.943395.06444.98

;procreggraphics;

modelY=X1X2X3/selection=stepwisesls=0.05sle=0.2r;

plotstudent.*p.='*';

run;

该程序告诉我们先建立一个临时数据集(一般临时的数据集在逻辑库里的work中)名叫EXP3;里面有4个变量YX1X2X3.其中procreggraphics是表示回归作图“selection=stepwise”表示逐步回归(选元,并给出回归结果),“sls=0.05”表示变量保留在模型中的显著性水平为0.05,而“sle=0.2”则表示变量选入到模型中的显著性水平为0.2,PLOT语句画标准残差与预测值的残差图。

逐步回归结果图和残差图

图1

图2

图3

图4

图5

图6

从图1至图6是对因变量Y进行逐步回归的结果,第一步(图1),变量X2被加入到模型中,说明三个自变量分别关于Y回归,其中由X2与Y回归得到的F统计量值最大,为3642.82,对应的概率为0.0001,在0.05的显著性水平下通过检验。

第二步,分别把变量X1和X3加入到刚建立的模型中,并分别计算其偏F检验值,结果表明X1的偏F统计值大于X3的偏F统计值,为20.3对应的概率为0.0001,小于进入模型的显著性水平0.20,所以X1被选入到模型中,此时模型中已有EXPEND和ads两个变量。

第三步,对X3和X1分别计算其偏F统计量值及其对应的概率(程序繁多就不一一输出),结果两个变量的偏F检验对应的概率都小于保留在模型中的显著性水平0.05,因此两个变量都被保留下来。

第四步,重复第二步和第三步,即把最后一个变量加入到由X2和X1对Y进行回归的模型中,结果两个变量的偏F检验对应的概率也都小于保留在模型中的显著性水平0.05,因此两个变量也都可以被保留下来。

从残差图(图6)中和逐步回归表中可以得到回归方程如下:

统计量值:

(0)(854.93)(361.21)(624.13)F=41426.4

对应概率:

(0.9981)(<0.0001)(<0.0001)(<0.0001)(<0.0001)

R-Square=0.9998andC(p)=4,MSE=2164.55531,SSR=64937

1、固定资产形成总额,社会消费品零售总额和出口总额都与GDP有显著的关系。

2.固定资产形成总额的系数表明固定资产形成总额没每加1亿元,GDP将增加0.6353亿元;社会消费品零售总额的系数表明社会消费品零售总额每1亿元,GDP将增加1.21375亿元,出口总额每增加1亿美元,GDP将增加4.48899亿元。

2.多重共线性

多重共线性是指在多元回归分析中自变量之间存在线性关系,用数学术语来表达就是系数矩阵的秩

但实践中,由于系数矩阵来自于样本观测,所以自变量之间的完全共线往往较少,代之的是自变量之间的近似共线性或称为高度共线性。

当回归模型中的自变量存在高度共线性时,虽然参数的OLS法估计量仍是的BLUE估计,但其估计量的稳定性却很差,也就是说对于不同的样本得到的参数估计值往往差别很大,从而造成检验失效。

因此在进行多元线性回归分析时,判断和处理自变量间多重共线性非常必要。

1.自变量间多重共线性的判断

自变量间多重共线性的判断方法很多。

除了利用有关理论经验地判断外,如C-D函数中的劳动力和资本使用量之间往往存在多重共线,通常在统计上一个简单而又有效的判断方法是:

对所有自变量关于因变量进行回归,若拟合优度很高,且F检验显著,但每一个自变量的回归

数T检验都不显著,则表明自变量间可能存在高度的多重共线。

关于多重共线,SAS系统提供了以下判断指标:

①方差膨胀因子VIF,定义为VIF

它表示回归系数的估计量由于自变量的共线性使得方差增加的一个相对度量,

表示第

个自变量对模型中其余自变量进行线性回归

得到的拟合优度。

一般来说,VIF>1,则表明自变量间存在高度共线。

②条件指数(conditionindices)K,定义为:

最大特征值与每个特征值比值的平方根,其中最大条件指数K称为矩阵

的条件数。

一般来说,若1≤K≤10,则可以认为自变量之间不存在或弱的多重共线;10

③方差比率(VarProp),通过主成分分析方法把矩阵X的P+1个特征值分解到P+1个主成分变量上(常数项也作为一个变量),每个变量分得的方差称为方差比率。

对大的条件数若同时有两个以上的方差比率超过50%,则认为这些变量之间存在一定程度的相关。

在SAS中输入代码:

procregcorr;/*对模型进行回归分析过程,并要求计算变量之间的相关系数*/

modely=x1x2x3/vifcollincollinoint;/*vif要求计算方差膨胀因子,而collin和collinoint则要求进行多重共线诊断*/

run;

在上面的程序中,procreg调用回归分析过程,并按MODEL语句给出的模型结构进行分析,其中选项corr要求计算变量之间的相关系数,vif要求计算方差膨胀因子,而collin和collinoint则要求进行多重共线诊断,两者的区别是前者没有对截据项进行调整,而后者进行了调整。

当截据项经检验是显著时,应考察由collinoint输出的结果,否则参看由collin输出的结果(由于我们前面已经检验了截距项是显著的,所以我们这里考察collinoint输出的结果)。

程序运行结果如下:

变量之间线性回归及多重共线诊断结果

图7

图8

图9

图10

从变量之间线性回归及多重共线诊断结果中最上面的相关系数阵(图7)可以看出,X1、X2、X3与Y都是正相关,并且X1、X2,X3都与Y高度正相关,相关系数分别为0.9853,0.9956和0.9456。

在自变量之间,X2与Y的相关系数为0.9956最高,而X2与X1的相关系数高达0.977(X2为社会消费品零售总额,X1为固定资本形成总额)X2和X3以及X1和X3的相关系数也很好高其值分别为0.9356和0.8827;上述说明X2与Y存在高度的线性关系,也说明X2和X1、X3存在高度相关性,且X1和X3也存在高度相关性(可以说明存在多重共线性);这与我们从经济理论得到的判断是一致的。

输出表中(图9)的方差膨胀因子(vaianceinflation)和最下面的共线性诊断(因为截据项检验显著)也说明了这一点。

其中条件数为14.66908,而在变量X1和X2上的方差比率分别为0.88783和0.99208,远超过50%,说明两变量高度共线。

如果不对多重共线进行处理而直接进行线性回归,根据输出分析表可以写出以下方程:

检验统计量:

(-0.00)(29.24)(19.01)(24.98)F=41426.4

对应概率:

(<0.0001)(<0.0001)(<0.0001)(<0.0001)(<0.0001)

R-Square=0.9998AdjR-Sq=0.9997RootMSE=46.52478

上述分析中我们发现的X2和X3存在高度相关性,虽然X2和X3的T检验显著。

由于自变量X2与X3高度相关,为了消除这一影响,通常可以去掉一个不重要的因素,然后就剩下的两个自变量对因变量进行回归。

考虑到X2和X3对Y都很重要,为保留这两个变量,以下我们将REG过程就三个自变量对Y做主成分回归。

3.主成分回归:

利用主成分分析方法,把P个自变量表示成K(K

由主成分的性质知,这K个主成分是不相关的。

再用这K个主成分关于因变量回归,最后把回归结果再转化为由原来的自变量和因变量之间的回归模型。

输入代码:

procregdata=EXP3outest=result1outvif;/*对模型进行回归,并且把结果输入到数据集result*/

modelY=X1X2X3/pcomit=1;/*“pcomit=1”表示去除最后一个主成分*/

run;

procprintdata=result1;

run;

在上述程序中,MODEL语句后的选项“pcomit=1”表示去除最后一个主成分,用剩下的P-1个主成分作为自变量关于因变量回归。

本例中有三个自变量,所以主成分有三个,去除一个后还有两个。

用这两个主成分对进口额进行回归,回归的结果存放到由procreg语句规定的选项“outest=”的数据集result1中。

程序运行结果如下:

图11

由图11第三行可以写出主成分回归方程如下:

从方程中我们可以得出如下结果:

固定资本形成总额的系数表明固定资本形成总额每增加1亿元,GDP将增加0.63348亿元,而城社会消费品零售总额系数表明社会消费品零售总额每增加1元,GDP将增加1.21941亿元,出口总额每增加1亿美元,GDP将增加4.47803亿元。

4.预测

我们预测Y(预测下一年的GDP)可以通过时间序列的方法进行预测。

先通过SAS的文件菜单点击导入数据,并且把导入的数据命名为tjsj(一般导入的数据在逻辑库的work里面)。

对数据进行平稳性检验。

输入代码:

dataY;/*建立临时数据集命名为sj*/

inputyearY;/*输入年份以及变量数据*/

cards;/*进行数据录入*/

197882.65

197993.01

1980103.53

1981107.96

1982114.11

1983123.42

1984147.53

1985175.78

1986194.74

1987220.12

1988259.71

1989283.49

1990310.95

1991342.65

1992411.04

1993538.94

1994732.89

1995931.97

19961121.93

19971264.63

19981374.6

19991500.95

20001701.88

20011919.09

20022150.76

20032578.03

20043110.97

20053905.64

20064462.74

20075252.76

20086719.01

20097521.85

20109224.46

201111307.3

;

procgplotdata=Y;/*对数据集进行绘制时序图*/

plotY*year/haxis=1978to2012by2;/*指出曲线图变量所在坐标轴,Y是曲线图的纵轴,year则是曲线图的横轴;haxis则是将横从1978至2012进行等距离划分,相邻两个值间隔2*/

symbolc=redi=joinv=star;/*各点的形状为星号,通过直线连接,曲线颜色为红色*/

run;

第一个代码表示对该序列绘制时序图用于观测平稳性,其中plotY*date的含义是规定将输出以date为横坐标,以Y为纵坐标的曲线图;symbolc=redi=jionv=star该语句的作用是规定所绘制图形的格式。

此图形中各点的形状为星号,各点是通过直线连接的,曲线的颜色为红色。

绘制图12所示:

图12

图12为原始数据时序图,可以看出具有明显的趋势性(有点成曲线指数增加的趋势)为非平稳模型。

所以对原序列进行1阶差分。

 

输入代码:

dataY;

inputyearY;

dif1=dif(Y);/*对序列Y进行一阶差分*/

cards;

197882.65

197993.01

1980103.53

1981107.96

1982114.11

1983123.42

1984147.53

1985175.78

1986194.74

1987220.12

1988259.71

1989283.49

1990310.95

1991342.65

1992411.04

1993538.94

1994732.89

1995931.97

19961121.93

19971264.63

19981374.6

19991500.95

20001701.88

20011919.09

20022150.76

20032578.03

20043110.97

20053905.64

20064462.74

20075252.76

20086719.01

20097521.85

20109224.46

201111307.3

;

procgplotdata=Y;/*对数据集进行绘制时序图*/

plotdif1*year/haxis=1978to201

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 国外设计风格

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1