我国GDP的统计分析.docx
《我国GDP的统计分析.docx》由会员分享,可在线阅读,更多相关《我国GDP的统计分析.docx(42页珍藏版)》请在冰豆网上搜索。
我国GDP的统计分析
统计调查分析报告
题目:
_关于我国国内生产总值的统计分析__
班级:
_____应数1102班_______________
*****_______徐沈和______________*****
学号:
______**********_______________
时间:
_____2013/7/5___________________
时代背景
进入本世纪,特别是2001年“9·11”事件后,为防止经济陷入衰退,美国进入了持续降息周期,在2000—2004年间连续25次降息,联邦基金利率从6.5%一直降到1%,并保持了很长时间。
期间,伴随良好的经济环境,美国房价也一路飚升,房地产市场十分景气,贷款买房条件也非常宽松,使得原来不符合银行要求的家庭也轻易获得了银行贷款即房屋次级贷款。
数据显示,次贷发展最快的时期在2003—2006年之间。
到2006年末,次贷已经涉及500万个美国家庭,贷款规模估计达到1.2万亿美元[1]。
随着降息效果的逐步显现,为防止经济过热,美联储在2005—2006年间,先后加息17次,利率从1%提高到5.25%。
由于政策效应的滞后性,2006年美国次级房贷仍有上升。
随着加息效应的逐步显现,房地产泡沫开始破灭,房价下降和抵押品贬值的同时,贷款利率却上升了,这使得一些债务人出现偿债困难。
从2007年3月份开始,一些贷款机构的问题开始暴露出来,在2007年8月次贷危机终于全面爆发。
在这一危机中,高度市场化的金融系统相互衔接产生了特殊的风险传导路径,即低利率环境下的快速信贷扩张,加上独特的利率结构设计使得次贷市场在房价下跌和持续加息后出现偿付危机[2]。
按揭贷款的证券化和衍生工具的快速发展,加大了与次贷有关的金融资产价格下跌风险的传染性与冲击力,而金融市场国际一体化程度的不断深化又加快了金融动荡从一国向另一国传递的速度。
在信贷市场发生流动性紧缩的情况下,次贷危机最终演变成了一场席卷全球的金融风波。
期间大致经历四个阶段,第一波:
冲击始于2007年8月份。
当时危机开始集中显现,大批与次级住房抵押贷款有关的金融机构纷纷破产倒闭,美国联邦储备委员会被迫进入“降息周期”。
第二波:
2007年年底至2008年年初,花旗、美林、瑞银等全球著名金融机构因次级贷款出现巨额亏损,市场流动性压力骤增,美联储和一些西方国家央行被迫联手干预。
第三波:
2008年3月份,美国第五大投资银行贝尔斯登濒临破产,迫使美联储紧急向其注资,并大幅降息75个基点。
第四波:
近日,美国两大住房抵押贷款融资机构——美国联邦国民抵押贷款协会(房利美)和美国联邦住宅抵押贷款公司(房地美)陷入困境。
危机已从最初的次贷领域,向整个金融市场和美国经济基本面蔓延,分析人士认为,次贷危机因此进入了更加动荡的阶段。
次贷危机导致美国信贷进一步萎缩、消费者信心下降、企业破产增多,美元持续贬值,美国失业率上升,美国经济已经陷入“滞胀”边缘。
一,收集我国1980-2011年GDP、人口数、固定资产投资、进出口总额、国家财政支出数据,做GDP与其他指标因素的相关分析和回归分析。
通过中国统计网查询了我国1980-2011年GDP、人口数、固定资产投资、进出口总额、国家财政支出数据并且通过Excel制作了如下表的数据。
年份
GDP/亿元
人口数/万人
固定资产投资/亿元
进出口总额/亿元
国家财政支出/亿元
1980
4545.624
98705
910.9
570
1228.83
1981
4889.461
100072
961
753.3
1138.41
1982
5330.451
101654
1230.4
771.3
1229.98
1983
5985.552
103008
1430.1
860.1
1409.52
1984
7243.752
104357
1832.9
1201
1701.02
1985
9040.737
105851
2543.2
2066.7
2004.25
1986
10274.38
107507
3120.6
2580.4
2204.91
1987
12050.62
109300
3791.7
3084.2
2262.18
1988
15036.82
111026
4753.8
3821.8
2491.21
1989
17000.92
112704
4410.4
4155.9
2823.78
1990
18718.32
114333
4517
5560.1
3083.59
1991
21826.2
115823
5594.5
7225.8
3386.62
1992
26937.28
117171
8080.1
9119.6
3742.2
1993
35260.02
118517
13072.3
11271
4642.3
1994
48108.46
119850
17042.1
20381.9
5792.62
1995
59810.53
121121
20019.3
23499.9
6823.72
1996
70142.49
122389
22913.5
24133.8
7937.55
1997
78060.85
123626
24941.1
26967.2
9233.56
1998
83024.28
124761
28406.2
26849.7
10798.18
1999
88479.15
125786
29854.7
29896.2
13187.67
2000
98000.45
126743
32917.7
39273.2
15886.5
2001
108068.2
127627
37213.5
42183.6
18902.58
2002
119095.7
128453
43499.9
51378.2
22053.15
2003
134977
129227
55566.6
70483.5
24649.95
2004
159453.6
129988
70477.43
95539.1
28486.89
2005
183617.4
130756
88773.6129
116921.8
33930.28
2006
215904.4
131448
109998.1624
140974
40422.73
2007
266422
132129
137323.9381
166863.7
49781.35
2008
316030.3
132802
172828.3998
179921.4702
62592.66
2009
340320
133450
224598.7679
150648.0635
76299.93
2010
399759.5
134091
251683.7688
201722.147
89874.16
2011
472115
134735
311485.1254
236401.992
109247.79
表一
1.1根据表一通过SPSS进行相关性分析:
A,在进行相关性分析前先做图来判断其是否符合相关性分析的要求
图1.1
图1.2
图1.3
图1.4
B,从散点图可以发现以下以下信息:
(1)两变量间存在着明显的相关趋势;
(2)这种相关趋势呈现线性相关趋势(除了GDP与人口数的相关性,这两个相关性后面会通过Spearman相关系数得到),因此可以考虑线性相关的极差相关系数加以刻画;(3)散点图上没有发现明显的异常值。
C,综合
(1),
(2),(3)可以知道变量的相关性可以通过SPSS的Pearson相关系数分析求解(结果见表二)
Correlations
GDP
固定资产投资
进出口总额
国家财政支出
GDP
PearsonCorrelation
1
.987**
.985**
.992**
Sig.(2-tailed)
.000
.000
.000
N
32
32
32
32
固定资产投资
PearsonCorrelation
.987**
1
.962**
.998**
Sig.(2-tailed)
.000
.000
.000
N
32
32
32
32
进出口总额
PearsonCorrelation
.985**
.962**
1
.969**
Sig.(2-tailed)
.000
.000
.000
N
32
32
32
32
国家财政支出
PearsonCorrelation
.992**
.998**
.969**
1
Sig.(2-tailed)
.000
.000
.000
N
32
32
32
32
**.Correlationissignificantatthe0.01level(2-tailed).
表二
注释:
Pearson相关系数分析比Spearman相关系数分析统计系能更高一些,但其数据要求要高很多,Spearman相关系数分析就对数据没有要求,其适用范围更广
通过SPSS的Spearman相关系数分析GDP与人口数的相关性(结果见表三
Correlations
GDP
人口数
Spearman'srho
GDP
CorrelationCoefficient
1.000
1.000**
Sig.(2-tailed)
.
.
N
32
32
人口数
CorrelationCoefficient
1.000**
1.000
Sig.(2-tailed)
.
.
N
32
32
**.Correlationissignificantatthe0.01level(2-tailed).
表三
通过表二和表三可以知道,GDP与人口数、固定资产投资、进出口总额、国家财政支出有密切的相关关系。
(还可以进一步做偏相关分析求解其剔除其他因素的作用大小,重新考虑两个因数间的相关程度,因为后面要进行回归分析,所以这里就不做偏相关分析了)
1.2通过表一利用MATLAB进行回归分析:
(1)基本模型的建立
记GDP为y,记人口数,固定资产投资、进出口总额、国家财政支出分别为x1,x2,x3,x4;再根据1.1的相关性分析散点图及相关性结果可以建立如下基本模型:
……………………
(1)
(2)模型求解
利用MAtLAB统计工具箱进行求解;
程序源代码:
x1=[9870510072101654103008104357105851107507109300111026112704114333115823117171118517119850121121122389123626124761125786126743127627128453129227129988130755131448132129132802133450134091134735];
x2=[910.99611230.41430.11832.92543.23120.63791.74753.84410.445175594.58080.113072.317042.120019.322913.524941.128406.229854.732917.737213.543499.955566.670477.4388773.6129109998.1624137323.9381172828.3998224598.7679251683.7688311485.1254];
x3=[570753.3771.3860.112012066.72580.43084.23821.84155.95560.17225.89119.61127120381.923499.924133.826967.226849.729896.239273.242183.651378.270483.595539.1116921.8140974166863.7179921.4702150648.0635201722.147236401.992];
x4=[1228.831138.411229.981409.521701.022004.252204.912262.182491.212823.783083.593386.623742.24642.35792.626823.727937.559233.5610798.1813187.6715886.518902.5822053.1524649.9528486.8933930.2840422.7349781.3562592.6676299.9389874.16109247.79];
y=[4545.6244889.4615330.4515985.5527243.7529040.73710274.3812050.6215036.8217000.9218718.3221826.226937.2835260.0248108.4659810.5370142.4978060.8583024.2888479.1598000.45108068.2119095.7134977159453.6183617.4215904.4266422316030.3340320399759.5472115]';
x=[ones(32,1)x1'x2'x3'x4'(x1.^2)'];
[b,bint,r,rint,s]=regress(y,x)
计算结果:
参数
参数估计值
参数置信区间
β0
17317.85
3168.67
31467.03
β1
-1.60
-2.07
-1.13
β2
0.45
0.02
0.88
β3
0.42
0.28
0.55
β4
1.68
0.34
3.01
β5
1.39E-05
1.05E-05
1.73E-05
R2=0.9985
F=3.35*10^3
p<1.2*10^-35
s2=2.95*10^7
表四模型
(1)的计算结果
结果分析;表四显示,R2=0.9985指因变量y(GDP)的99.85%可由模型确定,F值远远超过F检验的临界值,p远小于α,6个参数置信区间不包含0,因而从整体上看模型
(1)是可用的
模型的改进:
rcoplot(r,rint);(残差分析)
图1.5
从上图1.5残差图可以看出第二个数据为异常值,那么剔除第二个数据之后再次进行残差分析
图1.6
由上图1.6可以看出第28,29数据异常,剔除第28,29个数据后再次做残差分析
图1.7
从上图1.7可以看出第27个数据为异常值,剔除第27个数据之后,进行残差分析
图1.8
由上图1.8可以看出第13个数据异常,剔除第13个数据之后,再次进行残差分析
图1.9
由上图1.9可以看出第1.12个数据异常,剔除异常数据后,再次进行残差分析
图1.10
从上图1.10可以看出没有异常值,所以残差分析结束,最后分析结果为:
参数
参数估计值
参数置信区间
β0
1317343.25
1031414.67
1603271.83
β1
-25.01
-30.10
-19.93
β2
1.33
1.10
1.55
β3
-0.02
-0.11
0.06
β4
-0.41
-1.05
0.24
β5
0.0001192
0.0000966
0.0001418
R2=0.9998
F=19862.23
P<1.3*10^-34
S2=3394693
表五模型
(1)计算结果
结果分析;表四显示,R2=0.9998指因变量y(GDP)的99.98%可由模型确定,F值远远超过F检验的临界值,p远小于α,因而从整体上看模型
(1)是可用的β3,β4的置信区间包含0(但是区间右端点距0很近),所以将变量x3,x4保留在模型中,所以最后得到的模型为:
二,收集1980-2011年中南六省:
湖北、湖南、河南、江西、广东、广西的GDP数据,消除物价因素影响后,做方差分析
(1),通过查询中国统计网得到1980-2011年中南六省:
湖北、湖南、河南、江西、广东、广西的GDP数据并且利用Excel制作出下表
年份省份
江西省
湖南省
湖北省
河南省
广东省
广西省
1980
111.15
191.72
199.38
229.16
249.6484
97.33
1981
121.26
209.68
219.75
249.69
290.3558
113.46
1982
133.96
232.52
241.55
263.3
339.9242
129.15
1983
144.13
257.43
262.58
327.95
368.7537
134.6
1984
169.11
287.29
328.22
370.04
458.7351
150.27
1985
207.89
349.95
396.26
451.74
577.3838
180.97
1986
230.82
397.68
442.04
502.91
667.5302
205.46
1987
262.9
469.44
517.77
609.6
846.6877
241.56
1988
325.83
584.07
626.52
749.09
1155.367
313.28
1989
376.46
640.8
717.08
850.71
1381.39
383.44
1990
428.62
744.44
824.38
934.65
1559.028
449.06
1991
479.37
833.3
913.38
1045.73
1893.298
518.59
1992
572.55
986.98
1088.39
1279.75
2447.54
646.6
1993
723.04
1244.71
1325.83
1660.18
3469.283
871.7
1994
948.16
1650.02
1700.92
2216.83
4619.018
1198.29
1995
1169.73
2132.13
2109.38
2988.37
5933.052
1497.56
1996
1409.74
2540.13
2499.77
3634.69
6834.966
1697.9
1997
1605.77
2849.27
2856.47
4041.09
7774.53
1817.25
1998
1719.87
3025.53
3114.02
4308.24
8530.875
1911.3
1999
1853.65
3214.54
3229.29
4517.94
9250.676
1971.41
2000
2003.07
3551.49
3545.39
5052.99
10741.25
2080.04
2001
2175.68
3831.9
3880.53
5533.01
12039.25
2279.34
2002
2450.48
4151.54
4212.82
6035.48
13502.42
2523.73
2003
2807.41
4659.99
4757.45
6867.7
15844.64
2821.11
2004
3456.7
5641.94
5633.24
8553.79
18864.62
3433.5
2005
4056.76
6511.34
6590.19
10587.42
22557.37
3984.1
2006
4820.53
7568.89
7617.47
12362.79
26587.76
4746.16
2007
5800.25
9439.6
9333.4
15012.46
31777.01
5823.41
2008
6971.05
11555
11328.92
18018.53
36796.71
7021
2009
7655.18
13059.69
12961.1
19480.46
39482.56
7759.16
2010
9451.26
16037.96
15967.61
23092.36
46013.06
9569.85
2011
11702.82
19669.56
19632.26
26931.03
53210.28
11720.87
表6名义GDP
(2),消除价格因素:
通过统计网收集了中南6省1980-2011年的居民消费水平(都是将前年的看成100,有些省省份是将1978年看成100,此时通过spss的Transform将其进行转变)
年份省份
江西省
湖南省
湖北省
河南省
广东省
广西省
1980
99.7
105.8
108.6
104.6
105.3
110.0
1981
104.1
105.6
114.2
101.4
100.7
101.6
1982
112.4
108.7
116.3
101.4
93.6
103.3
1983
104.5
108.9
110.2
101.6
98.4
102.7
1984
107.6
110.7
114.2
100.8
100.6
103.3
1985
108.7
114.5
111.1
104.6
113.3
113.0
1986
101.6
110.6
115.9
105.4
91.4
106.2
1987
103.7
113.3
103.9
106.3
106.0
108.2
1988
104.7
111.0
102.2
119.4
116.4
120.8
1989
100.0
104.