我国GDP的统计分析Word格式文档下载.docx
《我国GDP的统计分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《我国GDP的统计分析Word格式文档下载.docx(42页珍藏版)》请在冰豆网上搜索。
1983
5985.552
103008
1430.1
860.1
1409.52
1984
7243.752
104357
1832.9
1201
1701.02
1985
9040.737
105851
2543.2
2066.7
2004.25
1986
10274.38
107507
3120.6
2580.4
2204.91
1987
12050.62
109300
3791.7
3084.2
2262.18
1988
15036.82
111026
4753.8
3821.8
2491.21
1989
17000.92
112704
4410.4
4155.9
2823.78
1990
18718.32
114333
4517
5560.1
3083.59
1991
21826.2
115823
5594.5
7225.8
3386.62
1992
26937.28
117171
8080.1
9119.6
3742.2
1993
35260.02
118517
13072.3
11271
4642.3
1994
48108.46
119850
17042.1
20381.9
5792.62
1995
59810.53
121121
20019.3
23499.9
6823.72
1996
70142.49
122389
22913.5
24133.8
7937.55
1997
78060.85
123626
24941.1
26967.2
9233.56
1998
83024.28
124761
28406.2
26849.7
10798.18
1999
88479.15
125786
29854.7
29896.2
13187.67
2000
98000.45
126743
32917.7
39273.2
15886.5
2001
108068.2
127627
37213.5
42183.6
18902.58
2002
119095.7
128453
43499.9
51378.2
22053.15
2003
134977
129227
55566.6
70483.5
24649.95
2004
159453.6
129988
70477.43
95539.1
28486.89
2005
183617.4
130756
88773.6129
116921.8
33930.28
2006
215904.4
131448
109998.1624
140974
40422.73
2007
266422
132129
137323.9381
166863.7
49781.35
2008
316030.3
132802
172828.3998
179921.4702
62592.66
2009
340320
133450
224598.7679
150648.0635
76299.93
2010
399759.5
134091
251683.7688
201722.147
89874.16
2011
472115
134735
311485.1254
236401.992
109247.79
表一
1.1根据表一通过SPSS进行相关性分析:
A,在进行相关性分析前先做图来判断其是否符合相关性分析的要求
图1.1
图1.2
图1.3
图1.4
B,从散点图可以发现以下以下信息:
(1)两变量间存在着明显的相关趋势;
(2)这种相关趋势呈现线性相关趋势(除了GDP与人口数的相关性,这两个相关性后面会通过Spearman相关系数得到),因此可以考虑线性相关的极差相关系数加以刻画;
(3)散点图上没有发现明显的异常值。
C,综合
(1),
(2),(3)可以知道变量的相关性可以通过SPSS的Pearson相关系数分析求解(结果见表二)
Correlations
GDP
固定资产投资
进出口总额
国家财政支出
PearsonCorrelation
1
.987**
.985**
.992**
Sig.(2-tailed)
.000
N
32
.962**
.998**
.969**
**.Correlationissignificantatthe0.01level(2-tailed).
表二
注释:
Pearson相关系数分析比Spearman相关系数分析统计系能更高一些,但其数据要求要高很多,Spearman相关系数分析就对数据没有要求,其适用范围更广
通过SPSS的Spearman相关系数分析GDP与人口数的相关性(结果见表三
人口数
Spearman'
srho
CorrelationCoefficient
1.000
1.000**
.
表三
通过表二和表三可以知道,GDP与人口数、固定资产投资、进出口总额、国家财政支出有密切的相关关系。
(还可以进一步做偏相关分析求解其剔除其他因素的作用大小,重新考虑两个因数间的相关程度,因为后面要进行回归分析,所以这里就不做偏相关分析了)
1.2通过表一利用MATLAB进行回归分析:
(1)基本模型的建立
记GDP为y,记人口数,固定资产投资、进出口总额、国家财政支出分别为x1,x2,x3,x4;
再根据1.1的相关性分析散点图及相关性结果可以建立如下基本模型:
……………………
(1)
(2)模型求解
利用MAtLAB统计工具箱进行求解;
程序源代码:
x1=[9870510072101654103008104357105851107507109300111026112704114333115823117171118517119850121121122389123626124761125786126743127627128453129227129988130755131448132129132802133450134091134735];
x2=[910.99611230.41430.11832.92543.23120.63791.74753.84410.445175594.58080.113072.317042.120019.322913.524941.128406.229854.732917.737213.543499.955566.670477.4388773.6129109998.1624137323.9381172828.3998224598.7679251683.7688311485.1254];
x3=[570753.3771.3860.112012066.72580.43084.23821.84155.95560.17225.89119.61127120381.923499.924133.826967.226849.729896.239273.242183.651378.270483.595539.1116921.8140974166863.7179921.4702150648.0635201722.147236401.992];
x4=[1228.831138.411229.981409.521701.022004.252204.912262.182491.212823.783083.593386.623742.24642.35792.626823.727937.559233.5610798.1813187.6715886.518902.5822053.1524649.9528486.8933930.2840422.7349781.3562592.6676299.9389874.16109247.79];
y=[4545.6244889.4615330.4515985.5527243.7529040.73710274.3812050.6215036.8217000.9218718.3221826.226937.2835260.0248108.4659810.5370142.4978060.8583024.2888479.1598000.45108068.2119095.7134977159453.6183617.4215904.4266422316030.3340320399759.5472115]'
;
x=[ones(32,1)x1'
x2'
x3'
x4'
(x1.^2)'
];
[b,bint,r,rint,s]=regress(y,x)
计算结果:
参数
参数估计值
参数置信区间
β0
17317.85
3168.67
31467.03
β1
-1.60
-2.07
-1.13
β2
0.45
0.02
0.88
β3
0.42
0.28
0.55
β4
1.68
0.34
3.01
β5
1.39E-05
1.05E-05
1.73E-05
R2=0.9985
F=3.35*10^3
p<
1.2*10^-35
s2=2.95*10^7
表四模型
(1)的计算结果
结果分析;
表四显示,R2=0.9985指因变量y(GDP)的99.85%可由模型确定,F值远远超过F检验的临界值,p远小于α,6个参数置信区间不包含0,因而从整体上看模型
(1)是可用的
模型的改进:
rcoplot(r,rint);
(残差分析)
图1.5
从上图1.5残差图可以看出第二个数据为异常值,那么剔除第二个数据之后再次进行残差分析
图1.6
由上图1.6可以看出第28,29数据异常,剔除第28,29个数据后再次做残差分析
图1.7
从上图1.7可以看出第27个数据为异常值,剔除第27个数据之后,进行残差分析
图1.8
由上图1.8可以看出第13个数据异常,剔除第13个数据之后,再次进行残差分析
图1.9
由上图1.9可以看出第1.12个数据异常,剔除异常数据后,再次进行残差分析
图1.10
从上图1.10可以看出没有异常值,所以残差分析结束,最后分析结果为:
1317343.25
1031414.67
1603271.83
-25.01
-30.10
-19.93
1.33
1.10
1.55
-0.02
-0.11
0.06
-0.41
-1.05
0.24
0.0001192
0.0000966
0.0001418
R2=0.9998
F=19862.23
P<
1.3*10^-34
S2=3394693
表五模型
(1)计算结果
结果分析;
表四显示,R2=0.9998指因变量y(GDP)的99.98%可由模型确定,F值远远超过F检验的临界值,p远小于α,因而从整体上看模型
(1)是可用的β3,β4的置信区间包含0(但是区间右端点距0很近),所以将变量x3,x4保留在模型中,所以最后得到的模型为:
二,收集1980-2011年中南六省:
湖北、湖南、河南、江西、广东、广西的GDP数据,消除物价因素影响后,做方差分析
(1),通过查询中国统计网得到1980-2011年中南六省:
湖北、湖南、河南、江西、广东、广西的GDP数据并且利用Excel制作出下表
年份省份
江西省
湖南省
湖北省
河南省
广东省
广西省
111.15
191.72
199.38
229.16
249.6484
97.33
121.26
209.68
219.75
249.69
290.3558
113.46
133.96
232.52
241.55
263.3
339.9242
129.15
144.13
257.43
262.58
327.95
368.7537
134.6
169.11
287.29
328.22
370.04
458.7351
150.27
207.89
349.95
396.26
451.74
577.3838
180.97
230.82
397.68
442.04
502.91
667.5302
205.46
262.9
469.44
517.77
609.6
846.6877
241.56
325.83
584.07
626.52
749.09
1155.367
313.28
376.46
640.8
717.08
850.71
1381.39
383.44
428.62
744.44
824.38
934.65
1559.028
449.06
479.37
833.3
913.38
1045.73
1893.298
518.59
572.55
986.98
1088.39
1279.75
2447.54
646.6
723.04
1244.71
1325.83
1660.18
3469.283
871.7
948.16
1650.02
1700.92
2216.83
4619.018
1198.29
1169.73
2132.13
2109.38
2988.37
5933.052
1497.56
1409.74
2540.13
2499.77
3634.69
6834.966
1697.9
1605.77
2849.27
2856.47
4041.09
7774.53
1817.25
1719.87
3025.53
3114.02
4308.24
8530.875
1911.3
1853.65
3214.54
3229.29
4517.94
9250.676
1971.41
2003.07
3551.49
3545.39
5052.99
10741.25
2080.04
2175.68
3831.9
3880.53
5533.01
12039.25
2279.34
2450.48
4151.54
4212.82
6035.48
13502.42
2523.73
2807.41
4659.99
4757.45
6867.7
15844.64
2821.11
3456.7
5641.94
5633.24
8553.79
18864.62
3433.5
4056.76
6511.34
6590.19
10587.42
22557.37
3984.1
4820.53
7568.89
7617.47
12362.79
26587.76
4746.16
5800.25
9439.6
9333.4
15012.46
31777.01
5823.41
6971.05
11555
11328.92
18018.53
36796.71
7021
7655.18
13059.69
12961.1
19480.46
39482.56
7759.16
9451.26
16037.96
15967.61
23092.36
46013.06
9569.85
11702.82
19669.56
19632.26
26931.03
53210.28
11720.87
表6名义GDP
(2),消除价格因素:
通过统计网收集了中南6省1980-2011年的居民消费水平(都是将前年的看成100,有些省省份是将1978年看成100,此时通过spss的Transform将其进行转变)
99.7
105.8
108.6
104.6
105.3
110.0
104.1
105.6
114.2
101.4
100.7
101.6
112.4
108.7
116.3
93.6
103.3
104.5
108.9
110.2
98.4
102.7
107.6
110.7
100.8
100.6
114.5
111.1
113.3
113.0
110.6
115.9
105.4
91.4
106.2
103.7
103.9
106.3
106.0
108.2
104.7
111.0
102.2
119.4
116.4
120.8
100.0
104.