线性回归经典假设的分析案例Word文档格式.docx
《线性回归经典假设的分析案例Word文档格式.docx》由会员分享,可在线阅读,更多相关《线性回归经典假设的分析案例Word文档格式.docx(23页珍藏版)》请在冰豆网上搜索。
8087.10
5146.40
1015.10
9415.60
115823.00
55472.00
3149.48
1992
10284.50
5588.00
1415.00
10993.70
117171.00
51333.00
3483.37
1993
14143.80
6605.10
2284.70
12462.10
118517.00
48829.00
4348.95
1994
19359.60
9169.20
3012.60
16264.70
119850.00
55043.00
5218.10
1995
24718.30
11884.60
3819.60
20620.00
121121.00
45821.00
6242.20
1996
29082.60
13539.80
4530.50
24774.10
122389.00
46989.00
7407.99
1997
32412.10
13852.50
4810.60
27298.90
123626.00
53429.00
8651.14
1998
33387.90
14241.90
5231.40
29152.50
124761.00
50145.00
9875.95
1999
35087.20
14106.20
5470.60
31134.70
125786.00
49981.00
11444.08
2000
39047.30
13873.60
5888.00
34152.60
126743.00
54688.00
13395.23
2001
42374.60
14462.80
6375.40
37595.20
127627.00
52215.00
16386.04
2002
45975.20
14931.50
7005.00
42027.10
128453.00
47119.00
18903.64
2003
53092.90
14870.10
8181.30
45842.00
129227.00
54506.00
21715.25
(资料来源:
《中国统计年鉴2004》)
使用上述数据建立多元线性模型,采用普通最小二乘法得到国家财政收入估计方程为:
由上可以看出模型的拟合优度和值都较大,说明建立的回归方程显著。
但在显著性水平为5%下,t(15)=2.131,大多数回归参数的检验不显著,若据此判断大部分因素对财政收入的影响不显著。
因此可以判定解释变量之间存在严重的多重共线性。
采用逐步回归法对解释变量进行筛选。
分别将与各解释变量作一元线性回归方程,以拟合优度值最大的模型为基础,将其余变量依次引入方程中。
经过我们多次比较各模型的值和各参数的值,最终确定的模型为:
该模型的经济意义十分明显,即财政收入主要取决于农业总产值和社会商品零售总产值,各因素数量的变化引起财政收入总量变化的程度由各自的系数来反映。
通过分析自变量的简单相关系数矩阵(如表2),我们可以得出更多的结论。
表2自变量的简单相关系数矩阵
Y
X1
X2
X3
X4
X5
X6
1.000000
0.958657
0.820071
0.944935
0.951524
0.998864
0.949525
0.975063
0.996144
0.924858
0.992650
0.925673
0.983926
0.953156
0.985532
0.977385
0.296411
0.328126
0.267888
0.322249
0.311477
0.370434
由表中可看出,自变量与、的相关系数较大。
从社会实际情况来看,工业的发展为建筑业的发展提供了基础,而建筑业的兴旺又会拉动工业总产值的增长,两者之间的物资交换过程经过社会商品零售总额反映出来;
同时自变量与高度相关,而实际情况中,由于我国农业生产力相对落后,农业人口占总人口的比重过大,农业总产值与人口总数有直接关系。
事实上,在模型中,由于自变量之间的共线性,和可由表征,可由来表征。
异方差性分析
消费水平指的是一个国家一定时期内人们在消费过程中对物质和文化生活需要的满足程度。
我们现以研究我国居民消费水平为目的,对影响我国居民消费水平的一些因素建立线性模型。
改革开放以后,我国的经济运行有了极大地改变,人民生活水平也有了极大的提高,故这一时期的样本更能反映这种我国居民的消费水平,因此我们选取的数据样本为1978年至2002年,数据如下表:
表3我国居民的消费水平资料
居民消费水平
城镇居民人均可支配收入
农村居民人均纯
收入
1978
184
343.4
133.6
896
1700.6
708.6
1979
207
405
160.2
1070
2026.6
784
1980
236
477.6
191.3
1331
2577.4
921.6
1981
262
500.4
223.4
1746
3496.2
1221
1982
284
535.3
270.1
2236
4283
1577.7
1983
311
564.6
309.8
2641
4838.9
1926.1
1984
354
652.1
355.3
2834
5160.3
2090.1
1985
437
739.1
397.6
2972
5425.1
2102
1986
485
899.6
423.8
3138
5854
2210.3
1987
550
1002.2
462.6
3397
6280
2253.4
1988
693
1181.4
545
3609
6859.6
2366.4
762
1373.9
601.5
3791
7702.8
2745.6
803
1510.2
686.3
《中国统计年鉴2003》)
我们将居民消费水平()作为被解释变量,选取的解释变量为城镇居民人均可支配收入()和农村居民人均纯收入(),我们认为这两个变量对我国居民的消费水平起着最重要的作用。
使用普通最小二乘回归估计法得出如下回归估计结果:
由上面方程可看出,城乡居民人均收入对居民消费水平的直接影响很大。
城镇居民人均可支配收入每增加1元,居民消费水平平均增加0.31元;
农村居民人均纯收入每增加1元,居民消费水平平均增加0.601元。
而且由于我国农村人口众多,因此提高农村居民的收入可明显提高我国居民的消费水平。
观察模型的残差图(如图1)可看出,散点分布的区域逐渐变宽,这说明随着经济规模的扩大,变量取值的差异变大,此模型可能存在异方差现象。
图1残差图
也可用White方法检验回归方程是否存在异方差,此时辅助回归方程为:
此模型的可决系数R2=0.76。
在显著性水平0.05下,2(5)=11.07,而nR2>
2(5)。
因此根据White检验,可以判定在5%的显著性水平下拒绝同方差的原假设,认为模型存在异方差。
由EVIEWS软件可直接得到White检验的结果,如表4所示:
表4White检验的结果
WhiteHeteroskedasticityTest:
F-statistic
10.76795
Probability
0.000086
Obs*R-squared
17.48050
0.003673
TestEquation:
DependentVariable:
RESID^2
Method:
LeastSquares
Date:
04/23/08Time:
20:
41
Sample(adjusted):
19802002
Includedobservations:
23afteradjustments
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
3037.265
5883.133
0.516267
0.6123
-28.59064
19.08983
-1.497690
0.1526
X1^2
-0.039514
0.025333
-1.559809
0.1372
X1*X2
0.232837
0.141274
1.648125
0.1177
62.28269
57.60882
1.081131
0.2947
X2^2
-0.331539
0.197944
-1.674914
0.1122
R-squared
0.760022
Meandependentvar
3596.147
AdjustedR-squared
0.689440
S.D.dependentvar
10276.80
S.E.ofregression
5727.046
Akaikeinfocriterion
20.