计量经济学自相关和异方差.docx
《计量经济学自相关和异方差.docx》由会员分享,可在线阅读,更多相关《计量经济学自相关和异方差.docx(22页珍藏版)》请在冰豆网上搜索。
计量经济学自相关和异方差
对经典线性回归模型的基本假定的理解
在回归分析中,我们的目的不仅仅是获得和,而是要对真实的和作出推断。
为了回归估计的有效解释,对变量和误差项做出假定是极其重要的。
经典线性回归模型的10个基本假定
假定1:
线性回归模型。
即回归模型对参数而言是线性的,如
在这里的假定,扩大了线性回归模型的范围,若自变量和因变量是非线性的同样可以使用线性回归模型,如
假定2:
在重复抽样中值是固定的。
即假定是非随机的。
从这个假定中,可以看出我们的回归分析是条件回归分析,就是以自变量的给定值作为条件进行回归。
假定3:
干扰项的均值为零。
即的条件均值为零,符号记为
这一假定说明了凡是模型不含的自变量而归于随机扰动项的变量,对因变量的均值都没有影响,也就是说在设定模型的时候已经把能够影响因变量的因素考虑其内。
这一假定也意味着
假定4:
同方差性或的方差相等。
即的条件方差是恒定的。
符号表示为
这一假定说明了对于每个的条件方差都是某个等于的正的常数,也意味着对应于不同值的总体均有同样的方差。
这一假定也保证了参数估计的有效性。
假定5:
各个干扰项之间无自相关性。
给定任意两个值:
,之间的相关性为零。
符号表示为:
这一假定说明干扰项不相关,任一次观测的干扰项都不受任何其他观测项的干扰项影响。
这一假定同样是为了保证用OLS估计出的参数的有效性。
假定6:
和的协方差为零。
即
这一假定说明干扰项和解释变量是不相关的。
为了保证干扰项和解释变量对因变量有各自独立(并且可以相加的)影响。
假定7:
观测次数n必须大于待估计的参数的个数。
这一假定是为了能够准确估计出参数。
假定8:
值要有变异性。
也就是说在一个给定的样本中,值不可以全是相同的。
如果的值全部相同,就无法估计参数,也就不能改找出解释变量和被解释变量之间的关系,因此值和值两者均有变化是最为重要的。
假定9:
正确的设定回归模型。
正确设定回归模型对准确解释经济现象尤其重要,只有正确的设定回归模型才能发现经济变量之间的关系和定量的分析经济现象。
假定10:
解释变量之间没有完全的多重共线性。
这一假定说明解释变量是不相关的。
为了保证解释变量对因变量有各自独立(并且可以相加的)影响。
异方差问题
一实验内容
研究我国2012年各地区居民人均消费支出与人均地区生产总值之间的关系。
二模型设定
为了定量分析居民人均消费支出与人均地区生产总值之间的关系,弄清是否是人均地区生产总值越大居民人均消费支出越高,建立了居民人均消费支出与人均地区生产总值之间的回归模型。
其中表示第年的居民人均消费支出;表示人均地区生产总值。
数据如下:
地区
居民人均消费(元)
人均地区生产总值(元)
北京
30349.5
87475
天津
22984.0
93173
河北
10749.4
36584
山西
10829.0
33628
内蒙古
15195.5
63886
辽宁
17998.7
56649
吉林
12276.3
43415
黑龙江
11600.8
35711
上海
36892.9
85373
江苏
19452.3
68347
浙江
22844.7
63374
安徽
10977.7
28792
福建
16143.9
52763
江西
10572.9
28800
山东
15095.0
51768
河南
10380.3
31499
湖北
12283.0
38572
湖南
11739.5
33480
广东
21823.3
54095
广西
10519.5
27952
海南
10634.5
32377
重庆
13655.4
38914
四川
11280.2
29608
贵州
8372.0
19710
云南
9781.6
22195
西藏
5339.5
22936
陕西
11852.2
38564
甘肃
8542.0
21978
青海
10289.1
33181
宁夏
12120.4
36394
新疆
10675.1
33796
三参数估计
运用Eviews软件,进行简单线性回归分析,得出参数估计值。
回归结果如下:
DependentVariable:
Y
Method:
LeastSquares
Date:
04/09/14Time:
09:
50
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
X
0.308966
0.026353
11.72404
0.0000
C
893.3818
1252.674
0.713180
0.4814
R-squared
0.825777
Meandependentvar
14298.39
AdjustedR-squared
0.819769
S.D.dependentvar
6711.427
S.E.ofregression
2849.244
Akaikeinfocriterion
18.80984
Sumsquaredresid
2.35E+08
Schwarzcriterion
18.90235
Loglikelihood
-289.5525
Hannan-Quinncriter.
18.83999
F-statistic
137.4531
Durbin-Watsonstat
2.202951
Prob(F-statistic)
0.000000
估计结果为
(1252.674)(0.026353)
括号内为标准误差。
从上述估计值中,我们可以看出其可决系数较高,F统计量的值也很高。
说明整体拟合优度很好;在参数估计中,其当显著性水平时,参数的P值为0.0000,小雨显著性水平,因此拒绝原假设,说明人均地区生产总值对居民人均消费有显著性影响。
但是,一般情况下,截面数据容易存在异方差,使得估计的参数不再有效,下面我们来检验是否存在异方差。
四检验模型的异方差
(一)图形法
现在我们从定性的角度进行判断,做出残差平方对人均地区生产总值X的散点图。
图形如下所示:
从上图可以看出,随着人均地区生产总值X的增加,残差的平方变动呈增大的趋势。
因此,模型很可能存在异方差,但是这仅仅是在定性的角度下看出这种趋势,但是否确实存在异方差还应通过进一步的检验。
(二)Goldfled-Quanadt检验
在Eviews软件中,对数据进行排序,以人均地区生产总值递增排序。
并构造子样本区间,建立回归模型。
在本例中,样本容量n=31,删除中间1/4的观测值,即大约7个观测值,余下部分平分得两个样本区间:
1-12和20-31,它们的样本个数均是12个,即n1=n2=12.
运用Eviews软件,对两部分进行简单线性回归分析,得出参数估计值。
回归结果如下:
DependentVariable:
Y1
Method:
LeastSquares
Date:
04/09/14Time:
10:
09
Sample:
112
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
X1
0.254819
0.080616
3.160889
0.0101
C
2808.286
2264.550
1.240108
0.2432
R-squared
0.499780
Meandependentvar
9869.067
AdjustedR-squared
0.449758
S.D.dependentvar
1736.976
S.E.ofregression
1288.459
Akaikeinfocriterion
17.31129
Sumsquaredresid
16601263
Schwarzcriterion
17.39211
Loglikelihood
-101.8678
Hannan-Quinncriter.
17.28137
F-statistic
9.991217
Durbin-Watsonstat
2.579120
Prob(F-statistic)
0.010143
由上表可知:
残差平方和=16601263。
DependentVariable:
Y2
Method:
LeastSquares
Date:
04/09/14Time:
10:
09
Sample:
112
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
X2
0.330762
0.079208
4.175884
0.0019
C
-534.4679
5183.365
-0.103112
0.9199
R-squared
0.635542
Meandependentvar
20392.63
AdjustedR-squared
0.599096
S.D.dependentvar
7243.679
S.E.ofregression
4586.477
Akaikeinfocriterion
19.85062
Sumsquaredresid
2.10E+08
Schwarzcriterion
19.93144
Loglikelihood
-117.1037
Hannan-Quinncriter.
19.82070
F-statistic
17.43801
Durbin-Watsonstat
1.954527
Prob(F-statistic)
0.001900
由上表可知:
残差平方和=210000000。
根据Goldfled-Quanadt检验和上述残差平方和可计算出F统计量为
在显著性水平下,F统计量中分子分母的自由度均为10,查F分布表得临界值,因为F=12.65>,所以拒绝接受原假设,说明模型确实存在异方差。
(三)White检验
运用Eviews软件,做White检验,结果如下:
HeteroskedasticityTest: