计量经济学自相关和异方差.docx

资源描述

计量经济学自相关和异方差.docx

《计量经济学自相关和异方差.docx》由会员分享，可在线阅读，更多相关《计量经济学自相关和异方差.docx（22页珍藏版）》请在冰豆网上搜索。

计量经济学自相关和异方差.docx

计量经济学自相关和异方差

对经典线性回归模型的基本假定的理解

在回归分析中，我们的目的不仅仅是获得和，而是要对真实的和作出推断。

为了回归估计的有效解释，对变量和误差项做出假定是极其重要的。

经典线性回归模型的10个基本假定

假定1：

线性回归模型。

即回归模型对参数而言是线性的，如

在这里的假定，扩大了线性回归模型的范围，若自变量和因变量是非线性的同样可以使用线性回归模型，如

假定2：

在重复抽样中值是固定的。

即假定是非随机的。

从这个假定中，可以看出我们的回归分析是条件回归分析，就是以自变量的给定值作为条件进行回归。

假定3：

干扰项的均值为零。

即的条件均值为零，符号记为

这一假定说明了凡是模型不含的自变量而归于随机扰动项的变量，对因变量的均值都没有影响，也就是说在设定模型的时候已经把能够影响因变量的因素考虑其内。

这一假定也意味着

假定4：

同方差性或的方差相等。

即的条件方差是恒定的。

符号表示为

这一假定说明了对于每个的条件方差都是某个等于的正的常数，也意味着对应于不同值的总体均有同样的方差。

这一假定也保证了参数估计的有效性。

假定5：

各个干扰项之间无自相关性。

给定任意两个值：

，之间的相关性为零。

符号表示为：

这一假定说明干扰项不相关，任一次观测的干扰项都不受任何其他观测项的干扰项影响。

这一假定同样是为了保证用OLS估计出的参数的有效性。

假定6：

和的协方差为零。

即

这一假定说明干扰项和解释变量是不相关的。

为了保证干扰项和解释变量对因变量有各自独立（并且可以相加的）影响。

假定7:

观测次数n必须大于待估计的参数的个数。

这一假定是为了能够准确估计出参数。

假定8：

值要有变异性。

也就是说在一个给定的样本中，值不可以全是相同的。

如果的值全部相同，就无法估计参数，也就不能改找出解释变量和被解释变量之间的关系，因此值和值两者均有变化是最为重要的。

假定9：

正确的设定回归模型。

正确设定回归模型对准确解释经济现象尤其重要，只有正确的设定回归模型才能发现经济变量之间的关系和定量的分析经济现象。

假定10：

解释变量之间没有完全的多重共线性。

这一假定说明解释变量是不相关的。

为了保证解释变量对因变量有各自独立（并且可以相加的）影响。

异方差问题

一实验内容

研究我国2012年各地区居民人均消费支出与人均地区生产总值之间的关系。

二模型设定

为了定量分析居民人均消费支出与人均地区生产总值之间的关系，弄清是否是人均地区生产总值越大居民人均消费支出越高，建立了居民人均消费支出与人均地区生产总值之间的回归模型。

其中表示第年的居民人均消费支出；表示人均地区生产总值。

数据如下：

地区

居民人均消费（元）

人均地区生产总值（元）

北京

30349.5

87475

天津

22984.0

93173

河北

10749.4

36584

山西

10829.0

33628

内蒙古

15195.5

63886

辽宁

17998.7

56649

吉林

12276.3

43415

黑龙江

11600.8

35711

上海

36892.9

85373

江苏

19452.3

68347

浙江

22844.7

63374

安徽

10977.7

28792

福建

16143.9

52763

江西

10572.9

28800

山东

15095.0

51768

河南

10380.3

31499

湖北

12283.0

38572

湖南

11739.5

33480

广东

21823.3

54095

广西

10519.5

27952

海南

10634.5

32377

重庆

13655.4

38914

四川

11280.2

29608

贵州

8372.0

19710

云南

9781.6

22195

西藏

5339.5

22936

陕西

11852.2

38564

甘肃

8542.0

21978

青海

10289.1

33181

宁夏

12120.4

36394

新疆

10675.1

33796

三参数估计

运用Eviews软件，进行简单线性回归分析，得出参数估计值。

回归结果如下：

DependentVariable:

Method:

LeastSquares

Date:

04/09/14Time:

09:

Sample:

131

Includedobservations:

Variable

Coefficient

Std.Error

t-Statistic

Prob.

0.308966

0.026353

11.72404

0.0000

893.3818

1252.674

0.713180

0.4814

R-squared

0.825777

Meandependentvar

14298.39

AdjustedR-squared

0.819769

S.D.dependentvar

6711.427

S.E.ofregression

2849.244

Akaikeinfocriterion

18.80984

Sumsquaredresid

2.35E+08

Schwarzcriterion

18.90235

Loglikelihood

-289.5525

Hannan-Quinncriter.

18.83999

F-statistic

137.4531

Durbin-Watsonstat

2.202951

Prob（F-statistic）

0.000000

估计结果为

（1252.674）（0.026353）

括号内为标准误差。

从上述估计值中，我们可以看出其可决系数较高，F统计量的值也很高。

说明整体拟合优度很好；在参数估计中，其当显著性水平时，参数的P值为0.0000，小雨显著性水平，因此拒绝原假设，说明人均地区生产总值对居民人均消费有显著性影响。

但是，一般情况下，截面数据容易存在异方差，使得估计的参数不再有效，下面我们来检验是否存在异方差。

四检验模型的异方差

（一）图形法

现在我们从定性的角度进行判断，做出残差平方对人均地区生产总值X的散点图。

图形如下所示：

从上图可以看出，随着人均地区生产总值X的增加，残差的平方变动呈增大的趋势。

因此，模型很可能存在异方差，但是这仅仅是在定性的角度下看出这种趋势，但是否确实存在异方差还应通过进一步的检验。

（二）Goldfled-Quanadt检验

在Eviews软件中，对数据进行排序，以人均地区生产总值递增排序。

并构造子样本区间，建立回归模型。

在本例中，样本容量n=31，删除中间1/4的观测值，即大约7个观测值，余下部分平分得两个样本区间：

1-12和20-31，它们的样本个数均是12个，即n1=n2=12.

运用Eviews软件，对两部分进行简单线性回归分析，得出参数估计值。

回归结果如下：

DependentVariable:

Method:

LeastSquares

Date:

04/09/14Time:

10:

Sample:

112

Includedobservations:

Variable

Coefficient

Std.Error

t-Statistic

Prob.

0.254819

0.080616

3.160889

0.0101

2808.286

2264.550

1.240108

0.2432

R-squared

0.499780

Meandependentvar

9869.067

AdjustedR-squared

0.449758

S.D.dependentvar

1736.976

S.E.ofregression

1288.459

Akaikeinfocriterion

17.31129

Sumsquaredresid

16601263

Schwarzcriterion

17.39211

Loglikelihood

-101.8678

Hannan-Quinncriter.

17.28137

F-statistic

9.991217

Durbin-Watsonstat

2.579120

Prob（F-statistic）

0.010143

由上表可知：

残差平方和=16601263。

DependentVariable:

Method:

LeastSquares

Date:

04/09/14Time:

10:

Sample:

112

Includedobservations:

Variable

Coefficient

Std.Error

t-Statistic

Prob.

0.330762

0.079208

4.175884

0.0019

-534.4679

5183.365

-0.103112

0.9199

R-squared

0.635542

Meandependentvar

20392.63

AdjustedR-squared

0.599096

S.D.dependentvar

7243.679

S.E.ofregression

4586.477

Akaikeinfocriterion

19.85062

Sumsquaredresid

2.10E+08

Schwarzcriterion

19.93144

Loglikelihood

-117.1037

Hannan-Quinncriter.

19.82070

F-statistic

17.43801

Durbin-Watsonstat

1.954527

Prob（F-statistic）

0.001900

由上表可知：

残差平方和=210000000。

根据Goldfled-Quanadt检验和上述残差平方和可计算出F统计量为

在显著性水平下，F统计量中分子分母的自由度均为10，查F分布表得临界值，因为F=12.65>，所以拒绝接受原假设，说明模型确实存在异方差。

（三）White检验

运用Eviews软件，做White检验，结果如下：

HeteroskedasticityTest:

展开阅读全文