《计量经济学》第四章精选题及答案.docx

资源描述

《计量经济学》第四章精选题及答案.docx

《《计量经济学》第四章精选题及答案.docx》由会员分享，可在线阅读，更多相关《《计量经济学》第四章精选题及答案.docx（19页珍藏版）》请在冰豆网上搜索。

《计量经济学》第四章精选题及答案.docx

《计量经济学》第四章精选题及答案

第四章：

多重共线性

二、简答题

1、导致多重共线性的原因有哪些？

2、多重共线性为什么会使得模型的预测功能失效？

3、如何利用辅回归模型来检验多重共线性？

4、判断以下说法正确、错误，还是不确定？

并简要陈述你的理由。

（1）尽管存在完全的多重共线性，OLS估计量还是最优线性无偏估计量（BLUE）。

（2）在高度多重共线性的情况下，要评价一个或者多个偏回归系数的个别显著性是不可能的。

（3）如果某一辅回归显示出较高的

值，则必然会存在高度的多重共线性。

（4）变量之间的相关系数较高是存在多重共线性的充分必要条件。

（5）如果回归的目的仅仅是为了预测，则变量之间存在多重共线性是无害的。

5、考虑下面的一组数据：

-10

-8

-6

-4

-2

（1）

（2）如果存在多重共线性的话，应该如何解决这个问题？

8、设想在模型

中，

和

之间的相关系数

为零。

如果我们做如下的回归：

（1）会不会存在

且

？

为什么？

（2）

会等于

或

或两者的某个线性组合吗？

（3）会不会有

且

？

9、通过一些简单的计量软件（比如EViews、SPSS），我们可以得到各变量之间的相关矩阵：

。

怎样可以从相关矩阵看出完全多重共线性、近似多重共线性或者不存在多重共线性？

三、计算题

1、考虑消费函数

其中，C、Y、W依次表示消费、收入与财富。

下面是假想数据。

810

100

1009

120

1273

140

1425

110

160

1633

115

180

1876

120

200

2252

140

220

2201

155

240

2435

150

260

2686

（1）作C对Y和W的普通最小二乘回归。

（2）这一回归方程是否存在着多重共线性？

你的判断依据是什么？

（3）分别作C对Y和W的回归，这些回归结果表明了什么？

（4）作W对Y的回归。

这一回归结果表明了什么？

（5）如果存在严重的共线性，你是否会删除一个解释变量？

为什么？

2、下表给出了美国1971-1986年期间新客车出售的数据。

年份

1971

10227

112.0

121.3

776.8

4.89

79367

1972

10872

111.0

125.3

839.6

4.55

82153

1973

11350

111.1

133.1

949.8

7.38

85064

1974

8775

117.5

147.7

1038.4

8.61

86794

1975

8539

127.6

161.2

1142.8

6.16

85846

1976

9994

135.7

170.5

1252.6

5.22

88752

1977

11046

142.9

181.5

1379.3

5.50

92017

1978

11164

153.8

195.3

1551.2

7.78

96048

1979

10559

166.0

217.7

1729.3

10.25

98824

1980

8979

179.3

247.0

1918.0

11.28

99303

1981

8535

190.2

272.3

2127.6

13.73

100397

1982

7980

197.6

286.6

2261.4

11.20

99526

1983

9179

202.6

297.4

2428.1

8.69

100834

1984

10394

208.5

307.6

2670.6

9.65

105005

1985

11039

215.2

318.5

2841.1

7.75

107150

1986

11450

224.4

323.4

3022.1

6.31

109597

Y——新车出售量，未经季节调整数量；

——新车，消费者价格指数，1967年=100，未经季节调整；

——消费者价格指数，1967年=100，未经季节调整；

——个人可支配收入，10亿美元，未经季节调整；

——利率，百分数，金融公司票据直接使用；

——民间就业劳动人数（个人），未经季节调整。

（1）如果你决定使用表中全部回归元作为解释变量，可能会遇到多重共线性吗？

为什么？

（2）如果你这样认为的话，你准备怎样解决这个问题？

明确你的假设并说明全部计算。

（3）制定适当的线性或者对数线性的模型，以估计美国对汽车的需求函数。

第二部分：

参考答案

一、术语解释

1、多重共线性：

对于经典线性回归模型（CLRM）

如果上式中某两个或多个解释变量之间出现了相关性，则称为存在多重共线性。

依据解释变量之间共线性的程度不同，可以分为完全多重共线性和近似多重共线性。

2、完全多重共线性与近似多重共线性：

所谓完全多重共线性，是指线性回归模型中的若干解释变量或全部解释变量之间具有严格的线性关系，也就是说，对于多元线性回归模型，若各解释变量

的之间存在如下的关系式：

式中

是不全为零的常数，则称这些解释变量之间存在完全多重共线性。

当各解释变量

的之间存在如下的近似的线性关系：

则可以说上述解释变量之间存在近似多重共线性。

还可以采用如下的方式，在近似线性关系式中，假设

，则可将此近似线性关系表示为：

其中

为随机误差项。

3、辅回归：

在变量之间存在多重共线性的情况下，有一个解释变量能由其它解释变量近似的线性表示出来。

为了找出哪个解释变量和其它变量有这种关系，我们可以将每个

对其余变量进行回归，即

这种回归叫做辅回归，它是相对于Y对各个X的主回归而言的。

二、简答题

1、答：

经济数据中大量存在多重共线性这一现象，主要原因在于：

经济领域很难象其它实验学科那样从控制性试验中获得数据；此外，可能有经济变量结构上的原因，也有数据收集与模型设定方面的原因，具体的，有以下几种：

（1）所使用的数据收集方法。

我们只能在一个有限的范围内得到观察值，无法进行重复试验。

（2）模型或从中取样的总体受到约束（经济变量的共同趋势）。

（3）模型设定的偏误。

（4）过度决定的模型。

这种情况尤其容易发生在解释变量的个数大于观测值个数的情形。

由于上述原因，实际应用中，解释变量之间总会存在一定程度的线性相关，因此，问题不是多重线性有无，而是多重共线性的严重程度。

2、答：

多元线性回归模型的一个重要应用是经济预测。

对于模型

如果给定样本以外的解释变量的观测值

，就可以得到被解释变量的预测值

但是，这只是被解释变量的预测值的估计值而不是预测值。

预测值仅以某一个置信水平位于以该估计值为中心的一个区间中。

对于预测的置信区间，我们利用的是构造

统计量，得到在给定

的置信水平下

的置信区间为

显然，当解释变量之间存在多重共线性时，

非常大，故而

的置信区间也很大，因此，模型的预测功能失效。

3、答：

辅回归是相对于Y对各个X的主回归而言的。

在变量之间存在多重共线性的情况下，有一个解释变量能由其它解释变量近似的线性表示出来。

为了找出哪个解释变量和其它变量有这种关系，我们可以将每个

对其余变量进行回归，即

，

并计算相应的决定系数，分别记为

。

然后，我们在建立统计量：

它服从自由度为k-2和n-k+1的F分布。

其中n为样本大小，k为包括常数项在内的解释变量个数。

如果计算出的

超过了相应自由度的临界值，则认为这个

和其余的解释变量存在共线性；如果

未超过临界值，则认为这个

和其余的解释变量不存在共线性。

这种辅回归模型检验不仅可以检验是否存在多重共线性，而且还可以得到多重共线性的具体形式。

4、答：

（1）错。

如果变量之间存在完全的线性关系时，我们甚至无法估计其系数或者标准误。

（2）错。

在高度多重共线性的情况下，仍然可以得到一个或者多个显著的t值。

（3）错。

OLS估计量的方差有下式给出：

从此式可以看出，一个很高的

可被一个很低的

或者很高的

抵消掉。

（4）错。

如果一个模型只有两个回归元，两两之间的高度相关系数便表示存在多重共线性。

但是在变量之间存在多重共线性的前提下，可能是几个变量之间的关系。

变量之间的相关系数较高是存在多重共线性的充分非必要条件。

（5）不确定。

如果观测到共线性在后来的样本数据中继续存在，或许无害。

但如果不是这样，或者目的在于做出精确的估计的话，多重共线性便成为问题。

如果仅仅要是预测的话，预测有效的前提条件是模型结构的稳定。

5、答：

（1）不能。

通过对

和

的观察，我们可以知道它们存在以下的关系：

，所以可知变量

和

是完全线性相关的。

（2）把方程写成

其中

。

因此，我们可以唯一的估计出

和

，但无法估计出原始的

，因为两个方程无法解出三个未知数。

6、答：

这种说法不正确。

因为

和

都是

的非线性函数，把它们包括在回归模型中并不违反经典性线性回归模型的基本假设。

多重共线性的相关是指的变量之间的线性相关。

7、答：

（1）是的。

经济时间序列数据有同向变动的趋势。

在这里，收入的滞后变量一般也可以相同的方向变动。

（2）在遇到时间序列数据存在线性相关性时，我们一般都是采用一阶或者高阶差分变换来消除共线性。

8、答：

（1）是的。

这是因为

和

之间的相关系数为0，所以

系数的表达式

、

中的交叉乘积项消失，从而变成与

和

系数同样的表示式。

（2）是它们的一个线性组合。

证明如下：

因此有

。

（3）不是。

原因如下：

。

9、答：

我们可以利用相关矩阵的行列式来判断多重共线性与否，可以利用R的行列式大小来判断多重共线性的强弱。

（1）若R的行列式为0时，则存在完全的共线性。

（2）若R的行列式很小接近于0时，则存在近似的共线性。

（3）若R的行列式为1时，则变量正交、不存在共线性。

三、计算题

1、解：

（1）使用EViews软件进行回归

DependentVariable:

SER01

Method:

LeastSquares

Date:

07/02/06Time:

19:

Sample:

110

Includedobservations:

Variable

Coefficient

Std.Error

t-Statistic

Prob.

24.33698

6.280051

3.875284

0.0061

-0.034952

0.030120

-1.160433

0.2839

0.871640

0.314379

2.772576

0.0276

R-squared

0.968182

Meandependentvar

111.0000

AdjustedR-squared

0.959092

S.D.dependentvar

31.42893

S.E.ofregression

6.356758

Akaikeinfocriterion

6.780239

Sumsquaredresid

282.8586

Schwarzcriterion

6.871015

Loglikelihood

-30.90120

F-statistic

106.5019

Durbin-Watsonstat

2.941201

Prob（F-statistic）

0.000006

回归得到的方程为：

。

（2）有。

R-squared的值为0.968182，但是系数W通过不过显著性检验。

（3）

Variable

Coefficient

Std.Error

t-Statistic

Prob.

24.45455

6.413817

3.812791

0.0051

0.509091

0.035743

14.24317

0.0000

R-squared

0.962062

Meandependentvar

111.0000

AdjustedR-squared

0.957319

S.D.dependentvar

31.42893

S.E.ofregression

6.493003

Akaikeinfocriterion

6.756184

Sumsquaredresid

337.2727

Schwarzcriterion

6.816701

Loglikelihood

-31.78092

F-statistic

202.8679

Durbin-Watsonstat

2.680127

Prob（F-statistic）

0.000001

Variable

Coefficient

Std.Error

t-Statistic

Prob.

26.45198

8.446165

3.131833

0.0140

0.048039

0.004543

10.57519

0.0000

R-squared

0.933241

Meandependentvar

111.0000

AdjustedR-squared

0.924896

S.D.dependentvar

31.42893

S.E.ofregression

8.613107

Akaikeinfocriterion

7.321304

Sumsquaredresid

593.4849

Schwarzcriterion

7.381821

Loglikelihood

-34.60652

F-statistic

111.8346

Durbin-Watsonstat

2.389869

Prob（F-statistic）

0.000006

在这两个回归中，系数是显著的，而在同时对两个变量进行回归时，却存在部分系数的不显著，说明变量之间存在多重共线性。

（4）

Variable

Coefficient

Std.Error

t-Statistic

Prob.

-3.363636

73.70690

-0.045635

0.9647

10.37273

0.410753

25.25299

0.0000

R-squared

0.987611

Meandependentvar

1760.000

AdjustedR-squared

0.986062

S.D.dependentvar

632.0272

S.E.ofregression

74.61690

Akaikeinfocriterion

11.63947

Sumsquaredresid

44541.45

Schwarzcriterion

11.69998

Loglikelihood

-56.19734

F-statistic

637.7133

Durbin-Watsonstat

2.366673

Prob（F-statistic）

0.000000

Variable

Coefficient

Std.Error

t-Statistic

Prob.

10.35497

0.123991

83.51400

0.0000

R-squared

0.987607

Meandependentvar

1760.000

AdjustedR-squared

0.987607

S.D.dependentvar

632.0272

S.E.ofregression

70.35864

Akaikeinfocriterion

11.43973

Sumsquaredresid

44553.05

Schwarzcriterion

11.46999

Loglikelihood

-56.19864

Durbin-Watsonstat

2.366224

不管是否带上常数项，R-squared的值都非常大（>0.98），而且Y的系数都通过显著性检验，说明W和Y存在高度的共线性。

（5）在满足模型的经济含义的前提下（以免造成模型设置失误），我们还是可以通过舍去W或者Y来消除共线性的

2、解：

（1）首先我们发现各个变量在数量级上存在较大差别，所以我们一般考虑对数线性回归模型。

如果我们的对数回归模型中包含了所有的解释变量，则得到如下的结果：

DependentVariable:

LOG（Y）

Method:

LeastSquares

Date:

07/02/06Time:

20:

Sample:

19711986

Includedobservations:

Variable

Coefficient

Std.Error

t-Statistic

Prob.

3.254859

19.11656

0.170264

0.8682

LOG（X2）

1.790153

0.873240

2.050012

0.0675

LOG（X3）

-4.108518

1.599678

-2.568341

0.0280

LOG（X4）

2.127199

1.257839

1.691154

0.1217

LOG（X5）

-0.030448

0.121848

-0.249884

0.8077

LOG（X6）

0.277792

2.036975

0.136375

0.8942

R-squared

0.854803

Meandependentvar

9.204273

AdjustedR-squared

0.782205

S.D.dependentvar

0.119580

S.E.ofregression

0.055806

Akaikeinfocriterion

-2.653874

Sumsquaredresid

0.031143

Schwarzcriterion

-2.364153

Loglikelihood

27.23099

F-statistic

11.77442

Durbin-Watsonstat

1.793020

Prob（F-statistic）

0.000624

我们发现R-squared=0.854803>0.80，LOG（X4）、LOG（X5）、LOG（X6）都不能通过0.10的显著性检验。

我们可以得出结论，各变量之间存在多重共线性。

（2）由于有5个解释变量，我们可以考虑消除部分解释变量重新对参数进行估计，以得到正确的回归方程。

我们首先得到个解释变量之间的相关系数矩阵：

0.99686458432

0.991353674836

0.525829679627

0.972144554185

0.99686458432

0.991273632989

0.543312899977

0.965239229554

0.991353674836

0.991273632989

0.461436278037

0.972615371514

0.525829679627

0.543312899977

0.461436278037

0.536184793714

0.972144554185

0.965239229554

0.972615371514

0.536184793714

我们发现只有X5与其它变量的相关系数较低，其余几个变量之间的相关系数都较高（>0.95），所以我们认为X5是可以留在模型中的，对于其他几个变量的选择问题就要考虑模型的实际经济含义以及各变量之间的经济关系。

从不同的角度出发，可能会去掉不同的变量。

以下是考虑问题的一个角度：

新车CPI和一般的CPI高度相关（0.997），PDI和新车CPI之间也高度相关（0.991）；PDI与就业水平也密切相关，两者的相关系数高达0.972。

我们可以考虑去掉一般CPI和PDI。

（3）我们利用保留的X2、X5、X6来估计模型：

DependentVariable:

LOG（Y）

Method:

LeastSquares

Date:

07/02/06Time:

20:

Sample:

19711986

Includedobservations:

Variable

Coefficient

Std.Error

t-Statistic

Prob.

-22.10374

8.373593

-2.639696

0.0216

LOG（X2）

-1.037839

0.330227

-3.142805

0.0085

LOG（X5）

-0.294929

0.073704

-4.001514

0.0018

LOG（X6）

3.243886

0.872231

3.719068

0.0029

R-squared

0.684855

Meandependentvar

9.204273

AdjustedR-squared

0.606069

S.D.dependentvar

0.119580

S.E.ofregression

0.075053

Akaikeinfocriterion

-2.128930

Sumsquaredresid

0.067595

Schwarzcriterion

-1.935783

Loglikelihood

21.03144

F-statistic

8.692569

Durbin-Watsonstat

1.309678

Prob（F-statistic）

0.002454

展开阅读全文