多元线性回归模型的案例讲解.docx

资源描述

多元线性回归模型的案例讲解.docx

《多元线性回归模型的案例讲解.docx》由会员分享，可在线阅读，更多相关《多元线性回归模型的案例讲解.docx（16页珍藏版）》请在冰豆网上搜索。

多元线性回归模型的案例讲解.docx

多元线性回归模型的案例讲解

1.表1列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X，鸡肉价格P1，猪肉价格P2与牛肉价格P3的相关数据。

年份

Y/千克

X/元

P1/（元/千克）

P2/（元/千克）

P3/（元/千克）

年份

Y/千克

X/元

P1/（元/千克）

P2/（元/千克）

P3/（元/千克）

1980

2.78

397

4.22

5.07

7.83

1992

4.18

911

3.97

7.91

11.40

1981

2.99

413

3.81

5.20

7.92

1993

4.04

931

5.21

9.54

12.41

1982

2.98

439

4.03

5.40

7.92

1994

4.07

1021

4.89

9.42

12.76

1983

3.08

459

3.95

5.53

7.92

1995

4.01

1165

5.83

12.35

14.29

1984

3.12

492

3.73

5.47

7.74

1996

4.27

1349

5.79

12.99

14.36

1985

3.33

528

3.81

6.37

8.02

1997

4.41

1449

5.67

11.76

13.92

1986

3.56

560

3.93

6.98

8.04

1998

4.67

1575

6.37

13.09

16.55

1987

3.64

624

3.78

6.59

8.39

1999

5.06

1759

6.16

12.98

20.33

1988

3.67

666

3.84

6.45

8.55

2000

5.01

1994

5.89

12.80

21.96

1989

3.84

717

4.01

7.00

9.37

2001

5.17

2258

6.64

14.10

22.16

1990

4.04

768

3.86

7.32

10.61

2002

5.29

2478

7.04

16.82

23.26

1991

4.03

843

3.98

6.78

10.48

（1）求出该地区关于家庭鸡肉消费需求的如下模型：

（2）请分析，鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。

先做回归分析，过程如下：

输出结果如下：

所以，回归方程为：

（-2.463）（4.182）（-4.569）（1.483）（0.873）

由上述回归结果可以知道，鸡肉消费需求受家庭收入水平和鸡肉价格的影响，而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显著。

验证猪肉价格和鸡肉价格是否有影响，可以通过赤池准则（AIC）和施瓦茨准则（SC）。

若AIC值或SC值增加了，就应该去掉该解释变量。

去掉猪肉价格P2与牛肉价格P3重新进行回归分析，结果如下：

Variable

Coefficient

Std.Error

t-Statistic

Prob.

-1.125797

0.088420

-12.73237

0.0000

LOG（X）

0.451547

0.024554

18.38966

0.0000

LOG（P1）

-0.372735

0.063104

-5.906668

0.0000

R-squared

0.980287

Meandependentvar

1.361301

AdjustedR-squared

0.978316

S.D.dependentvar

0.187659

S.E.ofregression

0.027634

Akaikeinfocriterion

-4.218445

Sumsquaredresid

0.015273

Schwarzcriterion

-4.070337

Loglikelihood

51.51212

F-statistic

497.2843

Durbin-Watsonstat

1.877706

Prob（F-statistic）

0.000000

通过比较可以看出，AIC值和SC值都变小了，所以应该去掉猪肉价格P2与牛肉价格P3这两个解释变量。

所以该地区猪肉与牛肉价格确实对家庭的鸡肉消费不产生显著影响。

2.表2列出了中国2012年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y，资产合计K及职工人数L。

序号

工业总产值Y/亿元

资产合计K/亿元

职工人数L/万人

序号

工业总产值Y/亿元

资产合计K/亿元

职工人数L/万人

3722.700

3078.220

113.0000

812.7000

1118.810

43.00000

1442.520

1684.430

67.00000

1899.700

2052.160

61.00000

1752.370

2742.770

84.00000

3692.850

6113.110

240.0000

1451.290

1973.820

27.00000

4732.900

9228.250

222.0000

5149.300

5917.010

327.0000

2180.230

2866.650

80.00000

2291.160

1758.770

120.0000

2539.760

2545.630

96.00000

1345.170

939.1000

58.00000

3046.950

4787.900

222.0000

656.7700

694.9400

31.00000

2192.630

3255.290

163.0000

370.1800

363.4800

16.00000

5364.830

8129.680

244.0000

1590.360

2511.990

66.00000

4834.680

5260.200

145.0000

616.7100

973.7300

58.00000

7549.580

7518.790

138.0000

617.9400

516.0100

28.00000

867.9100

984.5200

46.00000

4429.190

3785.910

61.00000

4611.390

18626.94

218.0000

5749.020

8688.030

254.0000

170.3000

610.9100

19.00000

1781.370

2798.900

83.00000

325.5300

1523.190

45.00000

1243.070

1808.440

33.00000

设定模型为：

（1）利用上述资料，进行回归分析；

（2）回答：

中国2000年的制造业总体呈现规模报酬不变状态吗？

将模型进行双对数变换如下：

1）进行回归分析：

得到如下回归结果：

于是，样本回归方程为：

（1.59）（3.45）（1.79）

从回归结果可以看出，模型的拟合度较好，在显著性水平0.1的条件下，各项系数均通过了t检验。

从F检验可以看出，方程对Y的解释程度较少。

表明，工业总产值对数值的79.6%的变化可以由资产合计对数与职工的对数值的变化来解释，但仍有20.4%的变化是由其他因素的变化影响的。

从上述回归结果看，

，即资产与劳动的产出弹性之和近似为1，表明中国制造业在2000年基本呈现规模报酬不变的状态。

下面进行Wald检验对约束关系进行检验。

过程如下：

结果如下：

由对应概率可以知道，不能拒绝原假设，即资产与劳动的产出弹性之和为1，表明中国制造业在2000年呈现规模报酬不变的状态。

一、邹式检验（突变点检验、稳定性检验）

1.突变点检验

1995-2012年中国家用汽车拥有量（

，万辆）与城镇居民家庭人均可支配收入（

，元），数据见表3。

表3中国家用汽车拥有量（

）与城镇居民家庭人均可支配收入（

）数据

年份

（万辆）

（元）

年份

（万辆）

（元）

1995

28.49

739.1

2004

205.42

3496.2

1996

34.71

899.6

2005

249.96

4283

1997

42.29

1002.2

2006

289.67

4838.9

1998

60.42

1181.4

2007

358.36

5160.3

1999

73.12

1375.7

2008

423.65

5425.1

2000

81.62

1510.2

2009

533.88

5854

2001

96.04

1700.6

2010

625.33

6280

2002

118.2

2026.6

2011

770.78

6859.6

2003

155.77

2577.4

2012

968.98

7702.8

下图是关于

和

的散点图：

从上图可以看出，2006年是一个突变点，当城镇居民家庭人均可支配收入突破4838.9元之后，城镇居民家庭购买家用汽车的能力大大提高。

现在用邹突变点检验法检验1996年是不是一个突变点。

H0：

两个字样本（1995—2005年，2006—2012年）相对应的模型回归参数相等

H1：

备择假设是两个子样本对应的回归参数不等。

在1995—2012年样本范围内做回归。

在回归结果中作如下步骤：

输入突变点：

得到如下验证结果：

由相伴概率可以知道，拒绝原假设，即两个样本（1995—2005年，2006—2012年）的回归参数不相等。

所以，2006年是突变点。

2.稳定性检验

以表3为例，在用1995—2009年数据建立的模型基础上，检验当把2010—2012年数据加入样本后，模型的回归参数时候出现显著性变化。

因为已经知道2006年为结构突变点，所以设定虚拟变量：

对1995—2012年的数据进行回归分析：

做邹氏稳定性检验：

输入要检验的样本点：

得到如下检验结果：

由上述结果可以知道，F值对应的概率为0.73，所以接受原假设，模型加入2010、2011和2012年的样本值后，回归参数没有发生显著性变化。

二、似然比（LR）检验

有中国国债发行总量（

，亿元）模型如下：

其中

表示国内生产总值（百亿元），

表示年财政赤字额（亿元），

表示年还本付息额（亿元）。

1990—2011年数据见表4。

表4国债发行总量

、

、财政赤字额

、年还本付息额（

）数据

1990

43.01

45.178

68.9

28.58

2001

461.4

216.178

237.14

246.8

1991

121.74

48.624

-37.38

62.89

2002

669.68

266.381

258.83

438.57

1992

83.86

52.947

17.65

55.52

2003

739.22

346.344

293.35

336.22

1993

79.41

59.345

42.57

42.47

2004

1175.25

467.594

574.52

499.36

1994

77.34

71.71

58.16

28.9

2005

1549.76

584.781

581.52

882.96

1995

89.85

89.644

-0.57

39.56

2006

1967.28

678.846

529.56

1355.03

1996

138.25

102.022

82.9

50.17

2007

2476.82

744.626

582.42

1918.37

1997

223.55

119.625

62.83

79.83

2008

3310.93

783.452

922.23

2352.92

1998

270.78

149.283

133.97

76.76

2009

3715.03

820.6746

1743.59

1910.53

1999

407.97

169.092

158.88

72.37

2010

4180.1

894.422

2491.27

1579.82

2000

375.45

185.479

146.49

190.07

2011

4604

959.333

2516.54

2007.73

对以上数据进行回归分析：

得到如下输出结果：

对应的回归表达式为：

（0.2）（2.2）（31.5）（17.8）

现在用似然比（LR）统计量检验约束

对应的回归系数

等于零是否成立。

过程如下：

输入要检验的变量名：

得到如下输出结果：

输出结果上部是关于约束GDP系数为零的F检验和LR检验。

由于两种检验的相应概率均小于0.05，即拒接原假设，GDP系数

不为零，模型中应该保留解释变量GDP。

输出结果下部是去掉了GDP变量的约束模型估计结果。

三、Wald检验（以表4为例进行Wald检验，对输出结果进行检验。

）

检验过程如下：

输入约束表达式：

得到如下结果：

从输出结果上部可以看出，相应概率非常大，远远大于0.05，表明原假设成立，即约束条件

成立，

是

的3倍。

输出结果的下部给出了约束条件

的样本值和样本标准差，分别为0.04和0.48。

展开阅读全文