逐步回归与虚拟变量回归.docx

上传人:b****5 文档编号:12156006 上传时间:2023-04-17 格式:DOCX 页数:26 大小:322.09KB
下载 相关 举报
逐步回归与虚拟变量回归.docx_第1页
第1页 / 共26页
逐步回归与虚拟变量回归.docx_第2页
第2页 / 共26页
逐步回归与虚拟变量回归.docx_第3页
第3页 / 共26页
逐步回归与虚拟变量回归.docx_第4页
第4页 / 共26页
逐步回归与虚拟变量回归.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

逐步回归与虚拟变量回归.docx

《逐步回归与虚拟变量回归.docx》由会员分享,可在线阅读,更多相关《逐步回归与虚拟变量回归.docx(26页珍藏版)》请在冰豆网上搜索。

逐步回归与虚拟变量回归.docx

逐步回归与虚拟变量回归

逐步回归与虚拟变量回归(第三章)

试验目的:

通过上机试验,使学生掌握逐步回归与虚拟变量回归的基本原理,熟悉逐步回归与虚拟变量回归的处理方法。

一、课本p122页第16题。

1、计算各个变量之间的相关系数,分析多重共线性的可能类型。

方法:

选择Y,X1,X2,X3,X4,X5数据,点“view/correlations”得到相关系数矩阵,如下图:

结论:

各解释变量相互之间的相关系数很高,证实存在严重的多重共线性。

多重共线性的可能类型:

根据上下图三表格可得:

(1)

,X2与x1,x3,x4,x4,x5有较高的相关系数,可能存在多重共线性,可以剔除X1,X3,X4,X5,用X2来代替X1,X3,X4,X4,并建立模型若多重共线性,再做相应处理。

(模型一)

(2)

,上述中X1与X3,X4,X5也有较高的相关系数,可能存在多重共线性,可以用X1来代替X3,X4,X45,来建立模型。

(模型二)

2、根据逐步回归原来,建立我国钢产量预测模型。

对模型估计如下:

模型二:

引入X2,X1,模型中的各变量的符号系数正确,T检验也都显著,拟合优度也高,也消除多重共线性,所以选择模型二。

1、自相关检验。

DependentVariable:

Y

Method:

LeastSquares

Date:

11/29/09Time:

16:

25

Sample:

19781997

Includedobservations:

20

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

C

-297.9093

101.7488

-2.927891

0.0094

X1

0.429333

0.117656

3.649042

0.0020

X2

0.474934

0.112997

4.203053

0.0006

R-squared

0.997280

    Meandependentvar

5153.450

AdjustedR-squared

0.996960

    S.D.dependentvar

2512.131

S.E.ofregression

138.5145

    Akaikeinfocriterion

12.83731

Sumsquaredresid

326166.6

    Schwarzcriterion

12.98667

Loglikelihood

-125.3731

    F-statistic

3116.268

Durbin-Watsonstat

0.695770

    Prob(F-statistic)

0.000000

模型中DW=0.695770,n=20,k=2,查DW检验表,得

,认为存在自相关。

(1)残差图分析:

结论:

存在着周期变动,表明存在自相关。

(2)偏相关系数分析:

在方程窗口中,点击View/ResidualTest/CorrelogramQ-statistics,得到:

结论:

第一期PAC值大于0.5,说明存在一介自相关。

(3)BG检验

在方程窗口中,点击View/ResidualTest/SerialCorrelationLMTest,并选择滞后期为3,得到:

Breusch-GodfreySerialCorrelationLMTest:

F-statistic

5.325047

    Probability

0.011703

Obs*R-squared

10.65893

    Probability

0.013721

TestEquation:

DependentVariable:

RESID

Method:

LeastSquares

Date:

11/29/09Time:

16:

44

Presamplemissingvaluelaggedresidualssettozero.

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

C

36.68954

78.68634

0.466276

0.6482

X1

-0.078614

0.091343

-0.860650

0.4039

X2

0.077361

0.087634

0.882781

0.3923

RESID(-1)

0.750910

0.253882

2.957708

0.0104

RESID(-2)

-0.195769

0.310485

-0.630527

0.5385

RESID(-3)

-0.307688

0.256109

-1.201396

0.2495

R-squared

0.532946

    Meandependentvar

-1.00E-12

AdjustedR-squared

0.366141

    S.D.dependentvar

131.0216

S.E.ofregression

104.3132

    Akaikeinfocriterion

12.37600

Sumsquaredresid

152337.3

    Schwarzcriterion

12.67472

Loglikelihood

-117.7600

    F-statistic

3.195028

Durbin-Watsonstat

1.858214

    Prob(F-statistic)

0.039361

结论:

滞后期为4,临界概率P=0.013721表明存在自相关。

因为e(-1)的t检验显著,说明存在一介自相关。

在方程窗口中点击Estimate的按钮,并输入:

YCX1X2AR

(1),得到:

DependentVariable:

Y

Method:

LeastSquares

Date:

11/29/09Time:

16:

54

Sample(adjusted):

19791997

Includedobservations:

19afteradjustments

Convergenceachievedafter10iterations

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

C

-218.3416

165.5403

-1.318964

0.2070

X1

0.525347

0.121153

4.336244

0.0006

X2

0.366507

0.118573

3.090981

0.0075

AR

(1)

0.579819

0.187809

3.087283

0.0075

R-squared

0.998579

    Meandependentvar

5308.474

AdjustedR-squared

0.998295

    S.D.dependentvar

2480.737

S.E.ofregression

102.4313

    Akaikeinfocriterion

12.28093

Sumsquaredresid

157382.5

    Schwarzcriterion

12.47975

Loglikelihood

-112.6688

    F-statistic

3514.228

Durbin-Watsonstat

1.637252

    Prob(F-statistic)

0.000000

InvertedARRoots

      .58

结论:

AR

(1)的T检验显著,进一步检查模型不存在自相关。

模型为:

t=(4.336244)(3.090981)(3.087283)

SE=102.4313DW=1.637252

2、异方差性检验

在方程窗口中点击:

View\ResidualTest\WhiteHeteroskedasticity.得到:

WhiteHeteroskedasticityTest:

F-statistic

0.704344

    Probability

0.630305

Obs*R-squared

4.049985

    Probability

0.542242

TestEquation:

DependentVariable:

RESID^2

Method:

LeastSquares

Date:

11/29/09Time:

17:

07

Sample:

19791997

Includedobservations:

19

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

C

-73504.34

64246.54

-1.144098

0.2732

X1

96.79652

142.1960

0.680726

0.5080

X1^2

-0.057576

0.100352

-0.573741

0.5759

X1*X2

0.105091

0.190526

0.551585

0.5906

X2

-73.65534

130.4776

-0.564506

0.5820

X2^2

-0.048929

0.090759

-0.539113

0.5989

R-squared

0.213157

    Meandependentvar

8283.289

AdjustedR-squared

-0.089475

    S.D.dependentvar

16161.23

S.E.ofregression

16868.76

    Akaikeinfocriterion

22.55640

Sumsquaredresid

3.70E+09

    Schwarzcriterion

22.85465

Loglikelihood

-208.2858

    F-statistic

0.704344

Durbin-Watsonstat

2.369668

    Prob(F-statistic)

0.630305

结论:

取显著水平a=0.05,

认为不存在异方差。

3、模型预测检验

在方程窗口中点击Forecast(或Resids)按钮,可以得到Y在样本期的模型预测值。

设预测变量名为YF。

命令如下:

GENRER=(1-YF/Y)*100计算相对误差

SHOWYYFER显示误差

PLOTYYF绘制拟合预测图

YF图如下:

 

显示误差,如下图:

绘制拟合预测图,如下:

结论:

根据图显示的计算结果,所建立的模型能如实反映我国钢铁预测模型。

二、在统计学教材中,采用了方差分析方法分析了不同班次对劳动效率的影响,其样本数据为

早班中班晚班

344939

374740

355142

334839

335041

355142

365140

试采用虚拟解释变量回归的方法对上述数据进行方差分析。

1、设置虚拟变量

D1:

D2:

从数据可知,该模型是加法。

模型方程:

Eviews中,输入相关数据后,在命令窗口输入:

LSYCD1D2得到:

DependentVariable:

Y

Method:

LeastSquares

Date:

12/01/09Time:

17:

27

Sample:

121

Includedobservations:

21

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

C

40.42857

0.555329

72.80115

0.0000

D1

-5.714286

0.785353

-7.276069

0.0000

D2

9.142857

0.785353

11.64171

0.0000

R-squared

0.952909

    Meandependentvar

41.57143

AdjustedR-squared

0.947676

    S.D.dependentvar

6.423172

S.E.ofregression

1.469262

    Akaikeinfocriterion

3.738961

Sumsquaredresid

38.85714

    Schwarzcriterion

3.888178

Loglikelihood

-36.25909

    F-statistic

182.1176

Durbin-Watsonstat

2.331933

    Prob(F-statistic)

0.000000

回归结果:

t=(72.80115)(-7.276069)(11.64171)

F=182.1176DW=2.331933

从回归结果可知:

模型拟合优度高,F检验显著,T检验也显著。

 

 

经过SPSS得到上述方差分析如上图。

 

三、表中给出1965—1970年美国制造业利润和销售额的季度数据。

假定利润不仅与销售额有关,而且和季度因素有关。

要求:

(1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量?

(2)如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量?

(3)如果认为上述两种情况都存在,又应当如何引入虚拟变量?

(4)对上述三种情况分别估计利润模型,进行对比分析。

年份季度

利润(Y)

销售额(X)

年份季度

利润(Y)

销售额(X)

1965-1

10503

114862

1968-1

12539

148862

2

12092

123968

2

14849

153913

3

10834

123545

3

13203

155727

4

12201

131917

4

14947

168409

1966-1

12245

129911

1969-1

14151

162781

2

14001

140976

2

15949

176057

3

12213

137828

3

14024

172419

4

12820

145465

4

14315

183327

1967-1

11349

136989

1970-1

12381

170415

2

12615

145126

2

13991

181313

3

11014

141536

3

12174

176712

4

12730

151776

4

10985

180370

1、如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量,估计利润模型,进行对比分析。

(1)为了更好研究四个季度的季节性影响,引入三个虚拟变量:

:

取得利润模型:

系数

分别反映了1、2、3、4季度对利润的平均影响程度,根据这些系数的t检验可以判断季节因素对利润是否有显著影响。

如图:

Eviews中,输入相关数据后,在命令窗口输入:

LSYCXD1D2D3得到:

DependentVariable:

Y

Method:

LeastSquares

Date:

12/01/09Time:

14:

07

Sample:

1965Q11970Q4

Includedobservations:

24

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

C

6910.449

1922.350

3.594792

0.0019

X

0.038008

0.011670

3.256914

0.0041

D1

-187.7317

660.1218

-0.284390

0.7792

D2

1169.320

637.0766

1.835446

0.0821

D3

-417.1182

640.8333

-0.650900

0.5229

R-squared

0.517642

    Meandependentvar

12838.54

AdjustedR-squared

0.416093

    S.D.dependentvar

1433.284

S.E.ofregression

1095.227

    Akaikeinfocriterion

17.01836

Sumsquaredresid

22790932

    Schwarzcriterion

17.26379

Loglikelihood

-199.2204

    F-statistic

5.097454

Durbin-Watsonstat

0.396350

    Prob(F-statistic)

0.005810

估计方程模型:

t=(3.594792)(3.256914)(-0.284390)(1.835446)(-0.650900)

回归方程表明:

第二季度的T检验效果显著,也就是说第二季度的销售额对利润的有显著影响。

销售额每增加1美元,则平均增加约3.8美分。

第一季度的平均利润是6722.7美元,而第二季度的平均利润提高了1169.32美元。

由于其他季度的影响不显著,所以只引入第二季度虚拟变量D2,得到如下回归方程:

t=(3.966130)(3.634023)(2.755062)

DependentVariable:

Y

Method:

LeastSquares

Date:

12/01/09Time:

14:

30

Sample:

1965Q11970Q4

Includedobservations:

24

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

C

6547.934

1650.963

3.966130

0.0007

X

0.039067

0.010750

3.634023

0.0016

D2

1369.099

496.9396

2.755062

0.0119

R-squared

0.506786

    Meandependentvar

12838.54

AdjustedR-squared

0.459814

    S.D.dependentvar

1433.284

S.E.ofregression

1053.426

    Akaikeinfocriterion

16.87395

Sumsquaredresid

23303846

    Schwarzcriterion

17.02121

Loglikelihood

-199.4874

    F-statistic

10.78895

Durbin-Watsonstat

0.481660

    Prob(F-statistic)

0.000598

 

(2)如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量?

如果是季度影响使利润对销售额的变化发生变异,应该乘法模型引入虚拟变量,如下方程模型:

Eviews中,输入相关数据后,在命令窗口输入:

LSYCXD1*XD2*XD3*X得到:

DependentVariable:

Y

Method:

LeastSquares

Date:

12/01/09Time:

14:

52

Sample:

1965Q11970Q4

Includedobservations:

24

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

C

7014.757

1782.932

3.934394

0.0009

X

0.037068

0.011322

3.273896

0.0040

XD1

-0.000933

0.004302

-0.216776

0.8307

XD2

0.007910

0.004018

1.968541

0.0638

XD3

-0.002385

0.004074

-0.585290

0.5652

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1