最新应用回归分析第七章答案.docx

上传人:b****5 文档编号:7605925 上传时间:2023-01-25 格式:DOCX 页数:17 大小:154.48KB
下载 相关 举报
最新应用回归分析第七章答案.docx_第1页
第1页 / 共17页
最新应用回归分析第七章答案.docx_第2页
第2页 / 共17页
最新应用回归分析第七章答案.docx_第3页
第3页 / 共17页
最新应用回归分析第七章答案.docx_第4页
第4页 / 共17页
最新应用回归分析第七章答案.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

最新应用回归分析第七章答案.docx

《最新应用回归分析第七章答案.docx》由会员分享,可在线阅读,更多相关《最新应用回归分析第七章答案.docx(17页珍藏版)》请在冰豆网上搜索。

最新应用回归分析第七章答案.docx

最新应用回归分析第七章答案

第七章岭回归

1.岭回归估计是在什么情况下提出的?

答:

当解释变量间出现严重的多重共线性时,用普通最小二乘法估计模型参数,往往参数估计方差太大,使普通最小二乘法的效果变得很不理想,为了解决这一问题,统计学家从模型和数据的角度考虑,采用回归诊断和自变量选择来克服多重共线性的影响,这时,岭回归作为一种新的回归方法被提出来了。

2.岭回归估计的定义及其统计思想是什么?

答:

一种改进最小二乘估计的方法叫做岭估计。

当自变量间存在多重共线性,∣X'X∣≈0时,我们设想给X'X加上一个正常数矩阵kI(k>0),那么X'X+kI接近奇异的程度小得多,考虑到变量的量纲问题,先对数据作标准化,为了计算方便,标准化后的设计阵仍然用X表示,定义为

,称为

的岭回归估计,其中k称为岭参数。

3.选择岭参数k有哪几种主要方法?

答:

选择岭参数的几种常用方法有1.岭迹法,2.方差扩大因子法,3.由残差平方和来确定k值。

4.用岭回归方法选择自变量应遵从哪些基本原则?

答:

用岭回归方法来选择变量应遵从的原则有:

(1)在岭回归的计算中,我们假定设计矩阵X已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小,我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量。

(2)当k值较小时标准化岭回归系数的绝对值并不是很小,但是不稳定,随着k的增加迅速趋于零。

像这样的岭回归系数不稳定,震动趋于零的自变量,我们也可以予以删除。

(3)去掉标准化岭回归系数很不稳定的自变量,如果有若干个岭回归系数不稳定,究竟去掉几个,去掉哪几个,这并无一般原则可循,这需根据去掉某个变量后重新进行岭回归分析的效果来确定。

5.对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分析。

答:

依题意,对逐步回归法所保留的三个自变量做岭回归分析。

程序为:

include'C:

\ProgramFiles\SPSSEVAL\Ridgeregression.sps'.

ridgeregdep=y/enterx1x2x5

/start=0.0/stop=1/inc=0.01.

岭迹图如下:

计算结果为:

可以看到,变量x1、x2迅速由负变正,x5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。

岭迹图如下:

先取k=0.08:

语法命令如下:

include'C:

\ProgramFiles\SPSSEVAL\Ridgeregression.sps'.

ridgeregdep=y/enterx1x2x5

/k=0.08.

运行结果如下:

得到回归方程为:

再取k=0.01:

语法命令如下:

include'C:

\ProgramFiles\SPSSEVAL\Ridgeregression.sps'.

ridgeregdep=y/enterx1x2x5

/k=0.01.

 

运行结果:

******RidgeRegressionwithk=0.01******

MultR.9931857

RSquare.9864179

AdjRSqu.9840210

SE329.6916494

ANOVAtable

dfSSMS

Regress3.00013420184144733947

Residual17.0001847841.9108696.58

FvalueSigF

411.5487845.0000000

--------------VariablesintheEquation----------------

BSE(B)BetaB/SE(B)

x1.0556780.0615651.0981355.9043751

x2.0796395.0218437.32912933.6458814

x5.1014400.0108941.56210889.3114792

Constant753.3058478121.7381256.00000006.1879205

回归方程为:

y=753.3058-0.05568x1-0.0796x2+0.1014x5

从上表可看出,方程通过F检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检验。

从经济意义上讲,x1(农业增加值)、x2(工业增加值)x5(社会消费总额)的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。

比逐步回归法得到的方程有合理解释。

6.对习题3.12的问题,分别用普通最小二乘和岭回归建立GDP对第二产业增加值x2,和第三产业增加值x3的二元线性回归,解释所得到的回归系数?

答:

(1)普通最小二乘法:

根据上表得到y与x2,x3的线性回归方程为:

=4352.859+1.438x2+0.679x3

上式中的回归系数得不到合理的解释.

的数值应该大于1,实际上,x3的年增长幅度大于x1和x2的年增长幅度,因此合理的

的数值应大于1。

这个问题产生的原因仍然是存在共线性,所以采用岭回归来改进这个问题。

(2)岭回归法:

程序为:

include'C:

\ProgramFiles\SPSSEVAL\Ridgeregression.sps'.

ridgeregdep=GDP/enterx2x3

/start=0.0/stop=0.5/inc=0.01.

根据岭迹图(如下图)可知,

很不稳定,但其和大体上稳定,说明x2和x3存在多重共线性。

取k=0.1,SPSS输出结果为:

MultR.998145,RSquare.996294

AdjRSqu.995677,SE2364.837767

ANOVAtable

dfSSMS

Regress2.0001.80E+0109.02E+009

Residual12.000671094925592457.7

FvalueSigF

1613.140715.000000

 

--------------VariablesintheEquation----------------

BSE(B)BetaB/SE(B)

x2.907990.021842.48906741.571133

x31.393800.035366.46364939.410560

Constant6552.3059861278.903452.0000005.123378

得岭参数k=0.1时,岭回归方程为=6552.306+0.908x2+1.3938x3,

得岭参数k=0.01时,岭回归方程为=3980.2+1.091x2+1.227x3,

与普通最小二乘回归方程相差很大。

岭回归系数

=1.227与前面的分析是吻合的,其解释是当第二产业增加值x2保持不变时,第三产业增加值x3每增加1亿元GDP增加1.227亿元,这个解释是合理的。

7.一家大型商业银行有多家分行,近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法,表7.5是该银行所属25家分行2002年的有关业务数据。

(1)计算y与其余四个变量的简单相关系数。

(2)建立不良贷款y对4个自变量的线性回归方程,所得的回归系数是否合理?

(3)分析回归模型的共线性。

(4)采用后退法和逐步回归法选择变量,所得回归方程的回归系数是否合理,是否还存在共线性?

(5)建立不良贷款y对4个自变量的岭回归。

(6)对第4步剔除变量后的回归方程再做岭回归。

(7)某研究人员希望做y对各项贷款余额,本年累计应收贷款.贷款项目个数这三个变量的回归,你认为这种做是否可行,如果可行应该如何做?

相关性

不良贷款y

各项贷款余额x1

本年累计应收到款x2

贷款项目个数x3

本年固定资产投资额x4

Pearson相关性

不良贷款y

1.000

.844

.732

.700

.519

各项贷款余额x1

.844

1.000

.679

.848

.780

本年累计应收到款x2

.732

.679

1.000

.586

.472

贷款项目个数x3

.700

.848

.586

1.000

.747

本年固定资产投资额x4

.519

.780

.472

.747

1.000

Sig.(单侧)

不良贷款y

.

.000

.000

.000

.004

各项贷款余额x1

.000

.

.000

.000

.000

本年累计应收到款x2

.000

.000

.

.001

.009

贷款项目个数x3

.000

.000

.001

.

.000

本年固定资产投资额x4

.004

.000

.009

.000

.

N

不良贷款y

25

25

25

25

25

我们从小学、中学到大学,学的知识总是限制在一定范围内,缺乏在商业统计、会计,理财税收等方面的知识;也无法把自己的创意准确而清晰地表达出来,缺少个性化的信息传递。

对目标市场和竞争对手情况缺乏了解,分析时采用的数据经不起推敲,没有说服力等。

这些都反映出我们大学生创业知识的缺乏;各项贷款余额x1

25

25

25

25

2、传统文化对大学生饰品消费的影响25

(4)信息技术优势本年累计应收到款x2

在我们学校大约有4000多名学生,其中女生约占90%以上。

按每十人一件饰品计算,大概需要360多件。

这对于开设饰品市场是很有利的。

女生成为消费人群的主体。

25

25

25

25

25

贷款项目个数x3

25

(二)创业优势分析25

25

图1-3大学生偏爱的手工艺品种类分布25

(一)大学生的消费购买能力分析25

(2)缺乏经营经验

加拿大beadworks公司就是根据年轻女性要充分展现自己个性的需求,将世界各地的珠类饰品汇集于“碧芝自制饰品店”内,由消费者自选、自组、自制,这样就能在每个消费者亲手制作、充分发挥她们的艺术想像力的基础上,创作出作品,达到展现个性的效果。

本年固定资产投资额x4

25

25

25

25

25

系数a

模型

非标准化系数

标准系数

t

Sig.

共线性统计量

B

标准误差

试用版

容差

VIF

1

(常量)

-1.022

.782

-1.306

.206

各项贷款余额x1

.040

.010

.891

3.837

.001

.188

5.331

本年累计应收到款x2

.148

.079

.260

1.879

.075

.529

1.890

贷款项目个数x3

.015

.083

.034

.175

.863

.261

3.835

本年固定资产投资额x4

-.029

.015

-.325

-1.937

.067

.360

2.781

a.因变量:

不良贷款y

共线性诊断a

模型

维数

特征值

条件索引

方差比例

(常量)

各项贷款余额x1

本年累计应收到款x2

贷款项目个数x3

本年固定资产投资额x4

1

1

4.538

1.000

.01

.00

.01

.00

.00

2

.203

4.733

.68

.03

.02

.01

.09

3

.157

5.378

.16

.00

.66

.01

.13

4

.066

8.287

.00

.09

.20

.36

.72

5

.036

11.215

.15

.87

.12

.63

.05

a.因变量:

不良贷款y

后退法得

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

-1.022

.782

-1.306

.206

各项贷款余额x1

.040

.010

.891

3.837

.001

本年累计应收到款x2

.148

.079

.260

1.879

.075

贷款项目个数x3

.015

.083

.034

.175

.863

本年固定资产投资额x4

-.029

.015

-.325

-1.937

.067

2

(常量)

-.972

.711

-1.366

.186

各项贷款余额x1

.041

.009

.914

4.814

.000

本年累计应收到款x2

.149

.077

.261

1.938

.066

本年固定资产投资额x4

-.029

.014

-.317

-2.006

.058

3

(常量)

-.443

.697

-.636

.531

各项贷款余额x1

.050

.007

1.120

6.732

.000

本年固定资产投资额x4

-.032

.015

-.355

-2.133

.044

a.因变量:

不良贷款y

逐步回归得

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

-.830

.723

-1.147

.263

各项贷款余额x1

.038

.005

.844

7.534

.000

2

(常量)

-.443

.697

-.636

.531

各项贷款余额x1

.050

.007

1.120

6.732

.000

本年固定资产投资额x4

-.032

.015

-.355

-2.133

.044

a.因变量:

不良贷款y

R-SQUAREANDBETACOEFFICIENTSFORESTIMATEDVALUESOFK

KRSQx1x2x3x4

____________________________________________

.00000.79760.891313.259817.034471-.324924

.05000.79088.713636.286611.096624-.233765

.10000.78005.609886.295901.126776-.174056

.15000.76940.541193.297596.143378-.131389

.20000.75958.491935.295607.153193-.099233

.25000.75062.454603.291740.159210-.074110

.30000.74237.425131.286912.162925-.053962

.35000.73472.401123.281619.165160-.037482

.40000.72755.381077.276141.166401-.023792

.45000.72077.364000.270641.166949-.012279

.50000.71433.349209.265211.167001-.002497

.55000.70816.336222.259906.166692.005882

.60000.70223.324683.254757.166113.013112

.65000.69649.314330.249777.165331.019387

.70000.69093.304959.244973.164397.024860

.75000.68552.296414.240345.163346.029654

.80000.68024.288571.235891.162207.033870

.85000.67508.281331.231605.161000.037587

.90000.67003.274614.227480.159743.040874

.95000.66508.268353.223510.158448.043787

1.0000.66022.262494.219687.157127.046373

RunMATRIXprocedure:

******RidgeRegressionwithk=0.4******

MultR.802353780

RSquare.643771588

AdjRSqu.611387187

SE2.249999551

ANOVAtable

dfSSMS

Regress2.000201.275100.638

Residual22.000111.3755.062

FvalueSigF

19.87906417.00001172

--------------VariablesintheEquation----------------

BSE(B)BetaB/SE(B)

x1.025805860.003933689.5744623956.560218798

x4.004531316.007867533.050434658.575951348

Constant.357087614.741566536.000000000.481531456

------ENDMATRIX-----

Y对x1x2x3做岭回归

RunMATRIXprocedure:

******RidgeRegressionwithk=0.4******

MultR.850373821

RSquare.723135635

AdjRSqu.683583583

SE2.030268037

ANOVAtable

dfSSMS

Regress3.000226.08975.363

Residual21.00086.5624.122

FvalueSigF

18.28313822.00000456

--------------VariablesintheEquation----------------

BSE(B)BetaB/SE(B)

x1.016739073.003359156.3726273164.983118685

x2.156806656.047550034.2752138783.297719120

x3.067110931.032703990.1592210052.052071673

Constant-.819486727.754456246.000000000-1.086195166

------ENDMATRIX-----

由图及表可知,

(1)y与x1x2x3x4的相关系数分别为0.844,0.732,0.700,0.519.

(2)y对其余四个变量的线性回归方程为

由于

的系数为负,说明存在共线性,固所得的回归系数是不合理的。

(3)由于条件数

=11.25>10,说明存在较强的共线性。

(4)由上表可知由后退法和逐步回归法所得到的线性回归方程为

由于

的系数为负,说明仍然存在共线性。

(5)Y对其余四个自变量的岭回归如上表所示。

(6)选取岭参数k=0.4,得岭回归方程

,回归系数都能有合理的解释。

(7)用y对x1x2x3做岭回归,选取岭参数k=0.4,岭回归方程为

回归系数都能有合理的解释,由B/SE(B)得近似的t值可知,x1x2x3都是显著的,所以y对x1x2x3的岭回归是可行的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 育儿理论经验

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1