应用回归分析第七章答案Word格式文档下载.docx
《应用回归分析第七章答案Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《应用回归分析第七章答案Word格式文档下载.docx(17页珍藏版)》请在冰豆网上搜索。
/start=0.0/stop=1/inc=0.01.
岭迹图如下:
计算结果为:
可以看到,变量x1、x2迅速由负变正,x5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。
先取k=0.08:
语法命令如下:
/k=0.08.
运行结果如下:
得到回归方程为:
再取k=0.01:
/k=0.01.
运行结果:
******RidgeRegressionwithk=0.01******
MultR.9931857
RSquare.9864179
AdjRSqu.9840210
SE329.6916494
ANOVAtable
dfSSMS
Regress3.00013420184144733947
Residual17.0001847841.9108696.58
FvalueSigF
411.5487845.0000000
--------------VariablesintheEquation----------------
BSE(B)BetaB/SE(B)
x1.0556780.0615651.0981355.9043751
x2.0796395.0218437.32912933.6458814
x5.1014400.0108941.56210889.3114792
Constant753.3058478121.7381256.00000006.1879205
回归方程为:
y=753.3058-0.05568x1-0.0796x2+0.1014x5
从上表可看出,方程通过F检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检验。
从经济意义上讲,x1(农业增加值)、x2(工业增加值)x5(社会消费总额)的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。
比逐步回归法得到的方程有合理解释。
6.对习题3.12的问题,分别用普通最小二乘和岭回归建立GDP对第二产业增加值x2,和第三产业增加值x3的二元线性回归,解释所得到的回归系数?
(1)普通最小二乘法:
根据上表得到y与x2,x3的线性回归方程为:
=4352.859+1.438x2+0.679x3
上式中的回归系数得不到合理的解释.
的数值应该大于1,实际上,x3的年增长幅度大于x1和x2的年增长幅度,因此合理的
的数值应大于1。
这个问题产生的原因仍然是存在共线性,所以采用岭回归来改进这个问题。
(2)岭回归法:
ridgeregdep=GDP/enterx2x3
/start=0.0/stop=0.5/inc=0.01.
根据岭迹图(如下图)可知,
和
很不稳定,但其和大体上稳定,说明x2和x3存在多重共线性。
取k=0.1,SPSS输出结果为:
MultR.998145,RSquare.996294
AdjRSqu.995677,SE2364.837767
Regress2.0001.80E+0109.02E+009
Residual12.000671094925592457.7
1613.140715.000000
x2.907990.021842.48906741.571133
x31.393800.035366.46364939.410560
Constant6552.3059861278.903452.0000005.123378
得岭参数k=0.1时,岭回归方程为=6552.306+0.908x2+1.3938x3,
得岭参数k=0.01时,岭回归方程为=3980.2+1.091x2+1.227x3,
与普通最小二乘回归方程相差很大。
岭回归系数
=1.227与前面的分析是吻合的,其解释是当第二产业增加值x2保持不变时,第三产业增加值x3每增加1亿元GDP增加1.227亿元,这个解释是合理的。
7.一家大型商业银行有多家分行,近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法,表7.5是该银行所属25家分行2002年的有关业务数据。
(1)计算y与其余四个变量的简单相关系数。
(2)建立不良贷款y对4个自变量的线性回归方程,所得的回归系数是否合理?
(3)分析回归模型的共线性。
(4)采用后退法和逐步回归法选择变量,所得回归方程的回归系数是否合理,是否还存在共线性?
(5)建立不良贷款y对4个自变量的岭回归。
(6)对第4步剔除变量后的回归方程再做岭回归。
(7)某研究人员希望做y对各项贷款余额,本年累计应收贷款.贷款项目个数这三个变量的回归,你认为这种做是否可行,如果可行应该如何做?
相关性
不良贷款y
各项贷款余额x1
本年累计应收到款x2
贷款项目个数x3
本年固定资产投资额x4
Pearson相关性
1.000
.844
.732
.700
.519
.679
.848
.780
.586
.472
.747
Sig.(单侧)
.000
.004
.001
.009
N
25
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
-1.022
.782
-1.306
.206
.040
.010
.891
3.837
.188
5.331
.148
.079
.260
1.879
.075
.529
1.890
.015
.083
.034
.175
.863
.261
3.835
-.029
-.325
-1.937
.067
.360
2.781
a.因变量:
不良贷款y
共线性诊断a
维数
特征值
条件索引
方差比例
4.538
.01
.00
2
.203
4.733
.68
.03
.02
.09
3
.157
5.378
.16
.66
.13
4
.066
8.287
.20
.36
.72
5
.036
11.215
.15
.87
.12
.63
.05
后退法得
-.972
.711
-1.366
.186
.041
.914
4.814
.149
.077
1.938
.014
-.317
-2.006
.058
-.443
.697
-.636
.531
.050
.007
1.120
6.732
-.032
-.355
-2.133
.044
逐步回归得
-.830
.723
-1.147
.263
.038
.005
7.534
R-SQUAREANDBETACOEFFICIENTSFORESTIMATEDVALUESOFK
KRSQx1x2x3x4
____________________________________________
.00000.79760.891313.259817.034471-.324924
.05000.79088.713636.286611.096624-.233765
.10000.78005.609886.295901.126776-.174056
.15000.76940.541193.297596.143378-.131389
.20000.75958.491935.295607.153193-.099233
.25000.75062.454603.291740.159210-.074110
.30000.74237.425131.286912.162925-.053962
.35000.73472.401123.281619.165160-.037482
.40000.72755.381077.276141.166401-.023792
.45000.72077.364000.270641.166949-.012279
.50000.71433.349209.265211.167001-.002497
.55000.70816.336222.259906.166692.005882
.60000.70223.324683.254757.166113.013112
.65000.69649.314330.249777.165331.019387
.70000.69093.304959.244973.164397.024860
.75000.68552.296414.240345.163346.029654
.80000.68024.288571.235891.162207.033870
.85000.67508.281331.231605.161000.037587
.90000.67003.274614.227480.159743.040874
.95000.66508.268353.223510.158448.043787
1.0000.66022.262494.219687.157127.046373
RunMATRIXprocedure:
******RidgeRegressionwithk=0.4******
MultR.802353780
RSquare.643771588
AdjRSqu.611387187
SE2.249999551
Regress2.000201.275100.638
Residual22.000111.3755.062
19.87906417.00001172
x1.025805860.003933689.5744623956.560218798
x4.004531316.007867533.050434658.575951348
Constant.357087614.741566536.000000000.481531456
------ENDMATRIX-----
Y对x1x2x3做岭回归
MultR.850373821
RSquare.723135635
AdjRSqu.683583583
SE2.030268037
Regress3.000226.08975.363
Residual21.00086.5624.122
18.28313822.00000456
x1.016739073.003359156.3726273164.983118685
x2.156806656.047550034.2752138783.297719120
x3.067110931.032703990.1592210052.052071673
Constant-.819486727.754456246.000000000-1.086195166
由图及表可知,
(1)y与x1x2x3x4的相关系数分别为0.844,0.732,0.700,0.519.
(2)y对其余四个变量的线性回归方程为
由于
的系数为负,说明存在共线性,固所得的回归系数是不合理的。
(3)由于条件数
=11.25>
10,说明存在较强的共线性。
(4)由上表可知由后退法和逐步回归法所得到的线性回归方程为
的系数为负,说明仍然存在共线性。
(5)Y对其余四个自变量的岭回归如上表所示。
(6)选取岭参数k=0.4,得岭回归方程
,回归系数都能有合理的解释。
(7)用y对x1x2x3做岭回归,选取岭参数k=0.4,岭回归方程为
回归系数都能有合理的解释,由B/SE(B)得近似的t值可知,x1x2x3都是显著的,所以y对x1x2x3的岭回归是可行的。