应用回归分析第七章答案讲课教案Word下载.docx
《应用回归分析第七章答案讲课教案Word下载.docx》由会员分享,可在线阅读,更多相关《应用回归分析第七章答案讲课教案Word下载.docx(15页珍藏版)》请在冰豆网上搜索。
![应用回归分析第七章答案讲课教案Word下载.docx](https://file1.bdocx.com/fileroot1/2022-11/17/505e9e80-b83a-44fa-9f18-57e2271b1dd7/505e9e80-b83a-44fa-9f18-57e2271b1dd71.gif)
(1)在岭回归的计算中,我们假定设计矩阵X已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小,我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量。
(2)当k值较小时标准化岭回归系数的绝对值并不是很小,但是不稳定,随着k的增加迅速趋于零。
像这样的岭回归系数不稳定,震动趋于零的自变量,我们也可以予以删除。
(3)去掉标准化岭回归系数很不稳定的自变量,如果有若干个岭回归系数不稳定,究竟去掉几个,去掉哪几个,这并无一般原则可循,这需根据去掉某个变量后重新进行岭回归分析的效果来确定。
5.对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分析。
依题意,对逐步回归法所保留的三个自变量做岭回归分析。
程序为:
include'
C:
\ProgramFiles\SPSSEVAL\Ridgeregression.sps'
.
ridgeregdep=y/enterx1x2x5
/start=0.0/stop=1/inc=0.01.
岭迹图如下:
计算结果为:
可以看到,变量x1、x2迅速由负变正,x5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。
先取k=0.08:
语法命令如下:
/k=0.08.
运行结果如下:
得到回归方程为:
再取k=0.01:
/k=0.01.
运行结果:
******RidgeRegressionwithk=0.01******
MultR.9931857
RSquare.9864179
AdjRSqu.9840210
SE329.6916494
ANOVAtable
dfSSMS
Regress3.00013420184144733947
Residual17.0001847841.9108696.58
FvalueSigF
411.5487845.0000000
--------------VariablesintheEquation----------------
BSE(B)BetaB/SE(B)
x1.0556780.0615651.0981355.9043751
x2.0796395.0218437.32912933.6458814
x5.1014400.0108941.56210889.3114792
Constant753.3058478121.7381256.00000006.1879205
回归方程为:
y=753.3058-0.05568x1-0.0796x2+0.1014x5
从上表可看出,方程通过F检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检验。
从经济意义上讲,x1(农业增加值)、x2(工业增加值)x5(社会消费总额)的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。
比逐步回归法得到的方程有合理解释。
6.对习题3.12的问题,分别用普通最小二乘和岭回归建立GDP对第二产业增加值x2,和第三产业增加值x3的二元线性回归,解释所得到的回归系数?
(1)普通最小二乘法:
根据上表得到y与x2,x3的线性回归方程为:
=4352.859+1.438x2+0.679x3
上式中的回归系数得不到合理的解释.
的数值应该大于1,实际上,x3的年增长幅度大于x1和x2的年增长幅度,因此合理的
的数值应大于1。
这个问题产生的原因仍然是存在共线性,所以采用岭回归来改进这个问题。
(2)岭回归法:
ridgeregdep=GDP/enterx2x3
/start=0.0/stop=0.5/inc=0.01.
根据岭迹图(如下图)可知,
和
很不稳定,但其和大体上稳定,说明x2和x3存在多重共线性。
取k=0.1,SPSS输出结果为:
MultR.998145,RSquare.996294
AdjRSqu.995677,SE2364.837767
Regress2.0001.80E+0109.02E+009
Residual12.000671094925592457.7
1613.140715.000000
x2.907990.021842.48906741.571133
x31.393800.035366.46364939.410560
Constant6552.3059861278.903452.0000005.123378
得岭参数k=0.1时,岭回归方程为=6552.306+0.908x2+1.3938x3,
得岭参数k=0.01时,岭回归方程为=3980.2+1.091x2+1.227x3,
与普通最小二乘回归方程相差很大。
岭回归系数
=1.227与前面的分析是吻合的,其解释是当第二产业增加值x2保持不变时,第三产业增加值x3每增加1亿元GDP增加1.227亿元,这个解释是合理的。
7.一家大型商业银行有多家分行,近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法,表7.5是该银行所属25家分行2002年的有关业务数据。
(1)计算y与其余四个变量的简单相关系数。
(2)建立不良贷款y对4个自变量的线性回归方程,所得的回归系数是否合理?
(3)分析回归模型的共线性。
(4)采用后退法和逐步回归法选择变量,所得回归方程的回归系数是否合理,是否还存在共线性?
(5)建立不良贷款y对4个自变量的岭回归。
(6)对第4步剔除变量后的回归方程再做岭回归。
(7)某研究人员希望做y对各项贷款余额,本年累计应收贷款.贷款项目个数这三个变量的回归,你认为这种做是否可行,如果可行应该如何做?
相关性
不良贷款y
各项贷款余额x1
本年累计应收到款x2
贷款项目个数x3
本年固定资产投资额x4
Pearson相关性
1.000
.844
.732
.700
.519
.679
.848
.780
.586
.472
.747
Sig.(单侧)
.000
.004
.001
.009
N
25
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
-1.022
.782
-1.306
.206
.040
.010
.891
3.837
.188
5.331
.148
.079
.260
1.879
.075
.529
1.890
.015
.083
.034
.175
.863
.261
3.835
-.029
-.325
-1.937
.067
.360
2.781
a.因变量:
不良贷款y
共线性诊断a
维数
特征值
条件索引
方差比例
4.538
.01
.00
2
.203
4.733
.68
.03
.02
.09
3
.157
5.378
.16
.66
.13
4
.066
8.287
.20
.36
.72
5
.036
11.215
.15
.87
.12
.63
.05
后退法得