最新应用回归分析第九章部分答案Word下载.docx
《最新应用回归分析第九章部分答案Word下载.docx》由会员分享,可在线阅读,更多相关《最新应用回归分析第九章部分答案Word下载.docx(17页珍藏版)》请在冰豆网上搜索。
![最新应用回归分析第九章部分答案Word下载.docx](https://file1.bdocx.com/fileroot1/2022-10/13/197da569-3cfb-4431-847c-5e16b1ace4dd/197da569-3cfb-4431-847c-5e16b1ace4dd1.gif)
4500
5000
废品率y(%)
5.2
6.5
6.8
8.1
10.2
10.3
13.0
解:
先画出散点图如下图:
从散点图大致可以判断出x和y之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。
(1)二次曲线
SPSS输出结果如下:
从上表可以得到回归方程为:
由x的系数检验P值大于0.05,得到x的系数未通过显著性检验。
由x2的系数检验P值小于0.05,得到x2的系数通过了显著性检验。
(2)指数曲线
由参数检验P值≈0<
0.05,得到回归方程的参数都非常显著。
从R2值,σ的估计值和模型检验统计量F值、t值及拟合图综合考虑,指数拟合效果更好一些。
9.3已知变量x与y的样本数据如表9.15,画出散点图,试用αeβ/x来拟合回归模型,假设:
(1)乘性误差项,模型形式为y=αeβ/xeε
(2)加性误差项,模型形式为y=αeβ/x+ε。
表9.15
序号
x
y
1
4.20
0.086
6
3.20
0.150
11
2.20
0.350
2
4.06
0.090
7
3.00
0.170
12
2.00
0.440
3
3.80
0.100
8
2.80
0.190
13
1.80
0.620
4
3.60
0.120
9
2.60
0.220
14
1.60
0.940
5
3.40
0.130
10
2.40
0.240
15
1.40
1.620
散点图:
线性化:
lny=lnα+β/x+ε令y1=lny,a=lnα,x1=1/x.
做y1与x1的线性回归,SPSS输出结果如下:
从以上结果可以得到回归方程为:
y1=-3.856+6.08x1
F检验和t检验的P值≈0<
0.05,得到回归方程及其参数都非常显著。
回代为原方程为:
y=0.021e6.08/x
(2)加性误差项,模型形式为y=αeβ/x+ε
不能线性化,直接非线性拟合。
给初值α=0.021,β=6.08(线性化结果),NLS结果如下:
y=0.021e6.061/x
根据R2≈1,参数的区间估计不包括零点且较短,可知回归方程拟合非常好,且其参数都显著。
9.4Logistic回归函数常用于拟合某种消费品的拥有率,表8.17(书上239页,此处略)是北京市每百户家庭平均拥有的照相机数,试针对以下两种情况拟合Logistic回归函数。
(1)已知,用线性化方法拟合,
(2)u未知,用非线性最小二乘法拟合。
根据经济学的意义知道,u是拥有率的上限,初值可取100;
b0>
0,0<
b1<
1初值请读者自己选择。
(1),时,的线性拟合。
对函数线性化得到:
,令,作关于的线性回归分析,SPSS输出结果如下:
由表ModelSummary得到,趋于1,回归方程的拟合优度好,由表ANOVA得到回归方程显著,由Coefficients表得到,回归系数都是显著的,得到方程:
,进一步计算得到:
,()
回代变量得到最终方程形式为:
最后看拟合效果,通过sequence画图:
由图可知回归效果比较令人满意。
(2)非线性最小二乘拟合,取初值,,:
一共循环迭代8次,得到回归分析结果为:
>
0.994,得到回归效果比线性拟合要好,且:
,,,
回归方程为:
。
最后看拟合效果,由sequence画图:
得到回归效果很好,而且较优于线性回归。
9.5表9.17(书上233页,此处略)数据中GDP和投资额K都是用定基居民消费价格指数(CPI)缩减后的,以1978年的价格指数为100。
(1)用线性化乘性误差项模型拟合C-D生产函数;
(2)用非线性最小二乘拟合加性误差项模型的C-D生产函数;
(3)对线性化检验自相关,如果存在自相关则用自回归方法改进;
(4)对线性化检验多重共线性,如果存在多重共线性则用岭回归方法改进;
(1)对乘法误差项模型可通过两边取对数转化成线性模型。
lny=lnA+αlnK+βlnL
令y′=lny,β0=lnA,x1=lnK,x2=lnL,则转化为线性回归方程:
y′=β0+αx1+β2+ε
模型综述表
从模型综述表中可以看到,调整后的为0.993,说明C-D生产函数拟合效果很好,也说明GDP的增长是一个指数模型。
方差分析表
从方差分析表中可以看到,F值很大,P值为零,说明模型通过了检验,这与上述分析结果一致。
系数表
根据系数表显示,回归方程为:
尽管模型通过了检验,但是也可以看到,常数项没有通过检验,但在这个模型里,当lnK和lnL都为零时,lnY为-1.785,即当K和L都为1时,GDP为0.168,也就是说当投入资本和劳动力都为1个单位时,GDP将增加0.168个单位,这种解释在我们的承受范围内,可以认为模型可以用。
最终方程结果为:
y=0.618K0.801L0.404
(2)用非线性最小二乘法拟合加性误差项模型的C-D生产函数;
上述假设误差是乘性的,现假设误差是加性的情况下使用非线性最小二乘法估计。
初值采用
(1)中参数的结果,SPSS输出结果如下:
参数估计表
SPSS经过多步迭代,最终得到的稳定参数值为P=0.407,a=0.868,b=0.270
y=0.407K0.868L0.270
为了比较这两个方程,我们观察下面两个图
线性回归估计拟合曲线图
非线性最小二乘估计拟合曲线图
我们知道,乘性误差相当于是异方差的,做了对数变换后,乘性误差转为加性误差,这种情况下认为方差是相等的,那么第一种情况(对数变换线性化)就大大低估了GDP数值大的项,因此,它对GDP前期拟合的很好,而在后期偏差就变大了,同时也会受到自变量之间的自相关和多重共线性的综合影响;
非线性最小二乘法完全依赖数据,如果自变量之间存在比较严重的异方差、自相关以及多重共线性,将对拟合结果造成很大的影响。
因此,不排除异方差、自相关以及多重共线性的存在。
(3)对线性化回归模型采用DW检验自相关,结果如下:
DW=0.715<
1.27,落在自相关的区间,所以采用迭代法改进
将得到的数据再取对数,而后用普通最小二乘法估计,保留DW值
从模型综述表中可以看到,DW=1.618>
1.45,认为消除了自相关;
方差分析表中可以看到F值很大,P值为零,说明模型通过了检验。
从系数表可得回归方程:
再迭代回去,最终得方程为:
Lnyt-Lnyt-1=-1.859+0.755(LnKt-LnKt-1)+0.465(LnLt-LnLt-1)
(4)对线性化回归方程通过VIF检验多重共线性:
多重共线性诊断表
直观法:
从模型综述表上可以看到,F值很大,而t值很小,这是多重共线性造成的影响;
VIF检验法:
从系数表上可以看到,VIF=13>
10,也说明多重共线性的存在;
条件数:
从诊断表上可以看到,最大的条件数是429,远远大于了100,所以自变量之间存在较为严重的多重共线性。
利用岭回归改进:
R-SQUAREANDBETACOEFFICIENTSFORESTIMATEDVALUESOFK
KRSQLNKLNL
____________________________
.00000.99394.860706.141014
.05000.99015.646381.330432
.10000.98639.577758.375355
.15000.98260.539715.390822
.20000.97843.513383.395623
.25000.97379.492922.395526
.30000.96869.475918.392882
.35000.96318.461184.388818
.40000.95730.448063.383937
.45000.95109.436158.378587
.50000.94462.425211.372979
.55000.93791.415047.367248
.60000.93101.405541.361481
.65000.92395.396598.355735
.70000.91677.388147.350049
从岭迹图观察,当k=0.2时,变量基本趋于稳定
取k=0.2进行岭回归,SPSS输出结果为:
α=0.479,β=1.127
从岭回归给出的结果来看,说明劳动力L较资金K对GDP的影响较大,而我国属于人口大国,就业人数对GDP的贡献不一定有显著的影响,相反,资金对GDP的影响按常理来说是非常显著的,这点普通最小二乘法给出了合理的解释,但是,岭回归在理论上很可信的。
总之,影响统计的因素有很多,例如统计员的失误、国家政策等,造成函数系数的不稳定。