应用回归分析习题413答案.docx
《应用回归分析习题413答案.docx》由会员分享,可在线阅读,更多相关《应用回归分析习题413答案.docx(18页珍藏版)》请在冰豆网上搜索。
应用回归分析习题413答案
4.13
(1)用普通最小二乘法建立y与x回归方程.
(2)用残差图及DW检验诊断序列的自相关
datadxh;
inputobsxy;
cards;
1
127.3
20.96
2
13021.4
3
132.7
21.96
4
129.4
21.52
5
13522.39
6
137.1
22.76
7
141.1
23.48
8
142.8
23.66
9
145.5
24.1
10
145.3
24.01
11
148.3
24.54
12
146.4
24.28
13
150.2
25
14
153.1
25.64
15
157.3
26.46
16
160.7
26.98
17
164.2
27.52
18
165.6
27.78
19
168.7
28.24
20
17228.78
run;
proc
print;
run;
proc
gplot
data=dxh;
plot
y*x;
run;
proc
reg
data=dxh;|
model
y=x/
clbprspecdw;|
output
out
=outr=residual;|
run;
方差分析
源
自由度
平方和
均方
F值
Pr>F
模型
1
110.59832
110.59832
11648.6
<.0001
误差
18
0.17090
0.00949
校正合计
19
110.76922
P值<0.05,回归方程显著。
均方根误差0.09744R方0.9985因变量均值24.57300调整R方0.9984变异系数0.39653
R方=0.9985,调整R方=0.9984,所以回归方程拟合度较高
参数估计值
变量
自由度
参数估计值
标准
误差
t值
Pr>|t|
95%置信限
Intercept
1
-1.43483
0.24196
-5.93
<.0001
-1.94316
-0.92650
x
1
0.17616
0.00163
107.93
<.0001
0.17273
0.17959
常数项和x的参数估计P值均小于0.05,所以参数显著有效
回归方程为y=-1.43483+0.17616
*阿srITl«r94MIIJHlog««5.«E阿田治agclgz曲gMCcvetIQuSJMuEat
e-
残差图成发散状,可能存在异方差。
Durbin-WatsonD
0.663
观测数
20
第一阶自相关
0.644
查DV分布表可知n=20,P=2时临界值dL和du分别为1.20和1.41,由于DW值=0.663小于dL,
故模型存在序列正自相关性•
(3)用迭代法处理序列相关,并建立回归方程
datadxhl;
setout;|
ro=1-0.5*0.663;
y_t_1=y-ro*lag1(y);
x_t_1=xro*lag1(x);
run;
procprintdata=dxh1;;|
run;
procregdata=dxh1;
modely_t_仁x_t_1/clbprspecDW/
run;
方差分析
源
自由度
平方和
均方
F值
Pr>F
模型
1
13.13330
13.13330
2467.41
<.0001
误差
17
0.09049
0.00532
校正合计
18
13.22379
P值<0.05,回归方程显著。
均方根误差0.07296R方0.9932
因变量均值8.48413调整R方0.9928
变异系数0.85992
由R方和调整R方知,方程拟合度较高。
参数估计值
变量自由度参数标准t值Pr>|t|95%置信限
Intercept
估计值
-0.30006
0.17268
误差
0.17763-1.690.1094
0.0034849.67<.0001
常数性参数检验的p值=0.1094大于0.05,不显著,除去常数项再建立回归方程
之间,所以迭代法建立的回归方程的误差项无自相关
去掉常数项建回归方程。
DW=1.360在dL和du
-0.674830.07471
0.165350.18002
procregdata=dxh1;
modely_t_1=x_t_1/nointclbprspecDWrun;
结果如下:
均方根误差0.07662
R方0.9999
方差分析
源
自由度
平方和
均方
F值
Pr>F
模型
1
1380.74604
1380.74604
235188
<.0001
误差
18
0.10567
0.00587
未校正合计
19
1380.85172
P值<0.05,回归方程显著。
因变量均值8.48413调整R方0.9999
变异系数0.90311
由R方和调整R方知,方程拟合度较高。
参数估计值
变量自由度参数
估计值
标准
误差
t值Pr>|t|
95%置信限
0.16684
0.00034402484.96<.0001
0.166110.16756
P值<0.05,参数估计显著有效。
回归方程:
耳=0-1如壬
其中齐=$_珂匸!
斗=工_阿7.
(3)用一阶差分法处理数据,并建立回归方程
datadxh2;|
seta;
difx=x-lag1(x);
dify=y-lag1(y);
run;
procregdata=dxh2;
modeldify=difx/rpDW
run;
结果如下:
方差分析
源
自由度
平方和
均方
F值
Pr>F
模型
1
2.11593
2.11593
381.34
<.0001
误差
17
0.09433
0.00555
校正合计
18
2.21025
P值<0.05,回归方程显著。
均方根误差0.07449R方0.9573
因变量均值0.41158调整R方0.9548
变异系数18.09839
由R方和调整R方知,方程拟合度较高。
参数估计值
变量
自由度
参数估计值
标准误差
t值
Pr>|t|
Intercept
1
0.03289
0.02585
1.27
0.2203
difx
1
0.16096
0.00824
19.53
<.0001
其中
Ar=jq-
7
Durbin-WatsonD
1.480
观测数
19
第一阶自相关
0.253
DW=1.480,查DWn=19,k=2.可知%和盅分别为1.18和1.40,DW=1.480在1.40和4-1.40
之间,误差项间无自相关•
(4)比较以上各方法所建回归方程的优良性.
在回归模型不存在序列相关时,普通最小二乘法比迭代法和一阶差分法操作起来更简便,但是,当一个回归模型存在序列相关性时,普通最小二乘法所建立的回归方程就不适用了,这时需要使用迭代法或一阶差分法。
由于一阶差分法的应用条件是自相关系数P=1,当P接
近1时,一阶差分法比迭代法好,当原模型存在较高程度的一阶自相关时,一般使用一阶差
分法,因为一阶差分法比迭代法简单而且迭代法需要用样本估计自相关系数P,对P的估计
误差会影响迭代法的使用效率,同时迭代法的算法时间复杂度比一阶差分的高,在效率上不
如一阶差分好。
4.14
(1)用最小二乘法建立回归方程,用残差图及DW检验诊断序列的自相关性
datadxh;
inputyx1x2@@;
cards;
893.935
292
1091.27
5
252
1229.97
5
267
1045.85
5
379
997.245
318
1495.14
6
393
1200.56
5
331
747.244
204
866.435
266
6035
253
343.525
315
472.1
6
271
171.794
166
135.794
204
925.955
335
1574.01
5
352
1405.33
5
274
971.274
333
1165.25
302
597.854324
490.344327
709.595206
987.35310
954.66306
1216.896350
1491.525275
668.34173
915.035360
565.924340
1267.985380
930.246285
379.384232
500.745294
83.655220
982.946391
722.284279
1337.445322
1150.514231
1514.846368
1442.085357
767.645260
1020.035298
1067.495350
1484.126320
957.684227
1344.915261
1361.785303
1424.696263
1158.214215
827.564294
803.164288
1447.466257
J
run;
procprintdata=dxh;
run;
procregdata=dxh;|
modely=x1x2/clbprspecDW/outputout=outr=residual;|run;
procgplotdata=out;
plotresidual*y;
run
方差分析
源
自由度
平方和
均方
F值
Pr>F
模型
2
2205552
1102776
10.15
0.0002
误差
49
5326177
108697
校正合计
51
7531729
P值<0.05,回归方程显著。
参数估计值
变量
自由度
参数估计值
标准误差
t值
Pr>|t|
95%置信限
Intercep
1
-574.0623
349.2707
-1.6
0.1067
-1275.9482
127.8234
t
9
5
4
4
6
x1
1
191.09849
73.30917
2.61
0.0121
43.77821
338.4187
8
x2
1
2.04514
0.91069
2.25
0.0293
0.21504
3.87524
回归分析方程
y=-574.06239+19105849^+204514兀
Durbin-WatsonD
0.745
观测数
52
第一阶自相关
0.615
DW值=0.745
ns
«oo
咖
HA
XK)
100
t
-1W
-m
mog
-«»
-xw
QIOQ300I0O300TOOSOO3W1W1IQ01J0Q13001400巧00TttM)
■
残差图满足线性关系,可建立回归方程。
(2)用迭代法处理序列相关,并建立回归方程
datadxhl;|
setout;|
ro=1-0.5*0.745;
y_t_1=y-ro*lag1(y);
x1_t_1=x1-ro*lag1(x1);
x2_t_1=x2-ro*lag1(x2);
run;
procprintdata=dxh1;
run;
procregdata=dxh1;
modely_t_1=x1_t_1x2_t_1/clbprspecdw;
Run;
方差分析
源
自由度
平方和
均方
F值
Pr>F
模型
2
2865658
1432829
21.55
<.0001
误差
48
3191497
66490
校正合计
50
6057155
P值<0.05,回归方程显著。
参数估计值
变量
自由度
参数估计值
标准误差
t值
Pr>|t|
95%置信限
Intercep
1
-178.7752
90.3381
-1.9
0.0536
-360.4123
2.86189
t
2
9
8
2
x1_t_1
1
211.11043
47.7473
4.42
<.0001
115.10802
307.1128
2
5
x2t1
1
1.43648
0.62864
2.29
0.0268
0.17253
2.70044
所得回归方程:
耳二-178-775224-21111043^+143618^其中齐=»-戸星店,乓也,町,=巧_段*j
Durbin-WatsonD
1.716
观测数
51
第一阶自相关
1
0.122
dd
DW=1.716在■和4-■之间,误差项无自相关
(3)用一阶差分法处理数据
Data=dxh2;|
seta;
dify=y-lag1(y);
difx仁xl-lagl(xl);|
difx2=x2-lag1(x2);|
run;
procregdata=dxh2;
modeldify=difx1difx2/rdw;|
run;
方差分析
源
自由度
平方和
均方
F值
Pr>F
模型
2
4033892
2016946
25.04
<.0001
误差
48
3865792
80537
校正合计
50
7899684
P值<0.05,回归方程显著。
参数估计值
变量
自由度
参数估计值
标准误差
t值
Pr>|t|
Intercept
1
7.69810
39.75421
0.19
0.8473
difxl
1
209.89106
44.14316
4.75
<.0001
difx2
1
1.39898
0.58282
2.40
0.0203
回归方程:
g=7-6M101209拠1。
&4斥*13989fiA^
其中如二只-Ph,唇二耳一也,-洛
(4)比较以上各方法所建回归方程的优良性
在回归模型不存在序列相关时,普通最小二乘法比迭代法和一阶差分法操作起来更简便,但是,当一个回归模型存在序列相关性时,普通最小二乘法所建立的回归方程就不适用了,这时需要使用迭代法或一阶差分法•由于一阶差分法的应用条件是自相关系数P=1,当P接
近1时,一阶差分法比迭代法好,当原模型存在较高程度的一阶自相关的情况时,一般使用一阶差分法而不用迭代法,因为一阶差分法比迭代法简单而且迭代法需要用样本估计自相关系数P,对P的估计误差会影响迭代法的使用效率,同时迭代法的算法时间复杂度比一阶