β1=0,表明X对Y无显著影响,一元线性回归模型无意义;如果|t|>tα/2(n-2),拒绝H0,接受H1:
β1≠0,表明X对Y有显著影响。
4、试说明为什么∑ei2的自由度等于n-2。
答:
在模型中,自由度指样本中可以自由变动的独立不相关的变量个数。
当有约束条件时,自由度减少,其计算公式:
自由度=样本个数-受约束条件的个数,即df=n-k。
一元线性回归中SSE残差的平方和,其自由度为n-2,因为计算残差时用到回归方程,回归方程中有两个未知参数β0和β1,而这两个参数需要两个约束条件予以确定,由此减去2,也即其自由度为n-2。
5、试说明样本可决系数与样本相关系数的关系及区别,以及样本相关系数与β^1的关系。
答:
样本相关系数r的数值等于样本可决系数的平方根,符号与β1相同。
但样本相关系数与样本可决系数在概念上有明显的区别,r建立在相关分析的理论基础之上,研究两个随机变量X与Y之间的线性相关关系;样本可决系数r²建立在回归分析的理论基础之上,研究非随机变量X对随机变量Y的解释程度。
6、已知某市的货物运输量Y(万吨),国内生产总值GDP(亿元,1980年不变价)1985~1998年的样本观测值见下表(略)。
DependentVariable:
Y
Method:
LeastSquares
Date:
10/28/13Time:
10:
25
Sample:
19851998
Includedobservations:
14
Variable
Coefficient
Std.Error
t-Statistic
Prob.
GDP
26.95415
4.120300
6.541792
0.0000
C
12596.27
1244.567
10.12101
0.0000
R-squared
0.781002
Meandependentvar
20168.57
AdjustedR-squared
0.762752
S.D.dependentvar
3512.487
S.E.ofregression
1710.865
Akaikeinfocriterion
17.85895
Sumsquaredresid
35124719
Schwarzcriterion
17.95024
Loglikelihood
-123.0126
Hannan-Quinncriter.
17.85050
F-statistic
42.79505
Durbin-Watsonstat
0.859998
Prob(F-statistic)
0.000028
(1)一元线性回归方程Yt=12596.27+26.95415GDPt
(2)结构分析β^1=26.95425是样本回归方程的斜率,它表示某市货物运输量的情况,说明货物运输量每增加1亿元,将26,95425用于国内生产总值;β^0=12596.27是样本回归方程的截距,它表示不受货物运输量影响的国内生产总值。
∧
(3)统计检验r2=0.78说明总离差平方和的78%被样本回归直线解释,有22%没被解释,说明样本回归直线对样本点的拟合优度还是比较高的。
显著性水平α=0.05,查自由度v=14-2=12的t分布表,得临界值t0.025(12)=2.18
(4)预测区间1980~2000
obs
GDP
RESID
Y
YF
YFSE
1980
1981
1982
1983
1984
1985
161.69
1294.51817047138
18249
16954.48182952862
1837.805042947807
1986
171.07
1317.688263830489
18525
17207.31173616951
.852*********
1987
184.07
842.2843420467398
18400
17557.71565795326
1815.329074565951
1988
194.75
-1152.585956772524
16693
17845.58595677253
1806.164743584577
1989
197.86
-2386.413356522331
15543
17929.41335652233
1803.689193053205
1990
208.55
-2288.553196819888
15929
18217.55319681989
1795.851377857323
1991
221.06
-246.7495861671741
18308
18554.74958616718
1788.013873793755
1992
246.92
-1729.78384903854
17522
19251.78384903854
1776.450315989464
1993
276.8
1582.826213815424
21640
20057.173********
1770.995648870701
1994
316.38
2658.981042723055
23783
21124.01895727694
1776.926294021264
1995
363.52
1645.362514039523
24040
22394.63748596048
1803.310480128086
1996
415.51
337.0163683828214
24133
23795.98363161718
1855.694986909933
1997
465.78
-60.96864300710876
25090
25150.96864300711
1927.747214173007
1998
509.1
-1813.62232698188
24505
26318.62232698188
2004.982737266598
1999
2000
620
29307.83732127556
2255.639096466328
单个值预测区间Y2000∈[29307.84-2.10×2255.64,29307.84+2.10×2255.64]
均值预测区间E(Y2000)∈[29307.84-2.10×2255.64,29307.84+2.10×2255.64]
8、查中国统计年鉴,利用1978~2000的财政收入和GDP的统计资料,要求以手工和EViews软件。
(1)散点图
DependentVariable:
Y
Method:
LeastSquares
Date:
10/29/13Time:
16:
40
Sample:
19782000
Includedobservations:
23
Variable
Coefficient
Std.Error
t-Statistic
Prob.
GDP
0.986097
0.001548
637.0383
0.0000
C
174.4171
50.39589
3.460939
0.0023
R-squared
0.999948
Meandependentvar
22634.30
AdjustedR-squared
0.999946
S.D.dependentvar
23455.82
S.E.ofregression
172.6972
Akaikeinfocriterion
13.22390
Sumsquaredresid
626310.6
Schwarzcriterion
13.32264
Loglikelihood
-150.0748
Hannan-Quinncriter.
13.24873
F-statistic
405817.8
Durbin-Watsonstat
0.984085
Prob(F-statistic)
0.000000
一元线性回归方程Y=174.4174+0.98GDPt
经济意义国名收入每增加1亿元,将有0.98亿元用于国内生产总值。
(2)检验r²=99%,说明总离查平方和的99%被样本回归直线解释,仅有1%未被解释,所以说样本回归直线对样本点的拟合优度很高。
显著性水平α=0.05,查自由度v=23-2=21的t分布表,得临界值t0.025(21)=2.08。
(3)预测值及预测区间
obs
Y
YF
YFSE
GDP
1978
3645.2
3768.939527560003
178.8799078873616
3645.2
1979
4062.6
4180.536602486764
178.7740777289417
4062.6
1980
4545.600000000001
4656.821670023003
178.6544531237366
4545.600000000001
1981
4889.5
4998.011387140059
178.5706344690318
4891.600000000001
1982
4889.5
4998.011387140059
178.5706344690318
4891.600000000001
1983
5330.5
5423.808265322558
178.4682301138803
5323.399999999999
1984
5985.6
6054.220364030461
178.3211083266242
5962.7
1985
7243.8
7282.306126162203
178.0499504848901
7208.1
1986
9040.700000000001
.0717*******
177.6928063009931
9016
1987
12050.6
12065.37179921504
177.189********16
12058.6
1988
10274.4
10306.76560988973
177.4697052274058
10275.2
1989
12050.6
12065.37179921504
177.189********16
12058.6
1990
15036.8
.0838*******
176.8172394391318
15042.8
1991
17000.9
16930.48077996771
176.6385874540277
16992.3
1992
18718.3
18582.68705461982
176.5261264423878
18667.8
1993
35260
.0857*******
177.4791848854038
35333.9
1994
21826.2
21653.09867943883
176.4182393724463
21781.5
1995
26937.3
26723.61175867555
176.5282689819769
26923.5
1996
35260
.0857*******
177.4791848854038
35333.9
1997
48108.5
47702.24331311228
180.7470770711596
48197.9
1998
59810.5
60122.92955260078
185.9681357044579
60793.7
1999
88479.2
88604.77659126783
204.5612478858191
89677.1
2000
70142.5
70361.48074871261
191.6614042102092
71176.6
2001
104413.7922729122
218.176********98
105709
单个值的预测区间Y2000∈[104413.8-2.07×218.2,104413.8+2.07×218.2]
均值预测区间E(Y2000)∈[104413.8-2.07×218.2,104413.8+2.07×218.2]
第三章多元线性回归模型
2、试对二元线性回归模型Yi=β0+β1X1i+β2X2i+ui,i=1,2,3,……n作回归分析:
(1)求出未知参数β0,β1,β2的最小二乘估计量β^0,β^1,β^2;
(2)求出随机误差项u的方差σ2的无偏估计量;
(3)对样本回归方差拟合优度检验;
(4)对总体回归方程的显著性进行F检验;
(5)对β1,β2的显著性进行t检验;
(6)当X0=(1,X10,X20)时,写出E(Y0/X0)的置信度为95%的预测区间。
答:
(1)由公式
可得出
。
其中
,
,
(2)随机误差项的方差
的无偏差估计量为
(3)求出样本可决系数
R-squared,修正样本可决系数为
=Adjusted-squared,比较
和
值大小关系,即可得出样本回归方差拟合优度。
(4)提出检验的原假设
对立假设为
:
至少有一个
不等于零(
),由题意得F的统计量为F-statistic。
对于给定的显著性水平
;从附录4的表1中,查出分子自由度为
,分母自由度为
的F分布上侧位数
。
由F-statistic与
的值大小关系,可得显著性关系。
(5)提出检验的原假设
,求出t统计量
-statistic。
对于给定的显著性水平
=0.05,;从附录4的表1中,查出t分布的自由度为f的t分布双侧位数
。
比较
-statistic与
值的大小关系,可得检验结果的显著性关系。
(6)E(YO|XO)的预测区间:
(Y0-tα/2(v)•S(Y0),Y0+tα/2(v)•S(Y0));
YO的预测区间:
(Y0-tα/2(v)•S(e0),Y0+tα/2(v)•S(e0)
3、经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关,对18名学生进行调查的统计资料如下表所示(略)。
DependentVariable:
Y
Method:
LeastSquares
Date:
10/29/13Time:
22:
18
Sample:
118
Includedobservations:
18
Variable
Coefficient
Std.Error
t-Statistic
Prob.
X2
0.402289
0.116359
3.457319
0.0035
X1
104.3081
6.409709
16.27345
0.0000
C
-0.962980
30.32507
-0.031755
0.9751
R-squared
0.979722
Meandependentvar
755.1556
AdjustedR-squared
0.977019
S.D.dependentvar
258.6819
S.E.ofregression
39.21512
Akaikeinfocriterion
10.32701
Sumsquaredresid
23067.39
Schwarzcriterion
10.47541
Loglikelihood
-89.94312
Hannan-Quinncriter.
10.34748
F-statistic
362.3656
Durbin-Watsonstat
2.561545
Prob(F-statistic)
0.000000
回归方程Y^=-0.96+104.3X1+0.4X2
(2)检验设原假设H0:
βi=0i=1,2
根据上表中的计算结果知:
S(β^1)=6.409709S(β^2)=0.116359
将S(β^1)和S(β^2)的值代入检验统计量式中,得
T1=β^1÷S(β^1)=16.2735t2=β^2÷S(β^2)=3.4561
对于给定的显著水平α=0.05,自由度为v=15的双侧分位数t0.05/2=2.13。
因为
¯
t1>t0.05/2t2>t0.05/2,所以否定H0:
β1≠0,H0:
β2≠0,即可以认为受教育年限和家庭收入对学生购买书籍以及课外读物有显著性影响。
(3)R2=RSS/TSS=0.979722R2=1-(1-R2)n-1/n-k-1=0.97702
(4)预测区间
obs
Y
YF
YFSE
X2
X1
1
450.5
485.1411747692648
42.173********408
171.2
4
2
507.7
486.3480417901021
42.10363828287697
174.2
4
3
613.9
602.7650101844977
41.60234303786757
204.3
5
4
563.4
504.2499025991888
41.39814289671567
218.7
4
5
501.5
504.5315049040509
41.39212417827067
219.4
4
6
781.5
825.9037819058965
42.97924483690921
240.4
7
7
541.7999999999999
526.2953401798169
41.41179733769013
273.5
4
8
611.1
639.17216531309
40.55748283418582
294.8
5
9
1222.1
1174.953542585611
47.47686324319662
330.2
10
10
793.2
863.1959728497693
40.68970052896574
333.1
7
11
660.8
667.8151426076286
41.63232216941219
366
5
12
792.7
766.0486478880758
40.41271901973422
350.9
6
13
580.9
560.2485323660397
43.30987322087763
357.9
4
14
612.7
664.9991195590084
41.45455915514781
359
5
15
890.8
878.8047863192651
40.55307988286174
371.9
7
16
1121
1112.926047930283
42.49588607436637
435.3
9
17
1094.2
1044.26078466035
43.63918011814712
523.9
8
18
1253
1285.140501588057
46.39915863939679
604.1
10
19
1235.216435826087
44.12507255732823
480
10
单个值的预测区间Y∈[1235.216-2.13×44.125,1235.216+2.13×44.125]
均值的预测区间E(Y)∈[1235.216-2.13×44.125,1235.216+2.13×44.125]
4、假设投资函数模型估计的回归方程为:
It=5.0+0.4Yt+0.6It-1,R2=0.8,DW=2.05,n=24其中It和Yt分别为第t期投资和国民收入
(1)对总体参数ß1,ß2的显著性进行检验(α=0.05)
(2)若总离差平方和TSS=25,试求随机误差项ut方差的估计量
(3)计算F统计量,并对模型总体的显著性进行检验(α=0.05)
答:
(1)首先提出检验的原假设H0:
ß1=0,i=1,2,。
由题意知t的统计量值为t1=4.0,t2=3.2。
对于给定的显著性水平α=0.05,;从附录4的表1中,查出t分布的自由度为v=21的双侧分数位t0.05/2(21)=1.72。
因为t1=4.0>t0.05/2(21)=1.72,所以否定H0,ß1显著不等于零即可以认为第t期投资对国民收入有显著影响;t2=3.2>t0.05/2(21)=1.72。
所以否定H0,ß2显著不等于零即可以认为第t期投资对第t-1期投资有显著影响。
(2)R2=RSS=R2×TSS=0.8×25=20.ut的方差估计量为: