应用回归实验报告文档格式.docx
《应用回归实验报告文档格式.docx》由会员分享,可在线阅读,更多相关《应用回归实验报告文档格式.docx(24页珍藏版)》请在冰豆网上搜索。
a.因变量:
y
由该系数表得出最小二乘估计的回归方程为:
(4)求回归标准误差;
模型汇总
R
R方
调整R方
标准估计的误差
.949a
.900
.888
.48002
a.预测变量:
(常量),x。
由上表得回归标准误差为:
=0.48002
(5)给出
与
的置信度为95%的区间估计;
B的95.0%置信区间
下限
上限
-.701
.937
.003
.005
由上表得:
得置信区间为:
(-0.701,0.0937);
(0.003,0.005);
(6)计算x与y的决定系数;
由(4)得模型汇总表得:
=0.900,从相对水平上来看,回归方程能够减少因变量y得99.0%得方差波动。
(7)对回归方程做方差分析;
由SPSS得方差表:
Anovab
平方和
df
均方
F
回归
16.682
72.396
.000a
残差
1.843
.230
总计
18.525
b.因变量:
由方差分析表中看到,F=72.396,Sig=0.000,说明y对x得线性回归高度显著。
(8)做回归系数β1显著性的检验;
从(5)中得系数表中可得:
回归系数β1检验的t值=8.509,显著性Sig=0.000,与F检验的检验结果一致。
(9)做相关系数的显著性检验;
从(4)的模型汇总表可得:
r=0.949,说明y与x有显著的线性关系,与F检验和回归系数检验的结果一致。
也说明对于一元线性回归三种检验的结果是完全一致的;
(10)对回归方程作残差图并作相应的分析;
残差图:
从残差图上看出,残差是围绕e=0随机扰动,从而模型的基本假定是满足的。
(11)该公司预计下一周签发新保单
=1000张,需要的加班时间是多少?
由SPSS得下表:
y
PRE
LICI
UICI
LMCI
UMCI
3.07586
1.91329
4.23844
2.72051
3.43122
0.88893
-0.38791
2.16577
0.25253
1.52534
3.95422
2.75531
5.15314
3.49369
4.41475
2.08995
0.91086
3.26905
1.6838
2.49611
1.83899
0.64613
3.03185
1.39446
2.28353
3.41645
2.24538
4.58752
3.03422
3.79868
4.95806
3.66413
6.25199
4.28802
5.62809
1.2833
0.04712
2.51947
0.733
1.83359
2.52017
1.35577
3.68457
2.15889
2.88145
4.47406
3.23246
5.71567
3.91169
5.03644
1000
3.70326
2.51949
4.88703
3.28373
4.12279
从表中得出加班时间:
(12)给出
的置信水平为95%的精确预测区间和近似预测区间。
从(10)表可以得出
置信水平为95%的精确预测区间为(3.28373,4.12279),近似预测区间为
即(2.74332,3.70326)。
(13)给出E(
)置信水平为95%的区间估计。
从(11)表中得E(
)置信水平为95%的区间估计为:
(2.51949,4.88703)。
2.16表2.8是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元)。
(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?
(2)建立y对x的线性回归;
(3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。
(4)通过p-p图或q-q,若有异常点剔出后再分析。
表2.8
序号
19583
3346
18
20816
3059
35
19538
2642
20263
3114
19
18095
2967
36
20460
3124
20325
3554
20
20939
3285
37
21419
2752
26800
4542
21
22644
3914
38
25106
3429
29470
4669
22
24624
4517
39
22482
3947
26610
4888
23
27186
4349
40
20969
2509
30678
5710
24
33990
5020
41
27224
5440
27170
5536
25
23382
3594
42
25892
4042
25853
4168
26
20627
2821
43
3402
24500
3547
27
22795
3366
44
24640
2829
11
24274
3159
28
21570
2920
45
22341
2297
12
27140
3621
29
22080
2980
46
25610
2932
13
30168
3782
30
22250
3731
47
26015
3705
14
26525
4247
31
20940
2853
48
25788
4123
15
27360
3982
32
21800
2533
49
29132
3608
16
21690
3568
33
22934
2729
50
41480
8349
17
21974
3155
34
18443
2305
51
25845
3766
解:
(1)
由图看出x与y大致呈直线关系;
(2):
12109.879
1196.948
10.117
3.314
.312
.835
10.630
回归方程为:
(3)
由标准残差的直方图和正态概率图可以看出,误差项通过了正态性假设。
(4)
DRE
ZRE
SRE
-3696.68
-1.55754
-1.5748
-2224.35
-0.93347
-0.9457
-3636.03
-1.53486
-1.55042
-375.051
-0.15628
-0.15889
1958.184
0.81246
0.8278
-1780.17
-0.73204
-0.7492
-392.213
-0.15325
-0.1609
-3575.91
-1.41585
-1.47673
-72.0447
-0.0303
-0.03066
647.7138
0.27341
0.27618
1737.722
0.72993
0.73915
3090.409
1.30489
1.31794
5635.198
2.37929
2.40314
348.5929
0.14638
0.14825
2097.342
0.88432
0.8938
-2290.41
-0.96691
-0.97667
-607.181
-0.25503
-0.25826
-1471.5
-0.61677
-0.62523
-3963.59
-1.65744
-1.68214
-2105.59
-0.8864
-0.89661
-2488.5
-1.04991
-1.06083
-2536.66
-1.05785
-1.07509
681.4174
0.28548
0.28947
5526.425
2.25829
2.31852
-651.909
-0.27524
-0.278
-860.884
-0.35843
-0.36456
-480.739
-0.2026
-0.20482
-224.075
-0.09358
-0.09503
96.67974
0.04044
0.04104
-2269.6
-0.95838
-0.96793
-646.131
-0.26929
-0.27376
1354.868
0.55793
0.57061
1847.029
0.76658
0.78094
-1381.23
-0.56254
-0.57851
-1382.66
-0.57197
-0.58364
-2055.73
-0.86289
-0.8741
195.4905
0.0812
0.08269
1666.631
0.70287
0.71033
-2766.33
-1.1668
-1.1791
569.472
0.23426
0.23971
-3149.78
-1.25555
-1.30514
394.8458
0.16637
0.16821
-756.692
-0.31903
-0.32246
3262.392
1.35865
1.38173
2770.396
1.12784
1.1601
3900.366
1.62942
1.65451
1658.646
0.70041
0.70738
14.12031
0.00594
0.00601
5166.6
2.18145
2.20331
2883.048
0.73228
0.9536
1279.154
0.54011
0.54551
由标准化残差可以看出无异常点。
3.11研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。
数据见表3.9.
表3.9
货运总量y(万吨)
工业总产值x1亿元
农业总产值x1亿元
居民非商品之处x3(亿元)
160
70
1.0
260
75
2.4
210
65
2.0
265
74
3.0
240
72
1.2
220
68
275
78
4.0
66
3.2
250
(1)计算出y,x1,x2,x3的相关系数矩阵;
由SPSS软件得:
相关性
x1
x2
x3
Pearson相关性
.556
.731*
.724*
显著性(双侧)
.095
.016
.018
N
.113
.398
.756
.254
.547
.101
*.在0.05水平(双侧)上显著相关。
所以y,x1,x2,x3的相关系数矩阵为:
(2)求y关于x1,x2,x3的三元线性回归方程;
-348.280
176.459
-1.974
.096
-780.060
83.500
3.754
1.933
.385
1.942
.100
-.977
8.485
7.101
2.880
.535
2.465
.049
.053
14.149
12.447
10.569
.277
1.178
.284
-13.415
38.310
由上表可得:
=3.754x1+7.101x2+12.447x3-348.280
⑶对所求得的方程作拟合优度检验;
模型汇总b
.898a
.806
.708
23.442
(常量),x3,x1,x2。
复相关系数R=0.806,决定系数R方=0.898,由决定系数看回归方程显著相关。
(4)对回归方程作显著性检验;
13655.370
4551.790
8.283
.015a
3297.130
549.522
16952.500
方差分析表,F=8.283,P=0.015,表明回归方程显著相关,说明x1,x2,x3整体上对y有显著的线性影响。
(5)对每一个回归系数作显著性检验;
由上表数据可知:
自变量x1,x2,x3对应P值为P1=0.100,P2=0.049,P3=0.284,从定性分析看,x2通过了显著性检验,x3的P值最大,明显未通过显著性检验,说明x3居民非商品支出对货运总量的影响是最小的。
(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验。
将x3剔除后,用y与x1,x2作回归,计算结果如图:
.872a
.761
.692
24.081
(常量),x2,x1。
12893.199
6446.600
11.117
.007a
4059.301
579.900
-459.624
153.058
-3.003
.020
-821.547
-97.700
4.676
1.816
.479
2.575
.037
.381
8.970
8.971
2.468
.676
3.634
.008
3.134
14.808
剔除x3后的回归方程为:
=4.676x1+8.971x2-459.624
回归方程的显著性检验:
此时的F=11.117,P=0.007,表明回归方程高度显著,说明x1,x2整体上对y有高度的线性影响。
回归系数的显著性检验:
剔除x3后,其余自变量的显著性都发生了不同程度的变化,这是由于自变量之间的相关性造成的,此时P1=0.037,P2=0.008,说明自变量都已显著,都通过了显著性检验。
⑺求出每一个回归系数的置信水平为95%的置信区间;
β1置信区间为(0.381,8.970)
β2的置信区间为(3.134,14.808)
⑻求标准化回归方程;
⑼求当
=75,
=42,
=3.1时的
,给定置信水平为95%,用spss软件计算精确置信区间,用手工计算近似预测区间。
居民非商品支出x3(亿元)
181.6541
114.1804
249.1279
249.8871
186.7191
313.0551
203.1308
139.2701
266.9915
263.1534
200.9208
325.3859
217.9183
155.9556
279.8809
262.0125
195.3407
328.6842
281.8559
213.4631
350.2487
171.9226
105.138
238.7071
262.3928
199.0204
325.7651
221.0727
156.1113
286.0341
3.1
267.829
204.4355
331.2225
从上面的数据可知:
,精确置信区间为(204.4355,331.2225),由前面问题6的表得;
手工计算进似预测区间为即(219.667,315.991)
⑽结合回归方程对问题做一些基本分析。
回归方程:
从这个回归方程