第三章多元线性回归模型StataWord文件下载.docx
《第三章多元线性回归模型StataWord文件下载.docx》由会员分享,可在线阅读,更多相关《第三章多元线性回归模型StataWord文件下载.docx(15页珍藏版)》请在冰豆网上搜索。
1510.2
1999
533.88
5854
1991
96.04
1700.6
2000
625.33
6280
1992
118.2
2026.6
2001
770.78
6859.6
1993
155.77
2577.4
2002
968.98
7702.8
下图是关于
和
的散点图:
(如何解释?
)
2.稳定性检验(邹氏稳定性检验)
以表6.1为例,在用1985—1999年数据建立的模型基础上,检验当把2000—2002年数据加入样本后,模型的回归参数时候出现显著性变化。
*用F-test作chow间断点检验检验模型稳定性
*chow检验的零假设:
无结构变化,小概率发生结果变化
*估计前阶段模型
*估计后阶段模型
*整个区间上的估计结果保存为All
*用F检验检验结构没有发生变化的约束
*计算和显示F检验统计量公式,零假设:
无结构变化
然后disf_test
则得到结果;
*F统计量的临界概率
然后得到结果
*F统计量的临界值
二、似然比(LR)检验
有中国国债发行总量(
,亿元)模型如下:
其中
表示国内生产总值(百亿元),
表示年财政赤字额(亿元),
表示年还本付息额(亿元)。
1980—2001年数据见表6.2。
表6.2国债发行总量
、
、财政赤字额
、年还本付息额(
数据
1980
43.01
45.178
68.9
28.58
461.4
216.178
237.14
246.8
1981
121.74
48.624
-37.38
62.89
669.68
266.381
258.83
438.57
1982
83.86
52.947
17.65
55.52
739.22
346.344
293.35
336.22
1983
79.41
59.345
42.57
42.47
1175.25
467.594
574.52
499.36
1984
77.34
71.71
58.16
28.9
1549.76
584.781
581.52
882.96
89.85
89.644
-0.57
39.56
1967.28
678.846
529.56
1355.03
138.25
102.022
82.9
50.17
2476.82
744.626
582.42
1918.37
223.55
119.625
62.83
79.83
3310.93
783.452
922.23
2352.92
270.78
149.283
133.97
76.76
3715.03
820.6746
1743.59
1910.53
407.97
169.092
158.88
72.37
4180.1
894.422
2491.27
1579.82
375.45
185.479
146.49
190.07
4604
959.333
2516.54
2007.73
对以上数据进行回归分析:
得到以下结果:
对应的回归表达式为:
(0.2)(2.2)(31.5)(17.8)
现在用似然比(LR)统计量检验约束
对应的回归系数
等于零是否成立。
(现在不会)
三、Wald检验(以表6.2为例进行Wald检验,对输出结果进行检验。
检验过程如下:
1.已知数据如表3.2
Y
X1
X2
1
10
3
2
9
8
5
15
4
28
-6
(1)先根据表中数据估计以下回归模型的方程:
(2)回答下列问题:
吗?
为什么?
对上述3个方程进行回归分析,结果分别如下:
得到结果如下:
从上述回归结果可知:
,
。
二元回归与分别对
与
所作的一元回归,其对应的参数估计不相等,主要原因在于
有很强的相关性。
其相关分析结果如下:
可见,两者的相关系数为0.9679。
3.表3.3列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X,鸡肉价格P1,猪肉价格P2与牛肉价格P3的相关数据。
Y/千克
X/元
P1/(元/千克)
P2/(元/千克)
P3/(元/千克)
2.78
397
4.22
5.07
7.83
4.18
911
3.97
7.91
11.40
2.99
413
3.81
5.20
7.92
4.04
931
5.21
9.54
12.41
2.98
439
4.03
5.40
4.07
1021
4.89
9.42
12.76
3.08
459
3.95
5.53
4.01
1165
5.83
12.35
14.29
3.12
492
3.73
5.47
7.74
4.27
1349
5.79
12.99
14.36
3.33
528
6.37
8.02
4.41
1449
5.67
11.76
13.92
3.56
560
3.93
6.98
8.04
4.67
1575
13.09
16.55
3.64
624
3.78
6.59
8.39
5.06
1759
6.16
12.98
20.33
3.67
666
3.84
6.45
8.55
5.01
5.89
12.80
21.96
717
7.00
9.37
5.17
2258
6.64
14.10
22.16
768
3.86
7.32
10.61
5.29
2478
7.04
16.82
23.26
843
3.98
6.78
10.48
(1)求出该地区关于家庭鸡肉消费需求的如下模型:
(2)请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。
先做回归分析,过程如下:
依次生成变量lnvar2lnvar3lnvar4lnvar5lnvar6
回归结果如下:
所以,回归方程为:
(-2.463)(4.182)(-4.569)(1.483)(0.873)
由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显著。
(AIC和SC准则不会算)
去掉猪肉价格P2与牛肉价格P3重新进行回归分析。
得出结果如下:
2.某硫酸厂生产的硫酸的透明度指标一直达不到优质要求,经分析透明度低与硫酸中金属杂质的含量太高有关。
影响透明度的主要金属杂质是铁、钙、铅、镁等。
通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。
测量了47组样本值,数据见表3.4。
表3.4硫酸透明度y与铁杂质含量x数据
序数
X
31
190
25
60
50
32
26
41
34
180
27
61
52
35
140
63
36
150
29
64
40
6
37
120
30
65
7
39
110
69
81
74
20
42
100
33
80
76
11
43
79
12
85
13
48
68
87
16
14
49
38
89
99
70
17
18
53
19
54
44
21
56
45
122
22
46
154
23
58
47
210
24
硫酸透明度与铁杂质含量的散点图如下:
所以应该建立非线性回归模型。
1.通过线性化的方式估计非线性模型。
生成变量:
(1)建立倒数模型:
所以倒数表达式为:
Y=0.069–2.37X
(2)建立指数函数
生成新变量:
建立指数模型:
所以指数表达式为:
lnvar3=1.99+104.5X
可决系数也由0.76提高到0.91,可见拟合为指数函数比倒数函数更好。
2.直接估计非线性回归模型
(不会,也不明白为什么直接估计比对数线性化后的结果要好==)