计量经济学实际案例.docx
《计量经济学实际案例.docx》由会员分享,可在线阅读,更多相关《计量经济学实际案例.docx(28页珍藏版)》请在冰豆网上搜索。
![计量经济学实际案例.docx](https://file1.bdocx.com/fileroot1/2022-12/12/81dea5e6-86e8-4f32-b72a-cf9a8c962085/81dea5e6-86e8-4f32-b72a-cf9a8c9620851.gif)
计量经济学实际案例
一、初步的统计分析
性别
身高
体重
性别
身高
体重
女
有效的N
41
41
男
有效的N
32
32
均值
163.5610
52.4634
均值
175.2813
65.7969
中值
164.0000
53.0000
中值
174.5000
65.0000
标准差
5.21560
4.96033
标准差
5.69796
7.56356
方差
27.202
24.605
方差
32.467
57.207
偏度
.664
-.184
偏度
.404
.153
峰度
1.478
.720
峰度
-.334
.170
以下两幅图反映了全体学生的身高体重的频率分布,我们可以发现本班上的全体学生的身高体重大致服从正态分布。
二、均值分析
1、分性别对身高进行的比较
假设男女身高相等,否定假设可认为男生身高明显高于女生。
2、分南北地区进行比较
(1)身高
假设两者均值相等,检验结果不能否定原假设,因而不能认为南北方身高有显著差异。
(2)体重
通过假设两者均值相等,检验结果无法否定原假设,因而认为南北方体重没有明显差异。
3、分出生年份月份进行比较
年份
性别
身高
体重
84
男
均值
172.00
56.00
N
1
1
总计
均值
172.00
56.00
N
1
1
85
男
均值
180.33
70.67
N
3
3
女
均值
161.00
51.00
N
2
2
总计
均值
172.60
62.80
N
5
5
86
男
均值
174.20
65.40
N
20
20
女
均值
162.11
52.28
N
18
18
总计
均值
168.47
59.18
N
38
38
87
男
均值
178.50
66.58
N
6
6
女
均值
164.83
52.83
N
18
18
总计
均值
168.25
56.27
N
24
24
88
男
均值
170.50
65.00
N
2
2
女
均值
167.00
53.50
N
2
2
总计
均值
168.75
59.25
N
4
4
89
女
均值
165.00
50.00
N
1
1
总计
均值
165.00
50.00
N
1
1
总计
男
均值
175.28
65.80
N
32
32
女
均值
163.56
52.46
N
41
41
总计
均值
168.70
58.31
N
73
73
ANOVA表
平方和
df
均方
F
显著性
身高*年份
组间
(组合)
107.446
5
21.489
.323
.897
组内
4455.924
67
66.506
总计
4563.370
72
体重*年份
组间
(组合)
307.565
5
61.513
.730
.603
组内
5645.250
67
84.257
总计
5952.815
72
由表可看出,各年份出生的人身高体重无显著性差异。
月份
性别
身高
体重
1
男
均值
177.00
65.00
N
2
2
女
均值
162.40
51.40
N
5
5
总计
均值
166.57
55.29
N
7
7
2
男
均值
176.00
73.33
N
3
3
女
均值
166.00
54.67
N
3
3
总计
均值
171.00
64.00
N
6
6
3
男
均值
174.50
69.50
N
4
4
女
均值
160.25
50.75
N
4
4
总计
均值
167.38
60.13
N
8
8
4
男
均值
181.25
68.50
N
4
4
女
均值
162.25
52.00
N
4
4
总计
均值
171.75
60.25
N
8
8
5
男
均值
169.50
65.25
N
2
2
女
均值
156.00
43.00
N
1
1
总计
均值
165.00
57.83
N
3
3
6
男
均值
175.00
63.00
N
1
1
女
均值
171.50
57.50
N
4
4
总计
均值
172.20
58.60
N
5
5
7
男
均值
171.00
64.33
N
3
3
女
均值
167.00
50.50
N
2
2
总计
均值
169.40
58.80
N
5
5
8
男
均值
179.20
64.90
N
5
5
女
均值
161.50
52.50
N
2
2
总计
均值
174.14
61.36
N
7
7
9
男
均值
171.67
58.00
N
3
3
女
均值
163.33
54.33
N
3
3
总计
均值
167.50
56.17
N
6
6
10
男
均值
174.67
61.83
N
3
3
总计
均值
174.67
61.83
N
3
3
11
女
均值
162.50
51.67
N
12
12
总计
均值
162.50
51.67
N
12
12
12
男
均值
171.00
66.50
N
2
2
女
均值
167.00
57.00
N
1
1
总计
均值
169.67
63.33
N
3
3
总计
男
均值
175.28
65.80
N
32
32
女
均值
163.56
52.46
N
41
41
总计
均值
168.70
58.31
N
73
73
ANOVA表
平方和
df
均方
F
显著性
身高*月份
组间
(组合)
1043.590
11
94.872
1.644
.109
组内
3519.780
61
57.701
总计
4563.370
72
体重*月份
组间
(组合)
1052.154
11
95.650
1.191
.313
组内
4900.661
61
80.339
总计
5952.815
72
由表同样可得出,各月出生的人身高体重无显著性差异。
三、回归分析
全班数据散点图情况如下:
1、未去奇异点
回归方程为:
Y=0.882X-90.461
2、去奇异点
输入/移去的变量(b)
模型
输入的变量
移去的变量
方法
1
身高(a)
.
输入
a已输入所有请求的变量。
b因变量:
体重
模型摘要(b)
模型
R
R方
调整的R方
估计的标准差
1
.808(a)
.653
.648
5.121
a预测变量:
(常量),身高。
b因变量:
体重
ANOVA(b)
模型
平方和
df
均方
F
显著性
1
回归
3447.990
1
3447.990
131.489
.000(a)
残差
1835.590
70
26.223
合计
5283.580
71
a预测变量:
(常量),身高。
b因变量:
体重
系数(a)
模型
非标准化系数
标准化系数
t
显著性
B的95%置信区间
B
标准误
Beta
下限
上限
1
(常量)
-88.747
12.807
-6.929
.000
-114.291
-63.203
身高
.870
.076
.808
11.467
.000
.718
1.021
a因变量:
体重
残差统计量(a)
极小值
极大值
均值
标准差
N
预测值
45.20
74.77
57.95
6.969
72
残差
-13.569
14.628
.000
5.085
72
标准预测值
-1.831
2.413
.000
1.000
72
标准残差
-2.650
2.857
.000
.993
72
a因变量:
体重
由散点图观察,身高与体重之间有比较明显的线性关系。
并且剔除序号37奇异点,得到改进的线性回归方程。
Y=0.870*X-88.747
3、分性别回归分析
(1)男生
先检验此样本数据是否满足一元线性回归模型的基本假设
a、干扰项零均值和同方差性
从图中我们可以看出对所有i,εi基本满足正态分布N(0,
)
b、无自相关性
利用SPSS软件计算出Durbin-Watson检验值为2.220,非常接近2,说明εi之间基本无自相关
现我们用最小二乘法估计该模型的系数:
记总体回归α+βxi的估计为:
ŷi=a+bxi
通过最小二乘估计,得
运用该样本数据,经计算,我们最后可以得到:
a=-20.641b=0.493
现在我们对模型进行检验
SST=1773.430
SSE=1528.671
SSR=244.758
R2=SSR/SST=0.138
调整的R2=0.109
说明拟合度并不是很好,也许随着样本的增大,拟合度将会变得理想。
我们现在对参数β进行检验
假设H0:
β=0H1:
β≠0
构造F统计量得到方差分析表
ANOVA(b)
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
244.758
1
244.758
4.803
.036(a)
Residual
1528.671
30
50.956
Total
1773.430
31
aPredictors:
(Constant),身高
bDependentVariable:
体重
从表中,我们可以看出显著性小于0.05,故否定原假设,故认为β不为0
于是我们给出模型:
Y=-20.641+0.493x
对α,β的区间估计(取置信度为0.95)
=
得到β的双侧置信区间:
0.034≤β≤0.953
由此可以得到α双侧置信区间:
-101.228≤α≤59.946
对σ2的点估计为
s2=∑ie2i/(n-2)=49.308
同前面一样,得到σ2的95%的置信区间:
≤σ2≤
于是31.889≤σ2≤78.610
接着,我们就可以做预测了
得到置信区间(置信度为0.95):
有一个同学身高为175cm,则根据我们的推断,其体重应该在(51.109,80.159)(单位:
KG),期望值为65.634KG,而这位同学的真实体重为63KG,属于中等偏瘦型。
(2)女生
同上,可以得到女生的身高和体重之间大致存在着以下的线性关系:
Y=-55.667+0.661x
对α,β的区间估计(取置信度为0.95)
=
得到β的双侧置信区间:
0.440≤β≤0.883
由此可以得到α双侧置信区间:
-91.905≤α≤-19.429
对σ2的点估计为
s2=∑ie2i/(n-2)=12.716
同前面一样,得到σ2的95%的置信区间:
≤σ2≤
于是10.023≤σ2≤24.707
接着,我们就可以做预测了
得到置信区间(置信度为0.95):
有一个同学身高为160cm,则根据我们的推断,其体重应该在(42.700,57.486)(单位:
KG),期望值为50.093KG,而这位同学的真实体重为49KG,属于中等偏瘦型。
四、对回归分析方法的比较
1、利用本科生男女生身高体重的相关数据资料,分别作了以下估计:
(1)分别估计男生和女生的模型
,结果如下(RSS为残差平方和):
男生:
RSS=867.5619
女生:
RSS=562.3358
(2)将男生和女生的数据合并成一个大样本,估计
,结果如下:
RSS=1842.836
(3)估计变截距固定效应模型,结果如下(D=0为男生,D=1为女生):
RSS=1558.651
下面对三种估计方法的比较分析
设S1为第一种估计方法下两个模型的残差平方和RSS之和,
S2为第二种估计方法下的残差平均和RSS,
S3为第三种估计方法下的残差平均和RSS。
S1=867.5619+562.3358=1429.898; S2=1842.836; S3=1558.651
作两项约束条件检验:
(1)第二种估计方法与第一种估计方法的本质差异在于:
对模型
施加约束“截距和斜率在男生和女生之间无差异”假设,检验过程:
>F0.05(2,69)
从而拒绝“截距和斜率在男生和女生之间无差异”假设,即首先放弃第二种估计方式的结果,并进一步作以下检验。
(2)第一种估计方式与第三种估计方式的本质差异在于:
对模型
施加约束“斜率在男生和女生之间相同,但截距不同”假设,检验过程:
>F0.05(1,69)
从而拒绝“斜率在男生和女生间相同,但截距不同”假设,即放弃第三种估计方式的结果,说明男生和女生之间,身高和体重的关系,无论在均值水平上还是变动率上都存在显著差异。
从而认为,对本科男女生身高体重关系的回归应采用估计方法
(1)。
2、利用本科生和研究生男女生(研修班数据)身高体重的相关数据资料,分别作了以下估计:
(1)分别估计本科男生、研究男生和本科女生、研究女生的模型
,结果如下(RSS为残差平方和):
本科男生:
RSS=867.5619
研究男生:
RSS=631.1248
本科女生:
RSS=562.3358
研究女生:
RSS=257.9198
(2)将本科男生和研究男生的数据合并成一个大样本,本科女生和研究女生的数据合并成一个大样本,估计
,结果如下:
男生:
RSS=1715.577
女生:
RSS=925.5335
(3)估计变截距固定效应模型,结果如下(D=0为本科生,D=1为研究生):
男生:
RSS=1499
女生:
RSS=889.9618
下面对三种估计方法的比较分析
设S11,S12为第一种估计方法下男生和女生分别的残差平方和RSS之和,
S21,S22为第二种估计方法下男生和女生分别的残差平均和RSS,
S31,S32为第三种估计方法下男生和女生分别的残差平均和RSS。
S11=867.5619+631.1248=1498.687; S12=562.3358+257.9198=820.2557;
S21=1715.577;S22=925.5335;S31=1499;S32=889.9618
对男生作两项约束条件检验:
(1)第二种估计方法与第一种估计方法的本质差异在于:
对模型
施加约束“截距和斜率在本科男生和研究男生之间无差异”假设,检验过程:
>F0.05(2,61)
从而拒绝“截距和斜率在本科男生和研究男生之间无差异”假设,即首先放弃第二种估计方式的结果,并进一步作以下检验。
(2)第一种估计方式与第三种估计方式的本质差异在于:
对模型
施加约束“斜率在本科男生和研究男生之间相同,但截距不同”假设,检验过程:
从而接受“斜率在男生和女生之间相同,但截距不同”假设,即接受第三种估计方式的结果。
由上述比较,从而认为,对本科男生和研究男生身高体重关系的回归应采用估计方法(3)。
对女生作两项约束条件检验:
(1)第二种估计方法与第一种估计方法的本质差异在于:
对模型
施加约束“截距和斜率在本科女生和研究女生之间无差异”假设,检验过程:
>F0.05(2,64)
从而拒绝“截距和斜率在本科女生和研究女生之间无差异”假设,即首先放弃第二种估计方式的结果,并进一步作以下检验。
(2)第一种估计方式与第三种估计方式的本质差异在于:
对模型
施加约束“斜率在本科女生和研究女生之间相同,但截距不同”假设,检验过程:
>F0.05(1,64)
从而拒绝“斜率在男生和女生之间相同,但截距不同”假设,即拒绝第三种估计方式的结果。
由上述比较,从而认为,对本科女生和研究女生身高体重关系的回归应采用估计方法
(1)。
数据来源:
本课程73同学的身高和体重数据
序号
性别
出生年月
籍贯
身高(cm)
体重(kg)
1
1
1987.08.27
扬州
187
75
2
1
1986.10.10
大连
168
50
3
1
1986.07.22
杭州
167
62
4
1
1986.09.03
新疆
171
56
5
1
1986.08.26
蜀汉
174
58
6
1
1986.05.27
三晋
168
72
7
1
1987.05.27
金华
171
59
8
1
1987.04.28
温州
181
68
9
1
1985.02.13
江苏
182
80
10
1
1988.02.27
浙江
170
70
11
1
1986.07.05
安徽
170
63
12
2
1988.7
杭州
165
51
13
1
1987.6
南京
175
63
14
1
1986.8
杭州
178
53
15
2
1987.2
杭州
165
53
16
2
1986.4
吉林
165
57
17
2
1987.12
山东
167
57
18
2
1986.8
长春
164
52
19
2
1987.3
湖南
158
52
20
2
1986.1
山西
164
56
21
2
1987.4
天津
157
45
22
2
1986.11
宁波
162
52
23
1
1986.1.6
吉林
173
65
24
1
1986.4.21
大连
176
70
25
2
1986.2.21
山西
165
55
26
1
1986.4.2
吉林
188
75
27
2
1986.11.11
杭州
170
58
28
2
1986.11.14
上海
166
50
29
2
1987.6.21
河南
175
63
30
2
1987.4.26
温州
168
52
31
1
1988.3.7
湖南衡阳
171
60
32
2
1986.11.18
杭州
160
49
33
2
1987.1.15
青岛
166
55
34
1
1987.2.20
绍兴
176
70
35
1
1985.3.15
海宁
182
62
36
2
1986.11.10
西安
160
47
37
2
1985.6.16
四川
163
49
38
2
1986.1.2
山西
154
40
39
1
1986.8.14
济南
174
69
40
1
1986.4.1
吉林
180
61
41
1
1987.1.18
重庆
181
65
42
2
1986.11.24
成都
160
43
43
1
1984.9.6
扬州
172
56
44
2
1986.11.6
浙江
155
53
45
2
1987.3.16
河北
156
50
46
1
1986.12.10
浙江
165
63
47
1
1985.12.19
湖北
177
70
48
1
1986.3.16
安徽
171
84
49
2
1986.11.22
浙江
162
60
50
2
1985.8.23
黑龙江
159
53
51
2
1987.7.1
浙江
169
50
52
1
1986.10.13
北京
177
65
53
2
1987.5.4
福建
156
43
54
1
1986.10.21
广东
179
71
55
1
1986.8.19
成都
183
70
56
2
1989.11.22
江苏
165
50
57
2
1987.9.3
吉林
159
50
58
2
1987.2.26
吉林
168
56
59
2
1986.4.17
辽宁
159
54
60
1
1986.3.27
吉林
174
72
61
1
1986.7.21
湖北
176
68
62
2
1987.1.3
山西太原
165
51
63
2
1986.11
陕西
165
53
64
2
1986.11.11
山西太原
160
53
65
2
1987.3.11
浙江宁波
161
46
66
2
1987.1.25
浙江
163
55
67
2
1986.9.26
上海
162
57
68
2
1986.11.25
浙江
165
52
69
2
1987.6.13
福建福州
180
64
70
2
1987.6.20
合肥
168
54
71
2
1987.3.24
黑龙江
166
55
72
2
1988.9.1
浙江
169
56
73
1
1986.9.3
浙江
172
62
研修