异方差案例分析.docx
《异方差案例分析.docx》由会员分享,可在线阅读,更多相关《异方差案例分析.docx(13页珍藏版)》请在冰豆网上搜索。
异方差案例分析
异方差案例分析
中国农村居民人均消费支出主要由人均纯收入來决定。
农村人均纯收入除从事农业经营收入外,还包括从事其他产业经营性收入以及工资性收入、财产收入和转移支付收入等。
为了考察从事农业经营收入和其他收入对中国农村居民消费支出增长影响,可使用如下双对数模型:
InY=0o+0iInX1+02InX2+“
其中,Y表示农村家庭人均消费支出,X】表示从事农业经营收入,X:
表示其他收入。
下表列出了中国2001年各地区农村居民家庭人均纯收入及消费支出相关数据。
中国2001年各地区农村居民家庭人均纯收入及消费支出
单位:
元
地区
人均消
费支出
Y
从事农
地区
人均消
费支出
Y
从事农
业经营
收入XI
其他收
入X2
业经营
收入XI
其他收
入X2
北京
3552.1
579.1
4446.4
湖北
1649.2
1352
1000.1
天津
2050.9
1314.6
2633.1
湖南
1990.3
908.2
1391.3
河北
1429.8
928.8
1674.8
广东
2703.36
1242.9
2526.9
山西
1221.6
609.8
1346.2
广西
1550.62
1068.8
875.6
内蒙古
1554.6
1492.8
480.5
海南
1357.43
1386.7
839.8
辽宁
1786.3
1254.3
1303.6
重庆
1475.16
883.2
1088
吉林
1661.7
1634.6
547.6
四川
1497.52
919.3
1067.7
黑龙江
1604.5
1684.1
596.2
贵州
1098.39
764
647.8
上海
4753.2
652.5
5218.4
云南
1336.25
889.4
644.3
江苏
2374.7
1177.6
2607.2
西藏
1123.71
589.6
814.4
浙江
3479.2
985.8
3596.6
陕西
1331.03
614.8
876
安徽
1412.4
1013.1
1006.9
甘肃
1127.37
621.6
887
福建
2503.1
1053
2327.7
青海
1330.45
803.8
753.5
江西
1720
1027.8
1203.8
宁夏
1388.79
859.6
963.4
山东
1905
1293
1511.6
新疆
1350.23
1300.1
410.3
河南
1375.6
1083.8
1014.1
资料来源:
《中国农村住户调查年鉴》(2002)、《中国统计年鉴》(2002)。
我们不妨假设该线性回归模型满足基本假定,采用0LS估计法,估计结果如下:
lnr=1.655+O.31661nXi+0.5084InX2
(1.87)(3.02)(10.04)
R=0・7831‘二0・7676D.W.二1.89F二50.53RSS二0・8232
OEquation:
UN1TTLEDWorkfile:
UNTITLED:
:
Untitled\[HDOICHI[Vies'||PrQc||Obj£C.t||P「int||Neme:
|[Fre:
ezg]
DependentVariable:
LOG(Y)
Method:
LeastSquares
Date:
06/02/09Time:
20:
58
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
^Statistic
Prob.
C
1.654822
0.886268
1.867180
0.0724-
LOG(X1)
0.316559
0.104700
3.023483
0.0053
LOG(X2)
0.508388
0.050615
10.04428
0.0000
R-squared
0.783059
【Weandependentvar
7.440815
AdjustedR-squared
0.767563
S.D.dependenWar
0.355636
S.E.ofregression
0.171458
AkaiKeinfocriterion
-0.597189
Sumsquaredresid
0.823141
Schwarz,criterion
-0.458416
Loglikelihood
12.25643
Hannan-Quinncriter.
-0.551953
F-statistic
50.53365
Durbin-Watsonsiat
1.890547
Prob(F-statistic)
0.000000
估计结果显示,其他收入而不是从事农业经营收入增长,对农户消费支出增长更具有刺激作用。
下面对该模型进行异方差性检验。
1・图ZK法。
首先做出Y及X】、X2散点图,如下:
图2
可见X1基本在其均值附近上下波动,而X1散点存在较为明显增大趋势。
再做残差平方项及lnXi、lnX2散点图:
可见图1中离群点相对较少而图2呈现较为明显单调递增异方差性。
故初步判断异方
差性主要是X2引起。
2.G-Q检验
根据上述分析,首先将原始数据按X2升序排序,去掉中间7个数据,得到两个容量为
12子样本,记数据较小样本为子样本1,数据较大为子样本2。
对子样本1进行OLS
回归,结果如下:
□Equation:
UNTITLEDJA/orkfih:
UNELED;;Untitled\百11回II禹
[View][Prod|Object|〔PrintJ|Name]|Free2e:
][Estimate][Forerast]|Stats『Resids]
DependentVariable:
LOG(Y)
Method:
LeastSquares
Date:
06/02/09Time:
21:
35
Sample:
112
Includedobservations:
12
VariableCoefficientStd.Errort-StatisticProb.
C
4.060660
1.2753163.184042
0.0111
LOG(X1)
0.343472
0.0831034.133090
0.0025
LOG(X2)
0.119658
0.1277860.936396
0.3-735
R-squared
0.706831
Meandependentvar
7.212597
AdjustedR-squared
0.641682
S.D.dependentvar
0.U1759
S.E.ofregression
0.084857
Akaikeinfocriterion
-1.883390
Sumsquaredresid
0.064806
Schwarzcriterion
-1.762164
Loglikelihood
14.30034
Hannan-Quinncriter.
-1.928273
F-statistic
10.84949
Durbin-Watsonstat
2.314157
Prob(F-statistic)
0.004000
得到子样本1残差平方和RSS尸0.064806;
再对子样本2进行0LSIH1归,结果如下:
口Equation;UNTULEDWo水file;UNTITLED;;Untitled\百~1「回II8SI
[Vi£w][PrcK][Obj€c:
t][prir±][Nam£][Frwzw][EstimateXForeicasMstatsXREsids]
DependentVariable:
LOG(Y)
Method:
LeastSquares
Date:
06/02709Time:
21:
38
Sample:
2031
Includedobservations:
12
VariableCoefficientStd.Errort-StatisticProb.
C
0.790788
1.8276890.432671
0.6754
LOG(X1)
0.138037
0.1883460.732890
0.4823
LOG(X2)
0.776242
0.1189086.528106
0.0001
R-squared
0.833949
Meandependentvar
7.744334
AdjustedR-squared
0.797049
S.D.dependentvar
0.390930
S.E.ofregression
0.176114
Akaikeinfocriterion
-0.423052
Sumsquaredresid
0.279145
Schwarzcriterion
-0.301825
Loglikelihood
5.538312
Hannan-Quinncriter.
-0.467934
F-statistic
22.60016
Durbin-Watsonstat
2.341788
Prob(F-statistic)
0.000310
得到子样本2残差平方和RSS?
二0.279145c
计算F统计量:
#279145“3082
0.064806
在5%显著水平下,Fo.o5(9,9)二3.183.white检验
记原模型残差平方项为,
将其及X”X2及其平方项及交义项做辅助回归,结果如下:
□Equation:
QIAN01Workfile:
UNnTLED:
:
Untitled\1亘]逍~I瓦]
|view]|prQa||object]|print[Name]|Freeze
Estimate]|Forecast][stats]|Resids]
HeteroskedasticityTest:
White
F-statistic
4.324625
Prob.F(5,25)
0.0057
Obs*R-squared
|14.37735
Prob.Chi-SquareC5)
0.0134
ScaledexplainedSS
11.68495
Prob.Chi-Square(5)
0.0394
TestEquation:
DependentVariable:
RESIDE
Method:
LeastSquares
Date:
06/03/09Time:
18:
47
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
-0.17^278
4.576151-0.037866
0.9701
LOG(X1)
0.102285
1.0762610.095038
0.9250
(LOG(X1)F2
0.014-591
0.0692680.210643
0.8349
(LOG(X1)>*(LOGCX2))
-0.043277
0.039001-1.109634
0.2777
LOG(X2)
-0.055497
0.476727-0.116412
0.9083
(LOG(X2)r2
0.025787
0.0176021.465040
0.1554
R-squared
0.463785
hleandepende
0.026553
AdjustedR-squared
0.356542
S.D.dependentvac
0.038100
S.E.ofregression
0.030562
Akaikeinfocriterion
-3.966115
Sumsquaredresid
0.023351
Schwarzcriterion
•3.688569
Loglikelihood
67.47479
Hannan-Quinncriier.
-3.875642
F-statistfc
4.324625
Durbin-Watsonstat
2.390463
Prob(F-statistic)
0.005679
由各参数t值可见各项都不是很显著,而且可决系数值也比较小,但white统计量
2
nR:
=310.464=14.38该值大于5%显著水平下自由度为5X分布相应临界值
2
Z0.05=11.07,因此应拒绝同方差假设。
去掉交义项后辅助回归结果如下:
□Equation:
UNTITLEDWorkfile:
UNTITLED:
:
Untitled\亘]倉]壓]
帧创胡[丹0€][Object]【Print]【NamJpreez@]【Estim吕te]任orecast][itats]〔R皀sick]
DependentVariable:
E2
Method:
LeastSquares
Date:
06/04/09Time:
15:
45
Sample:
131
Includedobservations:
31
VariableCoefficientStd.Errort-StatisticProb.
C
3.842612
2.812996
1.366021
0.1836
LOG(X1)
-0.570319
0.893284
-0.638452
0.5288
LOGQ(irLOG(X1)
0.041508
0.065169
0.636922
0.5297
LOG(X2)
-0.538598
0.195084
-2760855
0.0104
LOG(X2fLOG(X2)
0.038642
0.013311
2.902940
0.0074
R-squared
0.437376
Meandependentvar
0.026553
AdjustedR-squared
0.350819
S.D.dependentvar
0.038100
S.E.ofregression
0.030698
AkaiKeinfocriterion
-3.982554
Sumsquaredresid
0.024501
Schwarzcriterion
-3.751266
Loglikelihood
66.72959
-Quinncriter.
-3.907160
F-statistic
5.053009
DurbirvWmtsonstat
2.262924
Prob(F-statistic)
0.003784
显然,X2和X2平方项参数t检验是显著,并且white统计量nF二310.437376=11.58656
22
大于5%显著水平下自由度为5力分布相应临界值力0.05=11.07,因此应拒绝同方差假设。
4.异方差修正——加权最小二乘法
我们以1/X2为权重进行异方差修正。
加权后估计结果如下:
□Equation:
UNTITLEDWorkfile:
UNTITLED;;Untitled\目〔叵I]|~^1
[View||Prod|objEUt]|print||Namm||FrEezE|[Estimate|卜0胆3或||stats||Rms;ids|
DependentVariable:
LOG(Y)Method:
LeastSquaresDate:
06/04709Time:
16:
47Sample:
131
Includedobservations:
31
Weightingseries:
1/X2
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
2.325271
0.582093'3.994670
0.0004
LOG(X1)
0.44-0688
0.0558057.896906
0.0000
LOG(X2)
0.283866
0.0440506.444173
0.0000
WeightedStatistics
R-squared
0.721871
【屁日门dependentva「
7.315886
AdjustedR-squared
0.702004
S.D.dependentvar
3.932411
S.E.ofregression
0.102630
Akaikeinfocriterion
-1.623609
Sumsquaredresid
0.294921
Schwarzcriterion
-1.484836
Loglikelihood
28.16594
nan-Quinnenter.
-1.578373
F-statistic
36.33630
Durbin-Watsonstat
1.724818
Prob(F-statistic)
0.000000
UnweightedStatistics
R-squared
0.550255
【Seandepende
7.440815
AdjustedR-squared
0.518130
S.D.dependentvar
0.355636
S.E.otregression
0.246871
Sumsquaredresitf
1.706473
Durbin-Watsonstat
0.593183
可见修正后各解释变量显著性总体相对提高。
其white检验结果如下:
□Equation:
UNTITLEDWorkfile:
:
UNTITLED:
:
Untitled\
[vfewHprcxJObject][Print[Name]Fnegze][Estinnnte][尸wecast]|statsRgsids]
HeteroskedasticityTest:
White
F-statistic0.433666Prob.F(6,24>0.S491
Obs*R-squared3.032175Prob.Chi-Square(6)0.8048
ScaledexplainedSS2.259474Prob.Chi-Square(6)0.8944
TestEquation:
DependentVariable:
WGT_RESIDA2Method:
LeastSquares
Date:
06/04/09Time:
17:
06
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
0.023325
0.011707
1.992486
0.0578
WGTA2
-1.075369
3.693815
-0.291127
0.7735
(LOG(X1)r2*WGTA2
-0.009677
0.027862
-0.347303
07314
(LOGCWWGT人2
0.059895
0.596845
0.100353
0.9209
(LOG(X1)r(LOG(X2))*WGTA2
0.011777
0.039475
0.298340
0.7680
(LOG(X2)y^WGT吃
-0.028840
0.027094
-1.0644-32
0.2977
(LOG(X2)rWGTA2
0.278438
0.539896
0.515724
0.6108
R-squared
0.097812
Meandepend©ntva「
0.009514
AdjustedR-squared
-0.127735
S.D.dependentva「
0.013071
S.E.ofregression
0.013881
Akaikeinfocriterion
-5.520948
Sumsquaredresid
0.004624
Schwarz,criterion
-5.197144
Loglikelihood
92.57469
Hann;an・Quinncriter.
-5.415396
F-statistic
0.433666
Durbin-Watsonstat
2.232967
Prob(F-statistic)
0.849073
图10
2
此时white统计量nR2=310.023325=0.723小于5%显著水平下自由度为5X分布相应
2
临界值Z0.05=11.07,故此时满足同方差假设。
故修正后估计结果为:
八
InY=2.325+0.441InX】+0.284InX2