国内旅游收入的影响因素分析文档格式.docx
《国内旅游收入的影响因素分析文档格式.docx》由会员分享,可在线阅读,更多相关《国内旅游收入的影响因素分析文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
随着经济的发展,我国的交通条件也得到了很大的提高,同时给旅客的出行提供了很大的方便。
因此选择交通里程这一指标作为影响旅游收入的一个指标。
四,数据的收集
本文获取了1994年到2005年的数据如下表一所示。
表一1994年到2005年的统计数据
Y
X1
X2
X3
X4
X5
X6
1994
1023.51
2358.6
258.6
3399
524
21518.8
184.7088
1995
1375.7
2930.35
302.8
2821
629
29662.3
196.241
1996
1638.4
3382.5
327.9
3275
639.5
38520.8
198.8788
1997
2112.7
3625.2
337.1
3995
644
46279.8
219.4893
1998
2391.2
3793.55
334.4
4910
695
53407.5
233.0214
1999
2831.9
4032.16
329.7
6070
719
59621.8
240.8544
2000
3175.5
4266.7
331
7725
744
64332.4
245.5838
2001
3522.4
4613
333.3
9222
784
73762.4
279.3816
2002
3878.4
5089.2
330.6
10203
878
86910.6
288.7968
2003
3442.3
5547.2
334.6
11997
870
103617.3
290.4522
2004
4710.7
6179
347.7
13467
1102
119555.4
308.6934
2005
5285.86
6873.95
353.9
16348
1212
141051
313.5269
资料来源:
http:
//192.168.30.168:
81/
http:
//www.pinggu.org/bbs/index.asp
注:
Y为中国国内旅游收入,单位为亿元
x1为人均可支配收入,单位为元
x2为消费价格指数,以1985年为基年
x3为国内旅社数,单位为个
x4为国内旅游人数,单位为百万人次
x5为城乡居民年底存款余额,单位为亿元
x6为交通里程,单位为万公里
由中国国情决定,中国的旅游业在过去的几十年里发展的相当缓慢,到近几年才快速发展起来。
因此直到1994年才有与旅游收入相关的统计数据,这直接导致我们研究问题的样本量不足的问题。
五、模型的估计与调整
1、检验多重共线性
1)分别做y和各个解释变量的散点图,我们发现各个解释变量与y都是近似的线性关系,因此我们设定模型为
y=c+c1*x1+c2*x2+c3*x3+c4*x4+c5*x5+c6*x6
EViews的最小二乘估计结果见表二
DependentVariable:
Y
Method:
LeastSquares
Date:
12/16/07Time:
20:
27
Sample:
19942005
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-8383.433
2211.025
-3.791650
0.0127
-1.427166
1.667962
-0.855634
0.4313
24.87071
13.72040
1.812681
0.1296
0.376346
0.190880
1.971636
0.1057
4.800825
1.846466
2.600007
0.0482
-0.014566
0.044721
-0.325708
0.7578
15.12889
7.619128
1.985646
0.1038
R-squared
0.987928
Meandependentvar
2949.047
AdjustedR-squared
0.973441
S.D.dependentvar
1313.443
S.E.ofregression
214.0499
Akaikeinfocriterion
13.86149
Sumsquaredresid
229086.8
Schwarzcriterion
14.14436
Loglikelihood
-76.16896
F-statistic
68.19606
Durbin-Watsonstat
2.483285
Prob(F-statistic)
0.000124
从表一可以看出,除了x4的系数通过检验,其他解释变量的系数都未通过检验。
可见上述模型不是太好,我们可将模型设定如下
Y=clogy=c+c1*logx1+c2*logx2+c3*logx3+c4*logx4+c5*logx5+c6*logx6
EViews的最小二乘估计结果见表三:
表三EViews的最小二乘计算结果
LOG(Y)
19:
11
-16.77757
5.632615
-2.978646
0.0308
LOG(X1)
-2.619456
1.491743
-1.755970
0.1394
LOG(X2)
4.291464
1.158825
3.703288
0.0140
LOG(X3)
0.825338
0.315038
2.619803
0.0471
LOG(X4)
0.924662
0.499018
1.852963
0.1231
LOG(X5)
0.269979
0.867549
0.311198
0.7682
LOG(X6)
0.964413
0.738222
1.306399
0.2483
0.992832
7.884227
0.984230
0.501562
0.062986
-2.400614
0.019836
-2.117751
21.40368
115.4196
2.874831
0.000034
由上表可知,有些解释变量的系数的t统计量有所增加,即模型有所改进。
回归系数和修正的回归系数都很高,F统计量也很显著。
我们猜想上述模型存在多重共线性。
则由软件求得个解释变量的相关系数如表四:
1
0.7620690565
0.9760533812
0.9755342908
0.9965341779
0.9668251186
0.6154384719
0.6962122799
0.7134712765
0.7152267592
0.9587714366
0.9861081399
0.9615983457
0.9787216182
0.9188646329
0.9612301192
由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。
2).修正多重共线性
采用逐步归回的办法,去检验和解决多重共线性问题。
分别做Iny对logx1,logx2,logx3,logx4,logx5,logx6的一元回归。
结果如表五:
变量
logx1
logx2
logx3
logx4
logx5
logx6
参数估计值
1.576184
5.053141
0.783658
1.935193
0.872156
2.320342
t统计量
13.77961
4.592402
9.043727
7.958836
16.67611
7.863553
0.949969
0.678355
0.891054
0.863654
0.965289
0.860793
0.944966
0.646190
0.880160
0.850020
0.961818
0.846872
由表五可知,Inx5的修正系数最大,而且也通过了t检验,现在以Inx5为基础,顺次加入其他变量逐步回归结果如表六:
logx5logx1
-1.160109
2.431449
0.963094
logx5logx2
0.603853
8.819078
0.959227
logx5logx3
0.264561
4.412193
0.957903
logx5logx4
-0.545288
5.245959
0.958932
logx5logx6
2.410565
0.965947
0.961560
由上表可知所有新引入的解释变量都没有通过t检验,则如表七有LnY对LnX5的回归结果
12/15/07Time:
13
-1.724540
0.576894
-2.989355
0.0136
0.052300
0.0000
0.098007
-1.656554
0.096053
-1.575736
11.93932
278.0926
1.383752
0.000000
所以最后的回归结果为:
log
=-1.724540+0.872156*log
se=0.5768940.052300
t=-2.98935516.67611
=0.965289
=0.961818F=278.0926DW=1.383752
2、异方差的检验
由于研究对象的特殊性及我们国家经济的发展状况,我们的样本量受实际情况限制无法足够大,因此我们只能选择用图示法来检验模型是否存在异方差。
1)相关图形分析
由于样本量太小,logY的离散程度随logX5的变化不是太明显,下面我们来分析残差图。
2)残差图分析
由上图可以看出残差的平方并未随着解释变量的变化而呈现增大或减小的趋势,是比较分散和随机的,因此初步判断此模型不存在异方差。
3、自相关的检验
首先我们用图示检验法,先绘制
和
的散点图,如下所示:
(其中E为
,E1为
)
由图可以看出该模型存在正的自相关。
下面用科克伦奥克特迭代法对自相关进行补救。
用软件对模型进行估计可以得到
的序列,然后利用最小二乘估计法对模型
=
+
进行估计的结果如表八:
(其中E1为
E
12/19/07Time:
22:
51
Sample(adjusted):
19952005
11afteradjustments
E1
0.293139
0.302024
0.970584
0.3546
0.084243
0.004154
0.096837
0.092669
-1.833064
0.085875
-1.796891
11.08185
1.996219
由表八有
=0.293139,对原模型进行广义差分,得到广义差分方程:
-0.293139*log
=c1*(1-0.293139)+c2*(log
)+
令Y1=log
,X55=log
,c11=c1*(1-0.293139)
则模型变换为Y1=c11+c2*x55
对上述广义差分方程进行回归,得结果如表九:
Y1
23:
00
-2.983992
0.729103
-2.175638
0.2699
X55
0.826757
0.092164
8.970491
0.899407
5.678061
0.888230
0.288154
0.096336
-1.678994
0.083525
-1.606649
11.23447
80.46971
2.031662
0.000009
现在对差分后的方程用图示法进行检验,绘制
由图可知自相关已消除。
则由c1*(1-0.293139)=-2.983992得c1=-4.221469,且c2=0.826757。
所以本模型估计的最终结果为:
=-4.221469+0.826757log
六、结论分析
随着社会与时代的变迁,旅游业已成为我国乃至整个世界经济发展的一个重要组成部分,对旅游产业发展状况的统计量度就显得十分重要,这不仅从宏观上反映旅游业的发展水平、影响因素以及整个国家的经济发展水平,同时也直接关系到评估旅游业和旅游活动直接、间接和诱发性的经济影响,关系到旅游设施和资源的规划与开发,关系到如何确定旅游者结构并制订营销和促销策略,以及识别游客的流向、方式和偏好等,具有非常深远的实际应用价值。
旅游产业作为一个单独的行业,它既具备大多数行业在