国内旅游总花费影响因素分析.docx
《国内旅游总花费影响因素分析.docx》由会员分享,可在线阅读,更多相关《国内旅游总花费影响因素分析.docx(40页珍藏版)》请在冰豆网上搜索。
国内旅游总花费影响因素分析
中国国内旅游总花费影响因素分析
一、问题提出
1、研究问题
旅游可以促进人力、物力、资源的优化利用,促进当地的相关产业的开展,解决就业问题,提高经济收益等都是大有裨益的。
更重要是随着旅游业的开展,当地人的观念将会发生根本改变,即按照市场需求,组织生产,搞活流通,以信息化取代封闭的传统的生产模式。
旅游可以使单一资源产生规模效应,扩大单一资源的产品转化和升级,将市场建在家门口,对外提高当地的影响力。
旅游业是现代效劳业的重要组成局部,带动作用大。
加快旅游业改革开展,是适应人民群众消费升级和产业结构调整的必然要求,对于扩就业、增收入,推动中西部开展和贫困地区脱贫致富,促进经济平稳增长和生态环境改善意义重大,对于提高人民生活质量、培育和践行社会主义核心价值观也具有重要作用。
中国旅游业的开展是与改革开放同步进行的。
改革开放之前,由于受传统方案体制观念的影响,注重生产轻视消费,旅游被当做一种奢侈品而遭到排斥,同时,国内生活水平普遍较低,对外又采取闭关锁国政策,因此,旅游产业的开展缺乏必要的物质根底和政治条件。
改革开放以后,随着中国经济的开展,一方面,国民经济建设需要大量的资金;另一方面,由于对外开放的大门翻开,境外游客和资本急于进入中国,从而为中国的旅游业形成创造了良好的内外条件和环境。
本文通过对国内旅游总花费的影响因素展开研究,运用建立多元线性回归模型的方法,探讨影响国内旅游总花费的主要因素,并对这些因素进行分析。
2、数据来源(1994-2013,国家统计局)
Y国内旅游总花费(亿元)X1国内生产总值〔亿元〕X2平均工资〔元〕X3客运量〔万人〕x4国内游客(百万人次)x5居民消费价格指数〔上年=100〕
年份
国内旅游总花费(亿元)
国内生产总值〔亿元〕
平均工资〔元〕
客运量〔万人〕
国内游客(百万人次)
居民消费价格指数〔1987年=100〕
1994
5120
1092882
524
1995
5348
1172596
629
1996
5980
1245357
640
1997
6444
1326094
644
1998
7446
1378717
695
1999
8319
1394413
719
2000
9333
1478573
744
2001
10834
1534122
784
2002
12373
1608150
878
2003
13969
1587497
870
2004
15920
1767453
1102
2005
18200
1847018
1212
2006
20856
2024158
1394
2007
24721
2227761
1610
2008
28898
2867892
1712
2009
340902.8
32244
2976898
1902
2010
36539
3269508
2103
2011
41799
3526319
2641
2012
46769
3804035
2957
2013
51483
2122992
3262
3、定性分析
为了研究国内旅游总花费的影响因素,把国内旅游总花费〔亿元〕作为被解释变量y,将国内生产总值〔亿元〕、平均工资〔元〕、客运量〔万人〕、国内游客(百万人次)、居民消费价格指数〔上年=100〕作为解释变量,分别设为x1,x2、x3、x4、x5,假定其多元线性回归模型表示为:
y=β0+β1x1+β2x2+β3x3+β4x4+β5x5
二、相关分析
1、数据根本描述
DescriptiveStatistics
Mean
Std.Deviation
N
国内旅游总花费〔亿元〕
20
国内生产总值〔亿元〕
20
平均工资〔元〕
20
客运量〔万人〕
20
国内游客(百万人次)
20
居民消费价格指数〔上年=100〕
20
2、相关分析
利用散点图、简单相关系数检验被解释变量y和解释变量x1,x2,x3,x4,x5之间的关系。
根据散点图可以看出,国内旅游总花费y与国内生产总值x1、平均工资x2、客运量x3、国内游客x4、居民消费价格指数x5成正相关。
Correlations
国内旅游总花费〔亿元〕
国内生产总值〔亿元〕
平均工资〔元〕
客运量〔万人〕
国内游客(百万人次)
居民消费价格指数〔上年=100〕
PearsonCorrelation
国内旅游总花费y
.974
.968
.785
.986
.855
国内生产总值x1
.974
.999
.875
.996
.895
平均工资x2
.968
.999
.875
.994
.891
客运量x3
.785
.875
.875
.847
.814
国内游客x4
.986
.996
.994
.847
.886
居民消费价格指数〔上年=100〕x5
.855
.895
.891
.814
.886
Sig.(1-tailed)
国内旅游总花费y
.
.000
.000
.000
.000
.000
国内生产总值x1
.000
.
.000
.000
.000
.000
平均工资x2
.000
.000
.
.000
.000
.000
客运量x3
.000
.000
.000
.
.000
.000
国内游客x4
.000
.000
.000
.000
.
.000
居民消费价格指数〔上年=100〕x5
.000
.000
.000
.000
.000
.
N
国内旅游总花费y
20
20
20
20
20
20
国内生产总值x1
20
20
20
20
20
20
平均工资x2
20
20
20
20
20
20
客运量x3
20
20
20
20
20
20
国内游客x4
20
20
20
20
20
20
居民消费价格指数〔上年=100〕x5
20
20
20
20
20
20
从相关系数表中可以看出国内旅游总花费y与国内生产总值x1、平均工资x2、国内游客x4的相关系数都在0.9以上,高度相关;国内旅游总花费y与居民消费价格指数x5的相关系数在0.8以上,相关性也很强,国内旅游总花费y与客运量x3的相关系数在0.7以上,具有一定的相关性。
所以,国内旅游总花费y与这五个自变量做回归分析是适宜的。
三、模型建立
根据之前建立的模型y=β0+β1x1+β2x2+β3x3+β4x4+β5x5
,利用SPSS,采用强行进入的方法进行多元线性回归,得到结果如下:
1、拟合优度检验
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
ChangeStatistics
Durbin-Watson
RSquareChange
FChange
df1
df2
Sig.FChange
1
.993a
.987
.982
.987
5
14
.000
.584
a.Predictors:
(Constant),居民消费价格指数〔上年=100〕,客运量〔万人〕,国内游客(百万人次),平均工资〔元〕,国内生产总值〔亿元〕
b.DependentVariable:
国内旅游总花费〔亿元〕
从上表可以看出,方程的复相关系数R=0.993,样本决定系数R272,说明方程拟合优度很好。
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
5
.000a
Residual
14
Total
19
a.Predictors:
(Constant),居民消费价格指数〔上年=100〕,客运量〔万人〕,国内游客(百万人次),平均工资〔元〕,国内生产总值〔亿元〕
b.DependentVariable:
国内旅游总花费〔亿元〕
由ANOVA表可知,在0.05的显著性水平下,F值=,P值为0.000,说明回归方程高度显著,x1,x2,x3,x4,x5整体上对y有高度显著的线性影响。
回归系数的检验
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
Correlations
CollinearityStatistics
B
Std.Error
Beta
Zero-order
Partial
Part
Tolerance
VIF
1
(Constant)
.502
国内生产总值x1
.042
.038
.934
.295
.974
.279
.034
.001
平均工资x2
.293
.043
.968
.003
客运量x3
.001
-.117
.176
.785
.142
国内游客x4
.007
.986
.644
.097
.004
居民消费价格指数〔上年=100〕x5
.583
.855
.191
a.DependentVariable:
国内旅游总花费〔亿元〕
通过表格,我们看到平均工资x2、国内游客x4的回归检验系数P值小于0.05,通过检验。
而常数项、国内生产总值x1、客运量x3、居民消费价格指数x5系数检验P值均大于0.05,未通过检验。
4、残差分析——正态性检验
根据直方图和正态概率分布图可以看到,残差根本上符合正态性假设。
5、残差分析——异方差检验
Correlations
ABSE
国内生产总值〔亿元〕
平均工资〔元〕
客运量〔万人〕
国内游客(百万人次)
居民消费价格指数〔上年=100〕
Spearman'srho
ABSE
CorrelationCoefficient
.158
.158
.229
.156
Sig.(2-tailed)
.
.506
.506
.332
.510
.975
N
20
20
20
20
20
20
国内生产总值x1
CorrelationCoefficient
.158
**
.967**
.998**
.947**
Sig.(2-tailed)
.506
.
.
.000
.000
.000
N
20
20
20
20
20
20
平均工资x2
CorrelationCoefficient
.158
**
.967**
.998**
.947**
Sig.(2-tailed)
.506
.
.
.000
.000
.000
N
20
20
20
20
20
20
客运量x3
CorrelationCoefficient
.229
.967**
.967**
.968**
.910**
Sig.(2-tailed)
.332
.000
.000
.
.000
.000
N
20
20
20
20
20
20
国内游客x4
CorrelationCoefficient
.156
.998**
.998**
.968**
.941**
Sig.(2-tailed)
.510
.000
.000
.000
.
.000
N
20
20
20
20
20
20
居民消费价格指数〔上年=100〕x5
CorrelationCoefficient
.947**
.947**
.910**
.941**
1.000
Sig.(2-tailed)
.975
.000
.000
.000
.000
.
N
20
20
20
20
20
20
**.Correlationissignificantatthe0.01level(2-tailed).
由残差图可知,残差图上的点的散布是随机的,不太有规律;由Correlations表可知,残差绝对值与x1,x2,x3,x4,x55858,0.22956,,相应的P值均大于0.05,说明残差绝对值与自变量x1,x2,x3,x4,x5之间显著不相关。
故综上所述,不存在异方差。
6、自相关性检验
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
ChangeStatistics
Durbin-Watson
RSquareChange
FChange
df1
df2
Sig.FChange
1
.993a
.987
.982
6685
.987
5
14
.000
.584
a.Predictors:
(Constant),居民消费价格指数〔上年=100〕,客运量〔万人〕,国内游客(百万人次),平均工资〔元〕,国内生产总值〔亿元〕
b.DependentVariable:
国内旅游总花费〔亿元〕
4,查D.W表,当n=20,k=5时,dL=0.90,du=4<dL,且滞后残差图呈正相关关系,所以模型存在正自相关性。
7、共线性诊断
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
Correlations
CollinearityStatistics
B
Std.Error
Beta
Zero-order
Partial
Part
Tolerance
VIF
1
(Constant)
.502
国内生产总值x1
.042
.038
.934
.295
.974
.279
.034
.001
平均工资x2
.293
.043
.968
.003
客运量x3
.001
.176
.785
.142
国内游客x4
.007
.986
.644
.097
.004
23
居民消费价格指数〔上年=100〕x5
.583
.855
.191
a.DependentVariable:
国内旅游总花费〔亿元〕
CollinearityDiagnosticsa
Model
Dimension
Eigenvalue
ConditionIndex
VarianceProportions
(Constant)
国内生产总值〔亿元〕
平均工资〔元〕
客运量〔万人〕
国内游客(百万人次)
居民消费价格指数〔上年=100〕
1
1
.00
.00
.00
.00
.00
.00
2
.345
.01
.00
.00
.00
.00
.00
3
.028
.01
.00
.00
.56
.00
.01
4
.003
.52
.00
.00
.02
.02
.93
5
.001
.14
.00
.35
.22
.46
.01
6
.000
.33
.64
.20
.52
.05
a.DependentVariable:
国内旅游总花费〔亿元〕
由Coefficients表可以看出x1,x2,x4的VIF值都大于10,所以存在严重的多重共线性。
由CollinearityDiagnostics表可知,自变量x2,x3,x4,x5的条件数均大于10,进一步说明自变量之间存在严重的多重共线性。
8、异常值检验
年份
SDR_1
COO_1
LEV_1
1994
53
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
0.02077564
2010
2011
2012
2013
从上表可知,所有数据的删除学生化残差绝对值都小于3,除2013年库克距离都小于0.5,该模型存在异常值。
四、模型修改
〔1〕常数项、国内生产总值x1、旅客运输平均距离x3、居民消费价格指数x5系数检验P值均大于0.05,未通过检验;
〔2〕存在自相关性;
〔3〕自变量之间存在严重的多重共线性;
〔4〕2013年存在异常值。
2.修改
利用SPSS软件采用逐步回归的方式,得到以下结果并加以分析。
〔1〕拟合优度检验
VariablesEntered/Removeda
Model
VariablesEntered
VariablesRemoved
Method
1
国内游客(百万人次)x4
.
Stepwise(Criteria:
Probability-of-F-to-enter<=.050,Probability-of-F-to-remove>=.100).
2
平均工资〔元〕x2
.
Stepwise(Criteria:
Probability-of-F-to-enter<=.050,Probability-of-F-to-remove>=.100).
a.DependentVariable:
国内旅游总花费〔亿元〕
ModelSummaryc
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
ChangeStatistics
Durbin-Watson
RSquareChange
FChange
df1
df2
Sig.FChange
1
.986a
.972
.970
.972
1
18
.000
2
.992b
.984
.982
.013
1
17
.002
.711
a.Predictors:
(Constant),国内游客(百万人次)
b.Predictors:
(Constant),国内游客(百万人次),平均工资〔元〕
c.DependentVariable:
国内旅游总花费〔亿元〕
由ModelSummary表可知,方程的复相关系数R=0.986,样本决定系数为R2为0.972,调整后的样本决定系数为0.970,说明方程拟合程度很好。
(2〕回归方程显著性检验
ANOVAc
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
1
.000a
Residual
18
Total
19
2
Regression
2
.000b
Residual
17
Total
19
a.Predictors:
(Constant),国内游客x4
b.Predictors:
(Constant),国内游客x4,平均工资x2
c.DependentVariable:
国内旅游总花费y
由ANOVA表可知,在0.05的显著性水平下,F值为532.053,P值为0.000,远小于0.005,所以回归方程高度显著,说明x2、x4整体上对y有高度显著的线性影响。
〔3〕回归系数检验
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
Correlations
CollinearityStatistics
B
Std.Error
Beta
Zero-order
Partial
Part
Tolerance
VIF
1
(Constant)
.000
国内游客x4
.349
.986
.000
.986
.986
.986
2
(Constant)
57
.000
国内游客x4
.000
.986
.866
.217
.012
平均工资x2
.141