国内旅游总花费影响因素分析Word文件下载.docx
《国内旅游总花费影响因素分析Word文件下载.docx》由会员分享,可在线阅读,更多相关《国内旅游总花费影响因素分析Word文件下载.docx(39页珍藏版)》请在冰豆网上搜索。
78973.
.9
1998
2391.2
84402.3
7446
695
438.4
1999
2831.9
89677.
.2
2000
3175.5
99214.6
9333
744
434.0
2001
3522.4
109655.2
10834
784
437.0
2002
3878.4
120332.7
12373
878
433.5
2003
3442.3
135822.8
.7
2004
4710.7
159878.3
5.8
2005
5285.9
184937.4
4.0
2006
6229.7
216314.4
2
.0
2007
7770.6
265810.3
24721
1610
493.6
2008
8749.3
314045.4
28898
1712
522.7
2009
10183.7
340902.8
32244
1902
519.0
2010
12579.8
401512.8
36539
2103
536.1
2011
19305.4
473104.
65.0
2012
22706.2
519470.1
46769
2957
579.7
2013
26276.1
568845.2
51483
3262
594.8
3、定性分析
为了研究国内旅游总花费的影响因素,把国内旅游总花费(亿元)作为被解释变量y,将国内生产总值(亿元)、平均工资(元)、客运量(万人)、国内游客(百万人次)、居民消费价格指数(上年=100)作为解释变量,分别设为x1,x2、x3、x4、x5,假定其多元线性回归模型表示为:
y=β0+β1x1+β2x2+β3x3+β4x4+β5x5
二、相关分析
1、数据基本描述
DescriptiveStatistics
Mean
Std.Deviation
N
7.4595E3
7351.58315
20
2.1715E5
1.64588E5
2.01E4
14745.147
2.0126E6
8.31668E5
国内游客(百万人次)
1.3511E3
834.46503
居民消费价格指数(上年=100)
4.6773E2
73.11847
2、相关分析
利用散点图、简单相关系数检验被解释变量y和解释变量x1,x2,x3,x4,x5之间的关系。
根据散点图可以看出,国内旅游总花费y与国内生产总值x1、平均工资x2、客运量x3、国内游客x4、居民消费价格指数x5成正相关。
Correlations
PearsonCorrelation
国内旅游总花费y
1.000
.974
.968
.785
.986
.855
国内生产总值x1
.999
.875
.996
.895
平均工资x2
.994
.891
客运量x3
.847
.814
国内游客x4
.886
居民消费价格指数(上年=100)x5
Sig.(1-tailed)
.
.000
从相关系数表中可以看出国内旅游总花费y与国内生产总值x1、平均工资x2、国内游客x4的相关系数都在0.9以上,高度相关;
国内旅游总花费y与居民消费价格指数x5的相关系数在0.8以上,相关性也很强,国内旅游总花费y与客运量x3的相关系数在0.7以上,具有一定的相关性。
所以,国内旅游总花费y与这五个自变量做回归分析是合适的。
三、模型建立
根据之前建立的模型y=β0+β1x1+β2x2+β3x3+β4x4+β5x5
,利用SPSS,采用强行进入的方法进行多元线性回归,得到结果如下:
1、拟合优度检验
ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
ChangeStatistics
Durbin-Watson
RSquareChange
FChange
df1
df2
Sig.FChange
1
.993a
.987
.982
987.66685
207.735
5
14
.584
a.Predictors:
(Constant),居民消费价格指数(上年=100),客运量(万人),国内游客(百万人次),平均工资(元),国内生产总值(亿元)
b.DependentVariable:
国内旅游总花费(亿元)
从上表可以看出,方程的复相关系数R=0.993,样本决定系数R2=0.987,调整后的样本决定系数为0.982,说明方程拟合优度很好。
ANOVAb
SumofSquares
df
MeanSquare
F
Sig.
Regression
1.013E9
2.026E8
.000a
Residual
1.366E7
975485.806
Total
1.027E9
19
由ANOVA表可知,在0.05的显著性水平下,F值=207.735,P值为0.000,说明回归方程高度显著,x1,x2,x3,x4,x5整体上对y有高度显著的线性影响。
回归系数的检验
Coefficientsa
UnstandardizedCoefficients
StandardizedCoefficients
t
CollinearityStatistics
B
Std.Error
Beta
Zero-order
Partial
Part
Tolerance
VIF
(Constant)
-2265.053
3283.235
-.690
.502
.042
.038
.934
1.088
.295
.279
.034
.001
776.155
-.653
.293
-1.310
-2.226
.043
-.511
-.069
.003
364.442
-.001
-.117
-1.426
.176
-.356
-.044
.142
7.038
13.137
4.169
1.491
3.151
.007
.644
.097
.004
235.720
-3.988
7.094
-.040
-.562
.583
-.149
-.017
.191
5.241
a.DependentVariable:
通过表格,我们看到平均工资x2、国内游客x4的回归检验系数P值小于0.05,通过检验。
而常数项、国内生产总值x1、客运量x3、居民消费价格指数x5系数检验P值均大于0.05,未通过检验。
4、残差分析——正态性检验
根据直方图和正态概率分布图可以看到,残差基本上符合正态性假设。
5、残差分析——异方差检验
ABSE
Spearman'
srho
CorrelationCoefficient
.158
.229
.156
-.008
Sig.(2-tailed)
.506
.332
.510
.975
1.000**
.967**
.998**
.947**
.968**
.910**
.941**
**.Correlationissignificantatthe0.01level(2-tailed).
由残差图可知,残差图上的点的散布是随机的,不太有规律;
由Correlations表可知,残差绝对值与x1,x2,x3,x4,x5的相关系数分别为0.158,0.158,0.229,0.156,-0.08,相应的P值均大于0.05,说明残差绝对值与自变量x1,x2,x3,x4,x5之间显著不相关。
故综上所述,不存在异方差。
6、自相关性检验
从模型汇总表中可知,D.W值为0.584,查D.W表,当n=20,k=5时,dL=0.90,du=1.83,D.W=0.584<dL,且滞后残差图呈正相关关系,所以模型存在正自相关性。
7、共线性诊断
CollinearityDiagnosticsa
Dimension
Eigenvalue
ConditionIndex
VarianceProportions
5.622
.00
.345
4.037
.01
3
.028
14.064
.56
4
44.309
.52
.02
.93
68.413
.14
.35
.22
.46
6
139.200
.33
1.00
.64
.20
.05
由Coefficients表可以看出x1,x2,x4的VIF值都大于10,所以存在严重的多重共线性。
由CollinearityDiagnostics表可知,自变量x2,x3,x4,x5的条件数均大于10,进一步说明自变量之间存在严重的多重共线性。
8、异常值检验
SDR_1
COO_1
LEV_1
-0.25782
0.23288153
0.901502
-0.98394
0.03811258
0.140719
-0.63624
0.01869595
0.159692
-0.04643
1.51E-04
0.230634
0.038627
5.15E-05
0.111378
0.524824
0.00577236
0.056532
0.927193
0.01485042
0.043058
1.451298
0.03467744
0.046323
1.179306
0.04201566
0.107059
1.340228
0.09161782
0.194394
-0.14771
9.20E-04
0.140573
-0.48088
0.00775347
0.109754
-1.45338
0.06653409
0.119438
-2.10149
0.04287897
0.017574
-0.76643
0.03293286
0.196119
-0.63843
0.02077564
0.176539
-0.23033
0.00978043
0.457713
0.398954
0.0171609
0.328132
2.158468
0.86018878
0.532865
0.967995
7.68762598
0.930002
从上表可知,所有数据的删除学生化残差绝对值都小于3,除2013年库克距离都小于0.5,该模型存在异常值。
四、模型修改
1.全模型存在的问题
(1)常数项、国内生产总值x1、旅客运输平均距离x3、居民消费价格指数x5系数检验P值均大于0.05,未通过检验;
(2)存在自相关性;
(3)自变量之间存在严重的多重共线性;
(4)2013年存在异常值。
2.修改
利用SPSS软件采用逐步回归的方式,得到以下结果并加以分析。
(1)拟合优度检验
VariablesEntered/Removeda
VariablesEntered
VariablesRemoved
Method
国内游客(百万人次)x4
Stepwise(Criteria:
Probability-of-F-to-enter<
=.050,Probability-of-F-to-remove>
=.100).
平均工资(元)x2
ModelSummaryc
Sig.F