我国国内旅游收入影响因素的多元回归分析.docx
《我国国内旅游收入影响因素的多元回归分析.docx》由会员分享,可在线阅读,更多相关《我国国内旅游收入影响因素的多元回归分析.docx(12页珍藏版)》请在冰豆网上搜索。
我国国内旅游收入影响因素的多元回归分析
我国国内旅游收入影响因素的多元回归分析
我国国内旅游收入影响因素的多元分析
班级:
统计学129
姓名:
杨芳
学号:
200712918
2010年3月3日
问题背景:
我国的旅游业一直保持较高的发展速度,旅游作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。
我国的旅游业分为国际旅游和国内旅游两大市场,虽然国际旅游外汇收入的年均增长率高于国内旅游收入,但国内旅游收入在中国旅游收入中占50%以上的比例,因此,有必要对影响我国国内旅游业快速发展的因素进行分析。
数据的选择及处理:
影响国内旅游收入的因素有很多,本文选择了影响国内旅游收入因素(y)的因素有人均收入(x1)、国内旅游人数(x2)、城镇人均旅游支出(x3)、农村人均旅游支出(x4)、公路里程(x5)、铁路里程(x6)。
国内旅游收入数据资料
年份
国内旅游收入(亿元)
人均收入(元)
国内旅游人数(百万人次)
城镇人均旅游支出(元)
农村人均旅游支出(元)
公路里程(万公里)
铁路里程(万公里)
1994
1023.51
4044
524
414.67
54.88
111.78
5.9
1995
1375.7
5046
629
464.02
61.47
115.7
6.2389
1996
1638.38
5846
640
534.1
70.45
118.58
6.49
1997
2112.7
6420
644
599.8
145.68
122.64
6.6
1998
2391.18
6796
695
607
197
127.85
6.64
1999
2831.92
7159
719
614.8
249.5
135.17
6.74
2000
3175.54
7858
744
678.6
226.6
140.27
6.87
2001
3522.4
8622
784
708.3
212.7
169.8
7.0058
2002
3878.36
9398
878
739.7
209.1
176.52
7.19
2003
3442.27
10542
870
684.9
200
180.98
7.3
2004
4710.7
12336
1102
731.8
210.2
187.07
7.44
2005
5285.9
14053
1212
737.1
227.6
334.52
7.54376
2006
6229.74
16165
1394
766.4
221.9
345.6999
7.70838
2007
7770.6
19524
1610
906.9
222.5
358.3715
7.79659
数据来自《中国统计年鉴2008》
国内旅游收入(亿元):
指国内游客在国内旅行、游览过程中用于交通、参观游览、住宿、餐饮、购物、娱乐等全部花费。
人均收入(元):
指人均国民收入。
公路里程(万公里):
包括大中城市的郊区公路以及通过小城镇街道部分的公路里程和桥梁、渡口的长度,不包括大中城市的街道、厂矿、林区生产用道和农业生产用道的里程。
两条或多条公路共同经由同一路段,只计算一次,不得重复计算里程长度。
本文运用多元回归分析进行数据分析,利用SPSS17.0软件分析得如下结果:
表1
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次),人均国民收入(元)a
.
输入
2
.
人均国民收入(元)
向后(准则:
F-to-remove>=.100的概率)。
3
.
公路里程(万公里)
向后(准则:
F-to-remove>=.100的概率)。
a.已输入所有请求的变量。
b.因变量:
国内旅游收入(亿元)
由表1知,利用向后筛选策略共经过三步完成回归方程的建立,第一步全部解释变量都进入,第二步中,人均国民收入(元)被剔除,第三步中,公路里程(万公里)被剔除。
表2
模型汇总d
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.999a
.998
.996
123.78922
2
.999b
.998
.996
115.96287
3
.999c
.997
.996
117.15749
1.251
a.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次),人均国民收入(元)。
b.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次)。
c.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),城镇居民人均旅游支出(元),国内旅游人数(百万人次)。
d.因变量:
国内旅游收入(亿元)
由表2知,DW为1.251查表可知不存在自相关。
表3
Anovad
模型
平方和
df
均方
F
Sig.
1
回归
4.819E7
6
8031771.656
524.138
.000a
残差
107266.403
7
15323.772
总计
4.830E7
13
2
回归
4.819E7
5
9638063.449
716.724
.000b
残差
107579.096
8
13447.387
总计
4.830E7
13
3
回归
4.817E7
4
1.204E7
877.437
.000c
残差
123532.890
9
13725.877
总计
4.830E7
13
a.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次),人均国民收入(元)。
b.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次)。
c.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),城镇居民人均旅游支出(元),国内旅游人数(百万人次)。
d.因变量:
国内旅游收入(亿元)
表3中,第三个模型是最终的方程。
选择的显著性水平a是0.05,由于回归方程显著性检验的概率P值小于显著性水平a,因此被解释变量与解释变量之间的线性关系显著,建立线性模型是恰当的。
表4
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
-309.896
1635.702
-.189
.855
人均国民收入(元)
.016
.111
.037
.143
.890
国内旅游人数(百万人次)
4.137
1.248
.691
3.314
.013
城镇居民人均旅游支出(元)
5.084
1.154
.340
4.404
.003
农村居民人均旅游支出(元)
2.726
1.070
.095
2.547
.038
公路里程(万公里)
1.401
1.473
.065
.952
.373
铁路里程(万公里)
-585.948
280.062
-.172
-2.092
.075
2
(常量)
-463.436
1155.023
-.401
.699
国内旅游人数(百万人次)
4.298
.503
.718
8.550
.000
城镇居民人均旅游支出(元)
5.144
1.005
.344
5.119
.001
农村居民人均旅游支出(元)
2.703
.991
.095
2.726
.026
公路里程(万公里)
1.454
1.335
.068
1.089
.308
铁路里程(万公里)
-569.282
238.508
-.167
-2.387
.044
3
(常量)
-602.237
1159.797
-.519
.616
国内旅游人数(百万人次)
4.748
.290
.793
16.366
.000
城镇居民人均旅游支出(元)
4.745
.945
.317
5.019
.001
农村居民人均旅游支出(元)
2.886
.987
.101
2.925
.017
铁路里程(万公里)
-534.685
238.819
-.157
-2.239
.052
a.因变量:
国内旅游收入(亿元)
由表4知,如果选择的显著性水平a为0.05,前两个模型中由于都存在回归系数不显著的解释变量,因此这些方程都不可用。
第三个方程是最终的方程,其回归系数显著性检验的概率P值小于显著性水平a,因此这四个解释变量保存在模型中是合理的。
最终的回归方程为:
国内旅游收入=-602.237+4.748国内旅游人数+4.745城镇人均旅游支出+2.886农r村人均旅游支出-534.685铁路里程
表5
已排除的变量c
模型
BetaIn
t
Sig.
偏相关
共线性统计量
容差
2
人均国民收入(元)
.037a
.143
.890
.054
.005
3
人均国民收入(元)
.099b
.397
.702
.139
.005
公路里程(万公里)
.068b
1.089
.308
.359
.072
a.模型中的预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次)。
b.模型中的预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),城镇居民人均旅游支出(元),国内旅游人数(百万人次)。
c.因变量:
国内旅游收入(亿元)
表5给出了变量剔除方程的过程。
在模型二中,人均国民收入保留的情况下,它的标准化回归系数为0.037,回归系数的检验不显著(概率P值为0.890)。
在模型三中,在剔除公路里程的情况下,保留的人均国民收入,它的标准化回归系数为0.099,回归系数的检验不显著(概率P值为0.702)。
在剔除人均国民收入的情况下,保留的公路里程,它的标准化回归系数为0.068,回归系数的检验不显著(概率P值为0.308)。
表6
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
857.2092
7818.9868
3527.7786
1925.02474
14
残差
-205.14450
173.07202
.00000
97.48092
14
标准预测值
-1.387
2.229
.000
1.000
14
标准残差
-1.751
1.477
.000
.832
14
a.因变量:
国内旅游收入(亿元)
表6中,数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果显示标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。
表7
表7中,随着标准化预测值的变化,残差点在0点周围随机分布,因此认为异方差并不明显。
最终的回归方程为:
国内旅游收入=-602.237+4.748国内旅游人数+4.745城镇人均旅游支出+2.886农r村人均旅游支出-534.685铁路里程
参考资料:
1.《统计分析方法与SPSS的应用》,薛薇编
2.《应用回归分析》,何晓群、刘文卿编
3.《中国统计年鉴2008》
心得体会:
这份实习报告是我一字一字打上去,所涉及数据均是一项一项从中国统计年鉴查找,导入Excel,而后导入SPSS进行处理分析。
这份报告是对这两个星期的总结,而这次实习使我对SPSS统计软件的应用、应用回归分析和多元回归分析有更加深刻的了解和理解。
这次实习还教会了我如何从中国统计年鉴以及相关年鉴中找到自己需要的数据,这让我受益匪浅。