基于因子和聚类分析的我国旅游业研究Word格式文档下载.docx
《基于因子和聚类分析的我国旅游业研究Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《基于因子和聚类分析的我国旅游业研究Word格式文档下载.docx(19页珍藏版)》请在冰豆网上搜索。
地方
全员劳动生产率(万元/人)
总计
9.38
北京
19.71
天津
9.99
河北
4.68
山西
9.87
内蒙古
6.77
辽宁
9.63
吉林
8.27
黑龙江
7.13
上海
20.89
江苏
12.04
浙江
12.09
安徽
6.49
福建
7.88
江西
5.83
山东
8.73
在该指标中,我们细分为星级饭店数量、饭店劳动生产力、人均占有固定资产原价、百元固定资产营业收入、平均客房出租率。
在初期选用星级饭店数量时,我们发现,星级饭店数量可以按照饭店规模,饭店星级,饭店规模等进行分类。
考虑到篇幅限制以及数据处理的有效性我们认为可以不在具体分类。
令一个重要指标是星级饭店劳动生产力。
部分参考文献中,以国有星级饭店劳动生产力作为评价指标。
通过比较我们发现,除北京市外,其他省市的全员劳动生产率变化不大,而且平均分别为9.38万元和8.52万元。
基于普遍性,我们不选取国有星级饭店而选用更为普遍的星级饭店。
中国2006年国有星级饭店主要经济指标统计
8.52
10.48
8.32
4.38
12.81
6.16
9.02
7.11
7.99
18.2
12.27
14.94
6.45
8.69
5.92
8.23
图1我国旅游业评价体系图
基于此,我们得出了旅游业评价体系,如上图1所示。
3研究方法
近年来大部分关于旅游发展的文献主要基于主成分分析、因子分析、聚类分析、回归分析这几种多元统计方法。
但是对于中国各省份的旅游业发展研究还不够全面,而且目前一些研究文献主要参考指标选取的不够全面。
因此本文从五个方面选取了共14项指标对中国各省份2006年旅游业发展状况进行分析,并结合因子分析进行综合排名。
同时还运用聚类分析对31个省份的综合发展水平进行分类,研究各省份旅游业发展的平衡程度。
4我国旅游业指标的因子分析
因子分析法是通过对原始数据相关系数矩阵内部结构的研究,将多个指标转化为少量互不相关且不可观测的随机变量(即因子),以提取原有指标绝大部分的信息的统计方法。
因子分析首先将原始数据标准化处理,建立相关系数矩阵并计算其特征值和特征向量,接着从中选择特征值大于等于1的特征值个数为公共因子数,或者根据特征值累计贡献率大于80%来确定公共因子,求得正交或斜交因子载荷矩阵,最后计算公因子得分和综合得分。
本文使用SPSS17.0软件作为统计分析工具,调用SPSS17.0中的因子分析程序先对14个指标的原始数据进行标准化处理(消除量纲差异和数量级影响),通过数据处理,得相关系数矩阵P值均<
0.05,表明指标间存在较强的相关性,可用因子分析进行精简。
KMO值为0.803,Bartlett球形检验显著性水平<
0.0001,表明样本个数充足,相关系数矩阵非单位阵,故可以实施因子分析。
通过因子分析,得到各指标的解释的总方差如表1。
由表1可看出,主成分得到的前4个因子为综合因子,提取了80.684%数据信息,因此提取前三个主因子。
表1解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
1
6.345
45.318
2
2.196
15.687
61.005
3
1.464
10.456
71.461
4
1.291
9.223
80.684
5
.975
6.966
87.650
6
.767
5.481
93.131
7
.553
3.953
97.084
8
.217
1.552
98.637
9
.087
.623
99.260
10
.054
.384
99.643
11
.022
.159
99.802
12
.017
.125
99.927
13
.010
.073
100.000
14
7.253E-17
5.181E-16
提取方法:
主成份分析。
表2成份得分系数矩阵
星级饭店数
-.025
.308
-.174
星级饭店全员劳动生产率(万元/人)
.188
-.045
-.064
.227
平均客房出租率(%)
.008
.056
.046
.544
星级饭店人均占用固定资产原价
.228
-.282
.115
.193
星级饭店百元固定资产创营业收入
-.091
.410
-.258
.135
国际旅行社外汇收入
.194
-.006
-.048
-.055
入境旅游人数
.165
.024
-.037
-.204
入境旅游人均消费
-.016
-.015
.000
.508
旅行社营业收入总数
旅行社资产总额
.207
-.043
-.047
旅行社总数
-.075
.349
.034
.095
旅游业从业人员
-.041
.285
.094
-.004
旅游院校数
-.073
.447
旅游院校学生人数
-.040
-.061
.443
.042
提取方法:
主成分分析法。
表3公因子的命名与分类
因子名称
F1国际旅游和旅行社综合实力
F2旅游企业规模及创收能力
F3人员培养
F4区域消费水平
较大正荷载量
X2星级饭店全员劳动生产率
X4星级饭店人均占用固定资产原价
X6国际旅行社外汇收入
X7入境旅游人数
X9旅行社营业收入总数
X10旅行社资产总额
X1星级饭店数
X5星级饭店百元固定资产创营业收入
X11旅行社总数
X12旅游业从业人员
X13旅游院校数
X14旅游院校学生人数
X3平均客房出租率
X8入境旅游人均消费
如表3中所分,第一个公共因子F1在X2星级饭店全员劳动生产率、X4星级饭店人均占用固定资产原价、X6国际旅行社外汇收入、X7入境旅游人数、X9旅行社营业收入总数、X10旅行社资产总额6个变量上的荷载值都很大,上述指标中X2、X4、X9、x10是反映旅行社综合实力的核心指标,而X6、X7则是反映国际旅游竞争力的指标,因此这6个指标主要反映了旅游业在国际上的竞争力和其综合实力,将其名命名为国际旅游和旅行社综合实力。
在分析旅游业综合水平评价中,将上述两类指标归为一大类看似矛盾,但因子分析中的公共因子本身就是一个不可观测的、而又具有一定意义的变量,只要对原始变量具有较高的荷载,能够将原始变量归为合理的类别,就恰好起到简化指标、便于解释的目的。
第一个公共因子对全部初始变量的方差贡献率为45.318%,是研究旅游业综合水平时所需要考虑的重点方面。
第二个公共因子F2在X1星级饭店数、X5星级饭店百元固定资产创营业收入、X11旅行社总数、X12旅游业从业人员4个指标上有高荷载,X5是反映旅游企业创收能力的核心指标,指标X1、X11、X12主要是反映旅游企业的模,因此将其命名旅游企业规模及创收能力。
第二个公共因子对全部初始变量的方差贡献率为15.687,也是评价旅游业综合实力所需要考虑的主要方面。
第三个公共因子F3在X13旅游院校数、X14旅游院校学生人数两个指标上的荷载较高,指标X13和X14反映了旅游业内的人员受培训的情况,是旅游业综合实力形成的技术基础,因此将其命名为人员培养。
第三个公共因子对全部初始变量的方差贡献率为10.456%,它对解释旅游业综合实力的重要性相对差一些。
第四个公共因子F4在X3平均客房出租率、X8入境旅游人均消费两个指标上的荷载较高,指标X3反映了旅游业内的基础设施资源利用情况,指标x8反映了入境旅游的消费水平,因此将两个指标共同命名为区域消费水平。
第三个公共因子对全部初始变量的方差贡献率为9.223%,它对解释旅游业综合实力的重要性相对更差一些。
表4因子方差贡献率表
公因子
f1
f2
f3
f4
贡献率
通过因子分析,将14个指标变量降维成四个公共因子,依据因子荷载矩阵写出因子得分表达式为:
F1=-0.025X1+0.188X2+0.008X3+0.228X4-0.091X5+0.194X6+0.165X7-0.016X8+0.194X9+0.207X10-0.075X11+0.041X12-0.055X13-0.040X14
F2=0.308X1-0.045X2+0.056X3-0.282X4+0.410X5-0.006X6+0.024X7-0.015X8-0.006X9-0.043X10+0.349X11+0.2855X12-0.073X13-0.061X14
F3=0.022X1-0.064X2+0.046X3+0.115X4-0.258X5-0.048X6-0.037+0.000X8-0.048X9-0.005X10+0.034X11+0.094X12+0.447X13+0.443X14
F4=-0.174X1+0.227X2+0.544X3+0.193X4+0.135X5-0.055X6-0.204X7+0.508X8-0.055X9-0.047X10+0.0957X11-0.004X12+0.032X13+0.042X14
采用回归方法估计出因子得分,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各地区的综合得分F,即
F=(45.318*F1+15.687*F2+10.456*F3+9.223*F4)/80.684
将各个地区的数据代入上面四个式中,可得出各个地区旅游业综合实力的综合评价指标F的得分,以这个综合得分的大小进行排序,就可以排列出中国各地区旅游业综合实力的排名,如表5所示。
表531个省份旅游业综合实力的排名
地区
f1国际旅游和旅行社综合实力
f2旅游企业规模及创收能力
f3人员培养
f4区域消费水平
F综合实力
排名
北京
4.1674
-0.4021
-0.4126
-0.3168
1.6853
广东
1.6511
1.6353
0.7662
-1.4235
1.0998
上海
2.0351
-0.3027
-0.3713
1.5033
0.9605
浙江
0.2241
2.5224
0.1952
0.3290
0.7322
江苏
0.8828
0.8743
0.3679
0.4006
0.7166
四川
-0.4079
-0.9129
4.6685
0.2836
0.6214
山东
-0.4249
1.7784
0.5834
0.6000
0.3874
辽宁
-0.0742
0.1081
0.9247
0.3465
0.2235
江西
-0.4814
-0.0525
0.5322
2.4783
0.1734
福建
-0.1014
-0.0776
-0.1771
0.6201
-0.0267
山西
-0.5378
0.9163
-0.8615
1.1229
-0.0915
湖北
-0.3838
0.4195
0.2417
-0.5777
-0.1010
河南
-0.7154
1.2312
-0.3038
0.0587
-0.1132
广西
-0.0794
-0.5111
0.1534
-0.3513
-0.1572
海南
0.2669
-1.6938
0.2620
0.1817
-0.1722
15
云南
-0.2583
0.7567
-0.4415
-1.1770
-0.1835
16
安徽
-0.6594
0.8372
-0.4334
0.1321
-0.1920
17
新疆
-0.0547
-0.5820
-0.4077
0.1332
-0.2212
18
天津
0.0102
-0.6441
-0.6939
0.4633
-0.2258
19
重庆
-0.1957
-0.3468
-0.2482
-0.2571
-0.2469
20
河北
-0.8666
0.7238
-0.0028
-0.2499
-0.2665
21
-0.2342
-0.8911
-0.2644
-0.2857
22
吉林
-0.0807
-1.1203
-0.1976
0.0363
-0.3182
23
陕西
-0.0380
-1.0389
-0.0036
-1.0712
-0.3715
24
贵州
-0.6591
-0.1412
-0.7971
0.6442
-0.4207
25
青海
-0.3330
-0.6686
-1.0271
0.5386
-0.4479
26
甘肃
-0.4914
-0.5683
-0.5070
-0.0687
-0.4615
27
宁夏
-0.5625
-0.7240
-0.8375
0.9700
-0.4739
28
-0.5543
-0.0006
-0.8287
-0.4354
-0.4766
29
湖南
-0.5608
0.5606
-0.0140
-2.9850
-0.4886
30
西藏
-0.4828
-1.6852
-0.3527
-1.6643
-0.8579
31
根据各区域建筑企业竞争力因子得分、排名的结果,可得出如下结论:
表中四个公共因子得分和因子综合得分越大,说明国际旅游和旅行社综合实力、企业规模及创收能力、人员培训水平越高,旅游业综合竞争力越强。
由于原始数据的标准化处理意味着将整个行业各公共因子和综合因子的平均水平定为零点,表中的负值仅表示该地旅游业的国际旅游和旅行社综合实力、企业规模及创收能力、人员培训水平低于整个行业平均水平,还需要继续努力发展旅游业,才能达到全国旅游业的平均水平,正值的意义则相反。
分析发现,北京、广东、上海、浙江、江苏、四川、山东、辽宁、江西9个省或直辖市的旅游业综合实力在全国平均水平之上,其他的中西部等地区在全国的平均水平之下。
②从公共因子只得分可以看出,北京、广东、上海、浙江、江苏、四川、山东7个地区在旅游业国际旅游和旅行社综合实力、企业规模及创收能力、人员培训水平越高方面具有较明显优势,其余小于0的中西部等地区旅游业的水平有待提高。
③对第一个主因子进行纵向比较发现:
北京、广东、上海、浙江、江苏因子得分排名在前面,而其综合得分排名也在前面,表明了上述地区的星级饭店全员劳动生产率、星级饭店人均占用固定资产原价、国际旅行社外汇收入、入境旅游人数、旅行社营业收入总数、旅行社资产总额等指标水平较高,从而较好的促进了这些地区的旅游业的发展。
④从排名上看,西部地区的省份如陕西、贵州、青海、内蒙古、西藏等旅游业的各因子水平及综合实力水平都在全国的品均水平以下。
其原因为这些地区的经济发展水平不高,旅游业的各方面的竞争力都比不上东部地区,另外,这些地区地广人稀,游客数量少,很大程度上限制了旅游业的发展。
然而,这些地区并不缺少旅游资源,甚至说是资源丰富,因而,当地政府要大力宣传本地旅游业,突出自己的景点特点,吸引外地游客的到来,从而带动本地经济的发展。
5基于因子分析得分的聚类分析及结果评价
5.1聚类分析
基于因子分析得出的各个省市的综合得分,我们可以进行聚类分析。
采用SPSS的系统聚类法,聚类方法采用组间连接(Between-GroupsLinkage),距离选择欧式距离平方(SquaredEuclideanDistance),标准化为Zscores法。
由此我们得出了聚类结果表以及树形图。
表6聚类结果表(3~6类)
表6ClusterMembership
Case
6Clusters
5Clusters
4Clusters
3Clusters
1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
11:
12:
13:
14:
15:
16:
17:
18:
19:
20:
21:
22:
23:
24:
25:
26:
27:
28:
29:
30:
31:
*******************HI