基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx

上传人:b****7 文档编号:11068469 上传时间:2023-02-24 格式:DOCX 页数:50 大小:613.52KB
下载 相关 举报
基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx_第1页
第1页 / 共50页
基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx_第2页
第2页 / 共50页
基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx_第3页
第3页 / 共50页
基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx_第4页
第4页 / 共50页
基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx_第5页
第5页 / 共50页
点击查看更多>>
下载资源
资源描述

基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx

《基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx》由会员分享,可在线阅读,更多相关《基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx(50页珍藏版)》请在冰豆网上搜索。

基于文本分析的旅游社区酒店营销影响力评价研究毕业论文.docx

基于文本分析的旅游社区酒店营销影响力评价研究毕业论文

摘要

本文提出合理可行的酒店营销因素,计算各指标因素的权重,为旅游社区酒店营销提供参考。

酒店顾客的评论能够反映不同因素在消费者心目中的重要程度,因此,本文首先综合分析国内外互联网在酒店经营过程中的应用,通过对爬取到的到到网代表酒店的评论进行文本分析,进而归纳出消费者关注度较高的营销因素,创建旅游社区酒店营销的影响力评价指标体系,运用模糊层次分析法(FAHP)计算各营销因素的权重值,然后通过问卷调查对所建立的体系进行验证。

最后根据以上得出的结论提出旅游社区酒店营销的相关建议,并总结了本文研究存在的不足之处以及研究展望。

关键词:

文本分析;酒店营销;酒店营销影响力;评价体系

Abstract

Thispaperputsforwardreasonableandfeasiblemarketingfactors,calculatestheweightsofthehotelmarketingfactors,andprovidesreferencefortourismcommunityHotelmarketing.Thedegreeofimportanthotelcustomerreviewscanreflectthedifferentfactorsinthemindsofconsumers.SobyanalyzingthecommentsofTripAdvisoronbehalfofthehotel,andthensummedupthemarketingfactorsofhighdegreeofconsumerattention,createtourismcommunityhotelmarketinginfluenceevaluationindexsystem,usingfuzzyanalytichierarchyprocess(FAHP)tocalculatetheweightsofthemarketingfactors,andthenthesystemwasvalidatedbyquestionnaire.Finally,accordingtotheconclusionsabove,thispaperputsforwardsomesuggestionsaboutthetourismcommunityhotelmarketing,andsummarizestheshortcomingsandprospectsofthestudy.

Keywords:

textanalysis;hotelmarketing;hotelmarketinginfluence;evaluationsystem

 

一、概述

随着近年来旅游业的迅速发展和人们消费水平的提高,消费者对酒店住宿需求日益趋向个性化,但酒店供应商没有真正把握消费者心目中关注度高的营销因素或潜在营销因素。

因此本文从消费者心理对不同因素的关注度出发,研究酒店营销因素的影响力,为旅游社区酒店精准营销提供依据。

(一)概念界定

1.酒店

酒店,是指通过建筑物向消费者供给包括吃、住、购、娱四要素等服务的营业往来机构。

一般来说就是给宾客提供住宿和饮食的场所[1]。

2.酒店营销

酒店营销是以为酒店盈利为目的,以为消费者提供服务为手段,而进行的一系列销售活动。

酒店营销是酒店经营过程中不可缺少的一环,它开始于酒店提供服务和销售之前,贯穿住宿活动的始终。

作为市场营销学的重要分支,酒店营销除了具备市场营销的共同性质之外,也有着其行业特性。

因此,在酒店的营销活动过程中,不仅要遵循到市场营销的一般规律,而且要符合酒店营销的行业特性,以及考虑到酒店经营发展的实际情况。

酒店营销致力于开发酒店市场的潜力,增进酒店的收益[2]。

酒店在进行营销过程中,需把握以下要点:

第一:

选择正确的目标客户和细分市场;第二,一切以满足顾客需求为中心;第三,加强酒店内部合作,营造良好的营销氛围。

3.影响力

影响力是用一种以别人所乐于接受的方式,改变他人的思想和行动的能力[3]。

针对不同的学科、对象和角度,影响力有着不同的内涵和外延。

本文中的酒店营销影响力指的是影响人们进行酒店住宿决策时的力度。

4.旅游社区

用户通过网络进行交流形成了虚拟的网络社区,即网络论坛。

旅游社区是指一群基于旅行活动爱好者通过虚拟网络社区,进行与旅游活动相关话题的讨论和交流互动的网络论坛。

5.文本分析

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们实际不知道的、但又是潜在有用的信息和知识的过程[4]。

而文本分析是数据挖掘中常见的一种方法,主要指通过对文本进行处理和提取特征词,并从建模中取得实用的信息。

文本分析的原理是:

将非结构化或半结构化的文本转化为使得计算机能够识别结构化的领域知识库,通过建立其数学模型,使得计算机能够通过对已创建的数学模型进行计算和操作,以此实现对非结构化文本的识别。

(二)文献综述

1.国内外的研究现状

(1)国内研究现状

①酒店营销

金怀玉认为我国的目前的酒店营销存在着仍旧保持着传统的经营管理理念、对品牌效应不够重视、行业信息化低下等问题。

他认为应该加强实施酒店营销特色品牌化和品牌延伸,以及实现酒店业网络化营销。

王玉芳总结了酒店营销具有经济市场波动性和服务无形性的特点,并提出以酒店品牌为依托,进行针对性营销的观点。

国内的酒店营销的理论研究尚处于摸索阶段,研究的方向主要集中在策略研究、模式研究、战略研究和品牌推广等几个方面。

从2006年起,随着旅游业的发展,酒店业也迅速发展,国内对酒店的研究急速增多。

国内大多的研究是先通过对酒店的目标市场进行分析,再运用营销理论提出相关的营销策略和方案。

②酒店评论研究

沈涵等基于ASCI建立了经济型酒店顾客满意度模型,并以上海经济型酒店为例对模型进行了验证。

丁于思和肖轶楠基于网络评论创建了关于五星级酒店的顾客满意度模型,并对总体满意度和单维度满意度进行了分析。

目前国内在文本分析酒店评论方面的研究较少,大多集中在五星级酒店或某类型酒店(如:

商务型或经济型等)的顾客满意度研究。

(2)国外研究现状

①酒店营销

“现代营销学之父”菲利普科特勒认为传统的酒店营销已经无法满足21世纪的营销,好的酒店营销应该是不断的发展和变化的。

他认为全方位的酒店营销才是现代营销的大趋势,全方位酒店营销包括企业内部营销、产品整合营销、员工绩效营销和客户关系营销四种类型。

②互联网+酒店研究

英国学者戴安娜通过对伦敦和曼切斯顿量大城市的酒店进行抽样调查,旨在考察是否实施客户关系营销的在线业务和酒店对互联网的应用是否仅仅停留在“客房预订”和“提供资讯”等基本功能,最终研究结果发现酒店对互联网的使用仅仅记录了酒店集团与客户的商业关系,而不是为了收集讯息。

国外的一些学者也对影响酒店顾客满意度的因素进行深入研究,Wuest等定义了顾客体验酒店不同服务和设施的价值感知[5]。

2.本文的主要研究内容和意义

本文中笔者在介绍了酒店、酒店营销领域相关知识基础上,结合本文分析,依据研究所归纳酒店和旅游社区的功能、特点及策略等内容选取恰当的营销影响力指标、并在参考借鉴前任大量影响力评价研究方法和模型的基础上,通过文本分析建立了一套适用于旅游社区酒店营销影响力的评价指标体系,并通过问卷调研对该体系的合理性和可行性进行了实证研究。

可以说本文对旅游社区酒店营销方面的研究进行了补充,以旅游社区酒店营销的影响力评价指标体系完善了酒店营销评价体系的相关研究,对今后酒店营销的理论知识和实际操作提供了更完善便利的知识及模型。

二、相关理论基础

(一)文本分析理论

文本分析包括文本的获取和文本的预处理。

文本分析是指将通过爬虫或其他方式获取到的结构文本或领域本体经过文本解析、语法解析和词法解析等方法处理为半结构知识和领域本体知识,把处理好的知识抽取出来形成知识中间结构,再将知识中间结构转换成为领域知识库。

图1为文本分析流程图:

1.文本的获取

一般采用一些爬虫程序实现对文本的获取。

对给定的URL进行分析,根据设定的正则表达式获取链接中的内容,再将爬取的内容保存到本地。

图1文本分析流程图(以上流程图来自知行网)

2.文本预处理

文本的预处理包括文本分词和文本特征词提取。

(1)中文分词

中文分词(ChineseWordSegmentation),也可以称为中文切词,指的是通过某种特定的规则,讲中文文本切分成单独的具有意义的词条[6]。

(2)文本特征词提取

通过爬虫程序采集到的文本通常为非结构化或半结构化的形式,而计算机技术只能对结构化的数据进行处理。

故而要对文档进行特征词提取,提取的相应的特征是根据具体的应用目的。

通过对文本特征词的提取,降低文本构成矩阵的维度,挖掘文本中包含的热点属性。

常用的文本特征词提取方法包括基于统计的方法和基于语义的方法[7]。

1基于统计的方法

基于统计的方法是通过统计高频词汇,进而降低特征空间的维度,从而减少文本预处理后数据的复杂度,并能选择出用户最感兴趣的词条[8]。

常见的基于统计的方法有:

TFIDF法,词频方法(WordFrequency)和文档频次法(DocumentFrequency)等。

②基于语义的方法

基于语义的方法是指根据语义对文本进行处理,提取出高频特征词,根据文本的具体内容寻找出用户对不同属性的评价。

所提取出的评论的特征词的词频高低用来表示属性不同的重要程度,以此说明用户对于不同特征词的关注度不同,根据关注度的不同对这些特征词赋予不同的权重。

另外,由于同一特征词可能有多种特征词的描述,因此需要对这些特征词和观点进行归一化处理。

(二)模糊层次分析法(FAHP)

模糊层次分析法和层次分析法是20世纪70年代美国运筹学T.L.Saaty教授提出的定性与定量相结合的系统分析方法[9]。

模糊层次分析法摒弃了层次分析法矩阵一致性难以判断的弊端,因此,本文选定模糊层次分析法计算各指标的权重值。

具体计算步骤如下所示:

(1)建立优先关系矩阵,方法如下:

当因素Bi/Bim比Bj/Bjn重要时,rij=1;

当因素Bi/Bim和Bj/Bjn同等重要时,rij=0.5;

当因素Bi/Bim不如Bj/Bjn重要时,rij=0;

(2)构造模糊一致矩阵,构造方法如下:

,实施变换方法如下:

fij=(ri-rj)/2n+0.5

(1)

(3)层次单一排序——根据模糊一致矩阵,求得各指标层的权重值Wi,方法如下:

(2)

注:

α=(n-1)/2

(三)文献资料法

文献资料法是通过查阅大量的文献资料了解、证明研究对象的方法。

通过搜集国内外相关的文献资料,资料包括国内外酒店和国内外酒店营销、互联网+酒店和酒店评论的研究,以及对相关基础资料的查阅、归纳和总结以更好的了解酒店营销的研究动态和研究成果,为旅游社区酒店营销的影响力评价指标体系的构建提供基础性资料。

三、酒店和旅游社区的功能、特点

(一)酒店的功能、特点

1.酒店的历史

(1)西方酒店的发展史

西方酒店大发展史开始于古希腊、罗马时期,经历了古代客栈时期、大饭店时期、商业饭店时期和现代酒店四个阶段。

古客栈时期:

为满足外出人们的基本住宿需要,中世纪就出现了客栈和酒店。

中世纪后期,伴随着旅游和商贸的繁荣发展,客栈也开始兴起。

大饭店时期:

18世纪后期,第一次工业革命解放了大量的劳动生产力,是的人们的生活水平得以提高,贵族度假者和上层人物以及公务旅行者陡增,促使酒店业得以进一步发展。

该时期主要服务对象是贵族、商人以及上流社会人员。

接待目的为非盈利。

商业饭店时期:

20世纪初期,伴随着世界经济全球化步伐的迈开,商旅人士急剧上升。

由于当时严格的等级制度,商人不能入住大酒店,而他们又不愿意下榻相对比较廉价和简陋的小客栈,这就为商旅酒店的发展提供了机会。

现代酒店时期:

第二次世界大战结束后,各国疲于长期战争,开始发展经济,从而引起了对酒店需求的剧增,为原本饱受战争摧残的酒店业取得一线生机。

(2)中国酒店的发展史

中国酒店是在古代的“驿站”、“迎宾馆”和“客栈”的基础上逐渐发展为今天的现代酒店。

其间经历了古代酒店、近代酒店和现代酒店三个时期。

中国古代酒店:

中国古代酒店可分为官办和私人经营两大类,官办的酒店以驿站和迎宾馆为主。

中国近代酒店:

中国近代酒店分为西式酒店、中西式酒店和招商客栈三种类型。

西式酒店是19世纪初外国资本入侵的产物,这类酒店在服务、设施以及经营等各方面与中国传统酒店有着天壤之别。

中西式酒店,该类型酒店是中西结合的产物,受西式酒店的影响较大。

北京饭店就是中西式酒店的代表。

西方列强入侵中国后,在中国兴建的为其入侵所服务的酒店统称为招商客栈。

上海国际饭店就是招商客栈的代表。

中国现代酒店:

中国现代酒店业的发展史较短,从开始实行改革开放政策以来,在经营理念、管理水平和服务质量等方面都取得了较快的发展[10]。

2.酒店的功能

由史至今,人们外出出行必定会寻找地方下榻,由此酒店这一概念便由此产生。

中世纪后期,商贸和宗教信仰蓬勃发展,外出贸易的商人、传教士和信徒也随之增多,酒店数量也就跟着增加了。

最初的酒店仅提供最基本的食宿服务,到了地理大发现时期,酒店的规模扩大,部分已经开始提供多间客房,并设有厨房、酒窖等,以满足顾客的多样化需求。

至此,酒店开始迈向现代化发展。

3.酒店的特点

酒店具有出售无形商品的和有形商品的特点:

酒店出售有形的商品主要为客房,而客房是不可保留和存贮的。

酒店最大的特点是服务,服务是酒店的支柱。

服务是无形商品,看不见,摸不着,只能靠人体感知得到,因此酒店的服务产品受人的因素影响大。

(二)旅游社区的功能、特点

1.旅游社区的功能

旅游社区的功能有如下三点:

第一,旅游信息交流功能。

旅游者将自己的旅游经历书写成旅游游记或旅游攻略发布在旅游社区中,以供缺乏经验的旅游者消除顾虑。

第二,产品宣传与销售功能,在旅游社区中,旅游供应商可以通过广告的形式宣传产品,以此达到销售旅游产品的目的。

第三,旅游咨询功能,旅游社区为经验丰富的旅游者解答问题提供了途径。

2.旅游社区的特点

(1)传播效应强

社区成员在旅游社区中参与自己感兴趣的话题的讨论、交流和互动。

因为这种方式是以一种第三者的角度描述、评价某一件产品,不带有目的性的,所以这种网络口碑宣传效应极强,容易在浏览者心中产生共鸣。

(2)便捷性

旅游社区将已发布的内容保存下来,用户可随时随地的发布和浏览社区中的信息,摆脱了空间和时间上束缚,方便了社区成员浏览旅游信息。

四、基于文本分析构建旅游社区酒店营销影响力评价指标体系

(一)文本获取和分析流程

本文的文本是通过爬虫程序获取得到,具体步骤为:

首先拿到要爬取评论的酒店在到到网上的网址,然后通过程序给定的正则表达式选择要爬取的内容,最后再将爬取的内容保存在数据库或本地。

以上的步骤需更新原始的url,共经历了4个循环,分别是:

循环城市,循环打开每个酒店评论页,循环打开酒店评论的每一页,再从循环中提取每一条评论的内容。

图2为爬虫的流程图:

图2爬虫流程图

通过爬虫程序得到的酒店评论是非结构化的文本,参照文本分析理论和结合本文的实际情况,笔者提出适合分析和处理酒店评论的分析方法,具体流程如图3所示:

图3文本分析流程图

(二)文本分析工具的选择

ROSTWordParser是沈阳博士开发的中文词频分析软件,该软件可用于中文词频统计、分词、词典查看及设置、发现新词等功能,同时也支持过滤词表、自定义词表、特征词检索及统计停用词后的词频数,可以用于中文词频分析以及构建特定领域词表。

(三)旅游社区酒店营销的影响力因素的获取

1.点评网站的选取

国内主流的旅游电子商务网站主要有携程旅行、飞猪旅行、驴妈妈、同程网、蚂蜂窝、驴评网和到到网,其中蚂蜂窝是专注于UGC游记的在线旅游网站,而驴评网和到到网是纯粹的旅游点评网站。

到到网作为全球最大的旅游垂直媒体,全球最受欢迎的旅行社区,据官方网站介绍,每月有超过5000万独立用户,超过6000万条点评和评论[11]。

且到到网的评论具有国际性、真实性和客观公正的特点。

因此本文选择到到网(即猫途鹰TripAdvisor)为数据采集网站。

图42016年中国各城市酒店总量排行省份城市酒店总数(以上数据统计来自携程)

2.代表酒店样本的选取

携程对291个城市(地级市)进行汇总,获得232425家酒店。

以上统计因统计时会忽略地级市以外的地区(非地级市地区数量有限且不会对总数的方向性偏差)。

将以上得到的数据与多家OTA机构对比,其结果都在可接受的合理误差范围内,因此本文认为以上的酒店统计数据是合理且可信的。

本文爬取样本的时间为2017-3-19,从到到网的酒店中选取全国酒店数量排名前十的城市,依据酒店数量比例选定各城市的酒店样本数量,进而根据到到网最受欢迎的排名,选取作为样本代表的酒店共50个。

按照时间排序,利用爬虫技术爬取各个酒店前150条评论(评论不足150条的酒店予以剔除,选择下一个顺位排名的酒店),得到评论7450条,共1024389个字。

爬虫代码展示见附件1和附件2。

剔除重复、与酒店本身无关等无效评论。

图5爬虫评论统计展示

基于2016年全国酒店分布统计情况,选取排名前十的省份城市分别为:

重庆(9943家),西安(9876家),北京(9624家),广州(8136家),上海(6916家),成都(5978家),长沙(5480家),深圳(5335家),武汉(4975家)和杭州(3824家)。

其比例约为:

7.1:

7.1:

6.8:

5.8:

4.95:

4.25:

3.9:

3.8:

3.55:

2.75。

因此选定的城市和代表酒店数量为:

重庆(7家)、西安(7家)、北京(7家)、广州(6家)、上海(5家)、成都(4家)、长沙(4家)、深圳(4家)、武汉(3家)和杭州(3家)。

本文选取的酒店需满足酒店评论大于或等于150条,具体选择的酒店如表1所示:

表1全国代表酒店的选取

城市

数量

酒店名称

 

重庆

 

7

JW万豪酒店;

盛捷解放碑服务公寓;

申基索菲特大酒店;

万达艾美酒店;

江北希尔顿逸林酒店;

希尔顿酒店;

洲际酒店;

 

西安

 

7

豪享来温德姆至尊酒店;

盛美利亚酒店;

索菲特传奇酒店;

香格里拉大酒店;

威斯汀酒店;

万达希尔顿酒店;

索菲特人民大厦;

 

北京

 

7

怡亨酒店;

诺金酒店;

四季酒店;

嘉里大酒店;

瑰丽酒店;

瑜舍酒店;

丽思卡尔顿酒店;

 

广州

 

6

文华东方酒店;

方圆奥克伍德豪景;

四季酒店;

富力丽思卡尔顿酒店;

南丰朗豪酒店;

广交会威斯汀酒店;

 

上海

 

5

浦东文华东方酒店;

浦东丽思卡尔顿酒店;

浦东四季酒店;

外滩华尔道夫酒店;

和平饭店;

成都

4

博舍;

富力丽思卡尔顿酒店;

尼依格罗;

希尔顿酒店;

长沙

4

华天大酒店

运达喜来登酒店

芙蓉国温德姆至尊豪廷大酒店

皇冠假日酒店

深圳

4

中洲万豪酒店;

星河丽思卡尔顿酒店;

前海华侨城JW万豪酒店;

华侨城洲际大酒店;

武汉

3

新世界酒店;

江城明珠豪生大酒店;

光明万丽酒店;

杭州

3

温德姆至尊豪廷大酒店;

武林万怡酒店;

JW万豪酒店;

3.文本预处理

(1)将样本中与酒店无关的评论删除。

评论样本中有些与酒店无关的评论,如:

很好,赞!

很赞!

等,将这些评论予以剔除。

(2)评论中出现的表情符号。

将一些无意义的表情和符号删掉和替换,如☺,b( ̄▽ ̄)d等,若有实际意义,则用文字替换表情和符号。

(3)英文转化为中文,繁体字转化为中文。

如:

checkin/checkout转化为办理入住/办理退房等。

(4)网络用语转化为正常表述。

如:

牛X——厉害,RP——人品,高b格——高格调,木有——没有等

(5)大小写统一。

如WIFI,WiFi,Wi-Fi,Wifi,wifi——wifi;SPA,Spa,spa——spa等。

(6)将没有写完的评论予以删除。

4.文本分词

通过运用ROSTWordParser软件进行文本分词,并导入搜狗的细胞词库和自定义名词词典,部分词库图6所示:

图6部分词库展示

部分分词结果如图7所示:

图7部分分词展示

5.旅游社区酒店营销影响力评价指标体系的建立

5.1提取关键词及频次

本文利用ROSTWordparser的分词和词频统计功能,统计研究样本的词频情况。

本文通过将搜狗细胞词库下载的酒店类词库转化为文本形式,并添加到user文件下,得到的词频统计结果如表2所示(由于词汇较多,故仅展示部分高频词):

表2部分高频词展示表

词语

词频

词语

词频

词语

词频

酒店

10124

878

贴心

552

服务

5031

服务员

878

卫生

549

房间

4583

舒服

878

价格

539

位置

1811

餐厅

878

办理

535

方便

1684

大堂

878

整体

506

早餐

1504

态度

818

满意

504

设施

1417

舒适

757

风格

501

人员

1183

体验

756

免费

481

热情

1118

地理

747

周到

474

前台

1100

员工

707

硬件

467

1039

客人

572

西安

458

行政

977

客房

689

五星级

454

环境

963

交通

677

中心

448

918

干净

661

万豪

446

装修

887

设计

658

重庆

443

购物

422

印象

378

主动

314

豪华

422

升级

373

性价比

312

附近

414

369

亲切

312

问题

379

分钟

363

泳池

311

味道

395

上海

362

餐饮

311

5.2影响力评价体系的建立

(1)引入SERVPERF模型构建服务评价指标体系

为更加科学性的评价酒店的服务因素,本文引入SERVPERF模型进行评价。

SERVPERF模型(ServicePerformance,绩效感知服务质量度量方法),是克罗宁和泰勒于1992年提出的,该模型建立在SERVQUAL模型的基础上,但与SERVQUAL模型不同的是,SERVPERF模型摒弃了差异分析方法,在评估服务质量时不考虑顾客期望的影响,而直接用服务绩效来评估服务质量,克服了SERQUAL模型存在的缺陷[12]。

SERVPERF模型沿用了SERQUAL模型中的五个关键维度,分别为:

有形性、可靠性、响应性、保障性和移情性。

(2)各项目层指标的确定

根据费耐尔(Fornell)教授的顾客满意度指数理论和旅游六要素——“吃、住、行、游、购、娱”,以及SERVPERF模型的引入,确定旅游社区酒店营销的影响力评价指标体系如图8所示:

图8旅游社区酒店营销影响力评价指标体系

6.旅游社区酒店营销的影响力权重确定

6.1归一词群

本文旨在通过高频特征词的词频得到相应的评价指标体系中的权重值,为方便计算和

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 工作计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1