基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx

上传人:b****3 文档编号:16849132 上传时间:2022-11-26 格式:DOCX 页数:60 大小:1.58MB
下载 相关 举报
基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx_第1页
第1页 / 共60页
基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx_第2页
第2页 / 共60页
基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx_第3页
第3页 / 共60页
基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx_第4页
第4页 / 共60页
基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx_第5页
第5页 / 共60页
点击查看更多>>
下载资源
资源描述

基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx

《基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx》由会员分享,可在线阅读,更多相关《基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx(60页珍藏版)》请在冰豆网上搜索。

基于数据挖掘的移动通讯消费者行为分析Word文档格式.docx

RFM、客户细分、数据挖掘、CART算法、消费者行为

ABSTRACT

Withtheadventoftheinformationage,competitioninthemobilecommunicationsmarketmorecompetitive,marketshare,enhanceviscositybetweencustomersandbusinessmobilecommunicationsbusinesshasbeenthegoal.Atthesametime,theuseofmobilecommunicationmoreandmoreconsumers,howtofindconsumerbehaviorfromalargenumberofconsumerspendingrecordedinthemobilecommunicationsbusinesshasimportantstrategicsignificancetoimprovecustomersatisfaction.

Thispaperisthestudyofconsumerbehaviormobilecommunicationaboutdatamining,firstelaboratedthetheoryofdatamining,analysisandconsumerbehavioranalysis,andtheresultingdataintothesample,performRFManalysis,consumptionrecordsfromtheconsumer,ThatconsumerID,spendingtimeandamountofconsumptiontoitsR,F,Mvalue,thenextconsumertoprovidethedatabasesegmentation,analysisoftheirvaluebytheconsumer,ismorestraightforward.

Basedontheprocesseddata,conductconsumersegmentation.ByK-Means,Two-StepandKohonenclusteringmethods,wereclustering,choseK-Meanssegmentsresultsasconsumersegmentationcriteriatogiveconsumersfivecategories,namelyimportanttokeepcustomers,animportantdevelopmentclientitisimportanttoretaincustomers,thegeneralvaluecustomersandlow-valuecustomers.Onthebasisofconsumersegmentationbasedondifferenttypeswereconsumerbehavioranalysismoremeaningful.

Sincethisdatahas24785data,butconsumersonly10085,datadistributionmaynotsatisfysomealgorithms,thismobileconsumerstobuyCARTalgorithmwerecarriedoutonthetendency,CHAIDalgorithmandC5.0algorithms,thesethreealgorithmsprocessing,finalimportanttomaintainalargecustomerandtheirage,thelargerretaincustomersandimportantrelationshipbetweenfrequencyofconsumption,importantdevelopmentsandrecentcustomersarespendingtimecorrelationishigh,thegeneralvaluecustomersandconsumptionfrequencyandamountofconsumptionrelated,low-valuecustomersareandgenderhaveacertainrelationship.Forthis,intheexpandedmarketingplan,youcancarryouttargetedmarketing.

Inthispaper,data-driven,mobilecommunicationsconsumerspendingbehaviorcorrelationanalysis,corporatemarketingplanningforthefuturedevelopmentofgreatsignificance.

Keywords:

RFM,customersegmentation,datamining,CARTalgorithm,consumerbehavior

目录

摘要1

ABSTRACT2

1绪论7

1.1研究背景7

1.2国内外研究现状7

1.2.1数据挖掘的研究现状8

1.2.2客户消费者行为研究现状8

1.2.3基于数据挖掘的客户消费者行为研究现状9

1.3研究内容9

1.4本文组织结构10

2数据挖掘理论概述11

2.1数据挖掘特点11

2.2数据挖掘的一般过程11

2.3数据挖掘常用方法12

2.3.1决策树方法12

2.3.2统计分析方法12

2.3.3粗糙集方法12

2.3.4贝叶斯网络13

2.3.5人工神经网络13

2.3.6遗传算法13

3消费者行为分析14

3.1客户关系管理14

3.1.1CRM目标14

3.1.2CRM的体系结构15

3.1.3移动通讯企业实施CRM的优势15

3.2CRM流程16

3.3消费者行为分析17

3.3.1消费者行为17

3.3.2消费者行为模式18

3.3.3消费者行为研究理论基础19

3.4消费者细分方法21

3.4.1RFM分析22

3.4.2客户价值矩阵分析25

3.5移动通讯企业的消费者细分问题26

3.6本章小结27

4移动通讯消费者细分案例28

4.1数据预处理28

4.2消费者聚类30

4.2.1K-means聚类32

4.2.2Two-Step聚类34

4.2.3Kohonen聚类36

4.2.4聚类结果比较37

4.3细分客户消费行为分析38

4.3.1重要保持客户38

4.3.2重要发展客户40

4.3.3重要挽留客户41

4.3.4一般价值客户42

4.3.5低价值客户43

4.4实证研究44

4.4.1对某省电信运营商客户的细分44

4.4.2细分结果分析45

4.4.3研究结果的现实意义46

5移动通讯消费者相关性47

5.1消费者购买相关性48

5.1.1CART算法原理48

5.1.2CHAID算法原理49

5.1.3C5.0算法原理49

5.2消费者消费行为分析50

5.2.1重要保持客户CART消费分析50

5.2.2重要挽留客户C5.0消费分析52

5.2.3重要发展客户C5.0消费分析55

5.2.4一般价值客户CHAID消费分析57

5.2.5低价值客户CART消费分析59

5.3实证研究的现实意义60

6总结与展望62

6.1总结62

6.2展望62

致谢65

参考文献66

1绪论

1.1研究背景

随着科技的不断进步,中国通信企业经历了2G、3G和现在的4G时代,中国移动通讯的市场环境发生了翻天覆地的变化,形成了现在的移动、电信、联通等大型移动通讯企业为主导,多家小型企业参与的市场局面。

同时,中国的改革开放的逐渐深入,中国移动通讯市场逐步向外开放,形成了既有内部竞争又有外部压力的新格局。

作为当代的移动通讯产业,提高自己的核心竞争力已成为急需解决的问题。

中国作为一个人口大国,并且移动客户端人口数量巨大,所以需要从海量数据中进行数据挖掘,对移动通讯消费者行为进行分析,找出客户需求,从而提高核心竞争力,为实现科学经营打下坚实的基础。

在当下的竞争格局下,移动通讯企业已不再是昔日的以业务为中心,在当下以人为本的社会,以客户为中心已然成为移动通讯企业的核心,对不同类型的客户提供对应的服务,有利于增大客户黏度,从而实现以有限成本获得最大利益。

消费者行为分析本质上就是从消费者数据中分析消费者的行为规律,更加深入地了解消费者,开发其价值,为企业带来收益。

数据挖掘技术在当下信息大爆炸的年代有着无可比拟的优势,数据挖掘技术就是从大量随机和有噪声的数据中识别出现在又用的知识(模型或规则)的技术过程,从而把人们对数据的应用从低层次的联机查询操作,提高到决策支持、分析预测等更高层次的应用上。

[1]当下已是大数据的时代,数据挖掘技术在当代社会的各个领域都得到了广泛的应用,数据挖掘技术具有计算规模大、算法先进、鲁棒性强等特点,在大量实际工程项目中得到了诸多考验,所以把数据挖掘技术应用在移动通讯消费者行为分析中有较高的可靠性和实用性。

1.2国内外研究现状

随着互联网的发展,服务业也随之改变,利用消费者的消费记录,分析其潜在的消费可能性,并制定对应的消费方案成为各大企业的一种强有力的竞争手段,大数据广泛应用于客户消费者行为中,国内外对此作了相应的研究,并取得了相应的进展。

1.2.1数据挖掘的研究现状

数据挖掘技术最早源于1989年,随着信息技术大爆炸,国内外对此进行了大量的研究,取得了较为丰硕的成果。

数据挖掘技术方法较多,并不是各种算法的一种简单的叠加,而是基于现有的技术基础上融合的提升,国内外大量专家学者对数据挖掘技术进行了完善,其主要方法有:

分类、估计、预测、相关性分组或关联规则、聚类、复杂数据类型挖掘等方法。

R.Agrawal和Srikant[1]等人提出了著名的Aprior算法,这种关联规则方法对顾客事务数据中的关联问题做出了较好的诠释,该算法是基于频繁理论的低柜方法,即一种挖掘单维布尔关联规则的一种重要方法;

Liu[2]等人提出了AFOPT算法,该算法将树形结构和向量空间结构进行结合产生一种新的数据结构来存储所有与频繁集有关的信息,该方法在一定程度上提高了深度优先挖掘算法的性能;

Dong和Li[3]把模式定义为支持度的数据集,支持度增加了两个数据库中的重要性,且我们可以把频繁集看成是模式在空间上的实例。

基于此,国外很多公司都对数据挖掘上进行了相应的业务拓展:

Infermix公司与1998年收购了在数据挖掘技术上有较高声誉的RedBrick公司,RedBrick公司在关系引擎中通过创建模型完成对数据的分析和挖掘,这些模型可以通过结构查询语言SQL,像普通的表一样被访问和操作;

IBM和微软也成立了相应的研究中心进行这方面的工作,一些公司也已经提出了基于数据挖掘技术的商业智能解决方案。

与国外研究相比,中国直到1993年才由国家自然科学基金启动对数据挖掘的研究项目,这二十二年的高速发展,在数据挖掘领域也取得了较大突破。

杨辉[4]等人提出了一种用于数据挖掘的粗糙集产生多重知识库的新方法,改善了分类的精确性,提高了学习过程的有效性;

朱锡钧[5]等人现将USD准结构化,再转换成结构化数据,套用现有数据挖掘方法进行数据挖掘。

1.2.2客户消费者行为研究现状

市场竞争越来越激烈,客户行为分析得到了相应的重视,这是自1997年产生的客户关系管理后的一个新研究方向。

消费者行为的有效分析,能够有效预测将来对应的消费习惯、消费方式、消费行为,从而有利于优化企业与消费者之间的关系,减少客户流失,增加企业的竞争力。

FryerDS[6]等人提出了一种基于遗传算法的多分类器,来预测消费者购买行为,通过对购买可能性或购买意识来研究那些是潜在客户及这些客户的消费模式和消费习惯;

Bucklin[7]等人运用记录在服务器上的日志文件中点击数据流,判断访问客户是否决定继续浏览该网站以及网站间浏览的时间跨度;

JohnsonEJ[8]等人利用点击客户消费数据对在线访问及购买行为进行分析,得到经常访问电子商务平台网站的客户购买的可能性较大;

赵丹群采用了简单明了的图形将复杂大量的信息呈现给用户,提升用户交互,以便能够交互地分析数据关系;

晏创业[9]等人提出将XML和关联规则等数据挖掘算法相结合,可以实现网络数据挖掘的智能检索功能;

陈莉[10]等人认为,Internet/www信息检索与数据挖掘中,检索工具是其研究的重点,即如何在海量的图形,图像数据中进行数据分析,将多分辨技术(如子波、多子波)、粗集、SVM、神经网络、模糊算法等相关技术集成。

1.2.3基于数据挖掘的客户消费者行为研究现状

在客户消费行为方法研究上,研究人员突破原有方法,在统计学、集合论、人工智能、粗糙集、信息论等学科基础上,提出了以智能计算为核心的数据挖掘方法。

Euihosuh[11]等人建立了网络匿名消费者购买预测模型,利用关联规则挖掘消费者购买方式并对消费者购买可能性进行判断,实现了网络实时营销方法;

Changehung[12]等人基于关联规则和聚类方法,对消费者行为进行预测,该方法首先利用信誉度较好的客户的个人信息及购买数据进行聚类来获得客户基本的信息特征(如:

客户性别、年龄、收入、职业、生活习惯等),再将商品与客户特征进行匹配,最后将客户的消费日志信息与商品进行预测与关联分析,得到消费者的动态购买概率;

向勇[13]等人提出,以消费者的一般消费行为模式为基础,从个人内在影响因子及外在环境因素两方面入手,建立客户消费行为的库存管理影响预测指标体系,对指标体系进行了实证研究,对客户消费需求进行预测;

王振东[14]以网络聚类算法及密度聚类算法为基础,提出了客户消费行为动态网络生成技术的聚类中心点算法(DGICC)和以孤立点客户消费数据为基础的孤立点检测方法;

童建飞[15]通过对客户行为研究建立了移动增值业务的模型,并对消费者数据进行关联规则研究,提出了适合电信业务的改进关联算法(BUCT);

AlexBerson[16]等人从客户关系管理入手,利用决策树和聚类等数据挖掘算法对客户进行细分,并利用关联分析详细阐述了交叉销售中的应用;

MichelineKanber[17]等人对零售数据进行挖掘,得到数据挖掘有利于发现消费者购买模式和趋势,有助于零售商改进服务质量,取得更大的利润和销售;

1.3研究内容

本文主要研究客户购买行为的预测模型,提出了客户消费预测挖掘模型,影响客户消费因子及相应方法,具体如下:

(1)分析影响客户消费的一般因子,如:

客户经济影响因子,社会影响因素,客户心理影响因素,客户自身特征影响因子等;

(2)提出客户消费预测的数据挖掘模型;

(3)建立了对客户消费数据重要特征提取的神经网络方法;

(4)客户关联分类方法的提出;

(5)提出了基于模糊影响因子的客户消费行为预测的朴素贝叶斯分析方法。

1.4本文组织结构

本文第一章对当前研究进行了相关分析,总结了数据挖掘领域、客户关系分析领域以及两者相结合领域方向的前沿研究,在不断调研的基础上,进行本研究课题的相关探讨。

本文第二章是对数据挖据理论的简要介绍,第三章则是消费者行为相关理论的极少,以及对已有数据进行RFM处理后的结果进行分析。

第四章在第三章已处理好的RFM数据基础上,进行消费者细分,并最终采用K-Means方法,将消费者分为五类,最后对分类的消费者分类分析,采用CART、C5.0和CHAID算法,对其指标的相关性进行分析。

2数据挖掘理论概述

数据挖掘就是从大量的、不完整的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但是有潜在有用的信息和知识的过程。

数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

2.1数据挖掘特点

数据挖掘是一门广义的交叉学科,包括了数据库、人工智能、数理统计、并行计算方面的技术,其特点如下:

(1)数据库是数据挖掘的主要对象;

(2)数据挖掘是要发现隐含的、预先未知的信息;

(3)数据挖掘出来的信息是有价值的。

在本文中,利用数据挖掘技术,从消费者消费记录中挖掘出我们未知的、隐含的消费者行为,为后期消费者行为进行预测,制定相应的方案,提高企业的收益。

2.2数据挖掘的一般过程

数据挖掘过程一般可分为六个阶段:

(1)定义问题:

进行数据挖掘之前,需要对当前业务进行相应分析,从而定义问题的范围、得到计算模型所使用的度量以及定义数据挖掘项目的特定目标;

(2)准备数据:

由于当前数据的存储形式多样,并且数据可以分散在公司的各个部门并以不同的格式进行存储,并且可能由于操作人员等不确定因素,导致数据出错,所以需要对错误数据(噪声点或异常点)进行删除或插入缺失值;

(3)浏览数据:

数据常有最大最小值、平均值、平均偏差、标准偏差、方差等几个指标。

如:

通过查看最大值、最小值和平均值,可以确定数据能不能代表客户或者业务流程,数据库的数据越多,对应的精度和可靠性就会越高;

(4)生成模型:

通过创建挖掘结构定义要使用的数据列,将挖掘结构链接到数据源,但是只有对挖掘结构进行处理后,才能包含实际数据;

(5)浏览和验证模型:

对模型的性能进行测试,使用不同参数创建多个模型,对所有模型进行测试,查看那个模型对数据产生最佳结果;

(6)部署和更新模型:

按照新的要求,并在数据扩容的基础上,更新模型。

2.3数据挖掘常用方法

国际学术组织IEEEInternationalConferenceonDataMining(ICDM)于2006年12月评选出了数据挖掘领域的十大经典算法:

C4.5、K-Means、SVM、Apriori、EM、PageRank、AdaBoost、KNN、Naï

veBayes和CART算法。

其所有算法可以大致分为:

决策树方法、统计分析方法、粗糙集方法、贝叶斯网络、人工神经网络、遗传算法等。

2.3.1决策树方法

决策树方法就是利用信息论的原理建立起决策树,及信息论方法[18]。

决策树是一种应用广发的数据挖掘分类方法,由于其可以方便地把大量数据进行有目的的分类,转化成为直观的分类规则,典型的决策树方法有C4.5、CART等。

2.3.2统计分析方法

统计分析方法是指对目标数据集中的关系属性进行整理归类并进行解释的数据挖掘方法,主要李永乐统计学和概率论中的原理和技术[19]。

发现数据中的结构是统计学和数据挖掘的共同的目标,而数据库的字段项中的两大关系——函数关系和相关关系——均可以采用统计学方法对其中的信息进行分析,因而将统计分析的原理应用在数据挖掘中就是自然而然的事了。

在实际运用中,统计分析方法和数据挖掘的其它技术方法可以融合在一起使用,互相补充。

比较常用的统计分析方法有:

因子分析、相关分析、判别分析、回归分析等。

2.3.3粗糙集方法

粗糙集最先是由波兰Z.Pawlak教授1982年提出的,它是一种研究不确定性知识的数据分析处理理论[20]。

粗糙集有着成熟的数学基础,不需要先验知识,并且简单易用。

在数据挖掘中,实际系统中的数据往往包含着许多噪声和缺失信息,传统的处理方法(如模糊集理论)大多需要先验知识或者附加信息,而粗糙集则可以克服这个缺点,粗糙集方法只需要利用数据内部的知识即可以从中发现隐含的知识和揭示潜在的规律,可以说是一种天然的数据挖掘方法。

引入粗糙集理论,并且把它和传统的方法有机结合,可以大大增强对不确定和不完全信息的处理能力。

2.3.4贝叶斯网络

贝叶斯网络是一个带有概率注释的有向无环图,是一种基于概率推理的图形化网络[21]。

贝叶斯网络的理论基础是贝叶斯公式,通过一些变量的信息的概率推理,贝叶斯网络可以高效地解决某些不确定性和不完整的问题。

在数据挖掘中,可以把它应用到分类、聚类和预测等任务,并且对于海量数据的处理有着高准确率与高速度的优势。

2.3.5人工神经网络

人工神经网络是一种仿生信息处理的数学模型,应用类似于大脑神经突触联接的结构进行信息处理,是一种非线性自适应信息处理系统。

最初的神经网络模型是由心理学家W.S.McCulloch和数

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 设计艺术

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1