1、用户细分模型原理和注意事项2013-3-4目录用户细分的原理在携程的用户细分举例用户细分的注意事项用户细分原理用户细分使用的模型在统计模型中适合做用户细分的模型是聚类分析,(而且是Q型聚类,即观测对象聚类)聚类的含义:将数据分组成为多个类。在同一个类内对象之间的具有较高的相似度,不同类之间的对象差别较大聚类分析原理看样本之间的相似程度,通过统计量将他们划分成不同类将每个观测对象,也就是样本看成多维空间中的一个点,通过比较每个点之间的空间距离,来做聚类依据每个样本有一些维度,比如;币种,存款额,产品等级等根据维度特征和样本数量来确定具体使用什么方法来聚类聚类分析原理(官方)聚类原理:聚类分析的基
2、本思想是在样品之间定义距离,在样品之间定义相似系数,距离或相似系数代表样品或者变量之间的相似程度。按相似程度的大小,将样品(或变量)逐一归类,关系密切的类聚集到一个小的分类单位,然后逐步扩大,使得关系疏远的聚合到一个大的分类单位,直到所有的样品(或变量)都聚集完毕,形成一个表示亲疏关系的谱系图,依次按照某些要求对样品(或变量)进行分类.Spss提供的聚类方法系统聚类的过程:将每个样本看成一类,比较每个类之间的距离,将最小的两个点合并成一个类 计算新类和其他类之间的距离如果只有一类,那么停止,否则继续合并类K-means聚类方法Spss要求事先给定将样本聚合成几类允许自设或者默认方式选定一些样本
3、做为初始点,将其他每个样本看成一类计算初始聚类点与其他类之间的距离选出最小的距离,初始点与最小距离点的中间点作为新的聚类点重复上述过程直到合并成指定类两步聚类方法除了用传统的欧氏距离之外,增加似然距离测度第一步是考察每个样本,确定类中心。这个过程是构建一个特征树第二步是使用凝聚算法对特征数的枝节点分组,产生一个结果范围一般这个模型针对样本的变量里有连续型和分类型变量空间距离的计算方法空间距离的计算方法空间距离的计算方法空间距离的计算方法在携程的聚类举例实际应用在携程做用户细分时,比如对用户做春季度假游促销选取一段时间内的:用户ID,星级,用户最后一次消费行为,度假游金额,出发时间,返回时间,目
4、的地,出行人数,入住酒店星级,房间类型,间夜数,是否是商旅客户,是否拒绝邮件,去年同期是否有春季游的相关度假项目,是否是催眠唤醒客户实际应用首先将字段进行标准化处理然后通过系统聚类模型做出谱系图依据谱系图和具体业务内容,用k-means模型将用户分成4类高端出游型:消费金额高,周期短,频率低,酒店星级高积极旅游型:消费金额中等,季节性明显,频率高,酒店星级中等商务型:是商旅客户,无明显季节性,不关注热门目的地,消费金额没有季节变化低端自助型:消费金额低,季节性明显,酒店是3及其以下,关注热门目的地营销方案:针对高端客户,制作目的地优势显著的度假游,增加新项目,比如:潜水类针对积极旅游型:选择更多合作酒店,提供度假抵用券,增加客户粘性针对商务型:不促销针对低端自助型:提供非热门景点自助游用户细分注意事项注意事项必须有明确目标作为分类基础如果营销分析,那么不要加入用户自身的属性 比如男女,年龄等聚类分析模型中无意义字段或者非显著影响目标的字段会对聚类结果产生影响,导致分类不准的问题出现聚类分析开始之前必须做数据标准化,不然后出现大数据“吃掉”小数据