C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx

上传人:b****8 文档编号:11423028 上传时间:2023-03-01 格式:DOCX 页数:52 大小:261.59KB
下载 相关 举报
C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx_第1页
第1页 / 共52页
C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx_第2页
第2页 / 共52页
C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx_第3页
第3页 / 共52页
C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx_第4页
第4页 / 共52页
C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx_第5页
第5页 / 共52页
点击查看更多>>
下载资源
资源描述

C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx

《C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx》由会员分享,可在线阅读,更多相关《C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx(52页珍藏版)》请在冰豆网上搜索。

C基于 RFMS 指标的大型百货商场会员画像数据挖掘 docx.docx

C基于RFMS指标的大型百货商场会员画像数据挖掘docx

基于RFMS指标的大型百货商场会员画像数据挖掘

摘要

当代电商产业的迅猛发展使传统零售业受到冲击,完善商场会员画像成为运行商精细化管理、充分发挥会员价值的有效途径,我们希望基于数据挖掘的会员体系分析为其建立稳定的会员关系、策划促销活动提供可靠依据。

问题1中,分离数据后首先通过消费行为特征(频次、总额、单次最高消费等)和人口学信息特征(年龄、性别)分析会员的消费特征,得出女会员占主体、消费频次和总额高,特别是30-49岁年龄段的女士,但是男性会员消费质量高,平均和单次消费金额均略高于女性。

然后对比会员和非会员之间的价值差异,发现会员消费更活跃、购买力也更强。

问题2中,构建FMS购买力模型G(ci)=100⨯F(ci)+10⨯M(ci)+1⨯S(ci),

通过百分位阈值给各指标打分,可将每位会员的购买力分为8类,将其对应为铂金、黄金、白银、青铜四个价值等级,随机检验表明模型评价高质量率达62.5%,其余均为中上评价水平。

问题3中,构建RF消费状态评价模型Z(ci)=R(ci)⨯F(ci),通过滑动时间窗口计算出会员生命周期中消费状态随时间的变化,发现近年来新会员数量迅猛增加,超过总数40%,但完全“活化”的活跃会员不多,同时会员办卡1年内大概率消费活跃度偏低。

活跃会员数虽有增加,但其增长率低于新会员增长率;非活跃会员数保持相对稳定的数目。

问题4中,计算出2015年至2017年非活跃会员激活率超过10%,非活跃会员是存在激活的可能性的,激活率A(ti+1)=f(xn,xd,xz,xl)主要受商场促销活动四个指标中折扣促销活动次数和折扣力度影响,折扣大的活动能对非活跃会员产生较大的“延迟”效应,因此活动前的广泛宣传对提高激活率十分重要。

问题5中,通过消费细目数据挖掘,以商品类别为指标分析出会员消费喜好,并计算出热销前十的每种商品类目“交叉连带率”,将两者结合提供一份基于会员喜好的有效连带促销方案(如中秋节日促销),尽可能产生更多消费市场和经济效益。

 

关键词:

会员价值体系RFMS指标数据挖掘精细化管理

一、问题的重述

在零售行业中,会员价值体现在持续不断地为零售运营商带来稳定的销售额和利润,同时也为零售运营商策略的制定提供数据支持。

零售行业会采取各种不同方法来吸引更多的人成为会员,并且尽可能提高会员的忠诚度。

当前电商的发展使商场会员不断流失,给零售运营商带来了严重损失。

此时,运营商需要有针对性地实施营销策略来加强与会员的良好关系。

比如,商家针对会员采取一系列的促销活动,以此来维系会员的忠诚度。

有人认为对老会员的维系成本太高,事实上,发展新会员的资金投入远比采取一定措施来维系现有会员要高。

完善会员画像描绘,加强对现有会员的精细化管理,定期向其推送产品和服务,与会员建立稳定的关系是实体零售行业得以更好发展的有效途径。

附件中的数据给出了某大型百货商场会员的相关信息:

附件1是会员信息数

据;附件2是近几年的销售流水表;附件3是会员消费明细表;附件4是商品信

息表,一般来说,商品价格越高,盈利越高;附件5是数据字典。

请建立数学模型解决以下问题:

1.分析该商场会员的消费特征,比较会员与非会员群体的差异,并说明会员群

体给商场带来的价值;

2.针对会员的消费情况建立能够刻画每一位会员购买力的数学模型,以便能够对每个会员的价值进行识别;

3.作为零售行业的重要资源,会员具有生命周期(会员从入会到退出的整个过程),会员的状态(比如活跃和非活跃)也会发生变化。

试在某个时间窗口,建立会员生命周期和状态划分的数学模型,使商场管理者能够更有效地对会员进行管理;

4.建立数学模型计算会员生命周期中非活跃会员的激活率,即从非活跃会员转化为活跃会员的可能性,并从实际销售数据出发,确定激活率和商场促销活动之间的关系模型;

5.连带消费是购物中心经营的核心,如果商家将策划某次促销活动,如何根据会员的喜好和商品的连带率来策划此次促销活动?

二、问题的分析

2.1问题一分析

对于该商场会员的消费特征分析,我们以附件1中本地会员的卡号(kh)作

为唯一识别特征,与附件3中会员消费明细表(包括本地会员和非本地会员)进

行匹配,筛选出在此期间本地会员的的消费明细,从消费行为特征(会员购买频次、消费总额、平均购买金额和单次最高消费)以及人口学信息特征(会员年龄阶段、性别)分析该商场本地会员的消费特征。

对于会员与非会员群体的差异分析,我们以附件3中会员消费明细表中的会员消费产生的时间(dtime)、商品编码(spbm)和消费金额(je)作为识别特征,与附件2销售流水表进行匹配,分离出此期间会员(本地会员)以及非会员

(非本地会员和非会员)的消费信息,以消费行为特征(会员购买频次、消费总额、平均购买金额)为指标比较两个群体的差异,并结合具体数据分析会员群体给商场带来的价值。

2.2问题二分析

构建每一位会员购买力模型时,基于附件3数据,我们借鉴传统RFM方法中“购买频次(F)”和“消费总额(M)”指标[1],结合问题一中直观体现购买能力的“单次最高消费(Singlepeakconsumption,S)”指标,建立“FMS”会员购买力评价模型[2]。

每个指标按整体会员消费情况百分位阈值赋予不同“评价分数”[3],并结合各指标的系数计算出每位会员购买力的评分。

2.3问题三分析

首先,确定滑动的研究时间窗口,起初为半年,其后以半年为单位逐渐增加,共有6个时间窗口。

其次,确定时间窗口后,明确每个会员生命周期的算法;接着,在问题二模型基础上,建立判别会员活跃状态的“RF”模型,算出每个时间窗口内生命周期与活跃状态之间的概率分布关系;最后比较时间窗口滑动后,生命周期与活跃状态随时间变化的关系。

2.4问题四分析

计算激活率同样基于问题三中时间窗口滑动的考量。

我们追踪在原时间窗口中为非活跃的会员、在下一个窗口中变为一般活跃或很活跃的人数占原时间窗口中非活跃会员总数,将其定义为该时段内的非活跃会员激活率。

问题三种我们设定了6个时间窗口,因而可得出5个时段内的激活率,依此分析非活跃会员转化为活跃会员的可能性。

此外,结合实际销售数据,追踪分析原非活跃会员是否与商场促销活动的相关指标存在关系。

2.5问题五分析

需要分别计算出会员的消费偏好以及消费时的连带情况,进而策划促销活动。

首先,通过附件3中本地会员消费流水中的商品名称和附件4中匹配,分析所有本地会员的消费品牌编码(不同的名牌标码计算其对应的购买次数),借此得出会员消费时喜爱的品牌类别排行;其次,分析会员喜爱的品牌中商品的连带情况,由该品牌购买总数量和有效单据数确定商品的连带率。

三、模型假设

1.假设问题二中FMS购买力模型中商场会员消费频率、消费金额和单次消费最高金额三个不同的行为维度是相互独立的,不具有相关性[4];

2.假设研究的时间窗口内,某会员无消费记录,则该会员与时间窗口前一天进

行最后一次消费,以此计算其生命周期;

3.假设研究的时间窗口内,某会员无消费记录,则该时段内该会员卡处于“休眠”状态,不处于问题3中不活跃、一般活跃和很活跃三种状态中的任何一种,也就相应的不存在问题4中的激活与否问题。

4.假设问题5中促销活动主要以底价商品(单个商品价格小于10元)和折扣商品(售价与消费金额的差值占售价比例>20%)这两种为主;

5.假设研究窗口以半年为单位增加或减少,会员半年中的消费行为特征能表明其长期的消费习惯;

6.假设问题三中RF状态模型中商场会员消费频率、最近消费时间两个不同的行为维度是相互独立的,不具有相关性;

7.假设问题四中非活跃会员的激活主要受商场促销活动次数和促销力度的影响,与会员主观因素无关;

四、符号说明

符号

符号说明

符号

符号说明

F

购买频次

xn

参加促销活动总次数

R

最后一次消费时长

xd

参加底价促销活动次数

M

消费总额

xz

参加折扣促销活动次数

G

购买力

xl

折扣促销活动的折扣率

S

单次最高消费

A

非活跃会员激活率

Z

消费状态

ti

第i个时间窗口

ci

第i个会员

Jrj

第j个品牌连带率

五、模型的建立与求解

5.1数据预处理

结合商场实际运行情况,我们对附件数据进行预处理:

(1)办卡日期、出生日期处于1900年1月1日之前或2018年1月4日之后的会员信息记录无效;

(2)附件1中会员出生日期和性别不明确的,其年龄和性别状况缺测,该会员信息无效;

(3)附件2中若标红、商品售价、销售数量或消费金额为负值时,该消费记录

无效;

(4)附件3中会员消费记录若商品售价、销售数量、消费金额或此次消费积分存在负值时,该消费记录无效;

5.2问题一的分析与处理

结合前面的问题一求解思路,在分析该商场会员的消费特征时,我们以附件

1中本地会员的卡号(kh)作为唯一识别特征,与附件3中2015年1月1日至

2018年1月3日期间的的会员消费明细表(包括本地会员和非本地会员)进行匹配,筛选出在此期间本地会员的的消费明细,从消费行为特征(会员购买频次、消费总额、平均购买金额和单次最高消费)以及人口学信息特征(会员年龄阶段、性别)分析该商场本地会员的消费特征。

对于会员与非会员群体的差异分析,我们以附件3中会员消费明细表中的会员消费产生的时间(dtime)、商品编码(spbm)和消费金额(je)作为识别特征,与附件2中2016年1月1日至2017年9月23日期间的的销售流水表进行匹配,分离出此期间会员(本地会员)以及非会员(非本地会员和非会员)的消费信息。

考虑到附件2中的销售流水表中无非会员的人口学信息特征,我们以消费行为特征(会员购买频次、消费总额、平均消费金额)为指标比较两个群体的差异,并结合具体数据分析会员群体给商场带来的价值。

5.2.1商场会员的消费特征分析

(1)通过Fortran编程将附件3中数据进行预处理,得出有效会员消费信息(支撑材料中1_1_vipxf.txt),通过Excel进行统计画图,得出会员消费的消费行为特征[5](会员购买频次、消费总额、平均购买金额和单次最高消费)以及人口学信息特征(会员年龄阶段、性别)。

(2)人口学信息特征:

主要是会员的年龄阶段和性别。

数据预处理后,本地会员有效消费记录数据集包含392690条消费记录,

43940条会员信息。

对比图1我们可发现会员客户中存在很大的性别差异,其中

女会员38636人(占总数88%),男会员4409人(仅占10%不到),有895明会员性别不详(占总数2%)。

女会员数远大于男会员数,是商场会员的主力军。

 

图1本地会员的性别比例图

图2本地会员各年龄段的人数及其比例

据图2可得知,该商场会员客户群体中也存在较大的年龄差异。

30-39岁青年(10206人,占比23.23%)、40-49岁中年(10474人,占比23.84%)是会员主要群体,均占比20%以上。

其中50-59岁中老年会员数低于30-39岁青年、40-49岁中年人数,但多于20岁以下青少年(171人,仅占比0.39%)、60岁以上老年人(1267人,占比2.89%)。

除此之外,年龄不详的会员有12221人,约占27.8%,而性别不详的会员占比不到2%,表明在登记会员卡信息时,年龄信息缺失率远大于性别信息缺失率,基于女性会员占据会员主力军的实况下,年龄差异能为商场管理者提供更多有效的会员信息,因此在登记会员信息时,对会员的年龄信息给予更多的关注度。

(3)消费行为特征:

主要是会员购买频次、消费总额、平均购买金额和单次最高消费。

进行数据预处理后,本地会员有效消费记录集包含43940条会员信息,

392690条消费记录,消费总额为593081426.5元,平均消费额为1510.30元,其

购买频次、消费总额、平均购买金额和单次最高消费分布信息主要如表1、表2

所示。

表1中为本地会员消费频次和消费总额相关信息。

分析发现,在2015年1

月1日至2018年1月3日近3年期间,有超过60%的本地会员只有不超过5次

的消费记录,平均每7个月消费1次,这其中有占总会员数40%左右的会员数,

3年期间只有1-2次的消费记录,即低频消费/不活跃会员数占据了商场会员相当

表1会员的消费频次、消费总额指标频数分布及其占比

消费频次

消费总额

次数

会员数

占比%

金额(元)

会员数

占比%

1-2

18214

41.45

小于500

3447

7.84

3-5

10427

23.73

501-1000

4534

10.32

6-10

6686

15.22

1001-2000

6618

15.06

11-15

2817

6.41

2001-3000

4480

10.20

16-20

1513

3.44

3001-6000

7887

17.95

21-40

2526

5.75

6001-10000

4908

11.17

41-60

825

1.88

10001-15000

3449

7.85

61-90

490

1.12

15001-25000

3325

7.57

91-120

194

0.44

25001-35000

1654

3.76

121-150

113

0.26

35001-50000

1261

2.87

151-

135

0.31

50001-

2377

5.41

总计

43940

100.00

总计

43940

100.00

大的比例。

有32.70%的会员在3年期间消费了6-60次,平均每半年1次~每半个月1次,是该商场会员中消费频率相对稳定额会员。

此外,有2.12%左右的会员有超过60次的消费,消费频率小于15天,是消费十分活跃的会员,但相对而言人数较少。

综合来看,不难发现,该商场会员消费频次和对应的会员人数存在一定的关系,消费越频繁的会员人数越少。

结合消费总额可发现,大部分的会员3年期间在该会场的消费总额在500元~10000元期间,约占总会员数的65%,其中消费总额在1000~6000元间的最为集中,这表明该商场的大部分会员购买力中等,低于1000元总消费的会员数

表2会员的单次最高消费、平均单次消费指标频数分布及其占比

单次最高消费

平均单次消费

金额(元)

会员数

占比%

金额(元)

会员数

占比%

小于300

2464

5.61

小于300

3614

8.22

301-500

2950

6.71

301-500

5487

12.49

501-800

5410

12.31

501-800

8405

19.13

801-1300

6876

15.65

801-1300

8894

20.24

1301-1800

4617

10.51

1301-1800

5746

13.08

1801-2500

4232

9.63

1801-2500

4692

10.68

2501-3500

4972

11.32

2501-3500

3083

7.02

3501-4500

3313

7.54

3501-4500

1397

3.18

4501-5500

2003

4.56

4501-5500

714

1.62

5501-7000

1839

4.19

5501-7000

576

1.31

7001-

5264

11.98

7001-

1332

3.03

总计

43940

100.00

总计

43940

100.00

不超过20%,而超过10000元总消费额的会员数接近28%,表明该商场的高购

买力会员数多于低购买力会员,特别是超过50000元的会员数和低于500元的会员数接近,但是前者无疑具有更大的会员价值。

就总消费额而言,该商场的中等偏上购买力会员占据主体。

表2中为本地会员单次最高消费和平均单次消费相关信息。

分析发现,近3年期间,有接近45%的本地会员单次消费最高金额在301~1800元区间内,低于300元会员数占6%,而超过1800元的会员数约为50%,超过5500元的接近15%占比。

结合平均单次消费可发现,65%的会员平均每次消费金额在300~1800元之间,其中消费总额在800~1300元区间的最为集中,低于300元平均消费的会员数约为8%,而超过1800元平均消费额的会员数超过26%,说明该商场会员单次购买力比较大,高购买力的会员多于低购买力的会员。

(4)综合人口学信息和消费行为特征:

结合会员性别和年龄差异分析会员的具体消费特征。

不同性别、不同年龄段的会员近3年期间消费频率如图3所示。

由于女性会员数远远超过男性会员数,女性会员的消费频次也远远多于男性会员,这其中,

图3不同性别、年龄段会员的消费频率分布图

 

图4不同性别、年龄段会员的消费总额分布图

图5不同性别、年龄段会员的单笔消费金额均值分布图

 

图6不同性别、年龄段会员的单次最高消费均值分布图

40-49岁的女性会员消费频次最多(占比32%),30-39岁的女性会员其次(占比22%),20岁以下(占比0.2%)和60岁以上(占比3%)的女性会员消费频次偏低。

会员消费总额的差异如图4所示,40-49岁的女性会员消费总额远远超过其他各年龄段的会员,3年期间的总消费额高达200万元,30-39岁和50和59

岁其次,两者约100万元。

结合图2和图3发现,40-49岁女性会员的消费频次高,会员数目多,消费总额多,对于商场而言,40-49岁女性会员应是十分价值的会员。

图5和图6分别为单笔消费金额均值和单次最高消费均值图。

单笔消费均值

图中,50-59岁男性和20岁以下的男性会员消费较高,约2000元,其他年龄段

会员单笔消费均值在1500元左右,女性会员消费略低于男性。

单次最大消费均

值图中,50~59岁的会员消费较高,其中男性会员高于女性会员消费,约为6000元,60岁以上会员男性单次最高消费均值低于女性会员,除此之外女性会员单次消费均值略低于男性。

图5和图6中男性会员的比重显著增加,这主要是因为男性会员的消费频次相对较低,进而产生的消费质量较高。

因此对于商场而言,

虽然男性会员数目不占主体,但是消费质量高于女性会员,在策划相关活动时不可忽视男性会员的价值。

5.2.2会员与非会员群体的消费特征差异

我们主要从购买频次、消费总额、平均消费金额等角度分析本地会员和非会员群体(非本地会员和非会员)的消费特征差异,具体如表3所示。

表3本地会员和非会员的消费特征对比

消费总频次

消费总额(元)

平均消费金额(元)

本地会员

533165

724129606.65

1358.17

非会员

458672

539226613.98

1175.62

由于附件5中明确说明“我们只针对附件一中的会员进行管理”,因此在对比会员群体和非会员消费特征差异时,将非本地会员也归类于非会员群体,这在某种程度上扩大了非会员群体对于商场消费的贡献。

但是在这样的前提下,本地会员的消费频次、消费总额和平均消费金额都大于非会员(非本地会员和非会员)群体,这表明商场的会员群体比非会员群体更频繁得去商场消费,并且平均每次消费额都比非会员大,会员群体是商场长期发展的基石和保证,对商场的忠诚度和认可度很高,能为商场产生更多的商业价值。

5.2.3会员价值效应

表3直观呈现了本地会员的消费频次、消费总额和平均消费金额都大于非会员(非本地会员和非会员)群体,这表明商场的会员群体比非会员群体频繁的去商场消费,并且平均每次消费额都比非会员大,会员群体是商场长期发展的基石和保证,对商场的忠诚度和认可度很高,能为商场活动更多的商业价值,即商场会员的“价值效应”。

此外,会员单次消费均值大于非会员群体,说明会员有更大的可能性购买价格高的商品,而题干中已明确所指出“商品价格越高,盈利越高”,即会员群体为商场带来的盈利越多。

5.3问题二模型的建立和处理

构建每一位会员购买力模型时,基于附件3数据,我们借鉴传统RFM方法中“购买频次(F)”和“消费总额(M)”指标,结合问题一中直观体现购买能力的“单次最高消费(Singlepeakconsumption,S)”指标,建立“FMS”会员购买力评价模型。

每个指标按整体会员消费情况百分位阈值赋予不同“评价分数”,并结合各指标的系数计算出每位会员购买力的评分。

5.3.1FMS购买力模型的建立

在衡量会员价值和创收能力时,RFM模型时是具有重要使用价值的工具。

RFM模型具有三个重要的衡量指标:

会员最近一次消费距研究时段最后一天的时长R(Recency)、消费总频率F(Frequency)以及消费总金额M(Monetary)三项指标。

最后一次消费时长R表示会员最近一次的购买时间和分析时间间隔的天数,消费总频率F表示会员研究时段内所消费的总次数,消费总金额M是该会员在此期间消费的总金额。

一般而言,会员的消费频率越高,消费总金额越大,会员的购买力也就越大。

我们结合相关参考文献以及实际生活,发现RFM中,F和M两个指标相比R能更好的反应会员的购买能力,此外,问题一中的消费指标“单次最高消费(Singlepeakconsumption,S)”能体现出会员购买商品的品牌等级和价格信息,这也能体现出会员的购买力,因此我们建立“FMS”模型评价每位会员的购买力。

每个会员的购买力可以表示成:

G(ci)=100⨯F(ci)+10⨯M(ci)+1⨯S(ci)

(1)

这里的F(ci),M(ci),S(ci)分别代表会员ci以F、M、S为分类的相应变量评分。

所乘系数100、10、1只是为了能让百位、十位和各位上的F、M、S评分直观的组合为对应的购买力指数G。

其中F、M、S为分类的结合自身百分位考量,相应变量评分标准具体如下。

对于消费总频率F而言,因其为不连续的分布,且结合表1频次分布情况,

定义频次1-2次1分(40%),3-5次2分(20%),6-10次3分(20%),11-20次4分(10%),20次以上5分(10%)。

对于消费总金额M而言,600元以下1分(10%),601~2000元2分(25%),2001~6700元3分(30%),6701~35000元4分(25%),35000元以上5分(10%)。

对于单次最高消费S而言,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1