ImageVerifierCode 换一换
格式:DOCX , 页数:8 ,大小:20.69KB ,
资源ID:7115518      下载积分:12 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7115518.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(产品经理以英国某电商平台的年销售数据为例讲讲从数据清洗到可视化的整个流程怎么做.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

产品经理以英国某电商平台的年销售数据为例讲讲从数据清洗到可视化的整个流程怎么做.docx

1、产品经理以英国某电商平台的年销售数据为例讲讲从数据产品经理以英国某电商平台的年销售数据为例讲讲从数据清洗到可视化的整个流程怎么做清洗到可视化的整个流程怎么做 以英国某电商平台的年销售数据为例,讲讲从数据清洗到可视化的整个流程怎么做 本文选取了英国某电商平台的年销售数据,从 7 个方面进行拆解和分析,完成了从数据清洗到可视化的一整套流程。数据对于互联网+的商业模式存在巨大的价值,在业务中我们遇到的瓶颈往往通过数据分析,可以发现问题以及解决问题的对策。本文对英国某电商平台的年销售数据进行分析:一、报告梗概 1.报告背景及目的 报告对在取数区间内的某电商平台内的所有交易记录进行了分析,平台主要销售独

2、特的全时礼品,公司的许多客户都是批发商。为了更好地了解平台的经营状况,对销售数据进行分析,提出优化平台运营的策略,从而为平台创造更多价值。1.数据来源及说明 数据来源于 UCI加州大学欧文分校机器学习库,是一个跨国数据集,其中包含2010 年 12 月 1日至 2011 年 12月 9日之间在英国注册的非商店在线零售的所有交易。数据集含有 8个字段,其含义如下:InvoiceNo:6 位的发票号,系统为每笔交易自动分配的 6为不同的数字序列,如果是以 c开头则表明该订单被取消。StockCode:产品编号,每一种不同类别的商品对应不同的编号。Description:对产品类别的描述。Quant

3、ity:每次交易的某种产品的购买数量。InvoiceDate:每笔交易产生时的日期时间。UnitPrice:产品的单价,单位是英镑。CustomerID:5 位编码的客户 id,每个客户的 id都不相同。Country:客户来源的国家。二、数据预处理情况 1.重复值处理 整个数据集有 541909 条数据,其中完全重复的数据有 5268条,剔除后剩下536641条交易数据。2.缺失值处理 Description 和 CustomerID 两个字段即商品描述和客户 ID有缺失值,其中Descriptio 缺失 1454 条,占总数据量的 0.27%;CustomerID 缺失 135037 行,

4、占总数据量的 25.2%。因为商品描述是文本类型数据、对于本分析的结果不重要且缺失值占比非常小,所以不对其进行充填。对于 CustomerID,缺失量占到了总数居的四分之一且其本身对分析结果有重要意义,必须对其填充。在已验当前 CustomerID 中没有 0值的前提下,充填方式选择为用0 代替缺失的 CustomerID 值。至此,缺失值处理完毕。3.异常值处理 基于业务常识,商品单价和商品数量应为正数,查看数据时发现这两种类型的异常值。取出来查看后,发现由两种原因造成:订单被取消即发票号以开头的记录(共 11761 条);坏账数据即发票号以 A开头的记录(共 2条)。对于被取消的订单:由于

5、没有发生实质交易,对平台的交易数据不存在影响故直接删除,但后续可以针对这部分数据可以尝试分析挖掘取消背后的原因;于坏账:数据量极小,且坏账金额也极其微小,在此也选择直接删除。处理完异常值后,总的有效数据量为 524878 条。4.新增字段 为方便后续的时间序列分析,新增交易时间 date字段(具体到日)和交易月份month 字段;为方便后续的金额分析,新增交易金额 SumCost 字段(交易金额等于商品数量乘以商品单价)。至此,数据预处理完成,截取部分有效数据如下所示:三、订单分析 1.述性分析 在订单层面,描述性的统计信息如下图:平台在此期间总共有 19960笔有效订单,每笔平均购买 279

6、件品,笔均消费 533英镑,这两者都超过了各自的中位数水平。说明订单总体差异很大,尤其是笔均消费超过了 Q3分位数。最大的一笔订单中购买了将近 81000件商品,最大的单笔消费也高达 168469说明平台用户以批发商为主且存在购买力极强的客户。2.订单商数量分布 剔除离群值筛选出购买商品件数小于 2000 的订单绘制商品数量分布图如下:分布图呈现典型的长尾分布,大部分订单内的商品数量在 250 以内,大额数量订单稀少。3.订单金额分布 剔除离群值,筛选出单笔金额小于 1000英镑的订单绘制金额分布图如下:分布图有长尾趋势,金额主要分布在 400英镑以内,说明绝大部分客户在该平台上的消费金额预算

7、为 400 英镑以内,在 50英镑左右出现了最多的订单数。4.分析小结 平台在 2010年 12 月 1日至 2011 年 12月 9 日一年多的时间中产生有效交易 19960笔,总销售额为 8,887,209 英镑,平均每日交易 54笔,笔均购买量 279 件商品,笔均消费 533英镑。存在少数重要价值客户,此类用户购买力极强。作为批发型平台,要着重保持此类用户,用户维护、运营营销资源要向这些客户倾斜。四、客户分析 在缺失值处理时,对于客户 id缺失的数据,直接用填充了空值,因此在客户层面分析的时候剔除了这部分数据。1.描述性分析 在客户层面,描述性统计信息如下:在 4338个有效客户 ID

8、 中:平均每个客户消费 4次,超过中位数,至少有 25%的客户消费 1次之后就流失了;客均购买 1187件商品,超过 Q3分位数,最大的客户购买量达到了近 197000件;客均消费 2048英镑,超过 Q3 分位数,最大的客户消费额达到 280206。2.客户消费金额分布 剔除离群值,筛选出消费金额在 6000英镑以下的客户绘制消费额分布图如下:分布图呈现明显的长尾状,大部分客户的消费额在 1000 英镑以内,消费 200英镑左右的客户最多。3.客户贡献程度 二八定律普遍存在于销售市场,因此绘制出每个客户的消费额占总销售额的占比图如下:可以看出消费额前 1000名的客户贡献了 80%的销售额,

9、也就是说平台所有客户中前 20%的客户提供了 80%的销售总额。4.消费额与购买量的关系 客户的消费额与购买量的关系可以对平台促销策略进行指导,左图绘制了所有的数据(包含离群值),右图为筛选出消费额 5000 英镑以下的数据:由图可知:消费额与客户的购买量成正比关系,且存在少数购买量和消费额数目都很巨大的客户。在消费额小于 5000 英镑以内的客户,其消费额与购买量呈强正比关系;在 3000件商品范围内,每向客户多销售 1000件商品,销售额大概可以增加一倍。5.分析小结 平台的客户在这一年中平均会消费次,客均购买 1187 件商品,客均消费 2048英镑。但是值得注意的是有四分之一以上的客户

10、只消费了一次就直接流失掉了,如果能够保持这些客户,保守估计年销售额可以增加 2,400,000 到 3,000,000英镑,接近全年销售额的三分之一。平台的经营要注重新客的留存率,对于长时间没有复购的客户要积极联系,采取相应的唤回措施。五、商品分析 平台对每个客户的报价并不一样。在处理时,采取平均的方法,即:该件商品的销售总额除以该件商品的销售数量来定义每件商品的单价。1.价格分布 剔除离群值后,发现平台商品价格大部分低于英镑。2.价格-销量关系 在价格方面符合价格越低,销量越大的规律。价格低于英镑的商品的销量明显高于别的商品,在英镑的价格内出现了万级别的销量,验证了平台低价走量的批发商式销售

11、模式。此外,存在两件单价超过 6000英镑的商品,分别是价格为 6880英镑的AMAZONFEE商品和价格为 11062英镑的 B 商品,这两者的销量分别为 2 件和 1件,说明平台在高价商品上没有竞争优势。而高价商品所需的运维成本往往高于其他商品很多,建议平台专注单价 20 英镑以内的商品,继续提高低价商品的销量来获取更多收益。3.词云分析 对商品的描述一栏做词云分析,从可视化结果中发现:平台销售的商品属于小礼品类,其中闹钟类商品居多。4.分析小结 平台当前的定位是低价走量批发商式平台,这个销售模式得到了验证,应该继续坚持这个模式。对于超高价商品,平台的销售额贡献甚微,却要花费较高的销售成本

12、,因此平台的利益点可以专注在低价商品的高销量上。六、时间序列分析 1.销售额-时间关系 统计各月的交易量、销量以及销售额如图所示:显然:11月和 12 月的成交量最多,两者超过了全年交易量的四分之一,商品的出货量和销售额也是这两个月最多。纵观全年:销量、销售额、订单量呈现出相同趋势,从 1 月起销售额缓慢上升,至 4 月出现一个骤降后,从 5 月开始又缓慢下跌,随后至年底期间销量上升趋势明显。2.分析小结 11月销售的骤增与万圣节、双十一全球购的促销活动紧密相关,12 月的销售在万圣节的余温以及圣诞节的氛围中随较之 11月有所降低但仍高于全年平均水平。年初销量骤降的原因是前面两个月的促销极大地

13、释放了客户的购买欲望,且年初的节日少,批发商的采购意愿并不强烈。4月份出现骤降,而后销售额稳定在 600,000到 800,000之间。从 8 月开始,批发商们开始备货准备年底的倾销,成稳定上升趋势。因此,平台在 9月和 10 月应该为后续的节日活动造势,加大营销成本的投入,同时增加库存,为后续促销销量做保证。11月和 12 月要注意加大运维力度,防止线上销售渠道的崩溃而造成损失;年后 1月和 2月可以借情人节相关话题再次激发用户的购买欲望,促进淡季的销售。七、地区分析 1.用户来源分布 作为英国的电商平台,其用户九成以上是本土用户。排在后面的三个地区也都属于欧洲,分别是:德国、法国、爱尔兰。

14、2.销售额-地区分布 因为庞大的本土用户基数,平台的销售额九成以上是来自于本土市场,随后是欧洲的荷兰、爱尔兰、德国和法国。在欧洲市场以外,澳大利亚市场占据销售额第一名。虽然英国的销售额占据了九成以上,但客均消费上英国只算中等水平。而海外市场中,爱尔兰的客均消费表现十分抢眼达到 80000 英镑以上。达到 10000英镑以上的国家还有荷兰、新加坡和澳大利亚。3.分析小结 从销售总额来看:得力于本土优势,英国的本土用户贡献了平台 90%以上的销售额;因为地理位置方便,英国随后的销售额也主要来源于欧洲国家。从客均消费额来看:爱尔兰表现抢眼,购买力极强,随后是表现优秀的荷兰、新加坡、澳大利亚这些国家都

15、是高福利国家,客户资金充沛,消费意愿强烈。从大方向上来看:平台要关注欧洲市场尤其是本土市场的动向,紧跟市场动态。从客均购买力上来看,平台应与上述购买力强的客户主动保持联系,提供销售经理专人服务或优惠政策等。在这些地区也可以适时地做一些宣传推广,多吸收优质客户来提高海外市场的收益。八、客户分类 1.生命周期 计算客户从第一次消费到最后一次消费的天数,即为客户的生命周期,其描述性统计信息和分布如下:根据以上信息可以看出:至少有四分之一的客户没有留存,但也有四分之一的客户生命周期达到 8个月,两极分化严重。2.RFM 模型客户分类 Recency代表最近一次消费,Frequency代表消费频次,Mo

16、netary代表消费金额。这个用户划分模型十分经典,但具体的划分准则往往不能很好的把握,在此用 K-means 聚类方法自动将客户群体按 RFM 准则分为八大类,即如下图所示:在聚类之前首先观察和的关系,剔除掉明显的离群值,在数据集中区域进行聚类,因此画出散点关系图如下:可以看出:数据主要集中在左下角 f50和 m20000的区域,因此聚类模型所选择的数据为此区域的数据。在聚类时有必要结合业务知识手动设置初始中心,否则算法得出的结果偏差会比较大。在此,选定数据集中估计的八个中心为初始中心点,对数据进行归一化,多次调试后得出 RFM 模型聚类图如下:其中每一种颜色代表一类用户,方形数据标记代表每

17、一类的数据中心。上图为聚类效果还不错的一个调试后的模型,可以看到每类数据的中心分布在整个空间里比较均匀,即:每一类的中心分别属于三维空间坐标里的每一个象限。这是判断一个 RFM 模型效果好坏的重要标准。得出八类客户的 RFM 均值如下:通过无监督学习算法 K-means 可以自动挖掘客户数据之间的关系,划分出客户类型,比传统的简单均值法划分更有依据。但往往真实的客户数据并不规整,需要结合业务知识手动调参,即使调试多次,模型也可能仍然不能完美适配,这时要根据经验进行取舍。模型建立完成后,再回去看离群值,发现离群值客户通常都是对销售额贡献度很大的群体,所以一定不能忽略这类客户群。对于已经划分好的客

18、户群体,对每一类采取不同的营销策略,可以实现精准营销,将本增益的效果。九、分析总结 1)电商平台在 2010 年 12 月 1日至 2011年 12月 9 日期间发生有效订单 19960笔,笔单价 533.17英镑,笔均购买商品 279件,用户群体以批发商为主。订单交易额和商品数量的均值都超过 Q3分位数,说明订单差异大,存在购买力极强的客户对销售额做出了巨大贡献。2)客均购买商品 1187 件,客单价 4338英镑,均超过 Q3分位数。但客户群体中流失了至少 25%的新客,客户平均生命周期为 130天,一半的客户生命周期低于 93天,25%的客户生命周期超过 250 天。客户的生命周期分化严

19、重,流失客户和忠诚客户都占到四分之一以上。平台可以把忠诚客户维持的经验应用到新客中,提高初次购买体验来增加新客留存率。按客均消费计算,这部分新客留存带来的收益可以增加约 30%。3)平台售卖的商品价格基本在 20英镑以内,且呈现价格越低销量越高的趋势。销售量最多的产品是闹钟类的礼品,在 5英镑左右的商品出现万级别的销量。对于平台出售的 2种特高价商品(6000 英镑以上)销量仅为 3件,且购买高价商品的客户没有留存,建议下架特高价商品以减少高价商品的运维成本。4)基于本土优势,90%以上的客户来源与英国本土,其次是欧洲国家。但从客均消费来看:英国只算中等水平,而海外市场中,爱尔兰的客均消费表现十分抢眼,达到 80000英镑以上。达到 10000英镑以上的国家还有荷兰、新加坡和澳大利亚。对于这些购买力极强的海外客户,应积极保持联系,在该地区做宣传推广,获取更多优质客户;予以国际物流支持,增加优质客户粘性。5)根据 RFM 模型,建立了客户分类标准,销售情况符合二八定律:25%的客户贡献了 80%的销售额。因此建议用户运营部门根据模型划分结果,对客户进行差异化运营和营销,将资源更多地投入到重要客户中去。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1