ImageVerifierCode 换一换
格式:DOCX , 页数:8 ,大小:20.79KB ,
资源ID:6229917      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/6229917.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(超市内的数据挖掘应用.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

超市内的数据挖掘应用.docx

1、超市内的数据挖掘应用超市内的数据挖掘应用作者:Zhu Jianqiu 来源:不详 发布时间:2005-11-2 POS机(checkout scanner)最初用途是纯粹的基于操作上的方便,它的优点是可以集中设置价格,价格改变时,不用对货架上每个商品进行修改。但是,客户对不明确标价的商品一般不买,所以最初集中设置价格的方便没有实现。然而,在增加付帐速度,精确定价,库存控制方面起到很大的作用。 POS首先讨论超市在将来有望成为一个信息中介商,接着介绍了三个案例。每一个案例都演示了数据挖掘技术在该行业内的用途。第一个案例描述如何使用汇总的、匿名的交易数据和外部第二个案例显示了忠诚卡如何和个人消费联

2、系起来,定位基于客户行为的目标市场。第三个案例显示了如何使用直接和间接的数据挖掘技术(包括关联规则、自动聚集检测、决策树)来鉴别能够赢利的客户分片。机另外一个重要的作用,开始没有被注意到,那就是产生了大量的数据GB/TB。这一讲探索如何利用这些数据。demographic信息一起,研究和比较不同人种的购买行为。 行业发展趋势 零售业刚开始明白他们收集信息的真正价值,这可以参照其他行业,比如信用卡行业。信用卡行业与零售业类似,它们收集了客户购买商品的信息,这些信息可以以其他形式卖给需要针对单个客户进行市场定位的公司。超市收集的数据使得零售商有机会改变和品牌供应商之间的能力平衡。POS系统所收集的

3、数据能够回答供应商(如P&G保洁, Coca Cola可口可乐, Pesi百事等等)一个问题,这个问题是供应商非常希望得到回答的:谁在购买这种品牌的商品?这就是我们通常所说的,知识就是力量。“谁正在买什么?”这种知识使得零售商有能力成为信息中介商。 超市作为信息中介 信用卡公司作为信息中介的例子:客户得到了某航空公司提供的免费飞行里数,该客户有经常飞行的记录,但并不经常搭乘该航空公司的班机,为什么?客户为了得到这种优惠(免费飞行),必须填写一张清单,简单地注明所使用的信用卡。航空公司并不能直接向信用卡公司购买这些客户的姓名和地址等信息。因为信用卡公司必须保护客户的隐私权。那么,信用卡公司如何进

4、行信息中介的呢?信用卡公司采取另外一种方式,允许航空公司提这样的问题:哪些客户在最近六个月中,在飞行上花费超过2000$?对这些客户,由信用卡公司提供offer,航空公司出offer的内容,即免费旅行等优惠,来争取客户。A的猫食,这种商品的目标客户是饲养猫的家庭,但是,他不知道谁是猫的主人,从而针对性地进行市场策划,例如对猫的主人发放优待券。超市知道谁买了什么,因而也就知道谁是A的最好的潜在客户,该经理当然愿意为这一类信息付费。 重心从商品转换到客户 目前,超市从匿名客户,开始支持忠诚卡客户,即原来的超市发卡记录客户的行为,并不是用来进行数据挖掘的。传统的做法是基于统计的:对于每月花费超过PO

5、S程序记录的是匿名交易数据,现在可以记录有卡的客户的信息。如果没有客户的信息,超市将不能回答许多实际的问题。400$的客户,超市提供一次免费的聚餐。等等。这种方法有一个缺陷,主要是不针对客户,只针对在超市固定的花费。对于客户的月花费存在三种类型,一类客户不管超市如何促销,他们的花费都不会超过400$;第二类是日常月花费总超过400$,对于这一类客户,免费的聚餐不会构成吸引;最后一类客户,是确实因为此类促销活动,使得花费超过了400$。最后一类客户才是这种策略的真正目的。解决方案是给每一个客户不同的花费目标,这一点统计不能作到,需要使用数据挖掘的技术。数据挖掘技术可以对每个客户在花费的价格和购买

6、的商品上,度身定做相应的促销手段。例如,可以给客户免费赠送某个商品,这种商品他过去没有购买过,但是通过数据挖掘,我们知道他应该喜欢。 三个案例研究例如: 另一个转换是必须将不同大小的超市的销售进行比较 即考虑超市的销售量,为了表示与超市大小相关的测量因素,增加派生变量:对每个超市的每一个商品增加派生变量 分析特定客户群的购买模式 该数据挖掘项目的客户:某打包商品的厂商。目的:针对数据:过程:厂商如何了解特定种族的客户的购买模型South Texas的说西班牙语的购物者,进行特定种族的市场活动。Texas连锁超市提供 商业背景 数据 厂商需要知道不同的种族的目标客户的习惯和偏爱是否有不同,而这种

7、不同是否对品牌商品的市场定位有实际的意义。数据来源: Texas 销售数据不是具体的细节数据,是每周销售的汇总 各超市附近的人口统计信息 销售的产品分为五类: 数据是从 销售数据包括: 超市数据包括:的连锁超市客户以及其竞争产品的销售数据,原因是Texas一个州有大量的说西班牙语的人口。 西班牙人口的百分比 Ready-to-eat cereals(谷类);Desserts(餐后甜点);Snack(小吃);Main meals(主食);Pancake and variety baking mixing(烤饼等) 1996年6月到1997年12月 the actual units sold; t

8、he dollar volume; the equivalent case sales store size; the percentage of Hispanic shoppers; the percentage of African-American shoppers 数据分析: 销售数据是汇总的数据,不能做市场篮子分析( 销售数据是匿名的数据,不能通过忠诚卡对客户行为进行分析 Market-basket analysis) 数据预处理: 有些数据域包含多种不同含义,所以第一步是数据转换,将数据解码,分解成一个域表示一个明确的含义。 HISPLVL(the percentage of Hi

9、spanic shoppers)和AALEVEL(the percentage of African-American shoppers) AALEVEL 10HISPLVL 的域是1到10, 1表示African-American的百分比是90100%表示African-American的百分比是010%的域是1到15, 1表示在San Antonio之外的Hispanic的百分比是90100% 1110表示在San Antonio之外的Hispanic的百分比是010%表示在San Antonio之内的Hispanic的百分比是90100% 15表示在San Antonio之内的Hispa

10、nic的百分比是010% 根据推测,原来的数据库设计者之所以区别对待将不同的含义包括在一个数据域,对数据挖掘是会造成混乱的。解决方法是增加一个属性San Antonio,是因为历史上San Antonio有较高的Mexican-American人口,Hispanic是近来流入的。ALAMO,将San Antonio的超市区别对待。the units, dollars, equivalent cases by the total sales volume of the store 比较跨越不同层次的Hispanic人口的商品的销售 Hispanicity Scores,首先将超市分成三组,分别是

11、low , medium, high Hispanic,每一组的Hispanicity Scores是对sales, dollars, equivalent cases加权求和,最后每一个商品(脱离超市)的Hispanicity Scores是用high Hispanic超市的该商品Hispanicity Scores的平均值减去low Hispanic超市的该商品Hispanicity Scores的平均值。商品的Hispanicity Scores是一个正数,表明该商品在Hispanic 人口多的地方销售得好,相反是一个负数,表明在Hispanic人口多的地方销售得不好,正数越大销售得越好

12、,负数越大销售的越不好。 可视化工具的作用(MineSet) 一个失败的方法 最终的结果 MineSet将的evidence visualizer计算每一个输入变量对结果的贡献度。这个工具采用统计的数据挖掘技术,称做朴素的贝叶斯建模,这种分析能够迅速地决定哪些值或值的范围对哪些变量是好的证物(evidence ),属于或者不属于某一特定的分类。这个工具用来作假定分析,用户能挑选感兴趣的变量和值,迅速地在饼图上观察与不同的结果相关的可能性的效果。Hispanic percentage分成5份(020,2040,4060,6080,80100)作为目标变量,观察其他与它相关的变量,最后发现:the

13、 percentage of African-Americans; whether or nor the store was in San Antonio; the size of the store与目标变量是相关的。 市场篮子分析方法:每个商品被销售的数量和超市的Hispanic(低、中、高)人口做关联。 最激动的结果来自于对每个商品可视化派生变量hispanicity scores。 MineSet充分利用了屏幕上色彩的可视化表现能力。表现了可视化作为一种数据挖掘的方法能取得很好的效果。 谁在超市购买酸奶? 商业背景 数据 这个案例是将厂商和它的一个商品零售联营联合在一起进行考虑。一个零

14、售联营中,常常将一个种类商品的某个卖主称做“种类首领(卖主(供应商)可以通过数据挖掘技术来增加商品的利润率,从而竞争“种类首领”。category captain)”,该卖主决定着其他同类商品在商店的价格。 数据来源: 7 Date; Store; Lane (lane of transaction); Time; Customer ID; Tender type (payment type); UPC 两个文件(商品销售明细表)连接得到上述记录,连接键个超市1年POS机详细的交易记录 (universal product code); Quantity; Dollar Amount Date

15、-store-lane-time 从杂货到客户 一年的所有超市的交易记录量是巨大的,为了分析客户行为,除了上面给出的数据属性外,必须增加一些有意义的派生数据,同时,也需要增加一些辅助变量。扩展的交易细节记录属性描述CKOUT_KEYUnique key identifying checkoutSTOR_KEYUnique key identifying store and chainCHN_CDChain codeSTOR_CDStore codeLANE_NBRLane numberEVNT_DT_KEYDate(MMDDYYYY)EVNT_TM_KEYTime(HHMMSS)PRD_UPC

16、_KEYProduct UPCPRD_UPC_QTYNumber of particular UPCs purchasedPRD_UPC_AMT$ amount spent on particular UPCCUST_CARD_CDFrequent shopper IDCKOUT_AMTTotal purchased $ amountCKOUT_ITM_QTYTotal # of items purchasedUNIQUE_UPC_QTYTotal # of distinct UPCs purchasedPAYT_TY_NBRPayment type codeUPC_DESCProduct U

17、PC descriptionSIZE_DESCSize descriptionSIZSizeUOMUnit of measureCASE_PACKCase packMFG_DESCManufacturers descriptionMFR_CDManufacture IDITEM_NUMItem numberMARGINHigh, medium, or low prof超市与供应商和信用卡公司与航空公司有类似的关系,超市同样可以作为信息中介商。设想一个销售某种品牌商品的经理,例如某种品牌超市可以采用两种不同的方式从事信息中介,一种方式是针对匿名客户,另一种是针对注册或有忠诚卡的客户。对第一种,超市可以编写一段优待券打印程序,当一个客户购买某种商品时,打印与该商品有关商品的优待券(关联规则)。但是,一般而言,客户在购买了某种商品后,不会在很短的时间内购买相关商品。对于有忠诚卡的客户,可以分析他的购买历史,向他发放下次可能会购买的商品的优待券(序列模式)。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1