关联规则.docx

上传人:b****6 文档编号:5867414 上传时间:2023-01-01 格式:DOCX 页数:23 大小:2.55MB
下载 相关 举报
关联规则.docx_第1页
第1页 / 共23页
关联规则.docx_第2页
第2页 / 共23页
关联规则.docx_第3页
第3页 / 共23页
关联规则.docx_第4页
第4页 / 共23页
关联规则.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

关联规则.docx

《关联规则.docx》由会员分享,可在线阅读,更多相关《关联规则.docx(23页珍藏版)》请在冰豆网上搜索。

关联规则.docx

关联规则

关联规则是表示数据库中一组对象之间的某种关联关系的规则,关联规则挖掘的主要对象是交易(Transaction)数据库。

这种数据库的一个主要应用是零售业,比如超级市场的销售管理。

条形码技术的发展使得数据的收集变得更容易、更完整,从而可以存储大量的交易资料。

关联规则就是辨别这些交易项目之间是否存在某种关系。

例如:

关联规则可以表示“购买了商品A和B的顾客中有80%的人又购买了商品C和D”。

这种关联规则提供的信息可以用作商品目录设计、商场货架的布置、生产安排、具有针对性的市场营销等。

关联规则在CRM中的应用

CRM简介

CustomerRelationshipManagement(CRM),客户关系管理,指的是企业与其客户的交流方式,它实施于企业的市场营销、销售、服务与技术支等与客户有关的领域。

它是一种管理理念,又是一种旨在改善企业与客户之间关系的新型管理机制,也是一种管理软件和技术,它将最佳的商业实践与数据挖掘、数据仓库、一对一营销、销售自动化以及其它信息技术紧密结合在一起,为企业的销售、客户服务和决策支持等领域提供了一个业务自动化的解决方案,使企业有了一个基于电子商务的面对客户的前沿,从而顺利实现由传统企业模式到以电子商务为基础的现代企业模式的转化。

CRM的特征是:

①一对一营销②高度集成的交流渠道③统一共享的信息资源④商业智能化的数据分析和处理⑤对基于Web的功能的支持。

CRM的目标就在于协助企业不断地获取和积累客户知识,并将这些知识运用在企业的生产、市场营销和客户服务等各个领域,以提升客户满意度和忠诚度,提高企业的核心竞争力,从而降低生产、销售和服务成本,增加企业效益。

[5]

4.2基于关联规则的客户获得

以在线商店中的购物系统为例,说明关联规则在CRM客户获得中的应用。

某在线商店货架上有多种货物,例如,帽子、裙子、鞋子等,我们应用关联规则就是为了发现当一个人已经购买了帽子时,那他有多大可能还会买裙子呢?

首先,设定最小支持度为40%,假设该在线商店数据库中共有5条记录,如表1所示:

记录号帽子裙子鞋子

1110

2010

3110

4101

5010

根据Apriori算法,首先产生第一频集L1,如表2所示。

由于鞋子的支持度小于40%,最终L1频集为表3所示。

由L1频集,得出C2候选集,如表4所示。

由C2候选集,得出L2频集,如表5所示。

L2为得出的最终频集。

由关联规则可得:

confidence(帽子⇒裙子)=P(帽子∣裙子)=40%/60%=2/3

confidence(裙子⇒帽子)=P(裙子∣帽子)=40%/80%=1/2

由此可以看到买帽子的人也买裙子的可能性(67%)高于买裙子的人也买帽子的可能性(50%)。

帽子和裙子关联的支持度已足够高了,意味着这是一条有意义的关联规则。

目前在医学领域的应用也非常广泛与成功,比如:

对甲型肝炎疫情风险数据进行挖掘时,发现很多强关联规则,这些强关联规则中蕴含着甲型肝炎发病与季节、气温、气压、降水量、蒸发量等影响因素之间的关联关系,对指导疾病预防、控制实践,具有很强的应用价值。

【案例1】太阳证、阳明证、少阳证、少阴证药对分析

规则支持度置信度%

(rule)(support)(confidence)%

1.麻黄&桂枝==>伤寒太阳证*1688.89

2.杏仁&麻黄==>伤寒太阳证1487.50

3.生姜&桂枝==>伤寒太阳证1178.57

4.知母&石膏==>伤寒阳明证*969.23

5.石膏&葛根==>伤寒阳明证6100.00

6.黄芩&柴胡==>伤寒少阳证*2180.77

7.人参&半夏==>伤寒少阳证1430.33

8.黄芩&半夏==>伤寒少阳证1990.48

9.干姜&附子==>伤寒少阴证*1161.11

10.人参&附子==>伤寒少阴证964.29

}MicrosoftSQLServer2005AnalysisServices(SSAS)提供的基于Apriori算法的关联。

本节利用SQLServer2005对某大学2006年新生入学体检关于乙肝病毒检查的数据进行数据挖掘。

希望通过对所收集的乙肝病毒检查报告的数据挖掘来发现“两对半”5项指标之间的关系。

然后读者可以根据医学上对乙肝病毒检验的知识来判断关联数据挖掘的正确性(“+”表示该指标阳性,“-”表示该指标阴性)。

该图选中部分均为“乙肝表面抗原阳性”和“乙肝e抗原阳性”,这是典型的乙肝检验结果,该图中可以看出,其他指标可以有不同的反应

按照重要性计算公式:

该图中重要性值最大的是“3.142”这条规则的意思是“乙肝表面抗原阳性”、“乙肝e抗体阴性”和“乙肝e抗原阳性”会同时出现的情况,应该给予最大的关注。

这又是一条典型的乙肝诊断标准。

以“乙肝表面抗原阳性”为核心分成2大类,分别是乙肝患者和未患乙肝人群的“二对半指标”的组合情况。

正常人群:

1.“乙肝表面抗原阴性”与“乙肝表面抗体阳性”

2.“乙肝表面抗原阴性”与“乙肝核心抗体阴性”

乙肝病人:

1.乙肝表面抗原阳性”与“乙肝e抗原阳性”

数据挖掘在餐饮业的应用

首先,要想利用数据挖掘技术就必须要有数据库.要把所需要的数据先存储下来.这个问

题可以通过目前市面上已经被应用的点菜系统来解决.图1列举了某公司出品的一个点菜系

统的结构图.

事件集

客户集

案例:

发现数据业务之间关联

表1

2表2

表2

网站:

新浪新闻首页—按类别分类文件,按心情分类……

中国移动的三个品牌:

全球通:

贾樟柯,王石

动感地带:

周杰伦

神州行:

葛优

􀁺中国联通品牌

HELLO,MOTO!

----摩托,现在还好吗?

MOTO没落的五个原因

过份依赖单一明星产品,未能对用户有效分类

降价过快导致渠道利润骤降,中高端形象受损

与运营商合作不够深入,失利定制手机市场

工业设计未能保持创新,未能充分利用品牌优势

错失技术潮流,向网络,娱乐,多媒体转型缓慢

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1