数据仓库与数据挖掘技术 第五章 关联规则.docx

上传人:b****5 文档编号:3756322 上传时间:2022-11-25 格式:DOCX 页数:20 大小:2.92MB
下载 相关 举报
数据仓库与数据挖掘技术 第五章 关联规则.docx_第1页
第1页 / 共20页
数据仓库与数据挖掘技术 第五章 关联规则.docx_第2页
第2页 / 共20页
数据仓库与数据挖掘技术 第五章 关联规则.docx_第3页
第3页 / 共20页
数据仓库与数据挖掘技术 第五章 关联规则.docx_第4页
第4页 / 共20页
数据仓库与数据挖掘技术 第五章 关联规则.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

数据仓库与数据挖掘技术 第五章 关联规则.docx

《数据仓库与数据挖掘技术 第五章 关联规则.docx》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘技术 第五章 关联规则.docx(20页珍藏版)》请在冰豆网上搜索。

数据仓库与数据挖掘技术 第五章 关联规则.docx

数据仓库与数据挖掘技术第五章关联规则

第5章关联规则方法

5.1关联规则的概念和分类

5.1.1关联规则的概念

5.1.2关联规则的分类

1.基于规则中处理的变量类别分类

2.基于规则中数据的抽象层次分类

3.基于规则中涉及的数据维数分类

4.基于模式与规则之间的相互关系分类

5.2Apriori算法

5.2.1产生频繁项集

1.求频繁1项集L1

2.求频繁k+1项集Lk+1(即执行apriori-gen(Lk))

图5-1示例数据库

5.2.2产生频繁项集的实例

1.第1次迭代,产生频繁1-项集

3.第3次迭代,产生频繁3-项集

5.2.3从频繁项集产生关联规则

5.3FP-Growth算法

5.3.1FP-Growth算法计算过程

图5-2示例数据库

图5-3FP-tree

5.3.2FP-Growth算法示例

图5-4I5的条件模式树

5.4利用SQLServer2005进行关联规则挖掘

1.数据准备

图5-5客户基本情况表

图5-6贷款余额表

图5-7合并表数据

图5-8合并产生的表

2.实现挖掘任务

图5-9启动MicrosoftVisualStudio

图5-10新建AnalysisServices项目

图5-11AnalysisServices项目信息

图5-12新建数据源视图

图5-13数据源视图向导

图5-14选择数据源

图5-15选择表和视图

图5-16命名数据源视图

图5-17数据源视图具体信息

图5-18新建挖掘结构

图5-19数据挖掘向导欢迎界面

图5-20选择创建挖掘结构所用的方法

图5-21选择挖掘结构所用的数据挖掘技术

图5-22选择数据源视图

图5-23指定表类型

图5-24指定列

图5-25指定列内容和数据类型

图5-26为挖掘结构命名

图5-27挖掘模型

图5-28设置算法参数

图5-29参数设置

图5-30启动部署

图5-31显示部署进度

图5-32处理挖掘结构和所有模型

图5-33选择挖掘结构

图5-34处理成功

3.查看挖掘结果

图5-35加载挖掘模型进度

图5-36查看项集

图5-37设定支持度和项集尺寸

图5-38查看规则

图5-39显示依赖关系

图5-40查找感兴趣的结点

图5-41“房地产开发”的关系网络

图5-42选择事例表

图5-43选择可预测列

图5-44显示提升图

图5-45显示分类矩阵

习题5

1.说明关联规则挖掘的目的和作用。

2.简要说明在频繁模式发现技术中,产生候选项集和不产生候选项集两种技术各自的特点和优缺点。

3.图5-1所示的数据库,如果分别设定最小支持度s=10%和s=40%,置信度c=70%,计算该示例数据库中的频繁项集和规则。

4.根据图5-3所示的FP-tree,找出以I4,I3,I1,I2为后缀的频繁模式。

5.根据图5-3所示的FP-tree,找出其中所有的关联规则及他们的置信度。

6.练习使用SQLServer2005的关联规则挖掘模型。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1