数据仓库与数据挖掘试验报告乘用车数据挖掘.docx

上传人:b****3 文档编号:2888421 上传时间:2022-11-16 格式:DOCX 页数:26 大小:1.03MB
下载 相关 举报
数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第1页
第1页 / 共26页
数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第2页
第2页 / 共26页
数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第3页
第3页 / 共26页
数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第4页
第4页 / 共26页
数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx

《数据仓库与数据挖掘试验报告乘用车数据挖掘.docx》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘试验报告乘用车数据挖掘.docx(26页珍藏版)》请在冰豆网上搜索。

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx

数据仓库与数据挖掘试验报告乘用车数据挖掘

 

《数据仓库与数据挖掘》实验指导书

(适用于信息系统与信息管理专业)

 

编者:

XXX

XXX大学管理学院

20102-6

目录

实验目的:

1、熟悉Clementine软件从数据导入到结果输出的全过程。

2、复习Clementine软件中聚类方法。

3、复习Clementine软件中的关联分析方法

实验内容:

在Clementine中建立乘用车数据分析模型;

聚类分析:

使用K-Means、Kohonen、两步法,进行聚类,并简单给出结论;

异常点分析:

使用“异常”节点进行异常分析,并简单给出结论;

关联规则分析:

对其中感兴趣的字段进行关联分析,画出网络图,并简单给出结论。

乘用车数据分析:

打开操作区,选择“可变文件”,将之拖入操作区,编辑“可变文件”

,打开我的U盘中的“乘用车数据库——信管0901.csv”数据源,如图所示:

在“类型”中将各个字段的值读入,如图所示:

从总体中抽取37%进行数据分析:

把不用的字段过滤出去:

然后进行各项分析。

K-means分析:

创建K-means结点,编辑使用定制设置,选择所要进行分析的字段名,如图:

选择“执行”,执行之后在右侧区域形成K-means模型,并将K-means模型拖入操作区并与数据源相连。

如图:

单击模型进行分析:

点击“查看器”:

分析结果:

在对各项的字段进行分析中,对制造商名称、厢数、价格分成三个聚类,得出的结果是价格的重要性大于0.95,而厢数的重要性则为0.00,说明价格对聚类的影响程度很大,而厢数的影响程度几乎为0。

Kohomen分析:

创建Kohomen分析结点,选择相应的要分析的字段:

编辑完毕之后点击“执行”:

点击模型查看分析结果:

在查看器的分析结果中,年份和车系字段的重要性均大于0.95,这说明年份和车系对聚类的影响程度都很大。

两步聚类分析:

创建“两步”聚类分析结点,并进行编辑:

点击“执行”生成两步聚类分析模型,如图:

点击查看分析结果:

在分析结果中发现,价格、车系字段的重要程度均大于0.95,说明这些因素对于聚类的影响程度都很高。

异常分析:

创建“异常分析”结点并与源文件相连;

在编辑结点中,选择所要分析的字段,如图所示:

点击“执行”后,形成异常分析的模型,然后点击查看:

为了更好的查看异常用户的异常情况,创建一张表,用来显示异常用户的基本信息。

然后对表进行排序,将正常用户与异常用户隔离开来。

如图所示:

分析结果如图所示:

在字段“O-Anomaly”中,若字段值为“F”,则为正常用户,若字段值为“T”,则为异常用户。

关联分析:

运行到最后,解雇如下图:

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1