收藏

下载资源加入VIP,免费下载

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx

上传人：b****3 文档编号：2888421 上传时间：2022-11-16 格式：DOCX 页数：26 大小：1.03MB

下载相关举报

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第1页

第1页 / 共26页

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第2页

第2页 / 共26页

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第3页

第3页 / 共26页

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第4页

第4页 / 共26页

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx_第5页

第5页 / 共26页

点击查看更多>>

资源描述

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx

《数据仓库与数据挖掘试验报告乘用车数据挖掘.docx》由会员分享，可在线阅读，更多相关《数据仓库与数据挖掘试验报告乘用车数据挖掘.docx（26页珍藏版）》请在冰豆网上搜索。

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx

数据仓库与数据挖掘试验报告乘用车数据挖掘

《数据仓库与数据挖掘》实验指导书

（适用于信息系统与信息管理专业）

编者：

XXX

XXX大学管理学院

20102-6

目录

实验目的：

1、熟悉Clementine软件从数据导入到结果输出的全过程。

2、复习Clementine软件中聚类方法。

3、复习Clementine软件中的关联分析方法

实验内容：

在Clementine中建立乘用车数据分析模型；

聚类分析：

使用K-Means、Kohonen、两步法，进行聚类，并简单给出结论；

异常点分析：

使用“异常”节点进行异常分析，并简单给出结论；

关联规则分析：

对其中感兴趣的字段进行关联分析，画出网络图，并简单给出结论。

乘用车数据分析：

打开操作区，选择“可变文件”，将之拖入操作区，编辑“可变文件”

，打开我的U盘中的“乘用车数据库——信管0901.csv”数据源，如图所示：

在“类型”中将各个字段的值读入，如图所示：

从总体中抽取37%进行数据分析：

把不用的字段过滤出去：

然后进行各项分析。

K-means分析：

创建K-means结点，编辑使用定制设置，选择所要进行分析的字段名，如图：

选择“执行”，执行之后在右侧区域形成K-means模型，并将K-means模型拖入操作区并与数据源相连。

如图：

单击模型进行分析：

点击“查看器”：

分析结果：

在对各项的字段进行分析中，对制造商名称、厢数、价格分成三个聚类，得出的结果是价格的重要性大于0.95，而厢数的重要性则为0.00，说明价格对聚类的影响程度很大，而厢数的影响程度几乎为0。

Kohomen分析：

创建Kohomen分析结点，选择相应的要分析的字段：

编辑完毕之后点击“执行”：

点击模型查看分析结果：

在查看器的分析结果中，年份和车系字段的重要性均大于0.95，这说明年份和车系对聚类的影响程度都很大。

两步聚类分析：

创建“两步”聚类分析结点，并进行编辑：

点击“执行”生成两步聚类分析模型，如图：

点击查看分析结果：

在分析结果中发现，价格、车系字段的重要程度均大于0.95，说明这些因素对于聚类的影响程度都很高。

异常分析：

创建“异常分析”结点并与源文件相连;

在编辑结点中，选择所要分析的字段，如图所示：

点击“执行”后，形成异常分析的模型，然后点击查看：

为了更好的查看异常用户的异常情况，创建一张表，用来显示异常用户的基本信息。

然后对表进行排序，将正常用户与异常用户隔离开来。

如图所示：

分析结果如图所示：

在字段“O-Anomaly”中，若字段值为“F”，则为正常用户，若字段值为“T”，则为异常用户。

关联分析：

运行到最后，解雇如下图：

展开阅读全文

相关资源

猜你喜欢

相关搜索

资源标签

当前位置：首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1