你正在下载：《

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx

》 [预览]

格式：DOCX ，页数：26 ，大小：1.03MB ,
资源ID：2888421 下载积分：12 金币

快捷下载

登录下载

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

加入VIP,免费下载

温馨提示：由于个人手机设置不同，如果发现不能下载，请复制以下地址【https://www.bdocx.com/down/2888421.html】到电脑端继续下载（重复下载不扣费）。

已注册用户请登录：

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

三方登录：

1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

本文（数据仓库与数据挖掘试验报告乘用车数据挖掘.docx）为本站会员（b****3）主动上传，冰豆网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知冰豆网（发送邮件至service@bdocx.com或直接QQ联系客服），我们立即给予删除！

数据仓库与数据挖掘试验报告乘用车数据挖掘.docx

1、数据仓库与数据挖掘试验报告乘用车数据挖掘数据仓库与数据挖掘实验指导书（适用于信息系统与信息管理专业）编者：XXXXXX大学管理学院20102-6目录实验目的：1、熟悉Clementine软件从数据导入到结果输出的全过程。2、复习Clementine 软件中聚类方法。3、复习Clementine 软件中的关联分析方法实验内容：在Clementine 中建立乘用车数据分析模型；聚类分析：使用K-Means、Kohonen、两步法，进行聚类，并简单给出结论；异常点分析：使用“异常”节点进行异常分析，并简单给出结论；关联规则分析：对其中感兴趣的字段进行关联分析，画出网络图，并简单给出结论。乘用车数

2、据分析：打开操作区，选择“可变文件”，将之拖入操作区，编辑“可变文件”，打开我的U盘中的“乘用车数据库信管0901.csv”数据源，如图所示：在“类型”中将各个字段的值读入，如图所示：从总体中抽取37%进行数据分析：把不用的字段过滤出去：然后进行各项分析。K-means分析：创建K-means结点，编辑使用定制设置，选择所要进行分析的字段名，如图：选择“执行”，执行之后在右侧区域形成K-means模型，并将K-means模型拖入操作区并与数据源相连。如图：单击模型进行分析：点击“查看器”：分析结果：在对各项的字段进行分析中，对制造商名称、厢数、价格分成三个聚类，得出的结果是价格的重要性大于0.

3、95，而厢数的重要性则为0.00，说明价格对聚类的影响程度很大，而厢数的影响程度几乎为0。Kohomen分析：创建Kohomen分析结点，选择相应的要分析的字段：编辑完毕之后点击“执行”：点击模型查看分析结果：在查看器的分析结果中，年份和车系字段的重要性均大于0.95，这说明年份和车系对聚类的影响程度都很大。两步聚类分析：创建“两步”聚类分析结点，并进行编辑：点击“执行”生成两步聚类分析模型，如图：点击查看分析结果：在分析结果中发现，价格、车系字段的重要程度均大于0.95，说明这些因素对于聚类的影响程度都很高。异常分析：创建“异常分析”结点并与源文件相连;在编辑结点中，选择所要分析的字段，如图所示：点击“执行”后，形成异常分析的模型，然后点击查看：为了更好的查看异常用户的异常情况，创建一张表，用来显示异常用户的基本信息。然后对表进行排序，将正常用户与异常用户隔离开来。如图所示：分析结果如图所示：在字段“O-Anomaly”中，若字段值为“F”，则为正常用户，若字段值为“T”，则为异常用户。关联分析：运行到最后，解雇如下图：