1、2607 时间:2014年5月7日学生姓名班级学号成绩实验项目数据挖掘应用实验实验目的至少掌握一种数据挖掘工具,并能正确地使用; 利用所掌握的数据挖掘工具进行分类分析、关联分析、聚类分析等实验要求至少熟悉一种挖掘工具,并使用该挖掘工具进行分类、关联和聚类分析;阅读教材P139-156,边阅读,边操作;实验数据可用系统自带的,也可以从网上下载,也可以自行创建;算法自行选择,可以针对一个数据集选择多个算法进行比较分析,也可以每个算法选择不同的数据进行分析;学会并熟悉通过网络解决问题的能力;将本次试验的操作过程及分析结果填写在实验报告中。实验内容及实验结果1打开数据文件,数据预处理进行关联性分析分析
2、之前进行要先进行离散化处理,打开数据文件后,选择离散化处理的算法,确认算法参数之后就可以进行预处理操作;进行预处理之后的数据:2关联分析选择关联性分析的算法,对参数进行设置参数确定后就可以进行关联度的分析,关联算法的参数不同,几次测试的结果也不同,但都没得出与课本中相同的结果。3分类分析打开数据文件后,先选择进行分类的算法,J48-C4.5决策树算法,选择将测数据集作为训练集使用,同时选择output predictions使结果显示预测情况然后进行十折交叉验证,下图时将决策树可视化显示的结果4聚类分析选用k-均值聚类算法进行聚类分析,进行聚类之前先对数据文件进行规范化处理打开文件后选择规范化处理算法,进行规范化处理后将数据进行保存;下图是打开文件选择算法后的界面:下图是进行规范化处理之后的数据:重新打开进行规范化处理后的文件,选择k-均值聚类算法,下图是算法参数设置界面:k-均值聚类算法参数确认后进行聚类分析,下图是聚类分析的结果显示:除了“k-均值聚类算法”,聚类分析还可以选择其他的算法,重新选择算法“DBScan”,对算法参数进行设置,然后金子那个聚类分析“DBScan”聚类算法参数设置界面:DBScan聚类分析结果显示: