ImageVerifierCode 换一换
格式:DOCX , 页数:10 ,大小:353.61KB ,
资源ID:13601495      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/13601495.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据挖掘weka数据分类实验报告Word下载.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据挖掘weka数据分类实验报告Word下载.docx

1、Weka使用Java写成, 而且限制在GNU通用公共证书条件下公布。它能够运行于几乎全部操作平台, 是一款无偿, 非商业化机器学习以及数据挖掘软件。Weka提供了一个统一界面, 可结合预处理以及后处理方法, 将很多不一样学习算法应用于任何所给数据集, 并评定由不一样学习方案所得出结果。三、 数据预处理 Weka平台支持ARFF格式和CSV格式数据。因为此次使用平台自带ARFF格式数据, 所以不存在格式转换过程。试验所用ARFF格式数据集如图1所表示图1 ARFF格式数据集(iris.arff) 对于iris数据集, 它包含了150个实例(每个分类包含50个实例), 共有sepal length

2、、 sepal width、 petal length、 petal width和class五种属性。期中前四种属性为数值类型, class属性为分类属性, 表示实例所对应类别。该数据集中全部实例共可分为三类: Iris Setosa、 Iris Versicolour和Iris Virginica。试验数据集中全部数据都是试验所需, 所以不存在属性筛选问题。若所采取数据集中存在大量与试验无关属性, 则需要使用weka平台Filter(过滤器)实现属性筛选。试验所需训练集和测试集均为iris.arff。四、 试验过程及结果应用iris数据集, 分别采取LibSVM、 C4.5决议树分类器和朴素

3、贝叶斯分类器进行测试和评价, 分别在训练数据上训练出分类模型, 找出各个模型最优参数值, 并对三个模型进行全方面评价比较, 得到一个最好分类模型以及该模型全部设置最优参数。最终使用这些参数以及训练集和校验集数据一起结构出一个最优分类器, 并利用该分类器对测试数据进行估计。1、LibSVM分类Weka 平台内部没有集成libSVM分类器, 要使用该分类器, 需要下载libsvm.jar并导入到Weka中。用“Explorer”打开数据集“iris.arff”, 并在Explorer中将功效面板切换到“Classify”。点“Choose”按钮选择“functions(weka.classifie

4、rs.functions.LibSVM)”, 选择LibSVM分类算法。在Test Options 面板中选择Cross-Validatioin folds=10, 即十折交叉验证。然后点击“start”按钮: 使用LibSVM分类算法训练数据集得出结果参数: S 0 K 2 D 3 G 0.0 R 0.0 N 0.5 M 40.0 C 1.0 E 0.0010 P 0.1结果分析:使用该参数指定LibSVM训练数据集, 得到正确率为96.6667%, 其中150个实例中145个被正确分类, 5个被错误分类。依据混淆矩阵, 被错误分类实例为: 2个b类实例被错误分类到c; 3个c类实例被错误分

5、类到b。该算法P=0.967, R=0.967, ROC面积为0.975。将模型应用于测试集:使用LibSVM分类算法测试数据集得出结果分类误差:正确率为98.6667%, 只有两个实例被错误分类。P=0.987, R=0.987, ROC面积为0.992、C4.5决议树分类器仍然使用十折交叉验证, 训练集和测试集相同。使用C4.5决议树分类算法训练数据集得出结果 -C 0.25 -M 2使用该参数指定C4.5决议树分类器训练数据集, 得到正确率为96%, 其中150个实例中144个被正确分类, 6个被错误分类。 2个b类实例被错误分类到c,1个b类实例被错误分类到a;该算法P=0.96, R

6、=0.96, ROC面积为0.968。使用C4.5分类算法测试数据集得出结果正确率为98%, 有3个实例被错误分类。P=0.98, R=0.98, ROC面积为0.9933、朴素贝叶斯分类器使用朴素贝叶斯分类算法训练数据集得出结果 无使用朴素贝叶斯分类器训练数据集, 得到正确率为95.3333%, 其中150个实例中143个被正确分类, 7个被错误分类。 4个b类实例被错误分类到c;该算法P=0.953, R=0.953, ROC面积为0.994。使用朴素贝叶斯分类算法测试数据集得出结果正确率为96%, 有6个实例被错误分类。P=0.96, R=0.96, ROC面积为0.9954、三种分类算法比较:LibSVMC4.5决议树朴素贝叶斯校验正确率98.6667%98%96%训练混淆矩阵校验标准误差0.09430.1080.1483比较结果分析:LibSVM算法相比C4.5决议树算法、 朴素贝叶斯算法含有愈加好分类性能。五、 试验总结经过此次试验, 我对Weka平台有了比较完整和深入认识, 掌握了使用Weka平台进行数据挖掘方法, 包含数据预处理、 分类、 聚类、 关联分析等。经过试验, 对数据挖掘本身也有了比较直观认识。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1