ImageVerifierCode 换一换
格式:DOCX , 页数:11 ,大小:337.81KB ,
资源ID:7091577      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7091577.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(原创基于WEKA软件的分类模型性能比较报告附代码数据.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

原创基于WEKA软件的分类模型性能比较报告附代码数据.docx

1、原创基于WEKA软件的分类模型性能比较报告附代码数据 基于WEKA软件的分类模型性能比较数据预处理:在进行分类之前,为消除量纲的差别,首先对属性进行归一化处理。选择需要归一化的特征变量。BFTree:选择分类中的BFTree决策树,测试选择采用十折交叉验证,10-folds cross-validation是指,将训练集分为10份,使用9份做训练,使用1份做测试,如此循环10次,最后整体计算结果。分类评估选项中选择输出预测(output predictions)设置对决策树进行纠错(debug)和启发性探索(heuristic),每个分支最小的样本值为2个,剪枝策略为后剪枝,即在决策树完美分割

2、学习样例之后,对决策树进行修剪。上图给出了实验用的分类器以及具体参数,实验名称,样本数量,特征数量以及所用特征,测试模式。在右侧的Classifier output里面,我们看到了实验的结果。上图给出了生成的决策树,以及叶子节点数、树的节点数、模型训练时间。再往下是预测结果,可以看到每个样本的实际分类,预测分类,是否错分,预测概率这些信息。最下面是验证结果,整体的accuracy是99.9385%,e类准确率是99.9%,召回率99.9%,p类准确率是99.9%,召回率99.9%。Result list里右键点击分类的记录,选择Visualize classify errors,可以看到横轴代

3、表实际的类别,纵轴表示预测的类别,大部分的点落在左下方和右上方,说明预测误差很小。实例数/叶节点23456实例数/叶节点4671013准确率(%)99.7169 %99.729299.9385 %99.9754 %99.9261因此,可以选择叶节点为10.Naive-Bayes:同样选择交叉验证,即把数据集分成10份,1份作为验证集,其余部分作为训练集合。这样的方法保证了数据集的所有元素都被验证过。如图所示,这里把数据集分为10份来进行训练。设置参数Class作为分类属性。 分类器的输出结果如图所示结果中列出了分类器运行的信息,分类器训练的结果,分类器验证验证的结果、准确性计算等信息 ,可以看

4、到整体的accuracy是95.8272%,e类准确率是93.2%,召回率99.2%,p类准确率是99.1%,召回率92.2%。相对决策树算法的准确率稍低。从判断误差图来看分布在左上角和右下角的点也比较多,因此,误判的样本比较多。Knn设置最近邻为3,并对距离加权处理(distaneWeighting)从上图可以看到整体的accuracy是100%,e类准确率是100%,召回率100%,p类准确率是100%,召回率100%。准确率要高于贝叶斯和决策树算法。B)决策树贝叶斯KNN近邻准确率99.9754 %95.8272%100%混淆矩阵标准误差0.0010.040根据上述数据,虽然KNN有比较好的准确率和相对较好的标准误差,但是在这背后,很有可能是以较大错误率作为代价,这点可以从训练混淆矩阵中得到印证;而朴素贝叶斯分类算法的准确率相对较低,而标准误差也较高,综合评价可以得知,当前最好的分类算法是决策树算法,并且它是最优叶子节点设置参数为10。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1