ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:18.99KB ,
资源ID:18016845      下载积分:2 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/18016845.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(用MATLAB实现数据挖掘的一种算法Word文档下载推荐.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

用MATLAB实现数据挖掘的一种算法Word文档下载推荐.docx

1、使用dm=xlsread(lisanhua); 导入lisanhua.xls文件,在MATLAB中对一些连续属性值离散化。如下:1、29,48=1,48,62=2,62,77=34、94,110=1,110,143=2,143,200=35、126,205=1,205,293=2,293,564=38、71,120=1,120,175=2,175,202=310、0,1.5=1,1.5,2.5=2,2.5,6.2=3。然后对数据进行归一化处理:由于不同属性之间的属性值相同,所以利用下面语句对一共13个条件属性中的38个属性进行如下赋值,使每条属性唯一确定。从而得到38个条件属性,只不过38个里

2、面有且只能出现13个。程序如下:m1=0,3,2,4,3,3,2,3,3,2,3,3,4,3;k=1;w=m1(k);dm3=dm2;for i=1:3939 dm3(i)=dm2(i)+w; if rem(i,303)=0 k=k+1; w=w+m1(k); endend从而得到dm(3)矩阵。而且决策属性分为1:healthy;2:sick。并且在38个条件属性中没有值为0。四、挖掘算法1、特殊样本首先在前200条样本中分别找出三条对应两种决策属性的重要样本,样本必须满足在同类决策属性下其他199条的13条决策属性中和它的13条条件属性数目大于等于10的前3条样本。2、特殊条件属性值其次分

3、别对应两条决策属性值的5条重要条件属性值(在38个条件属性里找),特殊属性值必须满足:(1)在对应相同决策属性下,此决策属性支持率必须在前五,(2)而且如果不同决策属性出现相同条件属性。如果相同决策属性同时出现在不同决策属性中,删除这条后找支持率第六的条件属性,以此类推。挖掘算法在MATLAB里列出并做了标注。五、验证程序1、预处理在验证程序里面分别对测试数据和六条样本做了对比,又对其属性值和特殊属性值做了对比,最后利用加权求和算法判断测试样本的决策属性正确率。其中:nc,mc代表测试数据分别和两类样本属性中相同数是否大于等于9时的加权值。ncc,mcc代表测试数据分别和两类特殊属性满足几条数

4、目的加权值。2、关联规则(1)、如果(nc=0.9&ncc=8)|(ncc=10&nc=0.6) 得到决策属性healthy(2)、不满足以上条件的话 如果(mc=0.9|mcc=8)|(mcc=9&mc=0.6) 得到决策属性sick。(3)、不满足以上条件的话 如果nc=(mc+0.3)|ncc=(mcc+2) 得到决策属性healthy。(4)、不满足以上条件的话 如果mcnc 得到决策属性为sick。(5)、不满足以上条件的话 如果nccmcc 得到决策属性为healthy。(6)、不满足以上条件的话 如果mccncc 得到决策属性为sick。(7)、不满足以上条件的话 得到决策属性为

5、sick。六、正确率及结果分析正确率为82.5%结果分析:由于采用了两类约束方法,所以效果还可以。七、程序如下页所示clear;% 数据预处理程序 % % 载入数据%z1=dm(:,1); % 离散化第一列数据303 if z1(i)=29&z1(i)=48&62 z1(i)=2; else z1(i)=3;z2=dm(:,2); if z2(i)=0 z2(i)=1; else z2(i)=2;z3=dm(:,3); z3(i)=z3(i)+1;z4=dm(:,4); if z4(i)=94&z4(i)=110&143 z4(i)=2; else z4(i)=3;z5=dm(:,5); if

6、 z5(i)=126&z5(i)=205&293 z5(i)=2; else z5(i)=3;z6=dm(:,6); z6(i)=z6(i)+1;z7=dm(:,7); z7(i)=z7(i)+1;z8=dm(:,8); if z8(i)=71&z8(i)=120&175 z8(i)=2; else z8(i)=3;z9=dm(:,9); z9(i)=z9(i)+1;z10=dm(:,10); if z10(i)=0&z10(i)=1.5&2.5 z10(i)=2; else z10(i)=3;z11=dm(:,11); z11(i)=z11(i)+1;z12=dm(:,12); z12(i)

7、=z12(i)+1;z13=dm(:,13); z13(i)=z13(i)+1;z14=dm(:,14); z14(i)=z14(i)+1;dm2=z1,z2,z3,z4,z5,z6,z7,z8,z9,z10,z11,z12,z13,z14;% 预处理结束 % 挖掘算法 % 找6条样本前的预处理dm4=zeros(200,14);dm5=zeros(200,14);200 if dm3(i,14)=1 dm4(i,1:13)=dm3(i,1:13); else dm5(i,1:a1=zeros(38,1);a2=zeros(38,1);for k=1:3813 for j=1: if dm4(

8、j,i)=k&dm4(j,i)=0 a1(k)=a1(k)+1; if dm5(j,i)=k&dm5(j,i)=0 a2(k)=a2(k)+1;a5=a1;a6=a2;a3=zeros(5,1);a4=zeros(5,1);j=1;while j5 break; a1(i)=0; a22=0; a22=max(a2); if a2(i)=a22 a4(j)=a22; a2(i)=0;% 构造h1 h2 矩阵h1=zeros(200,14);h2=zeros(1,200);y1=0;y2=0;y3=0;y4=0;for j=1: x=0; h1(i,1:13)=dm3(j,1:13)=dm3(i

9、,1: h1(i,14)=dm3(j,14)=dm3(i,14); if sum(h1(i,1:13)h1(i,14)=1 x=x+1;h2(j)=x;% 筛选h2 矩阵 得到h3 h4矩阵h3=zeros(1,200);h4=zeros(1,200); if z14(i)=1 h3(i)=h2(i); else h4(i)=h2(i);%h5=h3;h6=h4;% 找六条重要样本 %y1=max(h5); if h5(i)=y1 h5(i)=0;t1=i;y2=max(h5); if h5(i)=y2t2=i;y3=max(h5); if h5(i)=y3t3=i;y4=max(h6); i

10、f h6(i)=y4 h6(i)=0;t4=i;y5=max(h6); if h6(i)=y5t5=i;y6=max(h6); if h6(i)=y6t6=i;% 找特殊样本结束% 找特殊属性值a3=zeros(6,1);a4=zeros(6,1);7b1=zeros(6,1);b2=zeros(6,1); if a5(i)=a3(j) b1(j)=i; if a6(i)=a4(j) b2(j)=i;b3(1:5,1)=b1(2:6,1);b4(1:5,1)=b2(1:5,1);% 寻找结束 % 验证程序开始h7=zeros(103,14);h8=zeros(103,14);tc=0;103

11、h7(i,1:13)=dm3(200+i,1:% 特殊样本 nc=0;mc=0;ncc=0;mcc=0; h8(i,1:13)=h7(i,1:13)=dm3(t1,1: if sum(h8(i,1:=9 nc=nc+0.3;13)=dm3(t2,1:13)=dm3(t3,1:13)=dm3(t4,1: mc=mc+0.3;13)=dm3(t5,1:13)=dm3(t6,1: % 样本结束 % 特殊属性值 ncc=0; if h7(i,j)=b3(1) ncc=ncc+3; else if h7(i,j)=b3(2) else if h7(i,j)=b3(3) ncc=ncc+2; else i

12、f h7(i,j)=b3(4) else if h7(i,j)=b3(5) else if h7(i,j)=b4(1) mcc=mcc+3; else if h7(i,j)=b4(2) else if h7(i,j)=b4(3) mcc=mcc+2; else if h7(i,j)=b4(4) else if h7(i,j)=b4(5) % 属性值结束 % 挖掘算法 if (nc=0.6) h7(i,14)=1; else if (mc h7(i,14)=2; else if nc=(mcc+2) else if mcnc else if nccmcc else if mccncc else% 挖掘结束% 计算正确率h9=zeros(103,1);h9=h7(:,14)=dm3(201:303,14);tc=sum(h9)/103% 算法完毕

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1