ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:70.67KB ,
资源ID:4418770      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4418770.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于Fisher判别准则的胃病分类模型.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

基于Fisher判别准则的胃病分类模型.docx

1、基于Fisher判别准则的胃病分类模型基于Fisher判别准则的胃病分类模型摘要本文就胃癌患者、萎缩性胃炎患者以及非胃病患者的分类问题,综合运用系统聚类和Fisher判别的方法建立了基于四个指标的分类判别模型。针对问题一,模型采用系统聚类和Fisher判别的方法,根据题中已知类型的三个样本13,14,15,将混淆的12个样本112区别开来,并且使得样本13,14,15在三个类别中。使用SPSS软件求得分类结果,胃癌患者:1,2,4,5,13;萎缩性胃炎患者:3,7,10,11,12,14;非胃病患者:6,8,9,15。针对问题二,本题基于问题一的分类情况,采用Fisher判别的方法,确定三个样

2、本16,17,18的类别。使用SPSS软件求得判别结果,第16号样本和第18号样本属于第二类,即萎缩性胃病患者;第17号样本属于第三类,即非胃病患者。最后对模型的优缺点进行分析,提出了改进方案。关键词 系统聚类;Fisher判别;SPSS软件;判别模型1问题的重述胃癌患者易误诊为萎缩性胃炎患者以及非胃病患者。进行胃癌的鉴别主要是通过化验4项生化指标:血清铜蓝蛋白(X1)、蓝色反应(X2)、尿吲哚乙酸(X3)、中性硫化物(X4)。本来从胃癌患者、萎缩性胃炎患者以及非胃病患者中一共抽取了12人进行指标化验,但是由于医护人员的疏忽,将化验结果搞混了。现有以前对胃癌患者、萎缩性胃炎患者以及非胃病患者化

3、验的结果各一例,依次为(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化验结果见附件表十。医学上一般根据临床的经验认为,患同一种病的人所表现出来的特征往往是相似的,现需建立一种判别准则,把上述混淆的结果区分开来,再将三个病人的化验指标如下:(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14),区分他们各属于哪一类人群。2模型假设和符号说明2.1.模型的假设(1)患同一种病的人所表现出来的特征往往是相似的;(2)被检测的人员没有其它任何疾病;(3)四项生

4、化指标无关联。2.2符号使用说明(不打编号)(1):血清铜蓝蛋白;(2):蓝色反应;(3):尿吲哚乙酸;(4):中性硫化物 (5)112:表示未知分类样本,即被混淆的样本; (6)1315:表示已知分类样本; (7)1618:表示待判的样本; (8)、:分别表示使用特征值时胃癌患者、萎缩性胃炎患者以及非胃病患者的重心; (9)、:分别表示使用特征值时胃癌患者、萎缩性胃炎患者以及非胃病患者的重心;(10)、:分别表示用特征值时第一类与第二类,第二类与第三类之间的分界点。(11)、:分别表示用特征值时第一类与第二类,第二类与第三类之间的分界点。 (13)、:分别表示第一类、第二类和第三类的个数;(

5、16)、:分别表示第个指标第个样本的数据和标准化后的数据;(17): 表示15个样本值的第个指标的样本均值; (18):表示15个样本值的第个指标的样本标准差; (19):分别表示Fisher判别时使用、为标准化的函数系数;3.问题的分析2.1 问题一的分析本问题要求解的是将混淆的12组样本判别其类型。由于患同一种病的人所表现出来的特征往往是相似的,首先想到的是运用系统聚类的方法,将未知类别的样本分为三类,再将已知类别的样本代入进行判别。但是此时却无法将已知类别的三组样本分开。所以最重要的是将已知类别的样本分开。于是将12组未知类别的样本和3组已知类别的样本一起运用系统聚类,将与13号样本为一

6、类的作为第一类,与14号样本为一类的作为第二类,与15号样本为一类的作为第三类。第一步,先将其聚成两类。若未将三类中的一类分开,重复第一步操作,直至有一个样本分开。第二步,对剩下的两个样本所在类聚成两类,若未将这两个样本分开。重复第二步,直至将这两个样本分开。第三步,此时将还未知类别的样本进行Fisher判别。2.2 问题二的分析本问题基于问题一的聚类结果,运用Fisher判别的方法,利用SPSS软件得到其判别结果。 4.模型的建立与求解4.1 问题一的解决方案及模型(多用几种方法)(模型要有名字)本问题要求的是将混淆的12组未知类别的样本区别开来。由于患同一种病的人所表现出来的特征往往是相似

7、的,首先想到的是运用系统聚类的方法,将未知类别的样本分为三类,再将已知类别的样本代入进行判别。但是此时却无法将已知类别的三组样本分开。于是将已知类别的三组样本看成三类,再聚类得到与其类似的样本。第一阶段:标准化。分析数据的量级和量纲,知该15个样本的数据最大相差,则说明相差较大,则需要对其进行标准化:(可写在模型的准备里面,我们用什么对其进行标准化) (1)第二阶段:系统聚类。利用标准化后的数据,用欧式距离求得两点间的距离,再找最小的距离,将其聚类为一组: 且 (2)第三阶段:Fisher判别。将给定的指标代入式(3)进行求解,将得到的y与式(4)、式(5)进行比较,判别出其类型;若不能判别,

8、再用的系数进行判别。(凡是公式都要提行) (3) (4) (5) (6) (7) (8)(流程图)4.1.1 问题一的求解(表格的两端不封口,居中,美观,再表达一下)(1)第一步,标准化(见下表)。表一: 标准化表人X1X2X3X4ZX1ZX2ZX3ZX412451340.10.41.598070.2407060.2681562.51490322001670.120.270.6697591.8084660.6512371.26386731701500.070.080.0508851.000832-0.30646-0.5645741001670.20.14-1.393151.8084662.18

9、35580.01283152551250.070.141.804362-0.18686-0.306460.01283161301000.060.12-0.77428-1.37456-0.498-0.1796471201330.10.26-0.980570.1931990.2681561.16763481601000.050.1-0.15541-1.37456-0.68954-0.372191851150.050.190.360322-0.66194-0.689540.493999101701250.060.040.050885-0.18686-0.498-0.9495111651420.050

10、.03-0.052260.620769-0.68954-1.04574121001170.070.02-1.39315-0.56693-0.30646-1.14197132281340.20.111.2473750.2407062.183558-0.27587141501170.070.06-0.3617-0.56693-0.30646-0.75704151351080.020.12-0.67113-0.9945-1.26417-0.17964(2)第二步,聚类。对标准化后的数据进行系统聚类,在SPSS中将其分为两类。表二: 第一次系统聚类人X1X2X3X4ZX1ZX2ZX3ZX4CLU2_1

11、12451340.10.41.598070.2407060.2681562.514903122001670.120.270.6697591.8084660.6512371.263867131701500.070.080.0508851.000832-0.30646-0.56457241001670.20.14-1.393151.8084662.1835580.012831152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964271201330.10.26-0.9

12、80570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94952111651420.050.03-0.052260.620769-0.68954-1.045742121001170.070.02-1.39315-0.56693-0.30646-1.141972132281340.20.111.2473750.2407062.

13、183558-0.275871141501170.070.06-0.3617-0.56693-0.30646-0.757042151351080.020.12-0.67113-0.9945-1.26417-0.179642(3)第三步,将表二中属于第一类的样本移出,再进行系统聚类。表三: 第二次系统聚类31701500.070.080.0508851.000832-0.30646-0.56457152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.179641712013

14、30.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.36

15、17-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(4)第四步,将表三中的第五个样本移出,再进行系统聚类。表四: 第三次系统聚类31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721

16、191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(5)将表四中的第七个

17、样本移出,再进行系统聚类。表五: 第四次系统聚类31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1

18、.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179642 (6)此时已将13、14、15号样本完全分开,但是在分开过程中,将5、7号样本移出,最后再对5、7号样本进行Fisher判别:表六: 第五次系统聚类12451340.10.41.598070.2407060.2681562.5149031122001670.120.270.6697591.80

19、84660.6512371.2638671131701500.070.080.0508851.000832-0.30646-0.564572241001670.20.14-1.393151.8084662.1835580.0128311152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.179643371201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-

20、0.37213391851150.050.190.360322-0.66194-0.689540.49399933101701250.060.040.050885-0.18686-0.498-0.949522111651420.050.03-0.052260.620769-0.68954-1.0457422121001170.070.02-1.39315-0.56693-0.30646-1.1419722132281340.20.111.2473750.2407062.183558-0.2758711141501170.070.06-0.3617-0.56693-0.30646-0.75704

21、22151351080.020.12-0.67113-0.9945-1.26417-0.179643所以属于胃癌患者的有1,2,4,7,13;属于萎缩性胃炎患者的有:3,5,10,11,12,14;属于非胃病患者的有:6,8,9,15。问题二的解决方案及模型第三阶段:Fisher判别。将给定的指标代入式(3)进行求解,将得到的y与式(4)、式(5)进行比较,判别出其类型;若不能判别,再用的系数进行判别。 (3) (4) (5) (6) (7) (8)问题二的求解表七: 未标准化的函数系数 (可以不要)Canonical Discriminant Function CoefficientsFun

22、ction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035Unstandardized coefficients 式1.1 式1.2表八: 判别表(标注)12451340.10.41122001670.120.271131701500.070.082241001670.20.141152551250.070.142261301000.060.123371201330.10.261181601000.050.13391851150.050.1933101701250.060.042211165142

23、0.050.0322121001170.070.0222132281340.20.1111141501170.070.0622151351080.020.1233162101420.10.082171801200.080.213181501300.050.142所以第16号样本(210,142,0.10,0.08)和第18号样本(150,130,0.05,0.14)属于第二类,即萎缩性胃病患者;第17号样本(180,120,0.08,0.21)属于第三类,即非胃病患者。附件:表十: 原始数据人X1X2X3X412451340.10.422001670.120.2731701500.070.0841001670.20.1452551250.070.1461301000.060.1271201330.10.2681601000.050.191851150.050.19101701250.060.04111651420.050.03121001170.070.02

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1