3肾炎的诊断论文1.docx

资源描述

3肾炎的诊断论文1.docx

《3肾炎的诊断论文1.docx》由会员分享，可在线阅读，更多相关《3肾炎的诊断论文1.docx（26页珍藏版）》请在冰豆网上搜索。

3肾炎的诊断论文1.docx

3肾炎的诊断论文1

肾炎的诊断

第十三组：

江云胜李江南樊明瑾

摘要

本文对肾炎的判断进行了分析，建立了一个分类判别模型，通过MATLAB7.0工具平台运用欧式判别法，马氏判别法分别给出了具体的诊断方案，并讨论了每种判别法的诊断误差。

通过这两种方案可以快速诊断样本是否患肾炎，且样本结果与实际情况大致相符，但通过检验我们发现用欧氏距离判别法，虽然简便直观，误差相对有些大，于是给出了马氏判别法，对实际中的肾炎诊断有很好的参考价值。

现将样本空间分为A、B两类,即患病样本集合和健康样本集合。

先分别计算这两类样本各自30个样本点集合的几何中心

，判别的实施方法是对某一给定的样本点

，计算该点到两类集合的几何中心的距离：

欧氏距离：

；

马氏距离为：

Da=

；Db=

；

判断的依据如下：

若Da

若Da>Db,则该样本点判为B类；

若Da=Db相等，则无法判别。

最终30个样本判别结果为：

无法判别

关键字：

特征分类欧式判别法马氏判别法

问题重述

人们到医院就诊时，通常要化验一些指标来协助医生的诊断。

诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。

表B.1是确诊病例的化验结果，其中1－30号病例是已经确诊为肾炎病人的化验结果；31－60号病例是已经确诊为健康人的结果。

表B.2是就诊人员的化验结果。

我们的问题是：

1.根据表B.1中的数据，提出一种或多种简便的判别方法，判别属于患者或健康人的方法，并检验你提出方法的正确性。

2.按照1提出的方法，判断表B.2中的30名就诊人员的化验结果进行判别，判定他（她）们是肾炎病人还是健康人。

3.能否根据表B.1的数据特征，确定哪些指标是影响人们患肾炎的关键或主要因素，以便减少化验的指标。

4.根据3的结果，重复2的工作。

5.对2和4的结果作进一步的分析。

基本假设

（1）各元素的化验结果与实际样本情况相符，且是在误差允许范围内；

（2）化验结果不受其他因素的影响；

（3）可以只通过每个样本点的一次化验结果来判别该样本点是否是患肾炎；

符号说明

A：

患病的样本集合

B：

健康的样本集合

：

患病的样本集合的第m种元素的几何中心（m=1，2,…，7）

：

健康的样本集合的第m种元素的几何中心（m=1，2…，7）

：

第i个患病的样本的第m种元素的含量（i=1，2，…，30）

：

第j个健康的样本的第m种元素的含量（j=1，2…，30）

：

任一样本点的第m种元素的含量（k=1，2…，90；m=1，2…，7）

Da：

任一样本点到A类样本几何中心的距离

Db：

任一样本点到B类样本几何中心的距离

：

A类样本集合的协方差矩阵

：

B类样本集合的协方差矩阵

模型的分析与建立

该问题涉及到特征分类，需要通过具体的运算来判别样本是否患肾炎，化验结果中每个样本点有七项指标，可以把它们看作是每一个样本点的一个变量。

为了简化计算，可从已给出的数据得：

两类样本集合中各元素含量的平均值及其占元素平均值总和的百分比，表格如下：

表一

　元素

比例

类别

患病

143.10

12.33

23.07

698.17

113.39

201.13

526.83

0.0833

0.0072

0.0134

0.4064

0.0660

0.1171

0.3066

正常

186.60

21.92

62.01

2511.13

295.14

90.37

367.21

0.0528

0.0062

0.0175

0.7105

0.0835

0.0256

0.1039

为此方法一中我们用欧氏判别法来分别计算任一样本点到两样本点集合的几何中心的距离，几何中心可用样本点集合的每个化验指标的平均数来表示，

而距离可表示为

；

若Da

若Da>Db,则该样本点判为B类；

若Da=Db，则无法判别。

方法二:

因马氏距离可以排除变量之间的相关性的干扰，为此我们采用马氏距离来代替欧氏距离。

改进的模型如下：

V是样本的协方差矩阵,协方差矩阵为非奇异阵

，则七维样本X到样本几何中心的马氏距离为：

Da=

；Db=

；

遵循判据如下：

若Da

若Da>Db,则该样本点判为B类；

若Da=Db，则无法判别。

模型求解：

在方法一中运用matlab7.0求解：

所得结果如下：

欧氏距离判别法

表二

1~30号

31~60号

61~90号

表三

1~30号

0.8333

0.1333

31~60号

0.9000

0.8667

61~90号

15\15

其中‘0’表示患病，即表示A类，‘1’表示正常即表示B类。

由欧式判别法知：

当样本患病时判别正确率为0.8333；当样本正常时判别正确率为0.9.通过此判别法对进行检验的样本判断出有15个患病，15个正常，对60个样本的判断正确率为0.8667。

由于欧式判别法比较简单，判别正确率为0.8667，在比较粗糙的判断是否患病具有一定的价值，需要结合其他判别方法进行判断。

方法二

马氏距离判别法

表四

1~20号

31~50号

61~80号

表五

21~30号

0.0167

51~60号

0.9667

0.9833

81~90号

13\17

其中‘0’表示患病，‘1’表示正常。

由马氏距离当样本患病时判别正确率为1；当样本正常时判别正确率为0.9667.通过此判别法对进行检验的样本判断出有13个患病，17个正常，对60个样本的判断正确率为0.9833。

马氏判别法判断患病样本的正确率为1，与确定的患病样本十分吻合，说明此法判断患病样本十分有效。

对于正常人的判断达到0.9667也可作为判断依据。

对于总体60个样本判断正确率为0.9833.与实际情况也相当近似。

当然，若结合其他判断方法进行二次判断就会更加正确。

现剔除某些元素后分析基于其他剩余元素上用马氏判别法所得到的结果，并与原来的马氏判别法的判别结果的正确率的百分比进行比较，可得如下表格：

模型检验

上述两种方法在判别就诊人员时有些样本存在差异，所列表格如下：

表六

序号

欧氏

马氏

由该表格可看出在1~30的患病样本中，其中马氏判别全部正确，但欧氏判别法在第18、23、25、27及30号样本的判别上有误判，在31~60的健康样本中，欧氏在39及48号样本的判别上出现误判，而马氏在32、38、49及54号样本的判别上出现误判。

根据表一的百分比可依次剔除相关的元素后算得相应的正确率，并得到如下两表格：

表七

方式

欧氏

马氏

正确率

0.8667

0.9833

0.9167

0.9667

0.9333

0.5167

0.7333

0.8167

0.8500

由表七知Zn、Cu、Fe的正确率分别为0.9167、0.9667、0.9333且0.9667>0.9333>0.9167>0.9在只剔除一个影响因素的条件下故最优先剔除铜，其次为铁再者为锌。

表八

方式

Zn&Cu

Zn&Fe

Cu&Fe

Zn&Cu&Fe

Zn&Na

Zn&K

正确率

0.8333

0.8667

0.9000

0.6667

0.6

0.5333

再考虑剔除两个或两个以上因素：

由编程逐个检验知在剔除三个或三个以上因素的情况下，正确率低于70%，不能作为判断依据。

由表八0.9000>0.8667>0.8333>0.6667>0.6667在保证准确率又能减少化验的指标的基础上，化验元素Fe、Cu不是影响人们患肾炎的关键或主要因素，可以考虑减少此两元素的化验。

通过两种判别的具体实施方法可得就诊人员在两种判别方法的判别结果及剔除某些元素后将剩余的元素项代入两种判别方法的公式可得判别结果，并得如下两表格

表九

（一）

欧氏

马氏

Zn&Cu

Zn&Fe

Cu&Fe

表九

（二）

B\A

欧氏

15\15

马氏

13\17

16\14

13\17

12\18

Zn&Cu

13\17

Zn&Fe

14\16

Cu&Fe

12\18

由上述两表格可看出在79及84号样本的判别上，欧氏与马氏结果不一致，需要作其他进一步分析，而我们发现84号样本在马氏和剔除某些元素后的判别结果都相同，故可以判别它是患者。

剔除某些元素后，79号样本的欧氏与马氏判别结果有出入，故它无法判别。

此时66号的判别存在较大的差异，故该样本的剔除元素之后的检验结果不能作为判断依据，这个样本的全部元素都应检验，而由表格可知66号样本在不剔除任何元素的情况下，两种判别方法的判别结果相同，故可以认定它的判断结果有效，即是健康的。

综上可得结果：

无法判别

模型的评价与改进

方法一中欧氏判别法能较好的反映以确诊病例的化验结果，在一定程度上能对病历作出较正确的结果，由于判断的正确率只能达到0.8667，需要进一步改进模型；马氏判别法相对于欧氏判别法正确率有很大的提高，达到0.9883，有很好的参考价值。

在剔除元素Fe和Cu的化验后，正确率为0.9000.减少了化验成本和工作量的同时，有较高的正确率，可以采用马氏判别法并剔除Cu、Fe的化验。

由于马氏判别法判断正确率不能达到100%，还需结合其他判别法作进一步的判断，最终不出现误诊情况。

神经网络能够更好的提高判别准确率。

神经网络模型：

对于激活函数我们可以根据输出层为0和1，我们选择了s型对数函数即

参数

>0,

样品s而言，隐单元j的输入

，相应的输出状态为：

由此输出单元i所接受的叠加信号是

网络的最终的输入是

对于任何一组确定的输入，输出是所有权{

}的函数，如果我们能够选定一组适当的权值{

}，使得对应于学习样本中任何一个患病的样品输入为（

）,输出为0，任何一个健康的样品输入为（

），输出为1，那么我们就可以利用它对待测样品进行判断，如果输出的近视为0，就判为患病，如果输出为近似为1，我们就判断为健康

通过matlab编程得到结果：

0.00196

0.0063997

0.0097014

0.064839

0.06484

0.009701

0.06484

0.094192

0.0019503

0.0052581

0.065012

0.2579

0.009701

0.064839

0.25793

0.06522

0.09418

0.009701

0.0648

0.0097

0.06484

0.0097014

0.065472

0.009701

0.00195

0.064839

0.99827

0.9948

0.998

0.906

0.9983

0.99827

0.99532

0.96312

0.99732

0.99532

0.98459

0.9061

0.2579

0.9953

0.9629

0.9953

0.9989

0.9953

0.99532

0.9953

0.99827

0.9983

0.99532

0.99527

当用bp神经网络进行仿真时

，x表示仿真结果。

所得结果正确率为100%

0.0003

0.0017

0.0352

0.0003

0.0352

0.9902

0.9906

0.0017

0.0206

0.9906

0.0017

0.0003

0.9906

0.9994

0.0352

0.9994

0.8207

0.9981

0.9992

0.0003

0.9906

0.0013

0.9906

0.0352

0.9994

则患病序号为1234589111213162527总共13个

正常序号为67101415171819202122232426282930总共17个

参考文献：

《数学建模》杨启帆主编高等教育出版社2005.5

《数学建模与数学试验》赵静但琦主编高等教育出版社2008.11

附录：

方法一：

欧氏判别法