化验检查诊断问题Word格式.doc
《化验检查诊断问题Word格式.doc》由会员分享,可在线阅读,更多相关《化验检查诊断问题Word格式.doc(14页珍藏版)》请在冰豆网上搜索。
编号专用页
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
摘要
本文就是针对健康人与肾炎病人体内Zn、Cu、Fe、Ca、Mg、K、Na七种元素含量的不同,通过建立七种元素含量的数学模型,来寻找一种方法来判断任意一个就诊人员是否为肾炎病人。
在问题一的求解中,我们采用了费歇尔判别模型。
利用表B.1中前20名肾炎患者和前20名健康人的数据对模型进行求解,提出了一种简单的判别方法,然后我们把剩余的10名肾炎患者和10名健康人的数据代入模型进行检验,发现该判别方法的正确率高达95%。
接着我们以此模型对表B.2中61到90号就诊人员进行判断,求得结果,其中15人为患者,15人健康,具体见正文表3。
在问题二的求解中,我们采用了主成分分析模型。
在对表B.1中的60组数据进行主成分分析后,我们选取Zn,Ca,Mg,K,Na五个指标为影响人们是否患肾炎的关键因素。
然后重复对问题一的求解,提出了新的判别方法,在对新的判别方法进行检验时,我们发现新的判别方法的正确率有所下降,达80%。
接着利用新模型对B.2中的就诊人员重新进行判断,其中16人患肾炎,14人健康,具体结果见正文表6。
最后,我们通过对两个模型对同一组未知数据的判断结果的比较,发现两种模型判断结果的一致率为83.33%。
基于以上两个问题的求解,我们发现两个模型各有优缺点。
一种需要测量的元素种类较多,但结果相对准确;
另一种操作简便,但误差相对较大。
因此我们得出结论:
认为应结合实际情况,在不同情况下使用不同的模型。
关键字:
肾炎诊断费歇尔判别模型主成分分析诊断判别方法
一、问题重述
肾炎是一种困扰人们生活和健康的疾病,及时发现和治疗能够有效地避免和遏制肾炎恶化。
人们到医院就诊时,通常要化验一些指标来协助医生的诊断。
诊断就诊人员是否患肾炎时,通常要化验人体内各种元素含量。
表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;
31-60号病例是已经确定为健康人的结果。
表B.2是就诊人员的化验结果。
基于上面的数据我们要完成下面的问题:
1:
根据表B.1中的数据,提出一种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
并按照提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
2:
能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
根据所得结果,重复1中的工作,然后将所得的结果与问题1的结果进行比较,作进一步的分析。
二、模型假设和变量符号说明
2.1模型假设
1)题中所给的内容和数据都是真实可信的;
2)除了表中列出的元素外,其他元素对是否会患肾炎的影响很小;
3)没该病的个体都是健康体;
4)假设病例没有其他疾病导致某种元素含量不正常;
5)检测是在同等条件下进行的,即同样的外界环境和生理条件。
2.2变量符号说明
:
某个病人的7种元素组合;
某个病人的费歇尔判别函数;
总体1的协方差矩阵;
总体2的协方差矩阵;
总体1的均值向量;
总体2的均值向量;
判别临界值;
某病人第i种元素的值;
第i种元素的判别系数;
第i个主成分。
三、问题分析及思路
对于该问题的第1问,实际上就是利用30名肾炎患者和30名健康者人体内的Zn,Cu,Fe,Ca,Mg,K,Na这7种微量元素的含量,给出一个简单的判别方法,判定其是肾炎患者还是健康人。
然后对未诊断的30名就诊人员进行判别,判定他(她)们是肾炎病人还是健康人。
在已知健康人和肾炎患者各自体内微量元素含量的基础上,我们可以采用某医院化验的30名肾炎患者和30名健康人体内的Zn,Cu,Fe,Ca,Mg,K,Na7种微量元素的含量作为基础数据,先从中选取20名肾炎患者和20名健康人的数据作为样本,进行采样分析,建立费歇尔(Fisher)判定模型,然后利用剩余的10名肾炎患者和10名健康人的数据对判定模型进行检验,并计算该判定模型的正确率。
再利用该判定模型对30名就诊人员进行判别,判定他(她)们是肾炎病人还是健康人。
对于问题的第2问,实际上就是根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
因此,我们选择了主成分分析模型来求出影响人们是否患肾炎的关键或主要因素,进而减少化验的指标。
接着重复问题1的求解过程,给出新的判别方法,对30名就诊人员进行重新判别,将结果与问题1的结果进行对比分析。
四、模型建立与求解
4.1问题1的建模求解
费歇尔(Fisher)判别是按照各类(总体)中的方差尽可能小,不同类中的均值之间差距尽可能大的原则,即类间距离最大而类内离散性最小的原则求判别函数,并利用判别函数进行最小距离分类。
2个总体(总体1和总体2)的基本函数表达为:
式中:
和分别为总体1和总体2的协方差矩阵;
和分别为总体1和总体2的均值向量。
判别规则:
其中:
在此题中总体1就是指肾炎病人,总体2指健康人,X就是每个样本中的7种元素的值构成的一个向量。
通过化简,原判别函数就可以转换为:
为样本中第i种元素的值,为第i种元素的判定系数。
现选取20名肾炎患者和20名健康人的数据作为样本,通过matlab编程求出判定函数的各个判定系数,然后确定判定函数。
结果如下:
确定判定临界值。
依据求出的判定函数表达式和判定临界值就得到了一种简单的判定方法,即:
根据每个就诊人员中各元素值,计算出判定函数的值,然后将计算出的判定函数的值与判定临界值进行比较,如果判定函数的值大于等于判定临界值,则判定其为患病,否则判定其为健康。
现利用剩下的10名肾炎患者和10名健康人的数据对该费歇尔判别模型进行检验,并计算该判定模型的准确率。
计算结果如表1、表2所示。
表110名肾炎患者对模型的检验
病例号
21
22
23
24
25
26
27
28
29
30
f(X)
1.598217
1.422755
-0.57788
0.230936
-0.77317
1.464474
0.143876
1.529581
0.609603
1.104563
与d的比较
大于
是否患病
患病
表210名健康人对模型的检验
51
52
53
54
55
56
57
58
59
60
-4.39821
-1.80257
-1.62888
-2.17763
-5.43523
-4.37493
-5.10223
-2.8534
-2.26974
-0.71405
小于
健康
从表1、表2可以看出在对剩余20人的判定中,仅有1个判定错误,所以该模型的判定正确率高达95%。
根据该判定模型,对30名就诊人员的化验结果进行判别,具体结果如表3所示。
表3对30组就诊人员进行预测
61
62
63
64
65
66
67
68
69
70
0.411117
-0.62626
-1.1581
0.929443
-0.40762
-1.14984
-2.13477
-0.29227
0.018507
-2.65306
71
72
73
74
75
76
77
78
79
80
0.313133
0.9539
0.455611
-1.7666
-0.85532
0.274089
-1.53291
-1.51958
-0.10697
-3.13663
1
2
3
4
5
6
7
8
9
10
-4.14866
-2.92481
1.336701
-1.74666
0.675634
-2.3804
-0.75702
-4.1025
-7.368
-1.50392
从表3可以看出在对30名就诊人员的化验结果进行的判定中,其中15名就诊人员为肾炎病人,15名就诊人员为健康人。
4.2问题2的建模求解
4.2.1主成分分模型介绍