肾炎诊断的数学模型.doc
《肾炎诊断的数学模型.doc》由会员分享,可在线阅读,更多相关《肾炎诊断的数学模型.doc(21页珍藏版)》请在冰豆网上搜索。
肾炎诊断的数学模型
摘要
本文解决的是肾炎的诊断的问题。
人们到医院就诊时,其是否患肾炎通常要化验人体内各种元素的含量来协助医生的诊断。
为解决此问题,我们建立了距离判别的数学模型。
对于问题一:
我们提出了欧式距离与马氏距离两种方法来判别就诊的是患者还是健康人。
我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果作为总体A,31-60号已确诊为健康人的化验结果作为总体B。
然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果作为样品C,然后我们将样品C用欧式距离模型进行判别,得到的误判率为23.33%;用马氏距离模型判别,得到的误判率为13.3%。
为此,我们选用马氏距离法。
为了使误判率降低,我们对模型进行改进,引入误判因子,此时的误判率降为3.33%。
对于问题二:
我们用改进了的马氏距离判别模型将判断表B.2的化验结果进行判别,得出如下结果:
61
62
63
64
65
66
67
68
69
70
患病
患病
正常
患病
患病
患病
正常
正常
患病
正常
71
72
73
74
75
76
77
78
79
80
患病
患病
患病
正常
正常
患病
正常
正常
正常
正常
81
82
83
84
85
86
87
88
89
90
正常
正常
患病
正常
患病
正常
正常
正常
正常
正常
对于问题三:
为了确定影响人们患肾炎的关键或主要因素,我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果按照元素种类划分总体,分别为A1(Zn),A2(Cu),A3(Fe),A4(Ca),A5(Mg),A6(K),A7(Na),同理,31-60号已确诊为健康人的化验结果划分总体为B1,B2,B3,B4,B5,B6,B7。
然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果划分为样本D1,D2,D3,D4,D5,D6,D7,然后根据我们建立的改进后的距离判别模型,用马氏距离法逐个算出由该元素带来的误判率。
然后将相似结果的元素组合用马氏距离法与原数据进行计算比较,我们得出影响人们患肾炎的关键或主要元素为Fe,Ca,Mg,K。
对于问题四:
我们将自己确定的关键元素Fe,Ca,Mg,K作为检验指标,再次根据建立后改进的距离判别的数学模型,用马氏距离方法将判断表B.2的化验结果进行判别,得出如下结果:
61
62
63
64
65
66
67
68
69
70
患病
患病
患病
患病
患病
患病
正常
正常
患病
正常
71
72
73
74
75
76
77
78
79
80
患病
患病
患病
正常
正常
患病
正常
正常
患病
正常
81
82
83
84
85
86
87
88
89
90
正常
正常
患病
正常
患病
正常
患病
正常
正常
正常
对于问题五:
将问题二,四的结果进行比较我们得知发现,根据我们确定出来的关键元素Fe,Ca,Mg,K作为指标,我们从被诊断为健康人的数据中发现了3组患肾炎的,而原被诊断为患肾炎的数据数目没变,根据我们在诊断的过程中不会把患肾炎的诊断成健康人,这进一步验证了我们选取的元素指标的正确性。
关键词:
肾炎诊断,马氏距离,距离判别
1、问题重述
人们到医院就诊都是一些很普遍的问题。
在人们就诊前,通常是需要通过化验一些元素来确认。
在诊断就诊人员是否患肾炎时,我们同样是对人体内各种元素含量进行化验,以其中的一些指标来协助医生的诊断。
在本文中,我们考虑肾炎的诊断数学建模问题。
在表B.1中,是确诊病例的化验结果。
其中1-30号为已确诊为肾炎病人的化验结果,31-60为已确诊为健康人的化验结果。
表B.2是就诊人员的化验结果。
具体数据见附录
(一)。
本文需解决的问题有:
问题一:
根据表B.1中的数据,提出一种或多种简便的方法,对来就诊的人进行判别是属于患者或健康人,并且还要检验我们提出方法的正确性。
问题二:
按照问题一提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
问题三:
能否根据表B.1的数据特征,确定那些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
问题四:
根据问题三的结果,重复问题二的工作。
问题五:
对问题二和问题四的结果作进一步的分析。
2、模型的假设与符号说明
2.1模型的假设
假设1:
题目所给的数据是合理的,正确的;
假设2:
化验结果中的各种元素之间的相关性干扰比较小;
假设3:
模型检验的结果达90%以上的正确,我们认为模型正确;
假设4:
模拟生成的30个正常数据和30个患病数据全部符合样本要求;
2.2符号说明
符号
符号说明
总体为k的协方差矩阵
以表B.1中1-30号各种元素的均值对应的矩阵
[]
由矩阵中的第j个元素构成的矩阵
以表B.1中31-60号各种元素的均值对应的矩阵
由矩阵中的第j个元素构成的矩阵
我们模拟的数据构成的矩阵
模拟数据的第i行构成的矩阵
[]
由矩阵的第i行第j列的元素组成的矩阵
D
由马氏距离法得出的距离平方差值
d
由欧式距离法得出的距离平方差值
表示样本y到总体均值为G的距离
u
误判因子,数值确定为4
其中,;
i=1,2…30
j=1,2,…7
k=1时分别表示表B.1中1-30号已确诊为肾炎病人的化验结果;
k=2时表示表B.1的31-60号已确诊为健康人的化验结果;
k=3,4,5,6,7,8,9,时,分别表示表B.1中1-30,31-60,号已确诊为健康人的化验结果以Zn,Cu,Fe,Ca,Mg,K,Na元素种类划分的数据
3问题的分析
此题研究的是一个肾炎的诊断的建模问题。
当人们到医院就诊时,我们通常是要化验一些指标来协助医生的判断。
诊断就诊人员是否患肾炎时也是如此,我们通常也要化验人体内各种元素含量。
我们于是对题目给的数据,建立了距离判别的数学模型,根据模型,我们对病例进行判定,病例样本到两个总体,的距离分别为,,如果,我们则说样本跟总体距离最近,即样本属于总体该类;如果,我们则说样本跟总体距离最近,即样本属于总体该类;然后通过判别出来的病例数据与原已确认的病例的数据进行比较,得出误判率,将该误判率作为我们评价模型的指标,误判率越小,则说明我们建立的模型越优。
针对问题一:
根据表B.1的数据,我们提出了欧式距离和马氏距离两种判别方法。
为了检验我们提出的方法的正确性,我们选取了选取出表B.1中1-30号已确诊为肾炎病人的化验结果作为总体A,31-60号已确诊为健康人的化验结果作为总体B。
然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果作为样品C,分别用这两种方法来检验。
对于欧式距离法,我们根据我们建立的距离判别的数学模型,用欧式距离马氏距离法,为了简化计算,我们求两个距离平方之差,当D(d)0时,我们则说与总体已确诊为健康人的化验结果距离较近,属于健康人,当D0时,则说与总体已确诊为肾炎的化验结果距离较近,属于患有肾炎的。
经计算比较得到两种方法的误判率。
根据误判率,我们出距离判别模型。
由结果可知,我们将选用马氏距离法进行判别。
针对问题二:
我们选用已确定的马氏距离法,对表B.2的数据逐个进行计算,用距离判别法逐个进行判别,得出结果。
针对问题三:
我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果按照元素种类划分总体,分别为A1(Zn),A2(Cu),A3(Fe),A4(Ca),A5(Mg),A6(K),A7(Na),同理,31-60号已确诊为健康人的化验结果划分总体为B1,B2,B3,B4,B5,B6,B7。
然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果划分为样本D1,D2,D3,D4,D5,D6,D7,通过我们建立后改进的距离判别模型,用马氏距离法计算可得到各种元素在诊断病情时带来的误判率,然后我们再以总体A总体B的7种元素均值,并选取表B.1中病例号为1,2,4的作图。
根据图形和误判率,我们得出可能为关键或主要因素的6组元素的组合。
接着,我们对每个组合按照我们检验出的指标元素用改进后的距离模型可得到各种情况的误判个数和此时对应的误判组号。
然后再根据马氏距离模型的差值D来判别指标。
经计算,Fe,Ca,Mg,K为主要判别指标。
针对问题四:
根据我们确定的Fe,Ca,Mg,K四种元素指标,用马氏距离法,再根据我们建立的距离判别模型得出结果。
针对问题五:
我们对于问题二和问题四得出的结果,我们得到,根据我们确定出来的关键元素Fe,Ca,Mg,K作为指标,我们从被诊断为健康人的数据中发现了3组患肾炎的,而原被诊断为患肾炎的数据数目没变,根据我们在诊断的过程中不会把患肾炎的诊断成健康人,这进一步验证了我们选取的元素指标的正确性。
4、数据分析
原则一:
我们在判别的过程中不会将患病的诊断出没患病的,但我们可以把一些指标值不是太明显的健康人诊断为患病(类似于住院做进一步检查)。
原则二:
非主要元素对主要元素的判断会产生影响(类似于非主要元素数值过大影响判断)
定义1:
在马氏距离判别模型中的距离平方差值D接近0的附近为易误判区域。
由题目所给的数据我们可计算得到:
以表B.1中1-30号各种元素的均值对应的矩阵
=(143.1012.33 23.07698.17 113.34201.13 526.83)
以表B.1中31-60号各种元素的均值对应的矩阵:
=(186.621.9262.012511.13295.1490.37367.21)
其中:
表示的是表B.1中1-30号已确诊为肾炎病人的化验结果的各项元素的均值;
表示的是表B.1的31-60号已确诊为健康人的化验结果的各项元素的均值;
经过比较我们可知,这两个总体的均值是有显著差异的。
在易误判区域内,我们引入了误判因子,使得我们能够更好的判别,再使得有患病可能的提前做好预防。
得出误判因子u的具体流程如图所示:
经计算,我们得出误判因子u=4
5问题一的解答
5.1模型的建立
根据题意,我们建立了欧式距离和马氏距离两个距离判别模型。
对于欧式距离法,我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果作为总体A,31-60号已确诊为健康人的化验结果作为总体B。
然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果作为样品C,分别用这两种方法来检验。
对于欧式距离法,我们根据我们建立的距离判别的数学模型,用欧式距离公式,分别求出样本C到总体A已确诊为肾炎病人的化验结果矩阵和总体B已确诊为健康人的化验结果矩阵的距离。
于是我们得到目标函数
d=,
对于马氏距离法,同理,为了简化计算,我们求两个马氏距离平方之差作为目标函数即为:
D=-
其中,=,=
综上所述:
得到欧式距离法的模型为:
d=-
其中,,
得到的马氏距离法的模型为:
D=-
其中,=,=
5.2模型的求解
将相应的数据分别代到上述模型中,分别判断差值。
如果平方差值d(D),则我们说该样品属于健康人的总体,反之,属于患肾炎的总体。
经计算,我们得到
用欧式距离判别此时的误判率为23.33%;
用马氏距离判别,得到此时的误判率13.33%。
为此,我们选用马氏距离法。
但是此时的误判率并不是很让人满意,于是我