胃癌诊断数学建模论文.doc

资源描述

胃癌诊断数学建模论文.doc

《胃癌诊断数学建模论文.doc》由会员分享，可在线阅读，更多相关《胃癌诊断数学建模论文.doc（14页珍藏版）》请在冰豆网上搜索。

胃癌诊断数学建模论文.doc

诊断疾病问题

成员1昝海霞200990014006数学系09应一

成员2彭文200990014037数学系09应一

成员3景波200990014011数学系09应一

诊断疾病问题

摘要

文中研究的是通过已给出的数据对其四项生化指标：

血清铜蓝蛋白（X1）、蓝色反应（X2）、鸟吲哚乙酸（X3）、中型硫化物（X4）进行分析，得出健康综合指数的临界值，从而协助医生诊断就诊人员是癌症病人还是萎缩性胃炎病人及健康人。

首先，在合理的假设下，建立了判别分析模型，将表中的数据分为，C三组，由其各自的离差矩阵求得每种指标对应的权重，并得到了健康综合指数的临界值，经过检验，用此模型诊断的正确率为100%

此外，文中对所建立的模型做了检验，误差分析和评价，并将此模型做了推广和应用。

关键词综合指数临界值权重判别分析

一、问题重述

胃癌患者容易被误诊为萎缩性胃炎患者或非胃病者，据此，通常要化验人体内四项生化指标：

血清铜蓝蛋白（X1）、蓝色反应（X2）、鸟吲哚乙酸（X3）、中型硫化物（X4），从而用这些指标协助医生诊断。

表中1-5号病例是已经确诊为胃癌的病人的化验结果；6-10号病例是已经确定为萎缩性胃炎病人的化验结果；11-15是已经确诊为健康人的化验结果。

血清铜蓝蛋白X1

蓝色反应X2

尿吲哚乙酸X3

中性硫化物X4

228

134

0.2

0.11

245

134

0.1

0.4

200

167

0.12

0.27

170

150

0.07

0.08

100

167

0.20

0.14

255

125

0.07

0.14

130

100

0.06

0.12

150

117

0.07

0.06

120

133

0.1

0.26

160

100

0.05

0.10

185

115

0.05

0.19

170

125

0.06

0.04

165

142

0.05

0.08

135

108

0.02

0.12

100

117

0.07

0.02

根据表中的数据，设想使用Fisher判别分析法，给出鉴别胃病的方法并对所给的数据进行检验，使问题得到有效的解决。

二、问题分析

医生在诊断就诊人员是癌症病人还是萎缩性胃炎病人及健康人。

通常要化验人体内四项生化指标，从而用这些指标协助诊断。

由表中看出医生通常用血清铜蓝蛋白（X1）、蓝色反应（X2）、鸟吲哚乙酸（X3）、中型硫化物（X4）在人体内的含量作为指标进行诊断。

要判断就诊人员是ⅰ胃癌病人还是ⅱ萎缩性胃炎病人及ⅲ健康人，分别对①胃癌患者与非胃病者及②萎缩性胃炎患者与非胃病者以及③胃癌患者与萎缩性胃炎患者进行分析，分别得出其相对应的健康综合指数的临界值（H1，H2，H3）作为判别标准，这是一个判别分析问题。

通过表中的数据分析可得：

如果就诊人员在情况①下由临界值H1判断为胃癌，则在第三种情况下分析，如果由临界值H3判断为胃癌，则认为此人患有胃癌；如果判断为萎缩性胃炎，则此人为萎缩性胃炎患者。

如果在情况①下由临界值H1判断为非胃病者，则在第二种情况下分析，如果由临界值H2判断为非胃病者，则此人为非胃病者；若判断为萎缩性胃炎，则此人为萎缩性胃炎患者。

要得到就诊人员的健康综合指数，就必须通过表中的数据得到人体内四项生化指标含量的一个权值（这个权值是恒定的）。

由于各年龄阶段人体内各种生化指标的含量是不同的，要使这个临界值更加准确，就必须消除年龄和体质的差异，所以所抽取样本应该是随机的，且这个随机样本中就诊人员没有其他病症。

为了使医生诊断的结果准确，建立判别分析模型，确定健康综合指数的临界值和人体内四项生化指标含量的权值。

将此权值代入表中进行检验，并计算此模型诊断结果的正确率。

三、模型假设及符号说明

1模型假设

（1）表中的数据是随机抽取的化验结果，具有普遍性；

（2）就诊人员没有其他病症，且化验当天没有特殊情况；

（3）化验仪器足够精确；

（4）除了表中列出的指标外，其它指标对是否患胃癌的影响很小。

（5）检测是在同等条件下进行的，即同样的外界环境和生理条件。

2符号说明

：

就诊人员健康综合指数的临界值；

：

第个就诊人员的综合指数；

：

第个就诊人员第个指标的权值；

：

第个就诊人员第个指标的含量；

：

第个指标含量的平均值；

：

就诊人员综合指数的平均值。

四、模型建立

模型判别分析模型

通常是由化验结果中X1，X2，X3，X4四种元素作为诊断指标，医生最终要诊断就诊人员是癌症病人还是萎缩性胃炎病人及健康人，就必须确定一个健康综合指数的临界值作为判别标准，因此这是一个判别分析问题。

故建立判别分析模型

将与健康综合指数的临界值作比较，就可诊断就诊人员是癌症病人还是萎缩性胃炎病人及健康人。

要得到就诊人员的健康综合指数，就必须通过表中的数据得到人体内四种元素含量的一个权值（这个权值是恒定的）。

为了求得，利用判别准则：

由于表中1-5号病例确诊为胃癌患者，6-10号病例确诊为萎缩性胃炎患者，11-15号病例确诊为非胃病者，故将表中的就诊人员分为，C三组：

A组为非胃病者，B组为胃癌患者，C组为萎缩性胃炎患者。

组数据矩阵为

C组数据矩阵为

作出，C三组的离差矩阵

则

其中

，

五、模型求解

由式求得H1=-4.9149，H2=1.1364,H3=3.5551，

表1-15号病例健康状况的综合指数

病例号

综合指数Hi0

-5.9225

-5.7190

-6.1765

-4.9491

-6.0543

综合指数Hi2

4.1222

3.8402

4.3695

3.7157

4.3193

病历号

综合指数Hi1

0.6134

0.7392

0.9614

0.6689

0.8465

综合指数Hi2

3.5402

2.5976

3.0171

3.3716

2.6570

病历号

综合指数Hi0

-4.2580

-4.2413

-4.5897

-3.4987

-3.7394

综合指数Hi1

1.0631

1.3429

2.0362

1.8544

1.2373

为了使医生对就诊人员的健康状况做一个更加准确的诊断，由Fisher模型求得就诊人员健康状况的综合指数。

要得到就诊人员健康状况的综合指数，由知，首先必须得到每一个指标对应的权重，利用判别准则：

先将病历号1-15分为,C三组（A表示非胃病者，B表示胃癌患者，C表示萎缩性胃炎患者）

组数据矩阵

C组数据矩阵

由通过Excel分别求得组与组及C组数据每一列的平均值，如表2

表2非胃病组A与胃癌组B及萎缩性胃炎组C的数据矩阵每一列的平均值

x01

x02

x03

x04

151

121.4

0.05

0.09

x11

x12

x13

x14

188.6

150.4

0.138

0.2

x21

x22

x23

x24

163

115

0.07

0.136

由矩阵分别求得组与组及C组数据的离差矩阵、（见附录）

且由、得

根据式有MATLAB求得

即：

健康综合指数临界值

其中

H1=-4.9149，H2=1.1364,H3=3.5551

将分别代入,C三组数据中用Fisher模型进行经检验，将组数据代入情况1中分析检验的结果是：

组数据的0均小于H1，则他们是癌症患者，再代入情况3中分析Hi2均大于H2则肯定他们是癌症患者，诊断的正确率为。

对组数据分析：

0均大于H1，则他们是非胃病者，再代入情况2中分析Hi1均大于H2，则肯定他们是非胃病者，诊断的正确率为100%。

对C组数据分析代入情况1中分析出结果不确定，则代入情况2或情况3中分析，都得出他们是萎缩性胃炎患者，则肯定他们是萎缩性胃炎患者，诊断的正确率为100%。

对,C三组数据的就诊人员总诊断的正确率为100%。

六、模型检验及误差分析

1、模型检验

将表中确诊病例的化验结果代入我们所建立的模型中，得到的结论分别是1-5号病例确诊为胃癌患者，6-10号病例确诊为萎缩性胃炎患者，11-15号病例确诊为非胃病者，诊断的正确率分别为100%、、100%这个概率说明我们所建立的模型能应用到实际生活中。

2、误差分析

（1）模型误差

表中给出确诊病例的化验结果只有15人，由于数据有限，不能很准确的代表普遍情况。

因此我们所建立的模型中判断的综合指数是有误差的。

这样，用模型所检验的准确率就达不到。

（2）舍入误差

在模型的建立过程中，由于数据复杂，我们通过四舍五入的方法来处理数据，这样得到健康人的综合指数是有误差的。

七、模型评价与改进

优点：

1.分析了由判别法得到的结果用来检验所给的15组数据，得出诊断的正确率为100%，这说明我们所建立的模型具有实际意义。

2.当实验数据非常多时，传统的方法就不再适用了，只能转而使用数值计算的相关理论，以发现数据中存在的关联和规则,此时该模型就具有非常强的实用性。

缺点：

文中假设就诊人员的病例是随机抽取的，而人在各年龄阶段体内元素的含量存在差异，故会出现误诊情况。

改进：

1.在一级甲等医院随机抽取大量确诊为癌症病人还是萎缩性胃炎病人及健康人的化验结果，从而使我们所使用的数据所确定的健康综合指数临界值够精确；

2.由于人体内四项生化指标含量在人体内是分布不均匀的，通过医学常识准掌握人体内四项生化指标含量分布情况，进而对模型加以改进，使得对胃病检验的准确率提高。

八、模型的应用及推广

1.国际乒乓球的比赛

在国际乒乓球比赛中，要想获胜，不仅单靠球技，需要考虑的因素很多。

例如：

打球的水平、打球时自己的弱势是不是对手的强势、年龄、心理素质等。

我们可以运用所建立的模型去综合分析各因素所占的权数，找到某两个对手交锋时获胜的综合指数，以及找到影响胜利的主要原因。

2.高考

中国每年参加高考的人数高居不下，而父母望子成龙与望女成凤的愿望越来越强烈。

因此导致参加高考的学生压力也越来越大，特别是那些站在二本边缘的学生。

对他们而言发挥的好坏因素很多：

当天的

展开阅读全文