数学建模医学肾炎化验分析模型Word格式文档下载.docx

上传人:b****2 文档编号:14910385 上传时间:2022-10-25 格式:DOCX 页数:30 大小:137.96KB
下载 相关 举报
数学建模医学肾炎化验分析模型Word格式文档下载.docx_第1页
第1页 / 共30页
数学建模医学肾炎化验分析模型Word格式文档下载.docx_第2页
第2页 / 共30页
数学建模医学肾炎化验分析模型Word格式文档下载.docx_第3页
第3页 / 共30页
数学建模医学肾炎化验分析模型Word格式文档下载.docx_第4页
第4页 / 共30页
数学建模医学肾炎化验分析模型Word格式文档下载.docx_第5页
第5页 / 共30页
点击查看更多>>
下载资源
资源描述

数学建模医学肾炎化验分析模型Word格式文档下载.docx

《数学建模医学肾炎化验分析模型Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《数学建模医学肾炎化验分析模型Word格式文档下载.docx(30页珍藏版)》请在冰豆网上搜索。

数学建模医学肾炎化验分析模型Word格式文档下载.docx

信息与计算科学年级:

许经超学院:

医学肾炎化验分析模型

摘要

此数学模型的建立主要是为了解决这样的问题,通过检测人体内相关微量元素的含量来判定一个人是否患肾炎。

因而在此数学模型中,自变量为体内若干种微量元素的含量,因变量作为判定一个人是否患病的主要数据,做如下设定,当被确诊为患病时,设为1,被确诊为健康时,设为0.我们通过对数据的基本分析和判别,试图通过线性回归模型解决这个问题,经过查阅相关资料,了解到logistic模型被广泛应用于病理学研究中作为研究模型,于是利用excel中的回归工具建立logistic回归模型,计算出该线性方程的常量和系数从而完成模型的初步建立。

然后利用回归统计表、方差分析表中、回归参数表等中的数据进行分析,来衡量线性回归的拟合度,以及线性方程中各参数的显著性,发现其回归程度较好,又通过将表1和表2中已确诊的数据代入,对60例受检者的数据进行判别,若大于0.5则判定为患病,若小于0.5则判定为健康。

对应的logit(p/(1-p))为正数时候患病,为负数时为健康。

发现该模型在本题判断中的正确率高达93.33%,预测能力显著。

诊断待测病人,将表3中的数据代入计算其患病概率,判别标准同上所述,得出受检者中有15人健康,15人患病的结论。

回归参数表中回归系数的统计量的线性系数显著性t值,表征了该系数的显著性水平,也表征了该项因素对于因变量判定的影响程度。

因此以此为衡量的标准来筛选7项相关因素,找到系数显著性最小三种元素,分别为Na,Zn,K;

我们又用排列组合的方法分别删除其中的一种、两种和三种元素,分别计算此时代入前60组数据时的准确度,通过比较从而确定主要影响元素。

保留了Ca,Cu,Fe,Mg四种元素,除去非主因素的干扰,用同样的方法重新计算该模型各系数的数值,在保证较高准确率的前提下,最终达到了简化检测过程的目的。

利用排除非显著性元素后的Logistic模型,将表3中的数据代入计算其患病概率,判别标准同上所述,得出受检者中有16人健康,14人患病的结论。

关键词:

logistic回归模型主因素筛选显著性检验

一、问题的提出与分析

提出问题:

病理检验的一些指标是医生诊断病人病症的主要依据。

诊断人员是否患肾炎时通常要化验人体内各种元素含量。

表1列出了60个病理检验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;

31-60号病例是已经确定为健康人的结果。

表2给出了另外一些就诊人员的化验结果。

我们的工作是:

1.根据表1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验提出方法的正确性。

2.按照1提出的方法,对表2中的30名就诊人员的化验结果进行判别,判定他们是肾炎病人还是健康人。

3.根据表1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,是否可以减少化验的某些指标。

4.根据3的结果,重复2的工作。

分析问题

根据以上均值分析可知,就诊者是否患肾炎可能取决于其体内各元素含量数值上的增减或各元素含量占元素总含量的比例失衡。

而在初步的数据分析下,肾炎产生的主要原因还无法得到确定,这无疑给以后数学模型的建立和求解带来了不便。

另外,对于题目给出的化验结果,在一般情况下,都希望能对它们进行数据的规范化处理,以避免含量差别很大的两种元素在改变一个单位含量时对是否患病的结果产生的影响程度相差过大。

以下7张图是健康人和病人体内元素含量的坐标图,以及存有相关数据的表格,通过这些图我们可以发现,体内元素的含量与病人的患病诊断具有一定的线性对应关系,因此我们设想,可以用线性回归的方法来构建模型,同时,我们通过查阅资料也得知,在临床上也的确经常使用这种模型去解决问题。

我们看到,7种微量元素的数值,可以作为7个自变量,而是否患病的判别概率,作为因变量。

因而在此数学模型中,自变量为体内若干种微量元素的含量,因变量作为判定一个人是否患病的主要数据,做如下设定,当被确诊为患病时,设为1,被确诊为健康时,设为2.这样就建立了一个多元方程,因此我们选择多元统计分析中利用excel中的回归工具建立logistic回归模型,计算出该线性方程的常量和系数,从而完成模型的初步建立。

回归分析工具是通过对一组观察值使用“最小平方法”进行直线拟合,以分析一个几个自变量对单个因变量的影响方向与影响程度的方法。

它是Excel中数据分析工具的一个内容。

然后利用回归统计表、方差分析表中、回归参数表等中的数据进行分析,来衡量线性回归的拟合度,以及线性方程中各参数的显著性。

同时,将表1和表2中已确诊的数据代入,检测本模型在进行诊断时的正确率。

诊断待测病人,将表3中的数据代入计算其患病概率,若大于0.5则判定为患病,若小于0.5则判定为健康。

同时,我们也看到,在图中的一些点的规律性并不明显,因此我们猜测,可以在构建的方程中忽略一些因素的影响,这就为我们提出简化模型提供了思路。

回归参数表中回归系数的t统计量的p值,表征了该系数的显著性水平,也表征了该项因素对于因变量判定的影响程度。

因此以此为衡量的标准来筛选7项相关因素,保留其中的主因项,去除非主因素的干扰,重新构建模型,以达到简化模型和提高精度的目的。

二、基本假设

(1)假设表中给出化验数据科学可信。

确诊病例确诊情况(患病、健康)准确无误。

(2)假设各位被测患者无其他疾病,不会干扰被测数值。

(3)假设医生不会仅仅依靠化验结果对患病情况作出最终判断,化验仅仅作为医生诊断的一种辅助手段,所以化验结果单方面的现实结果可以跟实际有一定程度的偏差。

三、符号说明

Logit(p),p的Logistic变换

i=1,2,3,4,5,6,7线性方程中的变量

i=1,2,3,4,5,6,7y与的复相关系数

i=1,2,3,4,5,6,7线性方程中的系数

F检验统计量

回归方程的显著性检验中的显著性水平

根据分子自由度1和分母自由度n-2找出的临界值,由查表得出

四、模型的建立与求解

4.1.模型的建立

从上述对数据的分析中,我们可以看到要建立的模型的因变量只有两个值,分别为患病和健康,由此可以考虑应用BinaryLogistic模型。

我们把Y=0定义为该受检者健康,Y=1定义为该受检者患病,以p作为受检者患病的概率,并把p看做自变量Xi的线性函数,即

(k=7)

在此假设下,由于p的值一定在区间[0,1]内,而且当p接近于0或1时,自变量即使有很大变化p的值也不可能变化很大,所以对上式直接用最小二乘法进行估计时行不通的。

从数学上看,函数p对Xi的变化在p=0或p=1附近是不敏感的、缓慢的,且非线性程度较高。

于是要寻求一个p的函数θ(p),使得它在p=0或p=1附近时变化幅度较大,

而函数的形式又不是很复杂。

因此,我们引入p的Logistic变换(或称为p的Logit变换),

当P在(0,1)变化时,logit(p)就在全体实数上变化。

我们有下面的变换公式:

等价于:

在拟合Logistic回归模型时,我们要建立因变量概率pi关于自变量的关系式,自变量都必须是数值型的。

拟合Logistic回归模型采用最大似然估计法。

4.2.问题的求解

4.2.1对模型的线性回归及对第一个问题的求解

4.2.1.1模型的线性回归

将数据导入Excel软件中,利用软件的“回归”函数,可以方便地得到线性回归模型的相关信息。

在进行回归时,选取置信度为95%。

于是可以得到该线性回归的回归统计、方差分析与回归参数,具体数值见下表。

回归统计

 

MultipleR

0.820977

RSquare

0.674003

AdjustedRSquare

0.629258

标准误差

0.307012

观测值

59

表4.2.1.1回归统计

一个要素或变量同时与几个要素或变量之间的相关关系。

复相关系数是度量复相关程度的指标,它可利用单相关系数和偏相关系数求得。

设因变量为Y,自变量为X1,X2,……Xk,则Y与X1,X2,……Xk的复相关系数记为Ry·

12……k,其计算式为Ry·

12……k=

复相关系数越大,表明要素或变量之间的线性相关程度越密切。

从表中可以看出,该回归模型复相关系数R的值达到了0.820977,这说明七种元素的含量与人的患病呈高度相关性。

df

SS

MS

F

SignificanceF

回归分析

7

9.938688

1.419813

15.06331

1.75794E-10

残差

51

4.807074

0.094256

总计

58

14.74576

表4.2.1.2方差分析

从图表中我们看到,F统计量的概率P值达到了0.000000000175794,远小于显著水平0.05,说明方程回归效果显著,方程中至少有一个回归系数显著不为零。

Coefficients

tStat

P-value

Lower95%

Upper95%

下限95.0%

上限95%

Intercept

0.892219

0.184417

4.838054

1.25E-05

0.521987

1.262451

166

-0.00036

0.00101

-0.36083

0.71972

-0.00239

0.001663

15.8

0.016483

0.004182

3.941917

0.000247

0.008089

0.024878

24.5

-0.00162

0.000866

-1.86433

0.068035

-0.00335

0.000124

700

-0.0003

6.32E-05

-4.73058

1.81E-05

-0.00043

-0.00017

112

-0.00094

0.000604

-1.56472

0.123832

-0.00216

0.000267

179

-6.5E-05

0.00031

-0.20962

0.834799

-0.00069

0.000557

513

0.000301

0.000222

1.359492

0.179972

-0.00014

0.000746

表4.2.1.3回归参数表

4.2.1.2回归方程的显著性检验

回归方程的检验

假设H0代表线性关系不显著

计算检验统计量F

通过查F分布表,F(1,5)=6.61,F=15.06331,F>

F(1,5),所以该线性模型线性显著,可以应用于对问题的分析。

表中可以找到线性回归模型中线性函数的各项系数值,由此可以得到

中,

b0=0.892219,b1=-0.0003

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1