ImageVerifierCode 换一换
格式:DOCX , 页数:54 ,大小:94.57KB ,
资源ID:7927599      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7927599.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(肾炎的诊断 数学建模.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

肾炎的诊断 数学建模.docx

1、肾炎的诊断 数学建模肾炎的诊断摘要本文研究的问题是通过检测人体内各种元素的含量,来诊断就诊人员是否患有肾炎。我们首先将健康的和患病的人群的体内的相关元素的平均值用计算出来,发现体内的元素含量的确和患病有必然的联系。我们再利用Excel软件中的logistic模型对样本做了具体的分析。( logistic模型被广泛应用于病理学中,被作为病理学研究的常用模型) 发现各元素的含量与是否患有肾炎之间的确有一定关联,属于线性回归问题。接着,计算出该线性方程的常量和系数从而完成模型的初步建立。对于问题一,我们取1-60号为样本,建立线性回归模型,以各元素的含量为自变量,是否患有肾炎为因变量,用表示,当时,

2、表示患有肾炎;当时,表示健康。然后利用回归统计表、方差分析表、回归参数表中的数据进行分析,来衡量线性回归的拟合度,以及线性方程中各参数的显著性,发现其回归程度较好。对60例受检者的数据进行判别,若p大于0.5则判定为患病,若小于0.5则判定为健康。结果正确率为93.33%。对于问题二,我们利用问题一中建立的优化模型进行检验,将待诊断的30个病例中各元素的含量代入模型一中,计算出对应的p值,然后和0.5进行比较,通过对数据分析处理:检验出61、62、64、65、66、68、69、71、72、73、75、76、79、83、85 号就诊人员患有肾炎;63、67、70、74、77、78、80、81、8

3、2、84、86、87、88、89、90 号就诊人员是健康的。对于问题三,由问题一知,这七种元素的回归系数显著性由高到低顺序依次为Ca,Cu,Fe,Mg,Na,Zn,K。所以,我们认为回归系数显著性较小的几种元素对是否患肾炎的影响有限,可以忽略不计,并加以检验,以期能够得到一个更为简化的判定方法。Mg、Na、Zn、K这4种元素所对应的回归系数显著性是最低的四个,分别为:-1.60239、1.380585、-0.3334、-0.21503。我们将这几种元素进行组合剔除,共有15种组合方式,比较去掉后该回归的各个参量的值,以标准误差和正确率作为评判假设是否合理的依据。从中找出在尽量减少元素检验的前提

4、下相对来说较优的模型。而保留下来的那些自变量对应的指标,即是影响人们患肾炎的关键因素,通过剔除法,得出Fe元素,Ca元素,Cu元素,Mg元素为影响人体患病的主要因素。结果正确率为93.33%,可见模型较优。对于问题四,我们通过问题三得到的最优回归模型进行检验,将待诊断的30个病例中各元素的含量代入模型三中,计算出对应的p的值,然后和0.5进行比较,通过对数据分析处理:检验出61、62、64、65、66、69、72、73、75、76、77、79、83、85号就诊人员患有肾炎;63、67、68、70、71、74、78、80、81、82、84、86、87、88、89、90号就诊人员是健康的。对于问题

5、五,我们通过对问题二中所判定的结果与问题四中所判定的结果,进一步对比分析,问题二中所判定的结果与问题四中的判定结果对病例号为 68、71、77的3名就诊人员所判定的结果有所不同。之所以会出现这种结果,我们认为由于每个人的体重不同,或者是因为样本的选取的分布不均匀和样本的容量较小问题等。关键词:多元线性回归 最优化 主要因子 显著性检验 1 问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1是确诊病例的化验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。表B.2是就诊人员的化验

6、结果。我们的问题是:1. 根据表B.1(见附录)中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。2. 按照1提出的方法,判断表B.2(见附录)中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3. 能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。4. 根据3的结果,重复2的工作。5. 对2和4的结果作进一步的分析。 2 问题分析2.1问题一的分析 问题一要求我们提出简便的方法,判别就诊人员是患者还是健康人。我们首先将健康的和患病的人群的体内的相关元素的平均值用计算出来,见表一,表

7、1 体内元素均值ZnCuFeCaMgKNa患病人体内每项元素平均值143.103312.334323.0667698.1667113.3933201.1333526.8333正常人体内每项元素平均值186.621.9236662.01162511.1333295.136690.37367.21发现患病和健康人群体内的元素含量的均值相差很大。所以体内元素的确和患病有必然的联系。又因logistic回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率,等等。我们根据建立的logistic回归模型来判断得病与健康的情况,由已确诊的病例中分析得知,

8、人体是否患病与人体内某些元素的含量呈相应的回归关系,由模型来判别病例。对于这种方法的正确性,我们利用回归统计表、方差分析表,回归参数表中的数据进行分析,来衡量线性回归的拟合度,以及线性方程中各参数的显著性,发现其回归程度较好。2.2 问题二的分析 问题二要求我们利用问题一中提出的方法,对表B.2中的30个病例进行判别。我们分别将各元素的含量输入到在问题一建立的模型中,求出对应的p的值,然后和0.5进行比较,判别出那些是患者,哪些是健康人。2.3问题三的分析 问题三要求我们根据表B.1的数据特征,确定影响人们患病的主要因素,以便减少化验因素。由问题一的结果得知,回归系数显著性由高到低顺序依次为C

9、a,Cu,Fe,Mg,Na,Zn,K。我们通过剔除模型中那些对因变量作用不显著的自变量,得到最优化模型,那些保留下来的自变量,即是影响人体患病的关键因素。2.4 问题四的分析 问题四要求我们利用问题三中得到的优化模型,即剔除掉那些非关键因素后的模型,再次,对表B.2中的30个病例进行判别。 我们分别将各元素的含量输入到问题一建立的模型中,求出对应的p的值,然后和0.5进行比较,判别出那些是患者,哪些是健康人。2.5 问题五的分析 问题五要求对问题二、问题四得出的结果,进行比较分析。我们通过问题二、问题四得出的结果对比后发现,只有3个样本有差异,之所以会出现这种结果,我们认为由于每个人的体重不同

10、,或者是因为样本的选取的分布不均匀和样本的容量较小问题等。因此,这3个样本的需要进一步的检验,才能确定是否患病。3 模型假设1. 假设问题所提供的60组数据是从大量的数据中随机抽取的,相互间没有任何必要的联系.2. 假设是否患有肾炎只与题目中给出的那几种元素的含量有关,与其他因素无关.3. 假设题目中所给的数据是真实可信的,且化验过程中没有出现错误。4. 假设题目中所给的样本只患肾炎或者是健康体,没有患其他的疾病。5. 假设人体内的各个元素是相互独立的,没有相互间的影响.6. 假设人的体重是近似相等的,这样就不存在了元素的含量与体重的关系. 4 符号说明: (i=1,2,7)分别表示人体内各元

11、素的含量;: 表示患肾炎;表示健康;: (i=1,2,7)表示线性方程中的系数; (i=1,2,7,表示对应的元素;表示患肾炎,表示健康)表示患病与健康人群的体内对应的各种元素的均值.Logit(p): p 的Logistic 变换: 方程的拟合优度。:表示总离差的平方和;:表示回归平方和:表示残差平方和;: 表示误判率;: 表示从总体中抽取的一个样本;: 显著性水平为和分子自由度、分母自由度的临界值;: 为在中的偏回归平方和5 模型的建立与求解5.1 问题一的建模与求解5.1.1 建立模型logistic模型被广泛应用于病理学中,被作为病理学研究的常用模型 ,比较常用的情形是探索某疾病的危险

12、因素,根据危险因素预测某疾病发生的概率,等等由于模型只有两个变量,分别为患病和健康,由此可以考虑应用多元Logistic(Binary Logistic) 模型。我们把y=1定义为该受检者患病,y=0定义为该受检者健康,为此,我们建立了如下模型: 注意, p=0或1时,此式失效 ,因为当p接近于0或1时,自变量即使有很大变化,p的值也不可能变化很大,且非线性程度较高。于是, 我们引入p 的Logistic 变换,即 , 所以,原模型可以表示为: , 拟合Logistic回归模型采用最大似然估计法。将数据导入EXCEL软件中,利用回归函数,选取的置信度为95%。得到了回归统计表、方差分析表、回归

13、参数表 。回归统计Multiple R0.823779R Square0.678612Adjusted R Square0.635348标准误差0.30448观测值60MultiPle R (复相关系数R ) :是R的平方根,又称为相关系数,用来衡量x 和y 之间相关程度的大小。本例中R 为0.823779,表示二者之间的关系是高度正相关。说明七种元素的含量与人的患病成高度相关性。方差分析dfSSMSFSignificance F回归分析710.179181.45416815.685437.37E-11残差524.8208250.092708总计5915Significance F 是在显著性

14、水平下的F的临界值,本题是7.37E-11远小于显著水平0.05。说明,回归效果显著。回归参数表Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept0.891130.1828744.8729141.07E-050.5241661.258094Zn-0.000330.000998-0.33340.740174-0.002340.00167Cu0.0166590.0041224.0416610.0001760.0083880.02493Fe-0.001620.000859-1.890950.064208-0.003359.94E-05Ca

15、-0.00036.25E-05-4.810661.33E-05-0.00043-0.00018Mg-0.000960.000598-1.602390.115128-0.002160.000242K-6.6E-050.000307-0.215030.830582-0.000680.00055Na0.0003030.000221.3805850.173312-0.000140.000744由回归参数表得知,的的值分别为:0.89113、-0.00033、0.016659、-0.00162、-0.0003、-0.00096、-6.6E-05、0.000303。5.1.2模型检验由方差分析表得知,检验

16、统计量F15.68543,而F(1,5)6.61,所以F F(1,5),所以该线性模型线性显著,可以用于实际问题的分析。将60份样本数据带入该模型中,得出,32、38、39、60与实际的结果不符。准确率为93.33%。具体数据见附录一。5.2问题二的求解 将该问的6190号的数据带入问题一的模型中,检验出61、62、64、65、66、68、69、71、72、73、75、76、79、83、85 号就诊人员患有肾炎;63、67、70、74、77、78、80、81、82、84、86、87、88、89、90 号就诊人员是健康的。具体的数据见表,具体的参数见附录二。表病例号ZnCuFeCaMgKNap预

17、测6158.25.4229.73231381795131.1213711621061.8740.55421771844270.8673961631520.812.513321761286460.57884906485.51.73.9950362.3238762.61.1829141651440.715.154779.771218.50.87464616685.71.094.279017045.8257.90.7948991671440.39.1141755249.5141.50.1320430681704.169.32943260155680.80.5368681691760.5727.331

18、813399.4318.80.7996261701927.0632.919693431035530.0566860711888.2822.61208231131413720.9655271721535.8734.8328163264672.50.9255321731432.8415.726512373347.50.91042617421319.136.2222024962465.80.12272507519220.123.81606156401680.43611717617110.530.567214547330.50.72633717716213.219.8152116636.21330.4

19、715370782031390.8154416298.9394.50.4204107916420.128.9106216147.3134.50.62785318016713.114.1227821236.596.50.18374108116412.918.6299319765.5237.80.0543980821671527205626044.8720.16887108315814.4371025101180899.50.87472818413322.831.316334012282890.252186085169830.8106899.1538170.76263118624717.38.65

20、255424177.5373.5-0.034780871853.931.31211190134649.80.5274490882096.4386.9215728874219.8-0.018040891826.4961.73870432143367.5-0.5893809023515.623.4180616668.91880.26642905.3问题三的求解由问题一知,这七种元素的回归系数显著性由高到低顺序依次Ca、Cu、Fe、Mg、Na、Zn、K。所以,我们认为回归系数显著性较小的几种元素对是否患肾炎的影响有限,可以忽略不计,并加以检验,以期能够得到一个更为简化的判定方法。Mg、Na、Zn、K

21、这4种元素所对应的回归系数显著性是最低的四个,分别为:-1.60239、1.380585、-0.3334、-0.21503。我们将这几种元素进行组合剔除,共有15种组合方式,剔除一种时以K为例,得出的数据见附录三,准确率为93.33%。剔除两种元素时发现,剔除K、Zn时的正确率最高为93.33%,具体的数据见附录四。剔除3种元素是发现剔除K、Na、Zn时的正确率为93.33%。具体的数据见附录五。剔除四种元素K、Na、Zn、Mg时的正确率为91.67%。具体的数据见附录六。综合考虑,比较后发现,剔除3种元素K、Na、Zn时,该回归较优。模型的参数的值分别为:0.967488、0、0.01891

22、9、-0.00165、-0.00034、-0.00086、0、0。而保留下来的那些自变量对应的指标,即是影响人们患肾炎的关键因素,通过剔除法,得出Fe元素,Ca元素,Cu元素,Mg元素为影响人体患病的主要因素。结果正确率为93.33%。5.4问题四的求解只分析,Fe元素,Ca元素,Cu元素,Mg元素为影响人体患病的主要因素。根据问题三的结论,将待检测的30组数据带入,问题三的模型中,检验出61、62、64、65、66、69、72、73、75、76、77、79、83、85号就诊人员患有肾炎;63、67、68、70、71、74、78、80、81、82、84、86、87、88、89、90号就诊人员是

23、健康的。具体的数据见表表病例号CuFeCaMgp预测615.4229.73231380.89311621.8740.55421770.7317721630.812.513321760.4954990641.73.9950362.30.9765061650.715.154779.70.9242251661.094.27901700.6640111670.39.11417552-0.036120684.169.329432600.4472680690.5727.33181330.8796231707.0632.91969343-0.003280718.2822.612082310.45587107

24、25.8734.83281630.8423331732.8415.72651230.92535517419.136.222202490.18505507520.123.816061560.56034317610.530.56721450.80422117713.219.815211660.5274371781390.815441620.542107920.128.910621610.70739518013.114.122782120.21105108112.918.629931970.036684082152720562600.18618508314.43710251010.816621842

25、2.831.316334010.052041085830.8106899.10.77407418617.38.6525542410.0911040873.931.312111900.5204890886.4386.921572880.065740896.4961.73870432-0.7351709015.623.418061660.45846705.5问题五的求解我们通过对问题二中所判定的结果与问题四中所判定的结果,进一步对比分析,问题二中所判定的结果与问题四中的判定结果对病例号为 68、71、77的3名就诊人员所判定的结果有所不同。之所以会出现这种结果,我们认为由于每个人的体重不同,或者是

26、因为样本的选取的分布不均匀和样本的容量较小问题等。6 模型的评价与推广本文研究的问题是通过检测人体内各种元素的含量,来诊断就诊人员是否患有肾炎。我们再利用Excel软件中的logistic模型对样本做了具体的分析。( logistic模型被广泛应用于病理学中,被作为病理学研究的常用模型) 发现各元素的含量与是否患有肾炎之间的确有一定关联,属于线性回归问题。接着,计算出该线性方程的常量和系数从而完成模型的初步建立。优点:方法简洁,便于操作,即直接通过EXCEL软件的回归分析工具就可得到结果;通过数据的对比,鉴定结果基本一致,从而为补充和证明,预测结果真实可靠;Ca,Cu,Fe,Mg四种元素作为主要因素,减少了化验指标,为医学鉴定带来了方便且正确率较高缺点:模型的预测结果仍然存在一定差异,这可能是由于样本容量太小,不能充分反映各个指标对肾炎的影响,单纯地检测微量元素比较片面,即使某些指标异常也可能是其它疾病引起的,从而导致误诊。而现实

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1