1、分析ACTG公布第一组数据(同时服用三种药物的300多名病人每隔几周测试的CD4和HIV的浓度),发现每个病人的测试次数大致在27次。作出测试CD4和HIV浓度的时间的散点图(如图3-1、图3-2),可以看出在治疗前期测试次数较多,主要集中在第0、5、10周左右,第四十周大部分病人也被作了一次CD4和HIV浓度的测量,因而我们采用拉格朗日插值模型根据每位病人的CD4和HIV浓度的已知数据计算出第0、5、10、20、30、40周的数据,再由统计学方法分别求第0、5、10、20、30、40周的典型值,利用最小二乘将得到的两组典型值拟和出CD4和HIV浓度变化的曲线,继而从图像中判断出同时服用三种药
2、物的治疗效果。 图3-1 CD4测试时间的分布 图3-2 HIV测试时间的分布分析ACTG公布第二组数据(1300多名病人按照4种疗法服药大约每隔8周测试的CD4浓度),发现多了年龄这一因素,作出CD4浓度关于年龄的散点图(如图3-3),可以看在每一个不同的年龄段的CD4浓度分布大致相同,猜想CD4与年龄的关系不是十分密切,查阅相关医学研究资料1证实了我们的想法。在不考虑年龄的情况下我们采用两种方案:方案一和分析第一组数据时类似,因为所给CD4浓度基本上是每隔8周测得的,因此对每种疗法的数据采用拉格朗日插值模型和统计学方法计算第0、8、16、24、32、40周的CD4浓度的典型值,再求解等时间
3、间隔序列的灰度预测模型来分析评价4种疗法的优劣。方案二是以艾滋病疗效评估的免疫学指标2为依据,各疗法在治疗过程中CD4浓度的增长率为标准并结合统计学的方法来分析增长率的数字特征来评价4种疗法的好坏。图3-3 四种疗法中log(CD4 count+1)与年龄的关系二、 基本假设 题中所给统计数据是可靠的; 病人均按时吃药,且药物没有副作用;3. 病人除服用治疗艾滋病的药物外,未服用或注射其它药物;4. 病人在接受艾滋病治疗过程中不受其它疾病影响;5. 艾滋病治疗效果与病人的性别、种族、体重等因素无关;6. 病人的饮食、睡眠等生活行为完全一样;7. 病人的心理状况良好且相同。三、 参数说明:每个病
4、人的测试时间;与测试时间对应的CD4浓度;每种疗法CD4的平均增长率;每个疗法的测试病人的周增长率;每个疗法的CD4浓度周平均增长率;每种疗法分别对应的日用药价格;每种疗法所对应的单位增长率所消耗的费用。四、 模型的建立与求解 分析同时服用3种药物的治疗效果考虑建立经过如下数据点的插值多项式: (该数组表示CD4或HIV的测试时间/周) (该数组表示CD4或HIV的浓度)由拉格朗日插值公式 计算出 、 、 、 、 、 、 ,因为数据量庞大,我们通过编写程序(见附件ans1.m)来实现,于是便得到第0、5、10、15、20、30、40周每个病人CD4和HIV的浓度。由于病人在接受治疗前的CD4和
5、HIV浓度不同(如图5-1),故我们对病人进行分组处理。图5-1 第0周CD4和HIV的分布从图中可粗略根据第0周病人情况进行分组如下,根据CD4分组: , , 分为三组;根据HIV分组: , 分为两组。虽然分组后各组数据量减少,但数据的规律性仍然不是很明显,我们只能对其求均值来得到 、 、 、 、 、 的典型值,如表5-1所示 (CD4精确到0.1,HIV精确到0.01):CD4:20.269.795.3112.6107.1180.1148.198.4163.1192.7204.2198.3299.2257.5191.4233.4267.2291.0301.4302.0336.7HIV:5.
6、023.043.233.803.943.163.306.583.212.673.573.532.532.52表5-1根据表5-1中的数据进行曲线拟和得到图6-1和图6-2。图6-1 三组CD4典型值的拟和结果图6-2 两组HIV典型值的拟和结果分析图6-1和图6-2知两组HIV的变化趋势大体相同,而对于CD4初始值 满足 或 的病人CD4在第35周最大,且HIV最小;对于 在第35周后CD4又开始增加,但HIV也有一个明显的增加,因此综合总体考虑最佳终止治疗的时间在第35周左右。 评价4种疗法的优劣(仅以CD4为标准)对于本问,我们采用两种方案进行分析。 方案一和求解第一问时类似,对每种疗法的
7、数据进行拉格朗日插值模型和统计学方法计算第0、8、24、32、40周的CD4浓度的典型值如表7-1所示(精确到0.0001):疗法13.00302.91982.79062.70672.81023.1717疗法22.98403.07922.94342.73942.73763.3577疗法33.00573.20303.05262.96022.91023.3982疗法42.90333.25533.22533.12573.00273.5812表7-1再利用等时间间隔序列的灰色预测模型(见附件gm_1_1.m)来分析评价4种疗法的优劣。该方法2是通过少量的、不完全的信息,建立灰色微分预测模型,对事物发展
8、规律作出模糊性的长期描述。灰色理论认为系统的行为现象尽管是朦胧的,数据是复杂的,但它毕竟是有序的,是有整体功能的。灰数的生成,就是从杂乱中寻找出规律。同时,灰色理论建立的是生成数据模型,不是原始数据模型,因此,灰色预测的数据是通过生成数据的gm(1,1)模型所得到的预测值的逆处理结果。、关联度提出系统的关联度分析方法,是对系统发展态势的量化比较分析。关联度一般表达式为: ri是曲线xi对参考曲线x0的关联度。2、生成数通过对原始数据的整理寻找数的规律,分为三类:a.累加生成:通过数列间各时刻数据的依个累加得到新的数据与数列。累加前数列为原始数列,累加后为生成数列。基本关系式:记 为原始数列 记
9、 为生成数列如果 与 之间满足下列关系,即称为一次累加生成。b.累减生成:前后两个数据之差,累加生成的逆运算。累减生成可将累加生成还原成非生成数列。c.映射生成:累加、累减以外的生成方式。3、建立模型(A)建模机理a.把原始数据加工成生成数;b.对残差(模型计算值与实际值之差)修订后,建立差分微分方程模型;c. 基于关联度收敛的分析;d.gm模型所得数据须经过逆生成还原后才能用。(B)采用“五步建模(系统定性分析、因素分析、初步量化、动态量化、优化)”法,建立一种差分微分方程模型gm(1,1)预测模型。基本算式为: 令 作一次累加生成, k有 可建立白化方程: 即gm(1,1).该方程的解为:
10、图8-1 灰色预测结果图8-1中所示的各分立点,分别是通过四种疗法治疗的病人所得数据由拉格朗日插值得到的间隔为8周的时间点,然后运用随机变量的数字特征,得到图8-1中所示的典型坐标点。(在使用灰色预测模型时,时间间隔不可改变,故上图中所示的X轴的时间并非实际的时间,而是经过一定比例的缩小得到,但总体的比例满足实际的模型假设)而在等间隔的时间序列里,可以利用等时间间隔的灰色预测方法,对今后几周的治疗效果做出预测。由于灰色系统中可以通过少量数据,对未知的信息做出比较精确的评价。从图中可以明确地看到疗法四,CD4的浓度总体上呈现上升趋势,且总体的CD4浓度较其他的三种疗法明显多,增加的速率也较其他三
11、种快。这也进一步说明了疗法四,治疗效果的优越性。从图中可知,对于疗法四,在一定的治疗期限内,随着治疗时间的延长,CD4的浓度对于大多数的HIV病毒患者来说,都将呈现上升趋势。在终止测试后,可以预见到疗法四对于继续服药,对于患者的病情仍具有一定效果。综上所述,利用灰色预测模型对CD4浓度进行预测时,得到了如下结论:疗法四有较好的治疗效果,且终止测试后继续治疗的效果较佳。方案二是以各疗法在治疗过程中CD4浓度的增长率为标准并结合统计学的方法来分析增长率的数字特征来评价4种疗法的好坏,由于不同病人在接受治疗前的CD4浓度各异,故通过对接受不同疗法后CD4的增长率进行比较来评价4种疗法的优劣。我们通过
12、编写程序(见附件diff2.m)来计算不同疗法不同病人CD4的增长率。基本算法:假设每种疗法中每个病人的测试时间为 ,相对应的cd4浓度为 ,每种疗法CD4的平均增长率为 ,则 然后再对平均增长率按一定的标准进行删选 selct( ),从而得到所需序列。对于艾滋病疗效评估的免疫学指标是:经治疗3个月后,CD4细胞计数与治疗前相比增加了30%即提示治疗有效3。以这一指标为依据来分析病人在接受4种疗法过程中CD4的增长率,对三个月(13周)后CD4的增长率取0和0.3两个分界点来分析4种疗效。 0说明治疗效果差;00.3说明治疗效果显著。因为接受各疗法的人数比较接近,分别是291、287、294、
13、306,故可通过比较表9-1中的数据来评价4种疗法的优劣。疗法实测人数疗效差的人数疗效不明显的人数疗效明显的人数12912045730228718262413294183634843061397988表9-1结论:疗法4对治疗艾滋病最为有效,疗法1疗效最差,疗法2和疗法3疗效相同,这与方案一的分析结果吻和。 综合药品价格重新分析问题二考虑到药品售价的因素,单纯考虑药品的治疗效果并非与实际应用相符。所以必须对艾滋病治疗药物的疗效和药品价格综合考察,以衡量具体治疗方法的优劣。衡量治疗效果的一个显著的特征是:CD4浓度的增长率的大小。在不考虑药品价格的前提下,显然CD4浓度增长率越大,治疗的效果就越
14、明显。而考虑药品价格后,在获得相同的CD4增长率的同时,所消耗的费用越少,则该疗法的实用性越强。因此我们着眼于获得单位增长率所消耗物品的费用,来重新衡量各疗法的优劣。设从数据计算得到的每个疗法的测试病人的周增长率 ,每个疗法的CD4浓度周平均增长率为 ,每种疗法分别对应的日用药价格 ,每种疗法所对应的单位增长率所消耗的费用 ,则;由MATLAB计算可得表10-1:3 4 0.004520.010230.012850.015451.2253.452.453.651897.1242360.7041334.631653.722 表10-1从表10-1中的数据可知,对于疗法一,它的价格较低,但治疗效果
15、不佳,不宜选用。而对于疗法二和疗法四,价格相对较高,疗法二的cd4增长率并不高,虽然疗法四的治疗效果最佳,但与其价格相联系后,其性价比不是很高。由第二问可得,疗法三的治疗效果仅次于疗法四,但其价格适中,性价比最高。所以综合考虑价格因素后,疗法三较优。五、 总结和评价对于第一问主要用了拉格朗日插值法,此法的优点有:(1)不需要求解线性方程组;(2)函数值可以用符号形式表示,而不要求一定是数量值。但在对数据进行插值时,有大量病人只测试了23周CD4和HIV的浓度,数据量小,因此由这些病人的测试数据所得的插值多项式计算得到的数据不准确,但若将这些数据去除,结果又将失去普遍性,故在计算典型值前将与实际
16、情况不符的数据除去并根据未接受治疗前的CD4和HIV将病人分组处理来减小误差。其次,在插值之前对数据处理不充分,也造成了一些误差。但这对整个评价体系来说,影响不大,可以认为模型是基本正确的。对于第二问采用两种方案,方案一根据病人CD4的浓度大致是每隔8周测试这一特点,用等时间间隔序列的灰色预测模型来求解,但由于并不是完全的等时间间隔,求解时,仍使用了拉格朗日插值进行等间隔化,在使用灰色预测模型时,由于初始数据不够多,导致预测产生了一些偏差。且只能预测测试结束后,一定时间内的效果。方案二则直观地反映了变化趋势,有一定的精度。且所得结果与方案一基本一致,这也进一步验证了模型的正确性。对于第三问,则
17、利用了第二问方案二所得的结果,把CD4单位周增长率所消耗的费用作为出发点,简洁而明确地说明了各治疗方法的优劣性。所得艾滋病治疗方法既综合了疗效,又考虑了费用。分析的结果,符合实际,具有一定的实际意义。六、 参考资料1 中华医学会,成人不同年龄组间CD4、CD8淋巴细胞计数值调查,2 XX百科,灰色预测, 3 汉中市卫生信息网,艾滋病诊疗指南,4 姜启源,数学模型,北京,高等教育出版社,19935 Shoichiro Nakamura美,科学计算引论基于MATLAB的数值分析,北京,电子工业出版社,2006附件:M 文件lag_func.m%功能:对一组数据作拉格朗日插值%x,y:已知数组%xi
18、:待计算数组的横坐标%fi:插值计算所得数组function fi=lag_func(x,f,xi)fi=zeros(size(xi);np1=length(f);for i=1:np1 z=ones(size(xi); for j=1: if i=j,z=z.*(xi-x(j)/(x(i)-x(j);endfi=fi+z*f(i);returncal_id_rep.m计算一组数据中相邻相同的数出现的次数%如1,1,1,1,2,2,5,5,5,5,7,7,8,7,8,8,1,1的计算结果是4,2,4,2,1,1,2,2function id_rep=cal_id_rep(PtID)k=0;i=
19、0;PtID=PtID,-1;for j=1:(length(PtID)-1) k=k+1; if PtID(j)=PtID(j+1) i=i+1; id_rep(i)=k; k=0 ; endans1.m计算本论文中第1问的f(0),f(5),f(10),f(15),f(20),f(30),f(40)每个病人的f(i)所构成的数组 i=0,5,10,15,20,30,40%id_rep:将题中PtID列数据(不包括未作测量的编号)cal_id_rep.m 计算得到的数组%week:题中CD4Date或RNADate列数据%amount:题中CD4Count或Vload列数据function
20、f0,f5,f10,f15,f20,f30,f40=ans1(id_rep,week,amount)x=0:1:40;tab=1;i=1;j=1;for k=1:length(id_rep) switch id_rep(k) case 2 for h=1: a2(i)=week(j); b2(i)=amount(j); j=j+1; y=lag_func(a2,b2,x); f0(tab)=y(1); f5(tab)=y(6); f10(tab)=y(11); f15(tab)=y(16); f20(tab)=y(21); f30(tab)=y(31); f40(tab)=y(41); tab=tab+1; i=1; case 3 a3(i)=week(j); b3(i)=amount(j); y=lag_func(a3,b3,x); case 4 a4(i)=week(j); b4(i)=amount(j); y=lag_func(a4,b4,x); case 55 a5(i)=week(j); b5(i)=amount(j); y=lag_func(a5,b5,x); case 66 a6(i)=week(j); b6(i)=amount(j); y=lag_func(a6,b6,x); case 77 a7(i)=week(j); b7(i)=amount(j); j=
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1