精品生存分析教程.pdf

上传人:b****2 文档编号:3213848 上传时间:2022-11-20 格式:PDF 页数:63 大小:1.11MB
下载 相关 举报
精品生存分析教程.pdf_第1页
第1页 / 共63页
精品生存分析教程.pdf_第2页
第2页 / 共63页
精品生存分析教程.pdf_第3页
第3页 / 共63页
精品生存分析教程.pdf_第4页
第4页 / 共63页
精品生存分析教程.pdf_第5页
第5页 / 共63页
点击查看更多>>
下载资源
资源描述

精品生存分析教程.pdf

《精品生存分析教程.pdf》由会员分享,可在线阅读,更多相关《精品生存分析教程.pdf(63页珍藏版)》请在冰豆网上搜索。

精品生存分析教程.pdf

随访资料的生存分析随访资料的生存分析内容内容一一、生存分析的基本概念生存分析的基本概念二二、生存率的生存率的Kaplan-Meier法法三三、生存率的生存率的LifeTable法法四四、Cox比例风险模型简介比例风险模型简介例1一一、生存分析的基本概念生存分析的基本概念例例1某医师收集了某医师收集了1998年年1月到月到2003年年2月月5年间用甲年间用甲、乙两种手术方法治疗肾上腺肿瘤病人的资料乙两种手术方法治疗肾上腺肿瘤病人的资料,以了解以了解患者术后结局及其可能的影响因素患者术后结局及其可能的影响因素。

术后记录的内容如术后记录的内容如下表下表:

-生存生存手术手术手术手术随访终止随访终止时间时间病历号病历号性别性别年龄年龄方法方法时间时间时间时间结局结局组织类型组织类型(月(月)-217328男男54甲甲98.02.1499.01.01失访失访高分化高分化10+225468女女61甲甲00.08.2703.02.28存活存活低分化低分化30+227347男男75乙乙02.04.1102.08.20死亡死亡高分化高分化4232435男男45乙乙99.11.0702.02.02死亡死亡高分化高分化26224562女女52乙乙03.01.2503.02.28存活存活低分化低分化1+.-两种手术方法的术后疗效比较两种手术方法的术后疗效比较:

-手术手术生存生存死亡死亡合计合计生存率生存率%-甲方法甲方法72269877.6乙方法乙方法6997888.5-合计合计1413517680.1-手术手术生存生存死亡死亡合计合计病死率病死率%-甲方法甲方法72269822.4乙方法乙方法6997811.5-合计合计1413517619.9-生存分析(生存分析(survivalanalysis)

(1)就是将事件的就是将事件的结果结果和出现这一结和出现这一结果所经历的果所经历的时间时间结合起来分析的一种统计分析结合起来分析的一种统计分析方法方法,它不仅可以从它不仅可以从事件结局的好坏事件结局的好坏,如疾病如疾病的痊愈(成功的痊愈(成功)和死亡(失败)和死亡(失败),而且可以从而且可以从事件的事件的持续时间持续时间进行分析比较进行分析比较,如某病经治疗如某病经治疗后存活的时间长短进行分析比较后存活的时间长短进行分析比较。

(2)能同时分析有结局的完全数据和没有结能同时分析有结局的完全数据和没有结局的不完全数据局的不完全数据,充分利用了信息充分利用了信息。

因而能够更为全面地反映某种治疗的效果因而能够更为全面地反映某种治疗的效果。

生存时间(生存时间(survivaltime)是指任何两个有联系事件之间的时间间隔是指任何两个有联系事件之间的时间间隔,常常用符号用符号t表示表示。

狭义的生存时间是指患某种疾病的病狭义的生存时间是指患某种疾病的病人到死亡所经历的时间跨度人到死亡所经历的时间跨度,而广义的生存时间可定而广义的生存时间可定义为从某种起始事件到某种终点事件所经历的时间跨义为从某种起始事件到某种终点事件所经历的时间跨度度。

例如例如,急性白血病病人从治疗开始到复发为止之间急性白血病病人从治疗开始到复发为止之间的缓解期的缓解期;冠心病病人两次发作之间的时间间隔冠心病病人两次发作之间的时间间隔。

戒烟开始到复发吸烟之间的时间长短戒烟开始到复发吸烟之间的时间长短;接触危险因素到发病等接触危险因素到发病等。

生存分析中最基本的一点就是计算生存生存分析中最基本的一点就是计算生存时间(小时时间(小时、日日、月月、年年)生存时间生存时间=事件终点事件终点事件起点事件起点事件终点事件终点:

(1)有完整结局的事件有完整结局的事件-完全数据完全数据

(2)无完整结局的事件无完整结局的事件-截尾数据截尾数据两种数据类型两种数据类型:

完全数据(完全数据(completedata):

从起点至死亡所从起点至死亡所经历的时间经历的时间,即死者的存活时间即死者的存活时间。

完全数据提供了完全数据提供了病人确切的死亡时间病人确切的死亡时间,是生存分析的主要依据是生存分析的主要依据。

截尾数据(截尾数据(censoreddata):

在随访工作中在随访工作中,由由于某种原因未能观察到病人的明确结局(即终于某种原因未能观察到病人的明确结局(即终止事件)止事件),所以不知道该病人的确切生存时间所以不知道该病人的确切生存时间,称之为截尾称之为截尾。

从起点至截尾点所经历的时间从起点至截尾点所经历的时间,称为截尾数据称为截尾数据。

它能提供部分信息它能提供部分信息,说明病人说明病人在某时刻之前没有死亡在某时刻之前没有死亡,一般用于确定暴露人一般用于确定暴露人口口。

产生截尾数据的原因产生截尾数据的原因:

病人失访病人失访。

由于搬迁而失去联系由于搬迁而失去联系,或由于其他原因或由于其他原因死亡死亡,而未观察到规定的终点事件而未观察到规定的终点事件。

病人的生存期超过了研究的终止期病人的生存期超过了研究的终止期,如研究计划规如研究计划规定只对病人随访定只对病人随访5年年,但有的病人的生存但有的病人的生存期超过了期超过了5年年,或者由于病人进入研究或者由于病人进入研究的时间较晚的时间较晚,虽然对他的随访期未满虽然对他的随访期未满5年年,但已到研究的截止时间但已到研究的截止时间。

在动物实验中在动物实验中,有时事先规定观察期限或动物数有时事先规定观察期限或动物数。

虽然有一部分动物在到达实验终止日期时虽然有一部分动物在到达实验终止日期时尚未现出规定的终止事件尚未现出规定的终止事件,但仍停止实但仍停止实验验,或者当达到了事先规定的终止事件的或者当达到了事先规定的终止事件的动物数后实验停止动物数后实验停止。

生存时间资料的特点生存时间资料的特点:

效应变量有效应变量有2个个,即即生存时间生存时间(天数(天数)和和结局结局(死亡与否(死亡与否、是否复发是否复发、是否阳性等)是否阳性等)。

存在截尾数据存在截尾数据。

分布类型复杂分布类型复杂生存时间资料常通过随访获得生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素因观察时间长且难以控制混杂因素,故其分布故其分布类型复杂类型复杂,常呈指数分布常呈指数分布、Weibull分布分布、对数对数正态分布正态分布、对数对数logistic分布或更为复杂的分布分布或更为复杂的分布,生物医学中的是生存时间分布呈现偏态和不规生物医学中的是生存时间分布呈现偏态和不规则状态则状态,影响因素较多影响因素较多,因此难以用传统的统因此难以用传统的统计方法对这类数据进行处理计方法对这类数据进行处理。

常见的随访方式有两种常见的随访方式有两种:

全体观察对象同时接受处理措施全体观察对象同时接受处理措施,观察到最后观察到最后一例出现结果一例出现结果,或者事先规定的随访截止时间或者事先规定的随访截止时间,如图如图b。

图中图中“”表示“死亡表示“死亡”,“o”表示失访表示失访、退退出研究或死于与本处理无关的其他原因出研究或死于与本处理无关的其他原因。

0始点t终点b时间全体观察对象在不同时间接受治疗处理全体观察对象在不同时间接受治疗处理,根据完成一定根据完成一定数量随访病例决定随访截止时间数量随访病例决定随访截止时间,或按事先规定的时或按事先规定的时间停止随访间停止随访,这是临床试验最常见的形式这是临床试验最常见的形式,如图如图a。

如病人在不同时间接受心脏移植手术如病人在不同时间接受心脏移植手术,有的病人可能术后有的病人可能术后20年仍然存活年仍然存活,而随访难以持续那么长的时间而随访难以持续那么长的时间,可根可根据不同的研究内容据不同的研究内容,按设计时的要求观察到预定时间按设计时的要求观察到预定时间,如如3年或年或5年即截止随访年即截止随访。

0始点t终点a时间生存时间资料的基本要求生存时间资料的基本要求样本由随机抽样方法获得样本由随机抽样方法获得,有代表性有代表性,并并应有足够的数量应有足够的数量。

死亡例数不能太小死亡例数不能太小;截尾值比例不能太大截尾值比例不能太大。

截尾原因无偏性截尾原因无偏性如老年患者常因不重视随访而如老年患者常因不重视随访而失访失访,由此可能使估计的生存率偏高由此可能使估计的生存率偏高。

为防止截尾为防止截尾偏性偏性,常需对被截尾者的年龄常需对被截尾者的年龄、职业和地区等构成职业和地区等构成情况进行分析情况进行分析。

缺项要尽量补齐缺项要尽量补齐。

生存分析研究的主要内容生存分析研究的主要内容描述生存过程描述生存过程-研究生存时间的分布特点研究生存时间的分布特点,估计生存率估计生存率及平均存活时间及平均存活时间,绘制生存曲线等绘制生存曲线等。

-根据生存时间的长短根据生存时间的长短,可以估计出各时可以估计出各时点的点的生存率生存率,并根据生存率来估计并根据生存率来估计中位生中位生存时间存时间。

同时也可根据同时也可根据生存曲线分析其生生存曲线分析其生存特点存特点。

比较生存过程比较生存过程-可通过生存率及其标准误对各样本的可通过生存率及其标准误对各样本的生存率进行比较生存率进行比较,以探讨各组间的生存以探讨各组间的生存过程是否有差别过程是否有差别。

例如比较手术治疗和化学治疗乳腺癌患例如比较手术治疗和化学治疗乳腺癌患者的生存率者的生存率,以探讨何种治疗方案较好以探讨何种治疗方案较好。

影响生存时间的因素分析影响生存时间的因素分析-其重点是通过生存分析模型来探讨时其重点是通过生存分析模型来探讨时间及结局作为因变量而将影响他们的因间及结局作为因变量而将影响他们的因素作为自变量素作为自变量,比如年龄比如年龄、性别性别、病理病理分期分期、治疗方式等治疗方式等。

-通过模型分析找出影响和生存时间的通过模型分析找出影响和生存时间的保护因素和不利因素保护因素和不利因素。

二二、生存率的生存率的Kaplan-Meier法法也称未分组资料的生存分析也称未分组资料的生存分析。

其特点是其特点是:

-当随访的病例数较少时当随访的病例数较少时,不需要将病人的不需要将病人的随访时间进行分组随访时间进行分组。

-根据实际资料计算不同时间的死亡概率和根据实际资料计算不同时间的死亡概率和生存概率生存概率,然后采用条件概率及概率乘法然后采用条件概率及概率乘法的原理计算生存率的原理计算生存率。

在在SPSS的的survival菜菜单中单中,可选择可选择Kaplan-Meier过程计算生存过程计算生存率率。

1.死亡概率和生存概率死亡概率和生存概率q=某年内死亡数某年年初观察例数1pq=某年活满一年人数某年年初人口数校正人口数校正人口数=(年初人口数年初人口数截尾例数截尾例数)2.生存率生存率(survivalrate)-记为记为S(ti),指某观察对象经历指某观察对象经历ti个单位个单位时间之后仍存活的概率时间之后仍存活的概率,-如如S(15),表示某观察对象活过表示某观察对象活过15天天(或或月月、年年)之后仍存活的概率之后仍存活的概率-生存率即累计生存概率生存率即累计生存概率S(ti)=P(Tti)=P1P2P3Pi3.半数生存期半数生存期(mediansurvivaltime)及及四分位数间距四分位数间距QT50=生存率为生存率为0.5时所对应的时间时所对应的时间表示有表示有50%的个体可活到这个时间的个体可活到这个时间,反映生存反映生存期的平均水平期的平均水平,也称中位生存时间也称中位生存时间.Q=T25T75表示中间半数病人生存期的分布范围表示中间半数病人生存期的分布范围.T25是第是第25百分位数百分位数,25%T75是第是第75百分位数百分位数,75%例例1.某医师比较某医师比较A、B两种药物治疗某肿瘤病人后的两种药物治疗某肿瘤病人后的效果效果。

收集的资料有收集的资料有

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 畜牧兽医

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1