生存分析 PPT-软装分析ppt.ppt
《生存分析 PPT-软装分析ppt.ppt》由会员分享,可在线阅读,更多相关《生存分析 PPT-软装分析ppt.ppt(117页珍藏版)》请在冰豆网上搜索。
生存分析survivalanalysis,医学研究中,为了解某种疾病(如慢性病、恶性肿瘤等)的预后及远期疗效、评价治疗方法的优劣或观察预防保健措施的效果等,常需对研究对象进行追踪观察,以获得必要的数据(如病人的生存时间、治疗后病情缓解情况及持续时间等),这类资料都属于随访资料。
随访资料是指对一批研究对象进行追踪观察所获得的有关其结局以及出现这种结局所经历的时间等方面的资料。
由于随访资料的分析最初起源于对寿命资料的统计分析,故称为生存分析,或称为生存时间分析。
2,何为生存分析,3,传统方法在分析随访资料时存在的困难1,随访结局和时间都成为了要关心的因素原有的疗效指标如有效率、治愈率等难以适用。
除了关注是否出现某种结局(如有效、治愈、死亡等),还要考虑出现这些结局所经历的时间长短。
如:
除了随访结局作为判定标准以外,只要能让病人存活时间延长,这种药物也应当被认为有效。
即时间延长也认为有效。
将两者均作为因变量拟合多元模型极为困难(“时间”分布不明,一般不呈正态分布,在不同情况下的分布规律也不同)。
4,传统方法在分析随访资料时存在的困难2,存在大量失访的资料失去联系(病人搬走,电话号码改变)无法观察到结局(死于其他原因)研究截止显然,无论是将失访数据算作“死亡”还是“存活”似乎都不大合理。
生存分析是将研究对象的观察结局和出现这一结局所经历的时间结合起来分析的一种统计分析方法。
并能充分利用所获得的信息,达到较准确、全面地评价和比较随访资料的目的,是临床试验和队列研究的一种重要分析手段。
5,生存分析的历史与应用,17、18世纪:
寿命表的提出及其应用。
1926年:
Greenwood提出评价生存函数的误差的方法Greenwood公式。
1958年:
生存函数的计算方法Kaplan-Meier法(乘积极限法product-limit)的提出。
1960年代中叶:
生存时间的组间比较方法的开发广义Wilcoxon秩和检验(Gehan,1965年);对数秩检验(log-ranktest,又称时序检验)Mantel,1966年。
1970年:
将协变量的影响模型化参数模型(假设生存时间服从Weibull分布、对数正态分布等);半参数模型(比例风险模型,又称Cox回归模型)Cox,1972年。
主要内容,概述生存分析的基本概念、资料要求生存率估计的非参数法乘积极限法、寿命表法生存率的比较Log-rank检验Cox比例风险回归模型,6,7,1概述,生存分析的方法已被广泛应用到医学研究领域,如现场追踪研究、临床疗效试验、疾病预后分析等,生存时间的涵义也随之扩展到更广义的范围,又称为时间-效应分析(time-effectanalysis)。
其研究内容主要包括:
对生存状况进行统计描述(生存概率、生存率、中位生存期等);寻找影响生存时间的“危险因素”和“保护因素”;估计生存率和生存时间长短,进行预后评价。
8,随访研究,例:
某医师收集了1992年1月1日到2001年12月31日10年间共346例手术后的大肠癌患者资料,以了解患者术后生存情况及其可能的影响因素。
表22-110年间346例手术后的大肠癌患者生存资料记录表,随访过程示意图,9,10,一、生存分析中的基本概念,1.起始事件、终点事件2.生存时间3.死亡概率、死亡率4.生存概率、生存率、生存函数5.生存率曲线6.中位生存期7.危险率函数,11,基本概念,
(一)起始事件、终点事件起始事件(initialevent):
反映研究对象生存过程的起始特征的事件。
如癌症患者接受某种特定的治疗、铅作业工人开始职业性铅接触等。
终点事件(endpointevent):
又称失效事件(failureevent),指研究者所关心的研究对象的特定结局。
如患者死于癌症、工人出现重症铅中毒症状等。
12,基本概念,
(二)生存时间定义:
广义的生存时间(survivaltime):
也称失效时间(failuretime),指从某个起始事件开始到某个终点事件的发生(出现反应)所经历的时间。
13,疾病确诊死亡疾病确诊痊愈治疗开始死亡治疗开始痊愈症状缓解疾病恶化接触毒物出现毒性反映接触危险因素发病出生出现第一颗乳牙开始戒烟(毒)再次吸烟(毒),起始事件,终点事件,随访时间,生存时间,14,基本概念,
(二)生存时间特点:
1.分布类型不易确定。
一般不服从正态分布,有时近似服从指数分布、Weibull分布、Gompertz分布等,多数情况下往往不服从任何规则的分布类型。
2.生存时间的影响因素多而复杂且不易控制。
15,基本概念,
(二)生存时间特点:
3.根据研究对象的结局,生存时间数据可分为:
(1)完全数据(completedata):
研究对象在观察期内出现反应(终点事件),这时记录到的时间信息是完整的,这种生存时间数据称为完全数据。
(2)截尾数据(截尾值、删失数据,censoreddata):
观察期内尚未观察到研究对象出现反应(终点事件)时,即由于某种原因停止了随访,这时记录到的时间信息是不完整的,这种生存时间数据称为不完全数据或截尾值。
表示为“”,16,基本概念,
(二)生存时间特点:
3.根据研究对象的结局,生存时间数据可分两种类型:
(1)完全数据
(2)截尾数据截尾的原因失访:
生存但中途失访,包括拒绝访问、失去联系等。
退出:
中途退出试验、改变治疗方案、死于其它与研究无关的原因:
如肺癌患者死于心机梗塞、自杀或因车祸死亡,终止随访时间为死亡时间。
终止:
指观察期结束时仍未出现结局。
17,随访资料常见形式,18,基本概念,
(二)生存时间生存时间资料的收集与整理:
对于随访资料,需记录的原始数据包括开始观察的时点(起始事件发生的时间)、终止观察的时点、研究对象的结局、考虑的影响因素等。
生存时间t为反映时间长短的指标,属数值变量:
生存时间(t)=终止观察的时点开始观察的时点;结局变量反映终点事件是否发生,为二分类的变量。
通常用(t,)完整地表示一个观察对象的随访结果。
19,20,基本概念,(三)死亡概率、死亡率死亡概率(mortalityprobability):
是指某单位时段期初的观察对象在该单位时段内死亡的可能性大小。
若某时段内有删失,则分母用校正人口数:
21,基本概念,(三)死亡概率、死亡率死亡率(mortalityrate):
指单位时间内研究对象的死亡频率或强度,即平均每千人(或万人、百人等)中的死亡人数。
平均人口数=(该时段期初人口数+期末人口数)/2,22,基本概念,(四)生存概率、生存率、生存函数生存概率(survivalprobability):
表示某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小。
若该时段内有删失,则分母用校正人口数。
23,基本概念,(四)生存概率、生存率、生存函数生存率(survivalrate):
指研究对象经历t个时段后仍存活的概率,即生存时间大于等于t的概率,用P(Tt)表示。
生存函数(survivalfunction):
生存率随时间t变化而变化,即生存率是相对于时间t的函数,记为S(t)。
生存函数在某时点的函数值就是生存率。
24,25,基本概念,(五)生存率曲线生存率曲线(survivalcurve):
指以时间为横轴、生存率为纵轴,将各个时点的生存率连接在一起的曲线图。
阶梯形:
小样本资料用直接法估计的生存曲线;折线形:
大样本资料用频数表法估计的生存曲线。
26,27,28,基本概念,(六)中位生存期中位生存期(mediansurvivaltime):
也称半数生存期,即生存时间的中位数,表示生存率等于50%时的时间。
反映生存时间的平均水平。
由于生存时间并非正态分布,故常用中位生存期作为某人群生存过程的概括性描述指标。
中位生存期越长,表示疾病预后越好;中位生存期越短,表示疾病预后越差。
利用生存曲线图或线性内插法估计,29,基本概念,(七)危险率函数危险率函数(hazardfunction):
指t时刻尚存活的研究对象死于t时刻后一瞬间的概率,为条件概率。
即活到t时刻的条件下在tt+t这一微时段内死亡的概率,用h(t)表示。
T为观察对象的生存时间危险率函数也称为死亡力(forceofmortality)、瞬时死亡率(instantaneousfailurerate)等。
30,危险率函数与生存函数的关系,31,h1(t)是一种上升的曲线,表示危险率随时间变化而增加,如急性白血病患者治疗无效其危险率随时间呈增加趋势;h2(t)的曲线为下降趋势,表示危险率逐渐减小,如意外事故造成的外伤经有效治疗后死亡的危险性逐渐减小;h3(t)为一种稳定的危险率函数,如某些慢性病患者在稳定期,其危险率基本不变。
h4(t)为一种山峰型曲线,表示危险率先增大后降低。
32,二、生存分析对资料的基本要求,1.样本由随机抽样方法获得,要有一定的数量。
2.完全数据所占的比例不能太少,即截尾值不宜太多。
3.截尾值出现的原因无偏性。
为防止偏性,常需对截尾的研究对象的年龄、职业、地区、病情轻重等情况进行分析。
4.生存时间尽可能精确。
因为许多常用的生存分析方法都在生存时间排序的基础上作统计处理,即使小小的舍入误差也可能改变生存时间顺序而影响结果。
5.缺项要尽量补齐。
33,三、生存分析的方法,1非参数法:
其特点是不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行估计,常用的方法有乘积极限法和寿命表法。
2参数法:
其特点是假定生存时间服从于特定的参数分布,根据已知分布的特点对影响生存时间的因素进行分析,常用的方法有指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法等。
3半参数法:
兼有非参数法和参数法的特点,主要用于分析影响生存时间和生存率的因素,属多因素分析方法,典型方法为Cox模型分析法。
乘积极限法(product-limitmethod):
小样本未分组资料寿命表法(lifetablemethod):
大样本分组资料,34,2生存率估计的非参数法,乘积极限法(product-limitmethod)是由Kaplan和Meier在1958年首先提出,故又称Kaplan-Meier法(K-M法)。
该法主要适用于样本含量较小的资料。
35,一、乘积极限法,例:
用某中药+化疗(中药组)和化疗(对照组)两种疗法治疗白血病后,随访记录患者死前存活月数,结果如下。
试分别估计两组的生存率并绘制生存率曲线。
中药组(n=16):
102+12+13186+19+269+8+6+43+943124对照组(n=10):
2+137+11+61113177,乘积极限法估计生存率的步骤:
1.将n个样本观察值(生存时间t)由小到大依次排列,秩次i=1,2,n。
如非截尾值与截尾值相同,将非截尾值排在前面。
2.列出各时点(实为一短的时间单位)的死亡例数。
截尾值对应的死亡数为0。
3.列出各时点(实为一短的时间单位)开始时的存活数,即期初观察单位数ni。
36,乘积极限法,乘积极限法估计生存率的步骤:
4.计算各时点死亡概率q及生存概率p。
5.求活过各时点的生存率S(ti),等于从开始观察时点到ti时点各生存概率的连乘积。
37,乘积极限法,生存率的区间估计:
以上计算出的样本生存率是总体生存率的点估计,进一步求得各生存率的标准误,即可按照近似正态分布原理估计总体生存率的可信区间。
38,乘积极限法,39,40,绘制生存率曲线常绘制成阶梯形的曲线。
方法是将各非截尾值及其对应的生存率标在直角坐标纸上,然后将各点垂直向下再水平向右连成阶梯形。
41,乘积极限法,图16-2两种疗法治疗后白血病患者的生存率曲线,42,1.曲线阶梯形不能用直线或曲线连接相邻的两个生存率散点。
随着死亡时点增多,曲线的阶梯形逐渐不明显。
2.曲线左连续每一级台阶的右端为断点,当前死亡时点处的纵坐标值在下一个台阶。
3.曲线尾部不稳定随着时间的增加,观察例数越来越少,误差越来越大,曲线尾部极不稳定。
在多组比较