ImageVerifierCode 换一换
格式:DOCX , 页数:25 ,大小:71.01KB ,
资源ID:4433607      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4433607.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(生存分析概念.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

生存分析概念.docx

1、生存分析概念一、生存分析的概念:将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。研究生存现象和响应时间数据及其统计规律的一门学科。对一个或多个非负随机变量(生存时间)进行统计分析研究。对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的

2、统计规律的分析与推断方法的学科。“二、生存时间”(SurvivalTime)的概念生存时间也叫寿命、存活时间、失效时间等等。医学:疾病发生时间、治疗后疾病复发时间可靠性工程系:元件或系统失效时间犯罪学:重罪犯人的假释时间社会学:首次婚姻持续时间人口学:母乳喂养新生儿断奶时间经济学:经济危机爆发时间、发行债券的违约时间保险精算学:保险人的索赔时间、保险公司某一索赔中所付保费汽车工业:汽车车轮转数市场学中:报纸和杂志的篇幅和订阅费三、生存分析的应用领域:社会学,保险学,医学,生物学,人口学,医学,经济学,可靠性工程学等六、生存分析研究的目的1、描述生存过程:估计不同时间的总体生存率,计算中位生存期

3、,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。2、比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗生存分析课程总结方案较优。统计方法log-rank检验等。3、影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。统计方法Cox比例风险回归模型等。4、预测:建立Cox回归预测模型。主要研究内容描述生存过程:研究人群生存状态的规律,研究生存率曲线的变动趋势,是人寿保险业的基础。生存过程影响因素分析及结局预测:识别与反应、生存

4、及疾病等相关风险因素,预测生存结局,在临床中应用的非常广泛。七、主要分析方法1、参数法方法:首先要求观察的生存时间t服从某一特定的分布,采用估计分布中参数的方法获得生存率的估计值。生存时间的分布可能为指数分布、Weibull分布、对数正态分布等,这些分布曲线都有相应的生存率函数形式。只需求得相应参数的估计值,即可获得生存率的估计值和生存曲线。2、非参数方法:实际工作中,多数生存时间的分布不符合上述所指的分布,就不宜用参数法进行分析,应当用非参数法。这类方法的检验假设与以往所学的非参数法一样,假设两组或多组的总体生存率曲线分布相同,而不论总体的分布形式和参数如何。非参数法是随访资料的常用分析方法

5、。3、半参数方法:只规定了影响因素和生存状况间的关系,但是没有对时间(和风险函数)的分布情况加以限定。这种方法主要用于分析生存率的影响因素,属多因素分析方法,其典型方法是Cox比例风险模型。4、几种常用的统计软件:SAS,SPSS,Stata,Excel,R第二章数据类型一、完全数据(Completedata)每个个体确切的生产时间都是知道的。这样的数据称为完全数据(Completedata)。但在实际的生存分析中,数据在很多情况下是很难完全观察到的。二、删失(Censoring)09统计学【经济分析】2班吕嘉琦32009121304 1生存分析课程总结生存数据一个重要的特点是:在研究结束时,

6、无法获得某些个体确切的生存时间。例如:失去联系(病人搬走,电话号码改变),无法观察到结局(死于其他原因),研究截止,个体仍然存活在这些情况下获得的数据就是删失数据(Censoreddata)。对存在删失的个体,只知道删失时间(Censoringtime)。删失分为右删失(Right censoring)、左删失(Left censoring)和区间删失(Intervalcensoring)1、右删失(Rightcensoring)。在进行观察或调查时,一个个体的确切生存时间不知道,而只知道其生存时间大于时间L,则称该个体的生存时间在L上是右删失的,并称L为右删失数据(Right-censore

7、ddata)。右删失有三种类型(按结束时间差别):I型删失(Type I censoring)、II型删失(Type IIcensoring)和III型删失(TypeIIIcensoring)。(1)I型删失(TypeIcensoring):对所有个体的观察停止在一个固定的时间,这种删失即为I型删失(或定时删失)。例如:动物研究通常是以有固定数目的动物接受一种或多种处理开始,由于时间和费用的限制,研究者常常不能等到所有动物死亡。一种选择就是在一个固定时间周期内观察,在截止时间之后仍可能有些动物活着,但不继续观察了。这些动物的生存时间是不知道的,只知其不小于研究周期时间。I型删失的删失时间是固定

8、的。图表1I型删失示例(2)II型删失(TypeIIcensoring):同时对n个个体进行观察,一直到有一固定数目(rn)的个体死亡(失效)为止,这种删失即为II型删失。II型删失的删失时间是随机的。09统计学【经济分析】2班吕嘉琦32009121304 2生存分析课程总结图表2II型删失示例(3)III型删失(TypeIIIcensoring):所有个体在不同时间进入研究,某些个体在研究结束之前死亡,他们的确切生存时间是知道的,其他个体在研究结束之前退出研究而不被跟踪观察或在研究结束时仍然活着。进入研究的时间可能不同,删失时间也可能不同,这种删失叫做III型删失,又称为随机删失(Rando

9、mcensoring)。图表3III型删失示例2、左删失(Leftcensoring)研究对象在时刻Cl开始接受观察,而在此之前我们感兴趣的时间已经发生,这就是左删失。例如:“您初次吸食大麻是在什么时候?” 有一种回答:“我吸食过,但我不记得吸食的具”体时间了。这些回答的吸食时间数据就是左删失。通过测试确定儿童学会完成特定任务的年龄,有些儿童在进入研究前就已经可以完成某项特定任务,这些儿童的事件发生时间也是左删失。09统计学【经济分析】2班吕嘉琦32009121304 3生存分析课程总结出现左删失同时,也可能出现右删失,称为双删失(Doublecensoring)。例如:对吸食大麻的问卷还有一

10、种回答:“我从来没有吸食过”,这样的数据就是右删失。3、区间删失(Interval censoring):若个体的确切生存时间不知道,只知道其生存时间在两个观察时间 L和R之间(LR),则称该个体的生存时间在L,R上是区间删失的。实际工作中,凡是不能或者不愿作连续监测时就会遇到这样的区间删失。区间删失分两种:第一类区间删失(CaseIIntervalcensoring)和第二类区间删失(CaseIIIntervalcensoring)。当对个体只进行一次观察,且个体的确切生存时间不知道,只知道其生存时间是否大于观察时间(即L=0或R=),这种删失称为第一类区间删失,也称为现实状况数据(Curr

11、entdata)。当对个体进行次观察,其观察时间L和R 满足0LRt)=1-F(t),Tt)=1-F(t)=f(u)dutf(t)=-S(t)=-dS(t)dt生存函数S(t)的图像叫做生存曲线(SurvivalCurve),如下图:陡峭的生存曲线表示较低的生产率或较短的生存时间;平缓的生存曲线表示较高的生存率或较长的生存时间。离散生存时间产生于舍入操作将失效(或死亡)时间分组从区间和寿命用整数计量等。离散时间生存函数是非增的阶梯函数,当T 取值为a1a2t ait离散时间生存函数是非增的阶梯函数二、危险率函数(HazardFunction):危险率函数:描述观察个体在某时刻存活条件下,在以后

12、的单位时间内死亡的(条件)概率:(t)=limh0+P(Tt+hTth当T连续(t)=f(t)S(t)=-dlnS(t)dt;当T 离散,取值为a1a2t)=tr(0)为平均寿命。五、常用的参数模型生存时间的分布一般不呈正态分布。常用的分布有:指数分布、威布尔(Weibull)分布、伽玛(Gamma)分布、对数罗吉斯蒂(logistic)分布、对数正态分布。09统计学【经济分析】2班吕嘉琦32009121304 7生存函数形式为:s()=exp(t)0, 0危险率函数为:(t)= (t)生存分析课程总结1、指数分布t ,tt生存函数形式为:s()=exp(-t)0,t0密度函数为:f()=ex

13、p(-t)危险率函数为:()=指数分布的一个重要性质:无记忆性(某事件的发生时间与历史记录无关),即(PTt+hTt)=P(Tt)2、威布尔(Weibull)分布其中是尺度参数,是形状参数,=1时为指数分布。-1适用于危险率递增(取1)、递减(取1)和为常数(取=1)等各种情形。3、伽玛(Gamma)分布生存函数:s()=t0()其中()=u0-1exp(-u)du称为伽玛函数。第四章生存数据基本特征的非参数估计一、生存函数的估计假设事件发生在D个严格区分的时间点上:tt2Lt的个数个体总数二、右删失生存函数的估计:S(i)= L S(0)S(i)=PTtiTti)PTti-1Tti-1)LP

14、Tt2Tt2)PTt1Tt1)09统计学【经济分析】2班吕嘉琦32009121304 8生存分析课程总结)存在右删失下:PTtiTti=Yi-diYi,i=1,2,L,DGill(1980)建议最大观察时间点以后的生存函数S(t)=S(tmax),即假设最大时间点上的Yi:时刻ti面临危险的个体数;di:时刻ti失效个体数三、乘积限(product-limit)估计乘积限估计又称Kaplan-Meier估计) S(ti)= diti i阶梯函数,在观察时间点上发生跳跃;跳跃的高度ti与上发生的事件数和ti前删失数有关;超出观测上限的时间没有给出很好的估计。四、乘积限估计尾部修正Efron(19

15、67)建议最大观察时间点以后的生存函数等于0,即等价于假定最大时间点上的生存者马上就会死亡。(负偏估计)) )生存者永远不会死。(正偏估计)Brown、Hollander和Kowar(1974)建议尾部估计为一条指数曲线,即) )五、乘积限估计的方差2六、生存函数点估计的置信区间利用渐进正态性的线性置信区间:()()-Z1-2)1-2其他变换形式的非线性置信区间对数变换反正弦平方根七、累积死亡率的估计无删失条件下危险率函数的估计:09统计学【经济分析】2班吕嘉琦32009121304 9(t)=)生存分析课程总结在时间t开始的区间中死亡的个数在时间t存活着的个体数区间宽度有删失条件下累计死亡率

16、估计:t t1.直接利用累积死亡率与生存函数的关系:()=-lnS()2.Nelson-Aalen估计为0, tt)=P(X-t)纯粹左删失情况很少见。十二、同时存在左、右删失情况设0=t1t2LtR0)=P(X-tX)的乘积限估计式。十四、生命表中生存函数的估计生命表(也称寿命表,life table)方法是测定死亡率和描述群体生存现象的最古老的技术之一。主要用于保险精算、人口学、医学等方面。一组(大规模)个体在整个考察时间上被连续观察,它们的事件发生时间或删失时间被记入a (k+1个相邻但不重叠的区间内j-1,aj)j=1,L,k+1)2.第二列给出进入第j个区间的对象数Yj,这些个体还没

17、有经历观察事件的发生。间在区间上是均匀分布的,则Yj=Yi-Wj/2根据生命表方法应用的范围不同,可分为人口生命表和临床生命表,分析方法相似。生命表方法数据假设(1)独立删失:假定删失的事件时间(包括损失和退出)与它们如果一直被观察到事件发生所得到的死亡时间是独立的。(2)假定删失时间和死亡时间是均匀分布在每个区间上的。(3)假定死亡力在区间内是常数。生命表的构造方法1.第一列给出相邻但不重叠的固定区间a ( ,Ii=j-1,aj)j=1,L,k+1)a0=0,ak+1=事件发生时间和删失时间将落入且只落入其中的一个区间。3.第三列给出在第j个区间中失去踪迹(死亡)或活着退出观察(迁出)的个体数Wj4.第四列给出在第j个区间中,面临观察事件风险的暴露数Yj的一个估计值,假设删失时09统计学【经济分析】2班吕嘉琦32009121304 12生存分析课程总结5.第五列是在第j个区间中发生观察事件(如死亡)的个体数dj6.)S(j)=S(j-1 =(-dj/Yj)且ji=1a生命表分析的主要任务就是估计S(j),基本思想:乘积限方法。fa , aj+aj-1/7.第七列给出估计的第j个区间中点处的概率密度函数(mj)其中amj

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1