队列研究.docx
《队列研究.docx》由会员分享,可在线阅读,更多相关《队列研究.docx(14页珍藏版)》请在冰豆网上搜索。
队列研究
第五章队列研究★
第一节概述
⏹队列研究(cohortstudy)
也称前瞻性研究prospectivestudy,随访研究follow-upstudy,纵向研究longitudinalstudy等。
暴露结局(疾病)
一、基本概念
⏹队列研究的重要概念
⏹队列cohort
⏹暴露exposure
⏹危险因素riskfactor
⏹保护因素protectivefactor
1、队列的概念:
拥有同一属性的某一组人。
a)2013年南京市常住人口
b)2010年到2014年南医大注册的所有学生
c)出生队列birthcohort:
出生于同一时期的人组成的特殊队列
1)队列可以是流动(有人员出入)的,也可以是固定的(相对固定,没有人员流动,成员不可以同时是非成员)
2、暴露的概念:
研究对象接触过的某种待研究的物质,或具有某种待研究的特征或行为。
(理解)物质:
病原体、毒物。
。
。
特征:
年龄、性别、血压、血糖。
。
。
行为:
吸烟、饮酒、工作类型。
。
。
二、基本原理
⏹选定一组研究人群,根据过去或目前的暴露情况进行分组
☐有无暴露因素:
暴露组和非暴露组
☐暴露因素的水平:
低、中、高剂量组
⏹随访观察各组的观察结局(发病或死亡)
⏹比较各组发病率或死亡率的差异,从而判定暴露因素与发病有无因果关联及关联大小
队列研究的特点:
1、研究对象是还没出现研究结局,但有可能出现研究结局的人群(susceptiblepopulation)
需设立纳入及排除标准
⏹剔除已生病个体或明确不会生病的个体
⏹在进行传染病危险因素的研究时,需考虑个体被感染的几率
2、属于观察性研究,根据暴露的自然存在状态分组,无人为控制,也不存在随机分组
3、时间顺序:
从“因”到“果”,可确定因果关系(疾病发生之前已经确定了研究对象的暴露情况)
4、前瞻性研究,可计算发病率、死亡率等率的指标
三、队列研究的用途
⏹检验病因假设是主要用途和目的
⏹评价预防效果
⏹研究疾病的自然史
⏹新药的上市后监测
四、队列研究的类型
1、前瞻性队列prospectivecohort
也称即时性或同步性(concurrent)队列
开始研究时确定对象、分组,经随访得到结局
¡优点:
资料准确
¡缺点:
样本大,花费大,时间长
建立队列时要特别考虑能否负担得起,能否获得想要的结果!
2、回顾性队列retrospectivecohort
也称历史性(historical)或非即时性(non-concurrent)队列
研究开始时疾病结局已发生,研究对象是过去进入队列的,分组依据的是过去的暴露资料
¡优点:
省人、物、时
¡缺点:
依赖历史资料的完整与可靠,常缺乏混杂因素的资料
3、双向性队列ambispectivecohort
历史队列后继续进行前瞻性队列
¡最适合于对人体健康同时具有短期和远期效应的暴露因素研究
第二节研究设计与实施
一、确定研究因素
队列研究最主要的目的:
进一步验证现况调查或病例对照研究中已发现的有特异影响、且在统计学上有联系的危险(或保护)因素。
暴露因素分类:
1)暴露水平:
定量标准化,累积暴露
2)暴露方式:
短期/长期、直接/间接、持续/间隔
二、确定研究结局
结局变量outcomevariable
也称结果变量,是随访中将出现的预期结果事件,也即研究者希望追踪的事件,是希望观察的自然终点,并非观察期的终止。
(结局是队列研究观察的终点,也就是研究对象已达结局变量就停止对其的观察;观察期是整个队列研究的时长,整个队列中研究对象不止一个人)
☐研究结局的确定应全面、具体、客观
发病、死亡、指标变化。
。
。
☐结局变量的测定应有明确统一的标准,并在研究全过程中严格遵守
三、确定研究现场和研究人群
(一)研究现场:
可行性+可靠性+科学性
☐有足量研究对象
☐领导重视
☐群众配合
☐交通方便
☐文化水平、医疗卫生条件好
(二)研究人群:
即队列的建立
☐人口相对稳定,方便进行随访
☐医疗卫生记录较完整、容易查询
☐无明显的环境污染
☐被研究的疾病发病率较高
☐被选择人群的合作程度好、领导支持
1、暴露人群的选择
☐一般人群:
常见暴露因素研究
☐特殊人群:
对罕见因素暴露的高危人群
如职业人群:
联苯胺致膀胱癌——染料厂工人
石棉致肺癌——石棉厂工人
特殊暴露人群:
放射线与白血病——原子弹爆炸受害者,放射治疗者等
有组织的团体:
一般人群的特殊形式
2、对照人群的选择可比性
☐内对照internalcontrol:
先选择一组研究人群,然后根据暴露情况进行分组
选择对照容易,但易受暴露污染(可比性好)
☐外对照externalcontrol:
选择职业人群或特殊暴露人群为暴露组,则需在该人群外去寻找平行的对照组
可避免暴露污染,但难度较大
☐总人口对照totalpopulationcontrol:
以全人口率为对照,也称一般人群对照
资料较易获得,但不与暴露组平行,可比性差,暴露组也可能包括在内
使用时需进行率的标化
☐多重对照multiplecontrols:
同时采用上述多种对照
可减少一种对照带来的偏倚,但工作量大
四、确定样本量
决定因素:
1、一般人群(非暴露组的)所研究疾病的发病或死亡率(P0),P0越接近0.5,样本越大
2、暴露组与对照组人群发病率之差d=P1-P0,暴露组疾病的发病或死亡率(P1),或相对危险度(RR)估算P1,d越大,样本越小
3、显著性水平:
第一类错误概率α
4、把握度(1-β):
β为第二类错误概率
注意事项:
⏹一般对照组样本数≥暴露组的样本数
⏹估计失访对数据分析的影响,一般按估计样本量增加10%作为实际样本量
五、资料的收集与随访
1、基线资料收集baselinedata
暴露的资料,个体的其他信息
来源:
1)查阅各种常规记录2)调查询问3)医学检查4)环境测量
2、随访followup
⏹随访的目的
¡确定分母的信息
研究对象是否仍处于观察中
¡确定分子信息
确定研究人群结局事件的发生
¡相关资料的收集
有关暴露和混杂因素的资料
⏹随访方法——以调查表为工具
¡常规记录或档案
¡定期调查,进行特殊安排的随访
¡环境调查与检测
⏹观察终点(endpoint)、随访期限和时间间隔
明确开始时间与终止时间
⏹失访(lossestofollow-up)的问题
⏹观察终点endpoint
研究对象出现了预期的结果,可不再随访
⏹研究对象未出现预期结果,但无法继续随访,则认为失访
⏹失访的情况在资料分析时作为结尾数据(censoreddata)
六、质量控制
⏹调查员的选择
⏹调查员培训
⏹制定调查员手册
⏹监督
每一次随访都是一次现况调查
第三节资料的整理与分析
基本步骤
⏹描述性分析,描述研究对象的组成、随访的经过、随访时间、结局的发生情况、失访情况等,并对两组的一般情况做均衡性检验
⏹两组率的描述、比较,进行关联强度的计算
⏹根据上述结果和研究中可能存在的偏倚,作出解释
一.队列发病率的计算
1、累积发病率cumulativeincidence,CI
☐定义:
某一固定人群在一定时期内某病新发生例数(D)与时期开始时总人数(N)之比
☐前提:
研究人群数量比较多,人口比较稳定,资料整齐
☐
公式:
2、发病密度incidencedensity,ID
⏹前提:
队列为一动态人群,人口不稳定,观察人数变动较大(失访、迁移、死于它病、中途加入等)
发病密度(ID)=观察期内的发病人数/观察人年数
人时的概念
☐观察人数乘以随访单位时间的积
☐人时是将人数和时间结合起来考虑的一种度量单位,它是观察人群中全部个体暴露于研究因素的时间总和
☐时间单位常用年,故又称人年数(person-years)
意义:
既说明该人群发生的新病例数,又说明该人群的大小和发生这些例数所经历的时间
3、标化比standardmortalityratio,SMR
标准死亡率就是全人口的死亡率
❑SMR>1,说明暴露导致或促进了结局的发生
❑SMR<1,说明暴露预防或减少了结局的发生
❑SMR=1,说明暴露与疾病没有关系(加不加暴露因素对于死亡率没有影响)
EG:
SMR=2/1=2
说明该厂30~40岁工人死于肺癌的危险性是一般人群的2倍
二、两组率差异的显著性检验
三、暴露和疾病关联强度指标及计算
⏹比较暴露组和对照组的率的差值——绝对值
⏹比较暴露组和对照组的率的比值——相对值
☐相对危险度
☐归因危险度
☐归因危险度百分比
☐人群归因危险度
☐人群归因危险度百分比
1、相对危险度Relativerisk,RR
概念:
暴露组某病发病率(或死亡率)与非暴露组该病发病率(或死亡率)之比,是反映暴露因素和疾病关联强度的一个指标
公式:
意义:
RR说明暴露组发病(死亡)的危险性是非暴露组的多少倍
相对危险度判断标准
RR95%可信区间(不包括1,说明暴露与疾病的关联有统计学意义,有关联)
Woolf法
RR=1,两组的发病率和死亡率没有差别
RR>1,暴露组的发病率或死亡率高于非暴露组,暴露可增加发病或死亡的危险
RR<1,暴露组的发病率或死亡率低于非暴露组,暴露可减少发病或死亡的危险
RR值离1越远,表明暴露的效应越大,暴露与结局关联的强度越大。
2、归因危险度Attributablerisk,AR
概念:
也称率差(ratedifference,RD)、特异危险度、超额危险度,为暴露组的发病(死亡)率与非暴露组的发病(死亡)率之差
意义:
AR表示暴露组中完全由暴露因素所致的发病(死亡)率,说明暴露的生物学效应
公式:
⏹RR具有病因学的意义
⏹AR更具有疾病预防和公共卫生学的意义
3.归因危险度百分比Attributableriskpercentage,ARP
概念:
又称病因分值,是指暴露人群中发病归因于暴露的成分占全部病因的百分比
公式:
暴露组的死亡率
4、人群归因危险度populationattributablerisk,PAR
概念:
人群中由于暴露于某因素导致的发病率或死亡率,说明暴露的社会效应
公式:
It为全人群某病发病(死亡)率;Io为非暴露组的某病发病(死亡)率
5、人群归因危险度百分比Populationattributableriskpercentage,PARP或PAR%
概念:
人群中因暴露于某因素所致的发病(死亡)占人群发病(死亡)的百分比,也即说明消除该因素后产生预防该病的效果占多大比重,具有公共卫生学意义,说明暴露的社会效应
公式:
PAR和PAR%既与RR和AR相关,也与人群中暴露者所占的比例相关
□RR和AR很高,但PAR和PAR%不高,说明某因素对全人群影响不大,但对高危人群影响很大,可对高危人群重点防制
□RR,AR,PAR和PAR%都很高,说明某因素对全人群的影响很大,宜全民防制
Eg:
AR%=(Ie-I0)/Ie=93.30%
说明在感染HBV的男性中,93.30%的HCC死亡病例是由于感染了HBV造成的
PAR=It-I0=1.38/10万人年
说明在全人群中,因为HBV感染造成的HCC死亡率为1.38/10万人年
PAR%=(It-I0)/It=66.67%
说明在全人群中,66.67%的HCC死亡病例是由于感染了HBV造成的
⏹PAR=1.38/10万人年,说明如果能够消除HBV感染,可以减少的HCC死亡率为1.38/10万人年
⏹PAR%=66.67%,说明如果能够消除HBV感染,全人群中66.67%的HCC死亡病例可减少
6、剂量-反应关系的分析
⏹率的趋势性检验
⏹有剂量-效应关系,暴露作为病因的可能性越大
第四节队列研究的偏倚及控制
1、选择偏倚selectionbias
¡有人拒绝参加
¡有些人档案丢失或记录不全
¡早期病人在开始时未能发现
¡研究对象由志愿者组成,其健康水平或习惯特征与总人群有差异
队列研究特有的选择偏倚
⏹失访偏倚lossestofollow-up
队列研究不可避免的偏倚,破坏了原有样本的代表性,一项研究的失访率最好不超过10%
原因:
迁出、外出、不再合作、死亡
影响:
失访率、失访者特征、两组失访差异
控制方法:
尽可能提高研究对象的依从性
⏹健康工人效应health-workereffect
在研究职业暴露因素时以一般人群为对照组时产生的偏倚,暴露组为健康工人,发病率或死亡率较低
控制方法:
不采用一般人群为对照,选择除暴露因素外其他因素一致的职业人群为对照;
资料分析时对期望死亡数进行校正。
2、信息偏倚informationbias
最常见的为错分偏倚misclassificationbias:
暴露错分、疾病错分、联合错分
原因:
仪器不准、检验技术不熟、定义不明
影响:
无差异错分、有差异错分
控制方法:
质量控制,“盲法”测量
3、混杂偏倚confoundingbias
由于混杂因子造成的偏倚
控制方法:
匹配、分层分析、多因素分析
第五节队列研究的优缺点
优点
⏹随访收集资料,一般不存在回忆偏倚
⏹可直接计算发病率或死亡率,得到RR,AR等关联强度指标,充分分析暴露因素的效应
⏹因在前果在后,检验病因假说的能力强
⏹可评价一种暴露因素与多种疾病的关系
⏹适于疾病自然史的研究,适于罕见暴露因素的研究
缺点
⏹不适合发病率低的疾病病因研究
⏹随访时间长,失访偏倚对结果的影响较大
⏹随访过程中变量的变化对结局影响大,研究设计要求高,资料收集和分析困难多
⏹研究费时间、费人力、费物力,组织与后勤工作艰巨