队列研究.docx - 冰豆网

资源描述

队列研究.docx

《队列研究.docx》由会员分享，可在线阅读，更多相关《队列研究.docx（14页珍藏版）》请在冰豆网上搜索。

队列研究.docx

队列研究

第五章队列研究★

第一节概述

⏹队列研究（cohortstudy）

也称前瞻性研究prospectivestudy，随访研究follow-upstudy，纵向研究longitudinalstudy等。

暴露结局（疾病）

一、基本概念

⏹队列研究的重要概念

⏹队列cohort

⏹暴露exposure

⏹危险因素riskfactor

⏹保护因素protectivefactor

1、队列的概念：

拥有同一属性的某一组人。

a）2013年南京市常住人口

b）2010年到2014年南医大注册的所有学生

c）出生队列birthcohort：

出生于同一时期的人组成的特殊队列

1）队列可以是流动（有人员出入）的，也可以是固定的（相对固定，没有人员流动，成员不可以同时是非成员）

2、暴露的概念：

研究对象接触过的某种待研究的物质，或具有某种待研究的特征或行为。

（理解）物质：

病原体、毒物。

。

特征：

年龄、性别、血压、血糖。

。

行为：

吸烟、饮酒、工作类型。

。

二、基本原理

⏹选定一组研究人群，根据过去或目前的暴露情况进行分组

☐有无暴露因素：

暴露组和非暴露组

☐暴露因素的水平：

低、中、高剂量组

⏹随访观察各组的观察结局（发病或死亡）

⏹比较各组发病率或死亡率的差异，从而判定暴露因素与发病有无因果关联及关联大小

队列研究的特点：

1、研究对象是还没出现研究结局，但有可能出现研究结局的人群（susceptiblepopulation）

需设立纳入及排除标准

⏹剔除已生病个体或明确不会生病的个体

⏹在进行传染病危险因素的研究时，需考虑个体被感染的几率

2、属于观察性研究，根据暴露的自然存在状态分组，无人为控制，也不存在随机分组

3、时间顺序：

从“因”到“果”，可确定因果关系（疾病发生之前已经确定了研究对象的暴露情况）

4、前瞻性研究，可计算发病率、死亡率等率的指标

三、队列研究的用途

⏹检验病因假设是主要用途和目的

⏹评价预防效果

⏹研究疾病的自然史

⏹新药的上市后监测

四、队列研究的类型

1、前瞻性队列prospectivecohort

也称即时性或同步性（concurrent）队列

开始研究时确定对象、分组，经随访得到结局

¡优点：

资料准确

¡缺点：

样本大，花费大，时间长

建立队列时要特别考虑能否负担得起，能否获得想要的结果！

2、回顾性队列retrospectivecohort

也称历史性（historical）或非即时性（non-concurrent）队列

研究开始时疾病结局已发生，研究对象是过去进入队列的，分组依据的是过去的暴露资料

¡优点：

省人、物、时

¡缺点：

依赖历史资料的完整与可靠，常缺乏混杂因素的资料

3、双向性队列ambispectivecohort

历史队列后继续进行前瞻性队列

¡最适合于对人体健康同时具有短期和远期效应的暴露因素研究

第二节研究设计与实施

一、确定研究因素

队列研究最主要的目的：

进一步验证现况调查或病例对照研究中已发现的有特异影响、且在统计学上有联系的危险（或保护）因素。

暴露因素分类：

1）暴露水平：

定量标准化，累积暴露

2）暴露方式：

短期/长期、直接/间接、持续/间隔

二、确定研究结局

结局变量outcomevariable

也称结果变量，是随访中将出现的预期结果事件，也即研究者希望追踪的事件，是希望观察的自然终点，并非观察期的终止。

（结局是队列研究观察的终点，也就是研究对象已达结局变量就停止对其的观察；观察期是整个队列研究的时长，整个队列中研究对象不止一个人）

☐研究结局的确定应全面、具体、客观

发病、死亡、指标变化。

。

☐结局变量的测定应有明确统一的标准，并在研究全过程中严格遵守

三、确定研究现场和研究人群

（一）研究现场：

可行性+可靠性+科学性

☐有足量研究对象

☐领导重视

☐群众配合

☐交通方便

☐文化水平、医疗卫生条件好

（二）研究人群：

即队列的建立

☐人口相对稳定，方便进行随访

☐医疗卫生记录较完整、容易查询

☐无明显的环境污染

☐被研究的疾病发病率较高

☐被选择人群的合作程度好、领导支持

1、暴露人群的选择

☐一般人群：

常见暴露因素研究

☐特殊人群：

对罕见因素暴露的高危人群

如职业人群：

联苯胺致膀胱癌——染料厂工人

石棉致肺癌——石棉厂工人

特殊暴露人群：

放射线与白血病——原子弹爆炸受害者，放射治疗者等

有组织的团体：

一般人群的特殊形式

2、对照人群的选择可比性

☐内对照internalcontrol：

先选择一组研究人群，然后根据暴露情况进行分组

选择对照容易，但易受暴露污染（可比性好）

☐外对照externalcontrol：

选择职业人群或特殊暴露人群为暴露组，则需在该人群外去寻找平行的对照组

可避免暴露污染，但难度较大

☐总人口对照totalpopulationcontrol:

以全人口率为对照，也称一般人群对照

资料较易获得，但不与暴露组平行，可比性差，暴露组也可能包括在内

使用时需进行率的标化

☐多重对照multiplecontrols:

同时采用上述多种对照

可减少一种对照带来的偏倚，但工作量大

四、确定样本量

决定因素：

1、一般人群（非暴露组的）所研究疾病的发病或死亡率（P0），P0越接近0.5，样本越大

2、暴露组与对照组人群发病率之差d=P1-P0，暴露组疾病的发病或死亡率（P1），或相对危险度（RR）估算P1，d越大，样本越小

3、显著性水平：

第一类错误概率α

4、把握度（1-β）：

β为第二类错误概率

注意事项：

⏹一般对照组样本数≥暴露组的样本数

⏹估计失访对数据分析的影响，一般按估计样本量增加10%作为实际样本量

五、资料的收集与随访

1、基线资料收集baselinedata

暴露的资料，个体的其他信息

来源：

1）查阅各种常规记录2）调查询问3）医学检查4）环境测量

2、随访followup

⏹随访的目的

¡确定分母的信息

研究对象是否仍处于观察中

¡确定分子信息

确定研究人群结局事件的发生

¡相关资料的收集

有关暴露和混杂因素的资料

⏹随访方法——以调查表为工具

¡常规记录或档案

¡定期调查，进行特殊安排的随访

¡环境调查与检测

⏹观察终点（endpoint）、随访期限和时间间隔

明确开始时间与终止时间

⏹失访（lossestofollow-up）的问题

⏹观察终点endpoint

研究对象出现了预期的结果，可不再随访

⏹研究对象未出现预期结果，但无法继续随访，则认为失访

⏹失访的情况在资料分析时作为结尾数据（censoreddata）

六、质量控制

⏹调查员的选择

⏹调查员培训

⏹制定调查员手册

⏹监督

每一次随访都是一次现况调查

第三节资料的整理与分析

基本步骤

⏹描述性分析，描述研究对象的组成、随访的经过、随访时间、结局的发生情况、失访情况等，并对两组的一般情况做均衡性检验

⏹两组率的描述、比较，进行关联强度的计算

⏹根据上述结果和研究中可能存在的偏倚，作出解释

一．队列发病率的计算

1、累积发病率cumulativeincidence，CI

☐定义：

某一固定人群在一定时期内某病新发生例数（D）与时期开始时总人数（N）之比

☐前提：

研究人群数量比较多，人口比较稳定，资料整齐

☐

公式：

2、发病密度incidencedensity,ID

⏹前提：

队列为一动态人群，人口不稳定，观察人数变动较大（失访、迁移、死于它病、中途加入等）

发病密度（ID）=观察期内的发病人数/观察人年数

人时的概念

☐观察人数乘以随访单位时间的积

☐人时是将人数和时间结合起来考虑的一种度量单位，它是观察人群中全部个体暴露于研究因素的时间总和

☐时间单位常用年，故又称人年数（person-years）

意义：

既说明该人群发生的新病例数，又说明该人群的大小和发生这些例数所经历的时间

3、标化比standardmortalityratio，SMR

标准死亡率就是全人口的死亡率

❑SMR>1，说明暴露导致或促进了结局的发生

❑SMR<1，说明暴露预防或减少了结局的发生

❑SMR=1，说明暴露与疾病没有关系（加不加暴露因素对于死亡率没有影响）

EG：

SMR=2/1=2

说明该厂30~40岁工人死于肺癌的危险性是一般人群的2倍

二、两组率差异的显著性检验

三、暴露和疾病关联强度指标及计算

⏹比较暴露组和对照组的率的差值——绝对值

⏹比较暴露组和对照组的率的比值——相对值

☐相对危险度

☐归因危险度

☐归因危险度百分比

☐人群归因危险度

☐人群归因危险度百分比

1、相对危险度Relativerisk，RR

概念：

暴露组某病发病率（或死亡率）与非暴露组该病发病率（或死亡率）之比，是反映暴露因素和疾病关联强度的一个指标

公式：

意义：

RR说明暴露组发病（死亡）的危险性是非暴露组的多少倍

相对危险度判断标准

RR95%可信区间（不包括1，说明暴露与疾病的关联有统计学意义，有关联）

Woolf法

RR=1，两组的发病率和死亡率没有差别

RR＞1，暴露组的发病率或死亡率高于非暴露组，暴露可增加发病或死亡的危险

RR＜1，暴露组的发病率或死亡率低于非暴露组，暴露可减少发病或死亡的危险

RR值离1越远，表明暴露的效应越大，暴露与结局关联的强度越大。

2、归因危险度Attributablerisk，AR

概念：

也称率差（ratedifference,RD）、特异危险度、超额危险度，为暴露组的发病（死亡）率与非暴露组的发病（死亡）率之差

意义：

AR表示暴露组中完全由暴露因素所致的发病（死亡）率，说明暴露的生物学效应

公式：

⏹RR具有病因学的意义

⏹AR更具有疾病预防和公共卫生学的意义

3.归因危险度百分比Attributableriskpercentage,ARP

概念：

又称病因分值，是指暴露人群中发病归因于暴露的成分占全部病因的百分比

公式：

暴露组的死亡率

4、人群归因危险度populationattributablerisk，PAR

概念：

人群中由于暴露于某因素导致的发病率或死亡率，说明暴露的社会效应

公式：

It为全人群某病发病（死亡）率；Io为非暴露组的某病发病（死亡）率

5、人群归因危险度百分比Populationattributableriskpercentage，PARP或PAR％

概念：

人群中因暴露于某因素所致的发病（死亡）占人群发病（死亡）的百分比，也即说明消除该因素后产生预防该病的效果占多大比重，具有公共卫生学意义，说明暴露的社会效应

公式：

PAR和PAR%既与RR和AR相关，也与人群中暴露者所占的比例相关

□RR和AR很高，但PAR和PAR%不高，说明某因素对全人群影响不大，但对高危人群影响很大，可对高危人群重点防制

□RR,AR,PAR和PAR%都很高，说明某因素对全人群的影响很大，宜全民防制

Eg:

AR%=（Ie-I0）/Ie=93.30%

说明在感染HBV的男性中，93.30%的HCC死亡病例是由于感染了HBV造成的

PAR=It-I0=1.38/10万人年

说明在全人群中，因为HBV感染造成的HCC死亡率为1.38/10万人年

PAR%=（It-I0）/It=66.67%

说明在全人群中，66.67%的HCC死亡病例是由于感染了HBV造成的

⏹PAR=1.38/10万人年，说明如果能够消除HBV感染，可以减少的HCC死亡率为1.38/10万人年

⏹PAR%=66.67%，说明如果能够消除HBV感染，全人群中66.67%的HCC死亡病例可减少

6、剂量-反应关系的分析

⏹率的趋势性检验

⏹有剂量-效应关系，暴露作为病因的可能性越大

第四节队列研究的偏倚及控制

1、选择偏倚selectionbias

¡有人拒绝参加

¡有些人档案丢失或记录不全

¡早期病人在开始时未能发现

¡研究对象由志愿者组成，其健康水平或习惯特征与总人群有差异

队列研究特有的选择偏倚

⏹失访偏倚lossestofollow-up

队列研究不可避免的偏倚，破坏了原有样本的代表性，一项研究的失访率最好不超过10%

原因：

迁出、外出、不再合作、死亡

影响：

失访率、失访者特征、两组失访差异

控制方法：

尽可能提高研究对象的依从性

⏹健康工人效应health-workereffect

在研究职业暴露因素时以一般人群为对照组时产生的偏倚，暴露组为健康工人，发病率或死亡率较低

控制方法：

不采用一般人群为对照，选择除暴露因素外其他因素一致的职业人群为对照；

资料分析时对期望死亡数进行校正。

2、信息偏倚informationbias

最常见的为错分偏倚misclassificationbias：

暴露错分、疾病错分、联合错分

原因：

仪器不准、检验技术不熟、定义不明

影响：

无差异错分、有差异错分

控制方法：

质量控制，“盲法”测量

3、混杂偏倚confoundingbias

由于混杂因子造成的偏倚

控制方法：

匹配、分层分析、多因素分析

第五节队列研究的优缺点

优点

⏹随访收集资料，一般不存在回忆偏倚

⏹可直接计算发病率或死亡率，得到RR,AR等关联强度指标，充分分析暴露因素的效应

⏹因在前果在后，检验病因假说的能力强

⏹可评价一种暴露因素与多种疾病的关系

⏹适于疾病自然史的研究，适于罕见暴露因素的研究

缺点

⏹不适合发病率低的疾病病因研究

⏹随访时间长，失访偏倚对结果的影响较大

⏹随访过程中变量的变化对结局影响大，研究设计要求高，资料收集和分析困难多

⏹研究费时间、费人力、费物力，组织与后勤工作艰巨

展开阅读全文