流行病学正文部分第6版第9章偏倚及其控制.docx

资源描述

流行病学正文部分第6版第9章偏倚及其控制.docx

《流行病学正文部分第6版第9章偏倚及其控制.docx》由会员分享，可在线阅读，更多相关《流行病学正文部分第6版第9章偏倚及其控制.docx（11页珍藏版）》请在冰豆网上搜索。

流行病学正文部分第6版第9章偏倚及其控制.docx

流行病学正文部分第6版第9章偏倚及其控制

第九章偏倚及其控制

流行病学研究结果的真实性是极其重要的问题，研究的真实性直接关系到能否获得正确的结论。

真实性的反面就是误差，这包括随机误差和系统误差，后者又称为偏倚。

减少误差就意味着提高真实性。

第一节研究结果的变异性

一、概述

研究结果包括描述性和分析性数据（指标）的变动或波动，称为研究结果的变异性（variability）。

它可存在于不同的水平，包括个体水平、群体水平和样本（研究）水平，详见表9-1。

表9-1变异性的水平和来源

变异性水平

变异的来源

个体

个体生物学变异，测量误差

群体

个体间遗传学变异，环境变异，测量误差

样本（研究）

抽样方式，样本大小，测量误差

变异的来源可以分为两个层次：

1.生物学（真实）变异和测量变异生物学变异反映真实的客观变异，测量的变异反映测量过程的误差。

例如，在个体水平上，某病人的血压真值在一段时间内本身存在波动，该段时间内血压值的变异反映的是真实的生物学变化；同时在血压的测量过程中，又存在一定的测量误差，由此造成的血压值的变异反映的是测量变异。

该病人的血压值的总变异就包含生物学（真实）变异和测量变异。

2.随机变异和系统变异随机变异（误差）的绝对值和方向（符号）交错变化，并呈有界范围的正态分布。

系统变异（误差）的绝对值和方向保持恒定。

上述的测量误差，就可以再分出随机误差和系统误差。

例如，血压测量中围绕真值（用均值代表）上下波动的微小误差（一般小于2.58σ）就是随机误差，而偏离真值并且绝对值和方向固定的误差就是系统误差。

二、个体水平的变异性

个体水平的变异性是指某个体特征测量值的变化，它可以是个体真值随时间的改变，也可以是由于测量误差引起的变化。

如某病人的血清总胆固醇，会随着个体状态（如膳食情况或空腹与否）发生改变，也可以由于不同实验室或测量方法等引起变化。

如果某病人的血清总胆固醇有两个不同的测量值，则需要结合个体状态和测量误差考虑，判定哪一个测量值更接近真实值。

个体水平测量值的变异来源归纳于表9-2。

表9-2个体水平测量值的变异来源

变异来源

特点

个体状态

日间变异，年龄、膳食或运动改变，环境因素（季节、温度等）

测量误差

仪器标度差，仪器精密度差，仪器读数或记录错误

三、群体水平的变异性

群体水平的变异性可以看成是各个体的累计变异，因为构成群体的各个体具有不同的遗传素质并受到不同的环境影响。

群体的变异程度常常大于个体的变异。

一般可根据群体的变异范围来确定“正常值”范围，用于判定个体测量值是否“正常”。

如某病人的血清总胆固醇得到一个确定的测量值，可以根据群体血清总胆固醇的变异范围，判断该病人的总胆固醇是否处于“正常”水平。

群体水平的变异性也受到测量误差的影响。

四、样本水平的变异性

样本（研究）水平的变异性是指通过不同样本的研究所得结果的差异性。

为什么高水平的血清总胆固醇是不利的或不健康的？

这可以在关于血清总胆固醇与心血管病死亡风险呈正相关的研究中找到答案，如Framingham心脏研究。

但是，研究通常不能针对整个总体人群来进行，而是通过样本人群来进行，这就引入了抽样变异（误差）。

通过不同样本的研究所得的关于总体结果的估计值会有不同，如果排除测量误差，这些样本的估计值与总体真实值（用各样本估计值的均值代表）的差异，就是抽样误差。

当样本含量增大时，抽样误差就会减小。

1.描述性结果的样本变异性可以示例如图9-1。

图9-1源人群与样本中高胆固醇率的样本变异性示例

在图9-1的示例中，源人群高胆固醇率为25%，样本A为40%，样本B为20%，样本C为0%。

如果增大样本含量，样本的变异性会减少，样本的高胆固醇率对群体的代表性会增大。

2.分析性结果的样本变异性可以示例如图9-2。

图9-2膳食与药物预防心肌梗死的样本变异性示例

在图9-2的示例中，研究A和研究B中膳食改良组五年内发生心肌梗死的风险为9%，而降胆固醇药物组为6%。

研究A样本较小（200人），两组效应指标（心肌梗死风险）的95%可信区间均较大，从而发生重叠，统计检验无显著性差异。

研究B样本较大（2,000人），两组效应指标（心肌梗死风险）的95%可信区间均较小，从而未发生重叠，统计检验有显著性差异。

一般而言，研究样本越大，效应估计值的抽样误差越小（95%可信越小），统计检验能发现的两组间效应差值越小。

如果研究样本非常大，两组间差异很小的效应值也会有统计学显著性，但这很少有生物学或临床意义。

例如在上述研究中，研究对象如果多达20,000人，对心肌梗死发生风险仅有1%的差异，也可以在统计学上得出显著性，但这并不能支持长期使用降胆固醇药物。

第二节研究的真实性

一、概述

研究的真实性或效度（validity）是指研究收集的数据、分析结果和所得结论与客观实际的符合程度。

如果研究结果与客观实际存在不符合的地方，这就是研究误差，它是研究真实性的反面。

研究误差可以分为系统误差和随机误差两部分：

系统误差是指有固定方向和固定大小的误差，来自于对象选取、测量和统计分析等的方法学缺陷；而随机误差没有固定方向和固定大小，一般呈正态分布，来自于随机抽样的变异和测量的随机变异等。

研究误差中的系统误差部分称为偏倚。

研究的可靠性或信度（reliability）亦称精确度（precision），就是反映研究结果中随机误差大小的程度，随机误差小则研究信度高。

随机抽样误差可以用统计学方法来估计，并且可以通过增大样本含量来减小。

测量数据的真实性可用真实性指数（indexofvalidity,IV），或某方面的真实性指标如灵敏度或特异度等来表示。

变异可以是真实的（如生物学个体变异），而反映研究误差的变异肯定是不真实的。

对于研究真实性的评价还必须考虑内部真实性和外部真实性两方面。

二、内部真实性

内部真实性（internalvalidity）是指研究结果与实际研究对象真实情况的符合程度。

它回答一个研究本身是否真实或有效。

如果一个研究针对实际研究对象提供了真实的频率描述或效应估计值，即随机误差和系统误差较小，则该研究是真实或有效的。

如果一个研究本身是不真实或无效的，则很难再应用到其他人群。

改善内部真实性的措施有：

限制研究对象的类型和研究的环境条件，如仅选用中年男性对象，或限定干预措施的场景等。

因为这样可以降低群体水平的变异性，或者使因果机制趋于一致等。

需要注意的是，这些措施可能限制研究结果应用到其他人群，也就是使下述的外部真实性受限。

三、外部真实性

外部真实性（externalvalidity）是指研究结果与推论对象真实情况的符合程度，外部真实性又称为普遍性（generalizability）。

它回答一个研究的结论能否推广应用到研究对象以外的人群。

如果研究对象对于推论对象的代表性不好，尽管它的内部真实性可能好，但它的外部真实性则肯定差。

增加研究对象的同质性，如限制对象的类型（如年龄、职业、体质特征或疾病分型等），可以改善内部真实性；而增加研究对象的异质性，使得研究对象的代表性范围扩大，则可以改善外部真实性。

在实际研究确定对象时，需要综合平衡考虑研究对象的同质性和异质性问题。

例如，针对白人男性做的研究能否推广到白人女性或其他种族的人群？

针对大医院病人（特定的医疗照顾环境）做的研究能否推广到普通医院的病人、或未住院的社区病人？

多中心或多组人群的综合研究可较好地解决这个问题。

第三节研究的偏倚

研究误差中的系统误差部分称为偏倚（bias）。

最著名的早期偏倚研究是Berkson做的，他在1946年证实了采用医院病人作研究对象的病例对照研究容易遭受潜在的选择偏倚，这种偏倚来自于病人入院机会同病人的多种状况有关联，又称为Berkson偏倚。

1976年Miettinen详细讨论了偏倚的定义，并给出了分类框架，这就是后来被广泛接受的选择偏倚、信息偏倚和混杂偏倚三分类。

一、选择偏倚

由于研究一般不可能包括所有的患病或暴露个体，所以必须选取样本来进行研究。

选择偏倚（selectionbias）是在研究对象的选取过程中，由于选取方式不当，导致入选对象与未入选对象之间存在系统差异，由此造成的偏倚称为选择偏倚。

例如，研究对象采用志愿者、方便样本，或者研究对象无应答或失访等。

以下分别就描述性和分析性研究的选择偏倚进行阐述。

1.描述性研究的选择偏倚主要体现在样本对总体的代表性上，如不是采用随机抽样，而是使用方便样本或某些特定群体（志愿者、因特网使用者等），造成外部效度（外推）受限。

控制方法主要是尽量采用随机抽样，避免样本选取的偏向，对特定群体的研究结果在外推上要谨慎等。

2.分析性研究的选择偏倚主要体现在研究对象进入、排除、不参与（对象不同意）或失访等与研究暴露或处理因素存在关联，由此增大或减少暴露与疾病、处理与效应的关联，导致效应估计的偏倚。

因此，需要仔细分析研究对象的各种选取（进出）环节是否同研究暴露或处理因素有关，从而估计有无选择偏倚和偏倚的方向或大致程度。

根据选取具体环节（入院、检出、排除、无应答或失访等）或已选取人群的具体特征（志愿者、健康工人或现患病例等），选择偏倚可以有许多具体名称，如入院偏倚、失访偏倚或志愿者偏倚等。

确定有无选择偏倚的关键，在于把握选取环节或已入选对象，是否存在人为增大或减少研究因素与结局的关联程度。

例如，在医院为基础的病例对照研究中，有暴露史的病例比有暴露史的对照更容易入院，从而造成高估的暴露比值比（入院偏倚）；在选用较多长病程病例的病例对照研究中，由于病例患病后暴露情况可能发生改变（如冠心病病人多吃低胆固醇食物等），从而造成低估的暴露比值比（现患病例偏倚）；病例由于暴露而增加了被检出的机会（如服用雌激素的子宫内膜癌病例容易出血而就医检查），而未暴露的病例被检出的机会较小，导致病例暴露比例高估（检出偏倚）。

控制选择偏倚的方法主要是严密掌握对象选取的各个环节，注意选取对象的代表性，避免有问题的选取方式，严格掌握对象的纳入与排除标准，以及增加应答和减少失访等。

二、信息偏倚

研究对象选取后，就要进行信息采集。

信息偏倚（informationbias）又称测量偏倚（measurementbias）或观察偏倚（observationbias），是来自于测量或资料收集方法的问题，使得获取的资料存在系统误差。

由于流行病学的暴露或疾病多为分类测量，所以信息偏倚有时又可称为错分偏倚（misclassificationbias）。

信息偏倚同样影响着描述性研究和分析性研究的结果

如果暴露或疾病的错误分类同研究分组无关，即在各比较组间不存在差异，称为无差异性错分（nondifferentialmisclassification）；它在大多数情况下模糊了研究组间的差异，一般使研究效应的估计值偏低（趋近于无效值或无关联）。

如果暴露或疾病的错误分类同研究分组有关，即在各比较组间存在差异，称为差异性错分（differentialmisclassification）；由于错误分类在组间存在差异的偏向可能不同，所以它造成高估或低估研究效应值。

无差异性错分和差异性错分的示例见图9-3。

图9-3无差异性错分和差异性错分的示例

在图9-3中，无差异性错分例子中，20%的摄入高脂肪膳食的病例和对照都低报了脂肪摄入量，导致OR值低估；在差异性错分例子中，所有的病例正确回忆了膳食脂肪摄入状况，而只有80%的对照正确报告了他们的膳食脂肪摄入状况，该例中OR值被高估。

差异性信息偏倚常见于回忆偏倚和调查者偏倚（interviewerbias）。

回忆偏倚产生于研究对象在记忆过去活动和暴露上的能力存在差异。

有严重疾病的病例努力回忆暴露来理解为什么会得病，而没有病的对照可能不大记得起暴露，因为那对他们没多大意义或不重要。

调查者偏倚产生于调查者对研究对象有差异性地收集信息。

例如，调查者知道研究假设后，有意无意地对病例组更深入详细的询问，甚至给一些提示。

采取盲法调查（调查者不知道研究对象是病例还是对照），可以降低调查者偏倚，虽然很难做到盲法调查。

为了减少错误分类以及改善测量的准确性，应尽可能采用盲法收集资料，尽量采用客观指标或记录，以及利用其他来源的信息加以核查。

另外，研究者们正在越来越多地使用生物学标记物，以测量易感性、内暴露（实际进入体内）剂量或生物学效应（剂量）等。

三、混杂偏倚

混杂偏倚（confoundingbias）是指暴露因素与疾病发生的相关（关联）程度受到其他因素的歪曲或干扰。

导致混杂产生的因素称为混杂因素，它是疾病的危险或保护因素，并且与研究的暴露因素存在相关。

混杂的本来含义是“混合掺杂”（mixingtogether），这里是指暴露因素对疾病的独立效应与混杂因素的效应混在一起，造成对暴露因素效应的估计偏倚。

混杂偏倚的判定原则为：

比较混杂因素调控前后的暴露因素效应估计值，如果存在专业上有意义的差异（注意不是统计学的显著性差异），则认为产生了混杂偏倚。

混杂偏倚在设计阶段可以通过配比、随机化分配或限制进入（选择混杂因素的某个层的对象）等方法来控制。

混杂偏倚在统计分析阶段可采用标准化率分析、分层分析和多变量分析等来控制。

以下对因果关联分析中混杂偏倚引起的假关联做简单阐述。

1.继发关联（secondaryassociation）这是一种纯粹由混杂偏倚产生的关联（图9-4,

（1）），即怀疑的病因（暴露）E与疾病D并不存在因果关系，而是由于两者（E,D）有共同的原因C，E,D同C存在关联，从而继发产生E与D的关联。

该关联以前又称间接关联，为了避免与间接因果关联（间接病因与疾病的关联）混淆，现改称继发关联。

例如，高血清胆固醇是冠心病的危险因素，高血清胆固醇可产生沉积于眼睑的黄色瘤，从而导致黄色瘤与冠心病的继发关联。

另外，E与C也可以由于相关（因果方向不明）而产生继发关联。

例如，吸烟是胰腺癌的危险因素，吸烟又与喝咖啡存在相关（没有确定的时间先后），从而造成喝咖啡与胰腺癌的继发关联。

2.直接因果关联的歪曲如果怀疑的病因（暴露）E与疾病D既存在直接关联，又存在间接关联（图9-4,

（2））或与其他危险（保护）因素F存在相关（因果方向不明，用双箭头线表示；图9-4,（3）），暴露E与疾病D的直接因果关联程度或方向将可能受到混杂干扰，即得到歪曲的关联估计值。

E与D的总关联等于E-D直接关联同E-F-D间接关联之和。

如果直接关联与间接关联混在一起，而将其作为直接关联的估计，就会出现混杂偏倚。

例如，静脉吸毒（共用注射器）E与性乱F都是人类免疫缺陷病毒（HIV）感染D的危险因素，吸毒者倾向于发生多性伴行为，即吸毒同HIV感染既存在直接关联（E→D）又存在间接关联（E→F→D）（图9-4,

（2）），而在有的情况下，吸毒与多性伴没有确定的时间先后而呈双向相关（图9-4,（3）），在这两种情况下，多性伴F将对吸毒E与HIV感染D的直接因果关联起混杂或歪曲作用。

图9-4混杂偏倚引起假关联

采用各种分析方法控制混杂偏倚后，继发关联将作为完全虚假关联被排除,并且歪曲的直接因果关联程度也将恢复其真实值。

四、混杂偏倚的分层分析

M-H（Mantel-Haenszel）分层分析方法的步骤：

（1）对可能的混杂因素进行分层，在各层内混杂因素就不再可能对暴露与疾病关联起混杂干扰；

（2）具备M-H方法的应用条件的前提,即判定层间RR或OR是否相等或相近；（3）可以将各层的RR或OR综合起来，即得到控制混杂后的调整RR或OR；（4）再将调整RR或OR与分层前的粗RR或粗OR（cRR或cOR）进行比较，一般而言，如果差值有0.5以上的改变（RR或OR>1时）或者有0.1以上的改变（RR或OR<1时），就可以下“存在混杂偏倚”的结论。

1.队列研究

（1）累计发病率资料

资料格式参见表9-3，各变量有一个代表所在层的下标i。

调整RR及其假设检验

值计算如下：

表9-3以累计发病率为研究指标的队列研究

新病例

未发病

合计

暴露组

N1i

非暴露组

N0i

合计

M1i

M0i

式（9-1）

（自由度为1）式（9-2）

（2）发病密度资料

资料格式参见表9-4，各变量有一个代表所在层的下标i。

调整RR及其假设检验

值计算如下：

表9-4以发病密度为研究指标的队列研究

新病例

合计人时

暴露组

非暴露组

合计

M1i

式（9-3）

（自由度为1）式（9-4）

2.病例对照研究

资料格式参见表9-5，各变量有一个代表所在层的下标i。

调整OR及其假设检验

值计算如下：

表9-5非配比的病例对照研究

有暴露

无暴露

合计

病例组

m1i

对照组

m0i

合计

式（9-5）

（自由度为1）式（9-6）

举例饮酒与肺癌的病例对照研究（吸烟为可能的混杂因素），表9-6为假设资料。

表9-6饮酒与肺癌病例对照研究

饮酒

不饮酒

合计

肺癌病例

对照

合计

100

（1）按可能的混杂因素吸烟分层：

表9-7饮酒与肺癌病例对照研究分层分析

吸烟层（i=1）

不吸烟层（i=2）

饮酒

不饮酒

小计

饮酒

不饮酒

小计

肺癌病例

对照

合计

（2）判定层间关联效应水平是否同质（否则不能应用M-H方法）：

按是否吸烟分层后，两层内的饮酒与肺癌的关联效应大小是同质的，可以应用M-H方法计算综合OR。

（3）计算综合或调整OR，并与粗OR比较：

P>0.25

（4）做出结论

吸烟对饮酒与肺癌的关联（cOR=3.69）有混杂作用（cOR≠ORMH），控制吸烟的混杂作用后，饮酒与肺癌无关联（

=0.6509,P＞0.25）。

注意：

针对ORMH的2检验是在排除了混杂偏倚的基础上再排除随机误差，而针对cOR的2检验是建立在没有排除混杂偏倚的基础上的。

（栾荣生）

源群体样本A高胆固醇率

180，174，215，305305，276，195，215，170=40%

233，276，146，195

205，188，190，295样本B

170，164，248，162295，146，220，162，228=20%

220，219，228，250

样本C

高胆固醇率=25%219，164，190，188，233=0%

（>240mg/dL）

图9-1源人群与样本中高胆固醇率的样本变异性示例

（保留5版教材图，略有修改：

page150图8-1）

图9-2膳食与药物预防心肌梗死的样本变异性示例

（保留5版教材图：

page150图8-2）

图9-3无差异性错分和差异性错分的示例

（保留5版教材图：

page153图8-3）

图9-4混杂偏倚引起假关联

（保留5版教材图：

page154图8-4）

展开阅读全文