流行病学正文部分第6版第10章病因与因果推断Word文件下载.docx
《流行病学正文部分第6版第10章病因与因果推断Word文件下载.docx》由会员分享,可在线阅读,更多相关《流行病学正文部分第6版第10章病因与因果推断Word文件下载.docx(17页珍藏版)》请在冰豆网上搜索。
防治实验中的处理(treatment,maneuver)可以看成是防治特定效应(结局)的可能原因。
如果实验处理使特定效应发生的概率升高,该处理就是特定效应的原因。
同病因类似,也就是防治措施与该效应呈相关。
二、病因模型
病因模型就是用简洁的概念关系图来表达因果关系的概念模型。
由于对因果关系有不同的理解或不同的侧重,所以有多种多样的病因模型。
目前具有代表性的因果模型有以下三类。
(一)生态学模型
该类模型将机体与环境作为一个整体来考虑。
常见的有动因-宿主-环境模型,又称为流行病学三角(图10-1),以及轮状模型(图10-2),它们给出了寻找病因的分类大框架。
该类模型简明,整体性强,但失之于笼统。
1.流行病学三角从因素间平衡和整体性观点看,它具有古老的思辨性和朴素的合理性,即疾病是三大因素相互作用的结果;
它的特点是将启动性必要病因从环境因素或宿主中分离出来成为动因(agent),这是传染病病原体的遗留物,但对非传染病则很难确定什么是启动性必要病因。
动因以前又称为致病因子或狭义的病因。
图10-1流行病学三角
图10-2轮状模型
2.轮状模型将环境进一步分为生物、理化和社会环境,宿主还包括遗传内核,而动因不再单列。
轮状模型各部分的相对大小可随不同的疾病而有所变化,如在胰岛素依赖性糖尿病中遗传核较大,而在麻疹中宿主(免疫状态)和生物环境(空气传播)部分较大。
(二)疾病因素模型
该模型(图10-3)在病因分类上操作性强,具有较强的实践指导意义,没有确定必要病因的困难。
它将因素分为两个层次:
外围的远因和致病机制的近因。
外围的远因包括社会经济、生物学、环境、心理行为和卫生保健因素。
基础或临床医学的病因主要是指致病机制的近因,流行病学的危险因素主要是指外围的远因。
近因对疾病诊断和治疗的意义较大,而远因对疾病预防的意义较大。
图10-3疾病因素模型
(三)病因网模型
根据生态学模型或疾病因素模型提供的框架可以寻找多方面的病因,这些病因相互存在联系,按时间先后联接起来就构成一条病因链,多个似有节点“鱼线”的病因链存在相互联系,交错联接起来就形成一张似“鱼网”的病因网(webofcausation)。
病因网的每一个节点是前面若干因素的结果,又是后面若干结果的原因之一,最后的“总节点”就是疾病终结局。
这就是病因网模型,它提供因果关系的完整路径。
例如,肝癌的病因网可以看成由三条主要病因链交错形成,三条病因链的起始端分别为乙肝病毒感染、黄曲霉毒素污染食品和饮水中的藻类毒素。
病因网模型的优点是表达清晰具体,系统性强,能很好地阐述复杂的因果关系。
(四)因果联接方式
因果联接方式包括但因单果、单因多果、多因单果和多因多果。
单一病因引起单一疾病,这是传统的简单化病因观,产生于人们早期认识疾病的局限性,也是因果特异性概念的根源。
单一病因引起多种疾病,这从病因的多种疾病效应方面来看,无疑是正确的,但所导致的这些疾病又并非仅由这单一病因所致。
多个病因引起单一疾病,这从疾病的多因性方面来看,无疑是正确的,但这些多个病因又并非仅仅导致单一疾病。
最后,多个病因引起多种疾病,例如,高脂膳食、缺乏体力活动、吸烟和饮酒引起脑血栓形成、心肌梗死、大肠癌和乳腺癌。
多种疾病的多个病因,可以是完全共同的,也可以是部分共同的。
多因多果实际上是把单因多果与多因单果结合在一起,全面反映了事物的本来面目。
(五)寻找病因的条目指南
上述病因模型给我们指出了寻找病因的大致方向、类别或联系方式(病因网),对于具体病因,可以分为宿主和环境两大方面。
1.宿主病因
(1)先天的包括基因、染色体、性别差异等。
(2)后天的包括年龄、发育、营养状态、体格、行为类型、心理特征、获得性免疫、既往史等。
2.环境病因
(1)生物的包括病原体、感染动物、媒介昆虫、食入的动植物等。
(2)化学的包括营养素、天然有毒动植物、化学药品、微量元素、重金属等。
(3)物理的包括气象、地理(位置、地形、地质)、水质、大气污染、电离辐射、噪声、振动等。
(4)社会的包括社会/人口(人口密度、居室、流动、都市化、交通、战争、灾害)、经济(收入、财产、景气)、家庭(构成、婚姻、家庭沟通)、饮食习惯、嗜好兴趣(烟、酒、茶、运动、消遣)、教育文化、医疗保健、职业(种类、场所、条件、福利、劳保设施)、政治、宗教、风俗等。
针对病因的具体研究涉及遗传学、病原生物学(医学微生物学和寄生虫学)、病理学(病因如何起作用)、营养学、环境卫生学、劳动卫生学、行为(心理)医学和社会医学等。
三、充分病因和必要病因
(一)充分病因和必要病因的概念
机械决定论将原因分为充分原因和必要原因。
类似地,病因也可以分为充分病因和必要病因。
充分病因(sufficientcause)是指有该病因存在,必定(概率为100%)导致疾病发生。
必要病因(necessarycause)是指有相应疾病发生,以前必定(概率为100%)有该病因存在。
按病因是否充分或必要分类,可以有四种组合:
(1)充分而且必要病因,
(2)必要但不充分病因,(3)充分但不必要病因,(4)不充分且不必要病因。
1.充分而且必要病因有该病因E存在时,疾病D必定发生;
有相应疾病D发生,以前必定有该病因E存在。
传统的因果观所谓的病因就是指的充分而且必要病因。
这种实例几乎不存在,除非将病因和疾病定义成几乎同一事件或特征,如狂犬病毒侵入脑内导致狂犬病恐水期症状。
2.必要但不充分病因有该病因E存在时,疾病D可能发生;
传染病中的病原体,维生素缺乏症中的维生素不足,它们都是相应疾病中必不可少的病因,又称为动因,但仅有动因还不能使疾病一定发生。
3.充分但不必要病因有该病因E存在时,疾病D必定发生;
有相应疾病D发生,以前可能有该病因E存在。
例如各类致死量的毒物,它们的摄入导致中毒死亡D分别是充分的,但对中毒死亡D各自又都不是必要的,即中毒死亡可由不同的致死量毒物(E1,E2,E3...)所致。
实际上,只要仔细分析,这种所谓的充分病因,是要附加一些条件的。
比如致死量如何确定,用最低、最大或平均致死量?
另外摄入者还存在个体差异。
要保证中毒死亡结果必定发生,并非由于单一的原因(毒物)。
因此,严格意义上的充分但不必要病因实际上也不存在。
4.不充分且不必要病因有该病因E存在时,疾病D可能发生;
例如吸烟导致肺癌。
我们可以听到这样反驳吸烟与肺癌的论证:
不是每个吸烟者都会得肺癌,即吸烟不是充分病因,吸烟者肺癌发生率<
100%;
另外不是每个肺癌病人以前都吸过烟,即吸烟不是必要病因,肺癌病人以前的吸烟率<
100%。
这些反驳者认为病因应该是充分而且必要的,否则不能成为病因。
殊不知,对于绝大多数病因(包括传染病或营养素缺乏病的其他病因)而言,它们既不是充分的,也不是必要的。
(二)充分病因和必要病因的局限性
1.充分病因的局限性充分病因几乎是不存在的,在牵强的例子中,病因和疾病结果几乎是一回事(因果同一),失去了因果关系的意义。
例如,乙肝病毒持续感染导致肝癌的概率不等于100%,即不是充分病因;
那么乙肝病毒DNA整合进肝细胞DNA,并且导致癌基因表达,产生肝癌细胞,在因果链上癌基因表达是否就是充分病因呢?
如果忽略宿主的免疫清除功能,癌基因表达导致肝癌的概率为100%,即将癌基因表达看成是充分病因,但这样的充分病因和疾病结果(肝癌)就几乎是一回事了。
如果单一的充分病因不存在,那么,多个病因同时出现(起作用),是否就能成为充分病因呢?
这种思维方式可以帮助我们扩大病因研究范围。
但是,这种使疾病发生的概率为100%的充分病因“组合”实际上也并不存在;
即使存在,每个病人的充分病因“组合”也是不同的,其数目等于所有病人数,这使因果研究失去了实际意义。
在实际研究中,我们仅仅能找出并只需要找出主要病因的“组合”,而这种病因“组合”远非充分的。
2.必要病因的局限性如前所述,传染病的特定病原体为必要病因。
例如,我们说乙型肝炎,一定是指的乙肝病毒而不是其他肝炎病毒引起的肝炎,因此乙肝病毒对于乙型肝炎的必要性从字面上就可以确定(语义重复),而不是一个实证问题。
我们不是先诊断乙型肝炎而断定以前必定有乙肝病毒感染,而是根据乙肝病毒感染,来对临床上的肝炎分类为乙型肝炎。
对于一般的慢性病,从字面或定义上,我们不可能得到“必要病因”的启示。
但对某些按“病因”分类的慢性病,就可以知道它们的必要病因,如“血管性痴呆”,脑血管病变就是它的必要病因。
总之,对于按某病因进行分类的疾病(包括非传染病),该病因就是它的必要病因,而正因为有该病因才被分类为该疾病。
总之,我们应当放弃因果决定论的充分病因和必要病因概念,而仅对病因的充分性和必要性进行概率测量。
第二节因果推断的逻辑方法
因果关系研究必然涉及到因果推断的问题,包括逻辑方法、统计关联和判定标准。
如何从客观资料得出因果结论,涉及到归纳推理方法;
概率因果观在统计学上意味着病因(暴露条件)与疾病呈相关,当然还必须确定该危险因素发生于疾病之前,以及“升高的概率”或相关未受到其他因素的干扰。
在实际的因果推断过程中,还可以综合应用因果判定标准。
因果推断的逻辑方法主要是归纳推理方法,它包括假设演绎法和Mill准则(消除归纳法),以及概率性推广的归纳统计推理。
归纳推理是从个别到一般,从特殊到普遍,它的结论是把前提里的道理扩大范围再讲一次,因而前提真则结论只是可能真。
而演绎推理是从一般到个别,从普遍到特殊,它的结论是把前提里的道理缩小范围再讲一次,因而前提真则结论必真。
一、假设演绎法
描述流行病学研究包括临床多病例观察、生态学研究和横断面研究等,它们主要陈述疾病的图景或现象,一般不涉及疾病的本质或因果关系;
它们能提供病因分析的初步线索,形成病因假设。
假设是在为数不多的经验事实以及已有理论的基础上,通过逻辑推理或创造性想象或猜测等形成的。
得到假设后,描述流行病学通过假设演绎法同检验假设的分析流行病学研究相衔接。
1.假设演绎法的推理过程
假设演绎法(hypotheticdeductivemethod)最早由赫歇尔(Hershel)提出,对近代科学的发展给予了强有力的推动。
该名称中的“演绎”仅仅指待观察(检验)的经验事实(证据),可由假设相对于背景知识而演绎地推导出来,从一般的假设导出具体个别的事实(证据),就是一个演绎推理。
但从具体个别的事实成立而推出一般的假设也成立,则是一个归纳推理。
其推理形式为:
(1)因为假设H,所以推出证据E(演绎推理);
(2)因为获得证据E,所以反推假设H成立(归纳推理)。
假设演绎法的整个推论过程为:
从假设演绎地推出具体的证据,然后用观察或实验检验这个证据,如果证据成立,则假设亦成立。
从逻辑学上看,反推是归纳的。
从一个假设可推出多个具体证据,多个具体证据的经验证实,则可使归纳支持该假设的概率增加。
2.假设演绎法的应用
例如,假设H:
乙型肝炎病毒(HBV)持续感染导致原发性肝癌(PHC);
根据该假设H,加上相关背景知识为前提,演绎地推出若干具体经验证据E1(肝癌病例的HBV感染率高于对照)、E2(HBV感染队列肝癌发生率高于对照)、E3(控制HBV感染后,肝癌的发生率下降)。
如果证据E1、E2、E3成立,则假设H亦获得相应强度的归纳支持。
根据假设推出的具体经验证据可分为两类:
已知事实和未知事实。
解释已知事实的为一般性检验,而预测未知事实的为严格检验,两者的归纳支持强度是不同的。
横断面研究或病例对照研究属于事后解释性研究,它对假设能提供的归纳支持强度较小。
队列研究或干预研究属于事前预测性研究,因此其论证强度是高于横断面研究或病例对照研究的。
如果经验证据经检验不成立或被否定,对假设该下怎样的结论呢?
这样的情况在研究中并不少见。
例如:
如果乙肝病毒引起肝癌(H),则在乙肝病毒感染率相同的地方,肝癌发病率也应相同(E);
但是,发现那里的肝癌发病率不相同(E不成立),所以乙肝病毒引起肝癌(H)不成立。
但是,问题并非如此简单。
科学理论(假设)是一个相互联系的整体,经验证据是由理论(假设)和先行条件这一组前提推出来的;
如果经验证据被否定,接着否定的是这一组前提中的任何一个,即可能是理论(假设)错了,或(和)可能是先行条件不对。
因此,推理的实际形式为:
如果假设H而且条件C,则证据E;
如果证据E不成立,所以假设H或(和)条件C不成立。
在上述乙肝病毒引起肝癌的例子中,先行条件应当为其他重要危险因素状态也相同。
因此,肝癌发病率不相同,可能否定的是先行条件,即实际上可能其他重要危险因素状态不相同,而不是否定乙肝病毒引起肝癌的假设。
二、Mill准则
分析流行病学研究的比较推理,主要应用的是Mill准则(Mill'
scanon)和统计归纳推理。
试图将因果推理的原则加以系统化的第一人是穆勒(Mill),他提出科学实验四法,后人将同异并用法单列,即科学实验五法:
求同法、差异法、同异并用法、共变法和剩余法。
需要注意的是,如果病因假设清单没有包括真实的病因,Mill准则就并不能提供任何帮助。
另外,Mill准则原本是用于能控制干扰条件的实验类型,以及假定原因为确定性的必要或充分条件。
因此,对于观察性研究或非确定性条件,Mill准则需要控制混杂或作概率性推广。
(一)求同法(methodofagreement)
是辨别某类事件或属性的必要条件的方法,推理形式为:
事件(病例,A)有关(暴露)因素
A,B,C--------a,b,c
A,D,E--------a,d,e
A,F,G--------a,f,g
……--------……
所以,a是A的必要条件
如在全部肝癌病例(A)中或相当一部分病例中(统计地)发现有乙肝病毒感染标记(a),表明乙肝病毒是肝癌的必要条件或具有相当必要性的条件。
当然,观察亦可从乙肝病毒感染到肝癌。
(二)求异法(methodofdifference)
是辨别某类事件或属性的充分条件的方法,推理形式为:
事件(对照,非A)有关(暴露)因素
B,C--------(a不出现),b,c
D,E--------(a不出现),d,e
F,G--------(a不出现),f,g
…--------……
所以,a是A的充分条件
如在全部非肝癌个体(对照,非A)中或相当一部分个体中(统计地)发现无乙肝病毒感染标记(非a),表明乙肝病毒是肝癌的充分条件或具有相当充分性的条件。
(三)同异并用法(jointmethodofagreementanddifference)
是辨别某类事件或属性的必要且充分条件的方法,推理形式为:
(1)求同部分
并且
(2)求异部分
所以,a是A的必要且充分条件
如在肝癌病例中发现均有或相当部分(统计地)有乙肝病毒感染标记,而在非肝癌个体(对照)中发现均无或相当部分(统计地)无乙肝病毒感染标记,表明乙肝病毒是肝癌的必要且充分条件或具有相当必要性和充分性的条件。
同异并用法是所有比较性研究(有对照组)设计的逻辑学基础。
(四)共变法(methodconcomitantvariation)
可以看成是求同法的特例。
当有关(暴露)因素不是分类的(有或无),而是等级或定量的,并与事件(结局)效应成量变关系(剂量-反应关系),才可以应用共变法。
推理形式为:
事件(效应,A)有关(暴露)因素
A1,B,C--------a1,b,c
A2,D,E--------a2,d,e
A3,F,G--------a3,f,g
如在吸烟与肺癌的研究中,随着吸烟剂量(等级)的增加,肺癌的比值比(OR)或相对危险度(RR)也增加,即呈共变或剂量-反应关系,所以支持吸烟为肺癌的病因。
实际上,分类资料的关联强度与定量或等级资料的剂量-反应关系,均表示结局事件与暴露因素的相关,从而支持因果联系。
(五)剩余法(methodofresidues)
剩余法可以看成是求异法的特例。
对某复合结局事件(A,B,C),已知它的有关(暴露)因素在特定的范围内(a,b,c),通过先前的归纳又知道b说明B,c说明C,那么剩余的a必定说明A。
结局事件有关(暴露)因素
B--------b
C--------c
所以,剩余a是A的必要条件
用剩余法判明联系,就象算术中的减法,即在一组复杂的现象中,把已知联系的现象减掉,探寻其他(剩余)现象的联系。
如在肝癌的病因研究中,肝癌的发病率除了乙肝病毒感染和黄曲霉毒素能解释的部分,还有未能解释的部分,这部分就可归因于暴露因素范围内“剩余”的因素,如饮水中的藻类毒素。
(六)归纳统计推理
任何经典的归纳推理都可以还原为最初级的形式,即简单枚举法:
S类的部分(S1,S2,S3…Sn)具有属性P,并且尚未观察到反例,所以S类全部都具有属性P。
对于概率论因果观而言,需要作概率性推广,这就是归纳统计推理,其基本形式为:
S1--------P
S2--------P
S3--------非P
……--------……
Sn--------P
(其中m/n部分具有P属性)
所以,S类的m/n部分具有P属性
统计归纳推理的结论同样超出了观察对象(样本)范围,但结论是统计的,不是说“S类全部具有P属性”,而是说“S类的m/n部分具有P属性”。
例如,同异并用法的概率性推广中,对病例组与对照组的暴露率做统计学比较,或对暴露组与非暴露组的发病率做统计学比较。
也可以这样说,统计学的许多方法在逻辑本质上是归纳的。
三、因果性实验中的对照法则
(一)设立对照的必要性
生物学或医学的研究对象过于复杂,很难仅仅通过实验室或其他外在条件来控制干扰,因此需要将一部分研究对象设置为对照或控制组(controlgroup)。
干扰作用(背景或基线)或自发变化体现在对照组上,通过与实验组比较,这些非处理因素的作用就可加以排除。
如设实验(处理因素)的效应为T,干扰(非处理因素)的效应为C,则:
实验(处理)组表现出来的混合效应=T+C
对照组表现出来的效应=C
实验(处理)的净效应=(T+C)-C=T
如果有两种处理(如实验处理和标准处理)的效应分别为T1、T2,则:
处理1组表现出来的混合效应=T1+C
处理2组表现出来的混合效应=T2+C
两处理净效应差值=(T1+C)-(T2+C)=T1-T2
这样,利用实验(处理)组与对照组的比较,从实验(处理)组的混和效应中分离出归因于处理的净效应。
需要注意:
实验(处理)组所表现出来的混合效应(T+C),是由处理前后两轮测量值之差来确定的。
如处理为降血压药,给药前后两轮血压测量值之差,就是降血压药组所表现出来的混合效应(T+C)。
这里“降血压药组给药前”并没有起到所谓对照的作用,即体现出非处理因素效应C。
如果不存在非处理因素的干扰(C=0),那么降血压药的效应(T)就等于两轮血压测量值“自身前后”比较之差,因而就不需要什么“对照(控制)”了。
因此,单纯的处理前后比较是没有对照(控制)的,“自身前后对照”的说法是不准确的。
(二)保证对照的有效性
根据实验(处理)组与对照的比较,可以得到处理净效应或净效应差值,但还需要假定各组的干扰(非处理因素)效应(C)是相等的,以及各组效应测量的准确度是相等的。
这就是各组干扰以及各组效应测量的可比性问题。
简而言之,就是各组除了处理因素不同,所有其他因素应尽可能相同。
有可比性的对照,才是有效的对照。
1.各组干扰(非处理因素)的可比性如果各组干扰(非处理因素)可比(均衡),那么表现出来干扰效应(C)就可比(相等),才可以从组间比较中分离出净效应或净效应差值。
保证各组干扰(非处理因素)的可比性,除了人为调整(配比),一个很重要的方法就是随机分配,它使得每个受试者进入各组的概率相等,也就使得干扰(非处理因素)在组间的分配是比较均衡的,样本越大均衡程度越高。
2.各组效应测量的可比性各组效应测量可比(准确度相等),也是做上述比较的前提。
保证各组效应测量的可比,除了客观测量工具或方法保持一致,还应当注意主观测量的一致性以及避免测量中的主观干扰,后两者可以通过盲法测量来实现。
第三节统计关联到因果关联
一、统计学关联
狭义的统计学关联(association)指分类资料的相关(correlation),这主要针对流行病学中较多的分类资料;
广义的关联等同于相关。
可能病因(暴露)E与疾病D存在统计学关联,只说明E与D的关联排除了偶然性(随机误差)的干扰,并不一定存在因果关联。
要确定因果关联,还得排除选择偏倚、信息偏倚和混杂偏倚这些系统误差的干扰,以及确定暴露E与疾病D的时间先后关系。
在排除或控制了这些偏倚的干扰后,如果还有统计学关联,或者统计学关联虽然有所改变(增强或减弱)但仍存在,就说明存在真实的关联,可以用因果判定标准进行综合评价,得出不同程度