第7章筛检及其评价陈维清Word格式.docx
《第7章筛检及其评价陈维清Word格式.docx》由会员分享,可在线阅读,更多相关《第7章筛检及其评价陈维清Word格式.docx(23页珍藏版)》请在冰豆网上搜索。
指易于被目标人群接受。
此外,筛检试验还要有良好的可靠性与精确性。
二、筛检的类型
按照筛检对象的范围分为整群筛检(massscreening)和选择性筛检(selectivescreening)。
前者指在疾病患(发)病率很高的情况下,对一定范围内人群的全体对象进行普遍筛检,也称普查。
如对35岁以上妇女作阴道细胞涂片筛检宫颈癌。
后者根据流行病学特征选择高危人群进行筛检。
如对矿工进行矽肺筛检,对石棉工人进行石棉肺、肺癌的筛检。
按筛检项目的多少分为单项筛检(singlescreening)和多项筛检(multiplescreening)。
前者指用一种检试验筛检一种疾病。
如以儿童呼吸次数筛检可疑儿童肺炎。
后者是同时使用多项筛检试验筛检一种疾病。
如同时进行胸透、查血沉、痰中结核杆菌等发现可疑肺结核,然后再进一步作明确诊断。
三、筛检的目的
筛检主要有三个目的:
(1)在外表健康的人群中发现可能患有某病的个体,并进一步进行确诊和早期治疗,实现二级预防。
(2)确定高危人群,从病因学的角度采取措施,预防或延缓疾病的发生,实现一级预防。
(3)识别疾病的早期阶段,帮助了解疾病的自然史,揭示疾病的“冰山现象”。
四、筛检试验与诊断试验的区别
诊断试验(diagnostictest)是对疾病进行诊断的方法。
从表面看,筛检试验与诊断试验都是应用一些试验、检查等手段,确定受检者的健康状况,但实际上,两者存在许多区别(下面几条能否用一张表来表示)。
1.对象不同筛检试验以健康人或无症状的病人为观察对象;
诊断试验是以病人或筛检阳性者为观察对象。
2.目的不同筛检试验把可能患有某病的个体与可能无病者区分开来;
诊断试验进一步把病人与可疑有病但实际无病的人区分开来。
3.要求不同筛检试验要求快速、简便,有高灵敏度,尽可能能发现所有可能的病人;
诊断试验的技术要求较复杂、准确性和特异度高,尽可能排除所有非病人。
相对于筛检试验的结果,诊断试验的结果具有更高的准确性和权威性。
4.费用不同筛检试验应是简单、廉价的方法;
诊断试验多运用实验室、医疗器械等手段,一般花费较高。
5.处理不同筛检试验阳性者须进一步作诊断试验以确诊;
而诊断试验结果阳性者要随之以严密观察和及时治疗。
五、实施原则
在一项筛检计划实施前,要认真考虑一系列与筛检实施有关的标准。
Wilse和Junger在1968年提出了实施筛检计划的10条标准。
在此基础上,世界卫生组织提出了筛检计划成功与否的7条标准。
1999年Crossroads提出了评价筛检计划更加全面的13条原则。
概括起来主要体现在三个方面:
1.社会学方面所筛检疾病或状态应是该地区现阶段的重大公共卫生问题,对筛检阳性者能实行有效的追踪和干预,有比较高的成本-效益比,所用筛检技术易于被群众接受。
2.科学方面对所筛检疾病或状态的自然史有比较清楚的了解;
所筛检疾病或状态应有可识别的早期临床症状或体征,且有足够长的领先时间实施筛检;
对所筛检疾病或状态的预防效果及其副作用有清楚的认识;
所筛检的疾病或状态有比较高的流行率。
3.伦理学方面在筛检开始前已确认筛检可以改变疾病的自然史;
对筛检阳性者,有相应的诊断和治疗方法,或者有可行的预防措施。
总之,对某病的筛检,比较理想的是每一项标准均能达到,满足的标准愈多说明筛检计划愈成熟。
然而实际情况总会有一项或多项标准不能满足,尽管如此,筛检仍值得实施。
最基本的条件是:
适当的筛检方法、确诊方法和有效的治疗手段,三者缺一不可,否则将导致卫生资源浪费,给筛检试验阳性者带来生理和心理上的伤害等不良后果。
六、伦理学问题
不论是医疗实践还是医学研究,筛检对受试者的影响均具有不确定性,受试者都可能面临一定程度的风险。
因此在实施时,必须遵守尊重个人意愿、有益无害、公正等一般伦理学原则。
筛检的宗旨是给受试者带来好处,但作为计划的受试者,有权利对将要参与的计划所涉及的问题“知情”。
研究人员也有义务向受试者提供足够的信息,包括参与这项计划的利益与风险,并使他们理解提供的信息,据此做出理性的选择,决定是否同意参加。
有益无害原则在筛检实施的标准中有明确体现。
如筛检试验必须安全可靠,无创伤性、易于被群众接受,不会给被检者带来身体和精神上的伤害。
对筛检试验阳性者,有进一步的诊断、治疗方法,不会给他们带来不必要的心理负担,对健康产生负面影响。
再者,筛检获得的是受试者个人的健康资料,因此个人的隐私权应受到尊重。
除非得到本人允许,不得向外泄露。
公正原则要求公平、合理地对待每一个社会成员。
如果筛检的价值和安全性已确定,并将用于医疗实践,给群众带来益处时,无论受试者的年龄、职务、性别、经济地位及与医务人员的关系如何,均应受到平等的对待。
七、筛检实例
儿童青少年的肺结核多属原发性结核,早期发现,并及时给予诊断和治疗,对控制结核病的传播有重要意义。
结核菌素纯蛋白衍生物(PPD)试验是早期测定是否感染结核菌的一种免疫学检查方法,目前常用来发现早期的结核病人,并结合拍X线胸片和查痰菌,对结核病做出诊断。
1.调查对象某地区4所中学的全体在校学生3053名,年龄13~19岁。
2.筛检方法对全体学生进行PPD试验,于受试者左臂皮内注射PPD试剂,72小时观察结果,硬结直径≥20mm者为强阳性,硬结直径<
20mm,但有水泡,双圈或有淋巴管炎者亦为强阳性。
3.确诊方法对于PPD试验强阳性者拍X线胸片,对胸片异常者询问病史并连续查痰菌3次。
痰检阳性者确诊为肺结核,痰检阴性而X线胸片有典型病变,经抗炎治疗无效且肺结核症状较典型者亦诊断为肺结核。
从上述例子可以看出,PPD试验为识别肺结核可疑患者的筛检试验,X线胸片检查和查痰菌为进一步确诊的方法。
由此我们可以看出筛检试验与诊断试验的区别和联系。
第二节筛检试验的评价
一、评价方法
筛检试验的评价指的是将待评价的筛检试验与诊断目标疾病的标准方法——即“金标准”(goldstandard)——进行同步盲法比较,判定该方法对疾病“诊断”的真实性和价值。
具体过程为:
先确定适宜的“金标准”,接着用它筛选适量的目标疾病患者(病例组)和非患者(对照组),然后用待评价的筛检试验再对他们检测一次,最后将所获结果与金标准诊断结果进行比较,并用一系列指标来评价筛检试验对该病的诊断价值。
为了减少偏倚,整个过程应遵循盲法原则。
(一)确定“金标准”
所谓“金标准”是指当前临床医学界公认的诊断疾病的最可靠方法。
使用金标准的目的就是准确区分受试对象是否为某病患者。
较为常用的金标准有活检、手术发现、微生物培养、尸检、特殊检查和影像诊断、临床综合判断、以及长期随访的结果等。
(二)选择受试对象
选择受试对象的原则是:
受试对象应能代表筛检试验可能应用的目标人群。
为使病例组有代表性,受试的目标疾病的患者应包括各种临床类型的病例,如不同病情程度的、不同病程的、典型和不典型的、有并发症和无并发症的、治疗过的与未治疗过的。
对照组应选择用金标准证实没有目标疾病的其他病例,特别是那些易与该病产生混淆的疾病,以期考核待评价的筛检试验的鉴别诊断价值。
故正常人一般不宜纳入对照组,因为将正常人纳入对照组将无法对筛检试验鉴别诊断能力进行评价。
(三)确定样本量
与研究样本量有关的因素有:
(1)待评价筛检试验的灵敏度,
(2)待评价筛检试验的特异度,(3)显著性检验水平,(4)容许误差。
当灵敏度和特异度均接近50%时,可用近似公式7-1。
式(7-1)
式中n为所需样本量。
z(为与其他章节保持一致,估统一为z)为正态分布中累积概率等于/2时的z值,如z0.05=1.96或z0.01=2.58。
为容许误差,一般定在0.05~0.10。
p为待评价的筛检方法的灵敏度或特异度,通常用灵敏度估计病例组所需样本量,特异度估计对照组所需样本量。
当待评价的筛检试验的灵敏度或特异度小于20%或大于80%时,样本率的分布呈偏态,需要对率进行平方根反正弦转换,并用公式7-2计算样本量。
式(7-2)
例如,待评价的筛检试验的估计灵敏度为75%,估计特异度55%,试计算病例组和对照组所需要样本量。
设=0.05,=0.08,则:
n1=(1.96/0.08)2×
(1-0.75)×
0.75=112.5≈113
(1-0.55)×
0.55=148.6≈149
所以,评价该筛检试验,病例组样本量为113例,对照组样本量为149例。
(四)整理评价结果
经“金标准”确诊的目标疾病患者和非患者,接受待评价的筛检试验检测后,可出现四种情况。
即“金标准”确诊的患者,可能被筛检试验判为有病(真阳性,A)或无病(假阴性,C);
而“金标准”确诊的非患者也可能被筛检试验确认为有病(假阳性,B)或无病(真阴性,D),整理成四格表如下。
表7-1筛检试验评价
筛检试验
金标准
合计
患者
非患者
阳性
真阳性A
假阳性B
R1
阴性
假阴性C
真阴性D
R2
C1
C2
N
二、评价指标
(一)真实性
真实性(validity),亦称效度,指测量值与实际值相符合的程度,故又称准确性(accuracy)。
用于评价真实性的指标有:
灵敏度与假阴性率、特异度与假阳性率、正确指数、似然比和符合率。
1.灵敏度与假阴性率
灵敏度(sensitivity),又称真阳性率(truepositiverate),即实际有病而按该筛检试验的标准被正确地判为有病的百分比。
它反映了筛检试验发现病人的能力。
式(7-3)
假阴性率(falsenegativerate),又称漏诊率,指实际有病,根据筛检试验被确定为无病的百分比。
它反映的是筛检试验漏诊病人的情况。
式(7-4)
灵敏度与假阴性率之间为互补关系,灵敏度=1-假阴性率。
即灵敏度越高,假阴性率越低,反之亦然。
2.特异度与假阳性率
特异度(specificity),又称真阴性率(truenegativerate),即实际无病按该诊断标准被正确地判为无病的百分比。
它反映了筛检试验确定非病人的能力。
式(7-5)
假阳性率(falsepositiverate),又称误诊率,即实际无病,但根据筛检被判为有病的百分比。
式(7-6)
特异度与假阳性率之间为互补关系,特异度=1-假阳性率。
即特异度越高,假阳性率越低,反之亦然。
3.正确指数
正确指数也称约登指数(Youden’sindex),是灵敏度与特异度之和减去1,表示筛检方法发现真正病人与非病人的总能力。
正确指数的范围在0~1之间。
指数越大,其真实性越高。
正确指数=(灵敏度+特异度)–1=1–(假阴性+假阳性)式(7-7)
4.似然比
似然比(likelihoodratio,LR)属于同时反映灵敏度和特异度的复合指标,即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。
该指标全面反映了筛检试验的诊断价值,非常稳定。
它的计算只涉及灵敏度与特异度,不受患病率的影响。
因检验结果有阳性与阴性之分,故似然比相应地区分为阳性似然比(positivelikelihoodratio,+LR)和阴性似然比(negativelikelihoodratio,-LR)。
阳性似然比是筛检结果的真阳性率与假阳性率之比。
该指标反映了筛检试验正确判断阳性的可能性是错误判断阳性可能性的倍数。
比值越大,试验结果阳性时为真阳性的概率越大。
式(7-8)
阴性似然比是筛检结果的假阴性率与真阴性率之比。
该指标表示错误判断阴性的可能性是正确判断阴性可能性的倍数。
比值越小,试验结果阴性时为真阴性的可能性越大。
式(7-9)
阳性似然比越大,筛检试验的诊断价值越高;
阴性似然比越小,筛检试验的诊断价值也越高。
因此,在选择筛检试验时应选择阳性似然比高的方法。
现以表7-2中的数据为例说明各项筛检试验评价指标的计算。
表7-2人群某病患病状况与筛检结果的关系
金标准诊断结果
165
80
245
45
730
775
210
810
1020
(二)可靠性
可靠性(reliability),也称信度、精确度(precision)或可重复性(repeatability),是指在相同条件下用某测量工具(如筛检试验)重复测量同一受试者时获得相同结果的稳定程度。
评价筛检试验可靠性的方法和指标有下面一些方法:
1.标准差和变异系数
当某试验是做定量测定时,可用标准差和变异系数(coefficientvariance,CV)来表示可靠性。
标准差和变异系数的值越小,表示可重复性越好,精密度越高。
反之,可重复性就越差,精密度越低。
变异系数为标准差与算术均数之比。
变异系数(CV)=(标准差/算术均数)×
100%式(7-10)
2.符合率与Kappa值
符合率(agreementrate,consistencyrate),又称一致率,是筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比例。
符合率可用于比较两个医师筛检诊断同一组病人,或同一医师两次筛检诊断同一组病人的结果。
式(7-11)
近年人们常用Kappa分析评价两种检验方法和同一方法两次检测结果的一致性。
该分析考虑了机遇因素对一致性的影响。
Kappa值的取值范围介于-1和+1之间。
如K<0,说明由机遇所致一致率大于观察一致性;
K=0,表示观察一致率完全由机遇所致;
K=-1,说明两结果完全不一致。
如K>0,说明观察一致性大于因机遇所致一致的程度;
K=1,说明两结果完全一致。
一般认为Kappa值在0.4~0.75为中、高度一致,Kappa值0.75为一致性极好,Kappa值0.40时为一致性差。
Kappa值的计算可用下式:
式(7-12)
继续以表7-2为例,计算一致率和Kappa如下:
实际工作中,影响筛检试验可靠性的因素有:
1.受试对象生物学变异由于个体生物周期等生物学变异,使得同一受试对象在不同时间获得的临床测量值有所波动。
例如,血压在一天内不同时间的测量值存在变异。
2.观察者由于测量者之间、同一测量者在不同时间的技术水平不一,认真程度不同,生物学感觉差异,预期偏倚等均可导致重复测量的结果不一致。
例如,血压测量者的不一致性,X线读片与化验结果判断的不一致性等。
3.实验室条件重复测量时,测量仪器不稳定,试验方法本身不稳定,不同厂家、同一厂家生产的不同批号的试剂盒的纯度、有效成份的含量、试剂的稳定性等均有不同,由此可能引起测量误差。
(三)预测值
预测值是反映应用筛检结果来估计受检者患病和不患病可能性的大小的指标。
根据筛检的阳性与阴性结果进行的估计分别称为阳性预测值和阴性预测值。
1.阳性预测值(positivepredictivevalue,PPV)是指筛检试验阳性者患目标疾病的可能性。
用公式表示为:
式(7-13)
2.阴性预测值(negativepredictivevalue,NPV)是指筛检试验阴性者不患目标疾病的可能性。
式(7-14)
根据表7-2的数据,计算得到该筛检人群目标疾病的:
总的来讲,筛检试验的灵敏度越高,则阴性预测值越高;
筛检试验的特异度越高,阳性预测值越高。
此外,预测值还与受检人群目标疾病患病率(P)的高低密切相关。
阳性预测值、阴性预测值与患病率、灵敏度和特异度的关系可用以下公式表示:
式(7-15)
式(7-16)
表7-3说明了人群在不同患病率、灵敏度与特异度的情况下,阳性预测值与阴性预测值的变化。
当灵敏度与特异度一定,疾病患病率降低时,阳性预测值降低,阴性预测值升高;
当患病率不变,降低灵敏度,特异度将提高,此时阳性预测值将升高,阴性预测值将下降。
表7-3在灵敏度、特异度和患病率不同水平时某人群糖尿病筛检的结果
患病率
(%)
灵敏度
特异度
筛检
结果
阳性预
测值(%)
阴性预
50
+
250
500
-
1000
20
100
400
200
800
90
180
580
31
20
420
95
56
720
820
88
(Gordis2000)
三、筛检试验阳性结果截断值的确定
开展筛检工作的目的就是将人群中表面健康无症状的可疑患者找出来,以便得到早期诊断和治疗。
这就要对筛检试验测得的观察值有个界定,即正常与异常,以区分某人可能“已患”或“未患”某病,也就是划分该试验阳性与阴性的标准。
如何确定筛检试验阳性结果的截断值(cutoffpoint)或临界点,与筛检试验测得病人与非病人的观察值的分布有关。
如图7-3(a)所示,病人与非病人的测量值呈两个独立的分布曲线,无重叠处。
如将临界点选在病人中的最小值,筛检试验的灵敏度和特异度均可达100%。
图7-3病人与非病人观察值分布类型
图7-3(c)所示病人与非病人的测量值呈一连续分布曲线。
同(a)情况一样,如将临界点选在病人中的最小值,筛检试验的灵敏度和特异度均可达100%。
通常遇到的是如图7-3(b)中所示的情况,病人与非病人的测量值呈两条相交的分布曲线,两条曲线下有一重叠区域。
H为病人的最低值,X为正常人的最高值,在H和X之间既有病人又有非病人,形成一个重叠区。
如果把病人与非病人的分界定在H,固然不会漏掉病人,但会把较多的非病人划入病人组中,出现假阳性;
如果将分界定在X,虽然没有将非病人误诊为病人,但又漏掉了相当部分的病人。
这种情况下,无论临界点选在何处,筛检试验的灵敏度和特异度均不可能同时达到100%。
在H和X两点间,当诊断点向右移时,特异度升高,灵敏度降低;
反之,当诊断点向左移时,灵敏度增大,特异度降低。
因此,在筛检实践中很难达到灵敏度与特异度均高的目标。
通常采取降低其中一方,以获得较高的另一方的策略。
至于筛检试验阳性结果的临界点选择在何处,则根据具体情况而定,以下几点可供参考。
1.如疾病的预后差,漏掉病人可能带来严重后果,且目前又有可靠的治疗方法,则临界点向左移,以提高灵敏度,尽可能多地发现可疑病人,但会使假阳性增多。
2.如疾病的预后不严重,且现有诊疗方法不理想,临界点可右移,以降低灵敏度,提高特异度,尽可能将非患者鉴别出来,但增加假阴性。
3.如果假阳性者作进一步诊断的费用太高,为了节约经费,可将临界点向右移。
4.如果灵敏度和特异度同等重要,可将临界点定在非病人的分布曲线与病人的分布曲线的交界处。
除上述四种情况外,人们常用受试者工作特征曲线(receiveroperatorcharacteristiccurve,简称ROC曲线)来决定最佳临界点。
它是用真阳性率和假阳性率作图得出的曲线,可反映灵敏度和特异度的关系。
ROC曲线的横轴表示假阳性率(1-特异度),纵轴表示真阳性率(灵敏度),曲线上的任意一点代表某项筛检试验的特定阳性标准值相对应的灵敏度和特异度对子。
如图7-4所示,随着灵敏度的上升,1–特异度值增加,即特异度下降,反之亦然。
通常将最接近ROC曲线左上角那一点定为最佳临界点。
在此临界点上,可同时满足筛检试验的灵敏度和特异度相对最优。
如图中的A点可定为血糖筛检试验最佳阳性临界点,该点对应的筛检试验的灵敏度为85%,特异度为88%。
图7-4糖尿病血糖试验的ROC曲线
ROC曲线是评价筛检试验的一种全面、准确、有效的方法,并可用以比较两种或多种筛检试验的诊断价值。
除了直观比较的方法外,还可计算ROC曲线下的面积。
曲线下面积反映了诊断试验价值的大小,面积越大,越接近1.0,诊断的真实度越高;
越接近0.5,诊断的真实度越低;
当等于0.5时,则无诊断价值。
第三节筛检效果的评价
在疾病控制中,筛检主要用来早期发现病人或高危个体,以便对其采取相应的医疗保健措施,以延缓疾病的发生或发展,改善预后的目的。
因此对筛检效果的评价可从生物学效果和社会经济学效益等方面进行评价。
主要内容有收益、检出患者的预后、卫生经济学评价等。
一、收益
收益(yield)也称收获量,指经筛检后能使多少