诊断试验.docx
《诊断试验.docx》由会员分享,可在线阅读,更多相关《诊断试验.docx(20页珍藏版)》请在冰豆网上搜索。
诊断试验
诊断试验(diagnostictest):
应用物理学的、生物化学的、血清免疫学的检查,临床检查和医疗器械检查,对疾病和健康状况提供信息的试验。
一种好的诊断方法要求真实、可靠、快速、安全、无损伤、费用低。
诊断试验的评价也是临床流行病学中重要组成内容之一。
第一节重要性
1、对诊断试验进行科学的评价能正确认识其临床应用价值。
2、科学地评价诊断试验是临床医生选择诊断试验的基础
诊断试验科学性评价
①?
?
试验是否与金标准试验进行“盲法”比较?
②?
?
是否每个被测者都做参照试验进行评价?
③?
所研究病人样本是否包括临床试验中将使用该诊断试验的各种病人?
④?
?
诊断试验的精确性(方法介绍详细、结果重复性好)
临床上诊断试验主要用于
(1)诊断疾病
(2)筛检疾病:
筛检原则
1)筛检的疾病是重大社会问题
2)能显着改善其预后
3)有足够的领先时间。
领先时间指的是从筛检发现到该病人因症状而去就诊的时间间隔
4)筛检试验方法快速、简易、价廉、安全、可靠、灵敏、特异、有效、能被受试者接受
(3)疾病随访
(4)判断疾病严重程度
(5)估计愈后
(6)估计对治疗的反应
诊断试验评价的目的
•怎样开展诊断试验研究
•怎样阅读和评价有关诊断试验的文章
•临床和科研工作中怎样选择诊断试验
–诊断疾病:
灵敏度和特异度高
–筛检无症状患者:
简便、经济、安全易接受
–疾病随访:
重复性好,影响因素少
–判定疾病的严重程度;估计疾病的临床过程及其预后;估计对治疗的反应;测定目前对治疗的实际反应
临床医生对一系列的检查事先要有计划,一般将最便宜、最无创伤的检查放在最先做。
第二节研究设计方法
1、确定“金标准”金标准:
是指当前医学界公认的可以明确肯定或排除某种疾病的最可靠的诊断方法。
2、选择研究对象
1)原则:
代表性
2)病例组:
按金标准确诊为“有病”的病例,包括各种类型的病人。
3)对照组:
按金标准确诊为无目标疾病的其他病例,特别是与该病容易混淆的病例。
正常人一般不宜纳入对照组。
被试验对象应同期进入研究。
3、样本大小的计算
决定样本量大小的有关因素
•灵敏度,计算病例组样本量
•特异度,计算对照组样本量
•显着性检验水平
•容许误差,一般定在0.05-0.10
4、列出诊断实验的四格表
诊断试验结果
诊断标准
金标准试验结果
合计
病人
非病人
阳性
a(真阳性)
b(假阳性)
a+b
阴性
c(假阴性)
d(真阴性)
c+d
合计
a+c
b+d
a+b+c+d
5、计算主要指标
1)真实性(validity)或准确性:
是测量值与实际值相符合的程度,亦即反映客观事物的准确程度
患病率:
a+c/N
(1)灵敏度(Sn)
*灵敏度(sensitivity)(真阳性率)即实际有病而按该诊断标准被正确地判为有病的百分率
灵敏度反映一项试验能将实际有病的人判定为患病的能力,其值越大,则漏诊的可能性愈小。
假阴性互补
(2)假阴性率(falsenegativerate)(漏诊率、第二类错误)
该指标是指在有病者中,被该项试验错判为无病的比例。
(3)*特异度(Sp)(specificity):
又称真阴性率。
特异度反映一项试验能将实际上未患某病的人正确地判定为未患某病的能力。
其值越大,则误诊的可能性愈小。
假阳性互补
(4)*假阳性率(falsepositive):
又称误诊率
该指标是指在无病者中,被该项试验错判为有病的比例。
(5)一致性(agreement):
该指标是指试验结果的真阳性和真阴性人数占受试者总人数的比例。
真阳性和真阴性值愈大,一致性愈接近于1,假阳性和假阴性愈小,该项试验价值愈高。
(6)*预测值(predicativevalue)Pv:
又称预检值、预告值。
检验结果的正确率,指诊断试验结果与实际符合的概率。
它包括阳性预测值与阴性预测值。
(+Pv)阳性预测值是阳性试验结果中实际患病者的百分率,即试验结果阳性者的患病概率。
该值愈大愈好。
(-Pv)阴性预测值是阴性试验结果中实际未患病者的百分率,即试验结果阴性者的未患该病的概率,该值愈大愈好。
(7)约登指数(Youden,sindex):
用灵敏度与特异度之和减去1。
其指数范围从0~1,约登指数愈大,其真实性亦愈大。
理想的约登指数为1。
(8)似然比(LR):
是诊断试验的结果在患者中出现的概率与非患者中出现的概率之比,是评价诊断试验真实性的重要综合指标。
包括
•阳性似然比(+LR)是诊断试验阳性结果在患者中出现的概率(真阳性率)与非患者中出现的概率(假阳性率)之比。
其值越大越好,表明阳性结果的正确率高。
阳性似然比=灵敏度(真阳性率)/假阳性率
•阴性似然比(-LR)是诊断试验阴性结果在患者中出现的概率(假阴性率)与非患者中出现的概率(真阴性率)之比。
其值越小越好,表明阴性结果的正确率高。
阴性似然比=假阴性率/真阴性率(特异度)
例:
某医院共收治360名疑似心肌梗塞病人,经临床及心电图等检查,确诊230名心肌梗塞病人,又对每个疑似患者进行肌酸磷酸激酶(CPK)含量测定,结果见表,试评价肌酸磷酸激酶诊断的真实性。
肌酸磷酸激酶试验结果
CPK
心肌梗塞病人
非心肌梗塞病人
合计
阳性
215(a)
16(b)
231
阴性
15(c)
114(d)
129
合计
230
130
360
灵敏度=a/(a+c)?
100%=215/230?
100%=93%
假阴性率=1-灵敏度=7%
结果表示在患心肌梗死的病人中用该试验检查阳性者占93%还有7%的人被漏诊。
特异度=d/(b+d)☞100%=114/130☞100%=88%
假阳性率=1-特异度=12%
结果表示在未患心肌梗死的病人中用该试验检查真阴性者占88%,还有12%的人被误诊。
患病率:
a+c/N=64%
一致性=(a+d)/(a+b+c+d)?
100%=329/360?
100%=91%
结果表示该试验检查出的阳性和阴性者中91%与金标准相符。
阳性预测值=a/(a+b)?
100%=215/231?
100%=93%
结果表示用该试验检查为阳性的人中有93%的人确实患心肌梗死。
阴性预测值=d/(c+d)?
100%=114/129?
100%=88%
结果表示用该试验检查为阴性的人中有88%的人确实未患心肌梗死。
•约登指数=(灵敏度+特异度)-1=0.81
•阳性似然比=(215÷230)/(16÷130)=7.6
其含义为心肌梗死患者CPK结果阳性者为非心肌梗死患者的7.6倍。
•阴性似然比=(15÷230)/(114÷130)=0.074
其含义为心肌梗死患者CPK结果阴性者为非心肌梗死患者的0.07倍。
理想的诊断试验要求灵敏度和特异度都很高,但当诊断试验的测量指标是连续变量时,不同的阳性标准有不同的灵敏度和特异度。
若提高灵敏度,必导致特异度下降,反之亦然。
第三节诊断试验评价指标和意义
1、灵敏度(Sn)和特异度(Sp)
(1)?
?
定义
(2)如何定临界点(cutoffpoints)
要求灵和特均高,不可能,如何定
截断值(cut-offvalue)或临界点的确定
•截断值所谓截断值就是正常值与异常值之间的界限值。
在诊断试验中,通常将正常范围定为均数±2倍标准差,在该范围内为正常,反之则异常。
截断值确定的策略
应以灵敏度和特异度最高,误诊率和漏诊率最小为理想。
(3)原则:
高灵敏度试验适用于
A.对于严重疾病但可治,早期诊断最好,而漏掉后果严重时。
结核
B.有几个诊断假设,为了排除某病的诊断。
C.用于筛检无症状病人而该病的发病率比较低,试验结果呈阴性时高灵敏度试验临床价值最大。
高特异度试验适用于:
A.无法治疗的疾病,误诊后果严重.如癌,阳性结果会导致病人精神和肉体上的严重危害。
B.要肯定诊断时,高特异度试验的阳性结果临床价值最大
2、预测值(Pv)又称诊断价值
它是诊断试验的收益评价指标,表示试验结果的实际临床意义,从本质上说是评价真实性的指标。
灵敏度和特异度是诊断试验本身的特征,是临床医生是否采纳该诊断试验的重要决策依据。
一旦诊断试验的结果报告出来,临床医生最紧要的工作就是判断有这种结果的人患病概率的大小。
预测值就是说明试验结果为阳性(或阴性)时,有多少概率有病(或无病)。
(1)定义
阳性预测值(positivepredictivevalue):
是指筛检试验阳性者患目标疾病的可能性
+Pv
阴性预测值(negativepredictivevalue):
是指筛检试验阴性者不患目标疾病的可能性
-Pv
(2)关系:
患病率一定时,灵敏度越高,则阴性预测值越好,临床医生更有把握判断阴性结果为非病人;反之,特异度越高,则阳性预测值越好,临床医生越有理由判断阳性结果为病人。
临床医生在很大程度上依据阳性与阴性预测值来判断受试者是否患病。
当灵敏度和特异度一定时,与受检人群目标疾病患病率(P)密切相关,人群患病率的波动远大于灵敏度和特异度的变化范围,因此临床医生更应注意患病率对试验结果的影响。
阳性预测值与患病率成正比,阴性预测值与患病率成反比。
关系公式
当患病率很低时,即使一个试验的灵敏度和特异度均很高,仍会出现许多假阳性,使阳性预测值降低,临床医生在判断一张化验单的阳性或阴性结果的临床价值时,必须事先考虑被检人群的患病率高低,才能做出正确的评价。
同样的试验在基层门诊部和在高级专科医院应用时,其阳性或阴性预测值也有很大差别。
3、受试者工作特性曲线(receiveroperatorcharacteristiccurve,ROC)
是用真阳性率和假阳性率作图得出的曲线,它可表示灵敏度和特异度之间的关系。
ROC有两方面的重要作用:
一是根据诊断目的确定参考值,二是对两个以上独立的诊断试验进行比较。
•ROC曲线可以决定最佳临界点,如患病率接近50%时,最接近左上角那一点,可定为自己最佳点。
以临界点作为截断值时,灵和特均高。
•ROC曲线也可用来比较两种和两种以上诊断试验的诊断价值.ROC曲线下面积反映一个诊断试验的整体准确性,面积越大,准确性越高.
ROC曲线是一种全面、准确评价诊断试验非常有效的方法。
ROC曲线常用来决定最佳临界点,通常最接近左上角那一点,可定为最佳临界点,点上的值即为最佳临界值。
ROC曲线也可用来比较两种和两种以上诊断试验的诊断价值,从而帮助临床医师作出最佳选择。
CT的整体准确性较高,在诊断脑瘤中的价值更大.
4、似然比(LR)
(1)定义:
即某一实验结果有病者与无病者的比值,也是反应诊断真实性指标(综合性指标),可同时反应灵敏度和特异度的复合指标。
比灵敏度和特异度更稳定,不受患病率影响,它的不足之处它是比不是率,应用时需换算。
+LR:
试验阳性结果的似然比系真阳性率和假阳性率之比。
说明正确判断阳性的可能性是错判阳性可能性的倍数。
-LR:
阴性结果的LR系假阴性率和真阴性率之比。
表示错判阴性的可能性是正确判断阴性可能性的倍数。
(2)例子:
CPK阳性结果的似然比为7.6,阴性结果的似然比为0.07,表示:
CPK阳性来自心肌梗死的可能性为来自非心肌梗死的7.6倍。
(或心肌梗死患者出现CPK阳性的机会是非心肌梗死者出现阳性结果的7.6倍)CPK阴性来自心肌梗死的可能性不到来自非心肌梗死的1/10。
(或心肌梗死患者出现CPK阴性的机会是非心肌梗死者出现阴性结果的0.07倍)
(3)似然比的重要作用
•实际上,很多有病的受试者的试验结果并不能在诊断试验后得到非常“异常”的结果,而可能是接近临界值的“边缘异常”的结果,这常常使临床医生难下诊断。
似然比摆脱了对一个试验结果简单的正常和异常分类,而是根据临界值的灵敏度和特异度来描述诊断试验结果的准确性。
上例中如果我们计算CPK的不同临界值的阳性似然比,可见随着CPK的诊断试验的临界值增大,似然比的比值也增大,所以,阳性似然比越大,阳性结果反映有病诊断的准确性越高。
•似然比的另一个重要作用是能缩短诊断假设,即如果知道了或估计出验前概率(患病率),利用似然比可以计算出验后概率。
诊断试验可用性评价
①?
?
计算疾病的验前概率
②?
?
应用敏感度和特异度的资料
③?
?
应用似然比
5、验前概率、验后概率以及关系和应用
(1)定义
•验前概率即患病率(P)
•验后概率即预测值诊断实验为阳性(阴性)时,受试对象患病(不患)的概率
(2)几个关系:
主要目的是求验后概率,中间的验前(后)比均为过程。
•验前比=验前概率/1-验前概率
•验后比=验前比*似然比
(3)似然比应用举例
•例:
某患者女性45岁,胸痛就诊,患冠心病概率为多少?
•文献资料,患病率1%
若患者有典型心绞痛,其似然比=100
验前比=0.01/(1-0.01)=0.01
验后比=0.01×100=1
验后概率=1/(1+1)=0.5=50%
若患者心电图检查ST段压低2.2mm,其似然比=11
验后比=验前比×似然比=1×11=11
验后概率=11/(1+11)=91%
当试验结果呈连续变量时,可计算不同区间的似然比
例:
一贫血女孩被认为在被查前患该病的概率40%,(即为验前概率=患病率)。
在实验室应用血清铁蛋白<65mmol/L作为诊断缺铁的标准(该标准诊断缺铁性贫血的灵敏度为90%,特异度85%)该女孩血清铁蛋白<65mmol/L,计算验后概率
计算:
•验前概率=患病率=0.4
•验前比=0.4/(1-0.4)=0.67
•阳性似然比=0.9/(1-0.85)=6
•验后比=验前比*似然比=0.67*6=4.02
•验后概率=验后比/1+验后比=4.02/1+4.02=0.8
•结论做过铁蛋白试验后,患病概率升高,诊断把握度增加。
•诊断试验的似然比决定了验前概率向验后概率变化的方向和大小
验前概率-诊断试验似然比-验后概率
•诊断试验的某一结果可使诊断疾病的验前概率增加或减少多少
似然比=1,验前概率=验后概率
似然比>1,表示患病的可能性增加,
愈大,患病的可能性愈大
似然比<1,表示患病的可能性减少,
愈小,患病的可能性愈小
•似然比大小和方向的粗略原则:
似然比>10或<0.1,使验前概率产生较大或常常是结论性的变化
似然比>5~10或<0.1~0.2,使验前概率产生中等度的变化
似然比>2~5或<0.2~0.5,使验前概率向验后概率产生较小程度
似然比>1~2或<0.5~1,使验前概率产生很小的变化
如事先测出诊断试验的似然比,计算就能帮助推断患者患某病的概率,有助作出正确诊断。
除公式计算外,还可利用似然比应用图。
似然比应用四个步骤:
A循证医学定似然比(P55页表4-7)
B确定其可行性和诊断试验在理论上的结果
C估计验前概率,计算第一个验后概率
D第一实验验后概率为第二实验验前概率,重复上述过程,即可得到最后的诊断。
当试验测定结果呈连续变量时,灵敏度和特异度并不是表示诊断试验特征最好的方法,应用似然比较科学,能全面描述诊断试验特征
6可靠性(精确性)评价指标(可重复性)
(1)定义:
可重复性是指诊断实验在完全相同条件下,进行重复操作获得相同结果的稳定程度。
(2)测量变异:
A观察者间变异
B观察者自身变异
C测量仪器,试剂
D研究对象生物学变异
(3)评价指标
A计量资料;用标准差、变异系数;
B记数资料:
用观察符合率和卡帕(Kappa)值表示
(4)Kappa值定理:
是判断不同观察者间,校正机遇一致率后的观察一致率指标,常用于比较两者的一致性,可用来评价可靠性。
Kappa值的取值范围为-1~+1,若Kappa值为负,证明观察一致率比机遇造成的一致率还小;Kappa值=-1,为两医生的判断完全不一致;Kappa值=0,表示观察一致率完全由机遇所致;Kappa值>0,表示观察一致程度大于因机遇一致的程度;Kappa值=1,表明两医生的判断完全一致;
•注意:
一个诊断试验具有较好的真实性,不一定具有较好的可靠性;而可靠性较好,不一定有较好的真实性。
两者不是必定相关的。
因此,在选择诊断试验时,即要考虑到其真实性,又决不可忽视其可靠性。
计算步骤:
观察一致率(P0)=(a+d)/N
机遇一致率(Pc)=(a+b)(a+c)/N+(c+d)(b+d)/N/N
非机遇一致率=100%-机遇一致率
实际一致率=P0-Pc=观察一致率-机遇一致率
Kappa值=实际一致率/非机遇一致率
=2(ad-bc)/(a+b)(b+d)+(a+c)(c+d)
Kappa值判断标准
Kappa值
一致性强度
<0
弱
0~0.2
轻
0.21~0.40
尚好
0.41~0.60
中度
0.61~0.80
高度
0.81~1
最强
第四节提高诊断试验效率的方法
(一)选患病率高的人群应用诊断试验
主观高-转诊、客观高-高危地区
(二)采用联合实验
1、平行(并联)实验:
①定义:
同时做几个实验,只要有一个阳性即可认为有病
②效应:
提高灵敏度和阴性预测值
③适应:
A急需作出诊断的B漏诊减少,误诊增加
2、系列(串联)实验:
主要用于慢性病的诊断
①定义:
依次相继实验,皆阳性的才为阳性
②效应:
提高特异度和阳性预测值
③适应:
A要增加疾病正确性癌B有危险的实验,先做安全性好的实验C单项实验特异性均不高时是最好的
(二)联合试验
1、并联试验(paralleltest)灵敏度和阴性预测值,特异度和阳性预测值,使误诊增多、漏诊减少☆。
在临床工作中,当①必须迅速作出诊断②目前尚无一种灵敏度很高的试验③漏掉一个人后果严重时④再进行诊断花费昂贵时,要尽量减少漏诊率,则可采取此试验。
2、串联试验(serialtesting)一种依次的试验,是否作下一个试验要根据上一个试验结果来决定。
串联试验特异度、阳性预测值增大,减少误诊率,灵敏度和阴性预测值降低,增加漏诊率☆。
在临床工作中,当不必迅速作出诊断时或误诊能造成严重后果时,应用此试验。
3、并联试验和串联试验混合进行
联合试验筛检糖尿病的结果
试验
尿糖
结果
血糖
糖尿病病人
非糖尿病
病人
+
-
14
10
-
+
33
11
+
+
117
21
-
-
35
7599
合
计
199
7641
▲串联:
全阳为阳,否则为阴
▲并联:
一阳即阳,全阴才阴
血糖试验:
灵敏度=(33+117)/199
特异度=(10+7599)/7641
尿糖试验:
灵敏度=(14+117)/199
特异度=(11+7599)/7641
并联试验:
灵敏度=(14+33+117)/199(增加)
特异度=7599/7641(减少)
串联试验:
灵敏度=117/199(减少)
特异度=(10+11+7599)/7641增加
第五节疾病早期诊断
一、早期诊断意义:
是指在临床出现症状之前的诊断,故是临床前期的诊断,二级预防,尤其对目前尚无特效预防措施的疾病等更为重要。
二、形式:
1、筛检(要求:
A灵敏度和特异度均高;B简、快、廉;C安全D依从性好)
2、定期健康检查
3、医院常规检查
4、病例搜索
5、病人自我检查
决定某病是否值得进行筛检发现取决于下述条件(P64)
第六节诊断正常参考值确定方法
一、概念:
指正常人各种人体指标数据波动范围。
二、方法:
1、均数±标准差方法:
A均数±2个标准差(正态分布)
B非正态分布,转为正态分布
2、百分位数法:
95%百分位数(120例)
3、ROC曲线法
4、实际工作:
即前瞻性研究
三、影响因素
•研究对象
•环境因素
•操作
•统计学处理问题
第七节常见偏倚
1、工作偏倚:
阳性----金标准方法确诊则产生偏倚
阴性-----不用
2、缺乏非病人群试验结果的信息造成的偏倚
3、不明结果引起
4、测量偏倚
5、金标准不当引起偏倚
筛检试验与诊断试验的区别
筛检试验与诊断试验的区别
诊断试验实例分析
一、方法学与结果描述和分析
1、题名:
肿瘤标记物:
血清CA125、SA联合诊断卵巢恶性肿瘤
2、作者:
李访亲
3、来源:
原湖南医科大学研究生论文
4、研究方法
4.1病例来源:
原湖南医科大学附属医院
4.2对象分组:
病例(卵巢恶性肿瘤)组50例
对照组:
女性健康献血员组49例
妇科良性疾病组59例
其他恶性肿瘤组9例
4.3诊断标准:
经手术和病理切片确诊,肿瘤分类按WHO(1973)标准
4.4诊断方法:
免疫放射分析技术(IRMA)法测定CA125(A法)
间苯二酚-盐酸法测定SA(B法)
界值的判断方法采用正态分布法,以95%上限为界,CA125正常上限为65Ku/L,SA为700mg/L。
5、主要结果
5.1病例组的CA125、SA均高于三个对照组。
5.2诊断试验真实性结果,见表
5.3绘制ROC曲线,图略
表5个不同界值CA125、SA值的灵敏度与特异度
A法B法
界值(Ku/L)灵敏度特异度界值(mg/L)灵敏度特异度
359465.85007075.6
659282.97006688.9
1007888.68005291.0
2006494.99004096.5
4004098.210003299.1
表单独和联合试验的指标结果
联合试验
诊断指标A法B法并联串联
灵敏度92.066.094.064.0
特异度82.988.973.597.4
假阳性率17.111.126.52.6
阳性似然比5.386.953.5524.6
阳性预测值69.772.360.291.6
准确度85.682.679.688.0
6.结论作者认为CA125具有早期诊断价值,联合试验可提高诊断效率。
二、诊断试验评价
1.与金标准的盲法比较该文使用病理切片的结果作为金标准,但观察比较结果未使用盲法。
2.病例代表性作者注意选择不同类型的病例,说明病例来源,也选择易混淆的其他肿瘤病人作为对照组,但最好不使用健康人作为对照组,因不便于评价诊断试验鉴别疾病的能力。
此外,健康人也不宜随便进行病理切片检查。
3.样本大小基本适宜,但未说明科学估算方法,且其他恶性肿瘤对照组的数量太少。
4.诊断界值的确定本文的诊断指标是计量的客观指标,采用正态分布法确定界值,并以ROC曲线定出界值,同时还报告了假阳性,因此结果时比较可靠的。
5.诊断试验的真实性作者分别报道了单独和联合试验的灵敏度与特异度,两种方法的特异度均较好,但并联试验和单独试验的阳性预测值较低,作者未结合临床实际进行综合分析评价。
6.诊断试验的重复性与可靠性结果表明两种诊断试验