主管临床医学检验实验室质量管理 第11章 临床检验方法评价.docx
《主管临床医学检验实验室质量管理 第11章 临床检验方法评价.docx》由会员分享,可在线阅读,更多相关《主管临床医学检验实验室质量管理 第11章 临床检验方法评价.docx(18页珍藏版)》请在冰豆网上搜索。
![主管临床医学检验实验室质量管理 第11章 临床检验方法评价.docx](https://file1.bdocx.com/fileroot1/2022-10/16/aabd1f00-06b8-4041-89fb-94f28a74effb/aabd1f00-06b8-4041-89fb-94f28a74effb1.gif)
主管临床医学检验实验室质量管理第11章临床检验方法评价
临床检验方法评价
基本概念和定义
性能参数
1.准确度:
国际临床化学联合会(IFCC)将准确度定义为分析项目测定值与其“真值”之间的一致性。
实际上,分析项目的真值可使用不同的参考方法技术获得。
然后通过使用系统误差或总误差概念来确定方法的准确度,并由它评价分析项目真值与其测定值之间一致性。
决定性方法指的是与某些绝对的物理量有关系,如质量。
它们被用于检测物质来提供与分析物真值最接近的值。
向血清样本中加入已知量同位素标记的分析物被再用质谱法测定称为同位素稀释质谱法,这是用于决定性方法的常见技术。
已校准的质量分光光度计允许确定未标记分析物的量和已标记分析物的量的比值。
这些量的比值可计算出未知的量。
参考方法是在工业和临床实验室由有经验的工作人员执行得更高精度的方法。
参考方法的结果可溯源到决定性方法。
由决定性方法验证的一级参考物质被用于参考方法的开发和校准。
比较方法均值是选择方法能力验证试验结果的平均值,他们通过使用不同仪器和技术的多个实验室产生的平均结果而获得。
将测量值和平均值作为比较是评价测量准确度的常见方法。
选择用于计算比较方法的平均值的方法,因为多年来它们具有可靠的性能,证据表明这些公议值经常与近似的真值非常接近。
同组均值是使用相同仪器和技术从几个实验室获得的能力验证试验结果的平均值。
同组均值可允许实验室通过与其他实验室使用相同的仪器的比较来评价自己仪器的准确度。
此种方法,实验室依赖于厂家来描述方法与某些准确度更独立测量之间的关系。
(2)系统误差概念:
系统误差是测定量与真值的一致性的度量。
准确度的这方面的估计通常是通过方法学比较试验,即评价的方法与准确度已建立和确认的方法同时检测临床标本。
不准确度和偏倚常被用来强调比较方法之间的缺乏一致性。
对于给定的方法,系统误差可为正或负偏倚,其不同于随机误差,其出现正和负两方向。
系统误差可再分为两种类型,即固定的和比例的误差。
固定的系统误差指的是即使分析物浓度改变但仍处于同一大小;而比例系统误差大小是分析物浓度的百分数。
固定和比例系统误差是可以检出的,并可以通过绘制试验方法的结果与一组样本的“真值”之间的关系图可清楚地显示(如下图)。
在图A中,随机误差显示的离散数据围绕拟合的线性。
图B中,固定误差造成在同一方向的偏移,其可通过线与Y轴的交点(Y轴截距)来定量估计。
比例误差造成线的斜率偏离理想的45度角。
因此,仔细地检查关系图能提供有关这些分析误差分量的有价值的信息。
另一个有用的工具是检查系统误差的“偏倚图”,其是试验和参考方法之间的差值(偏倚)为Y轴,参考方法的结果为X轴的图形。
偏倚图帮助直观地检查偏倚在整个值范围内是否是固定的,或偏倚是否受到方法之间差值的影响。
然而,这些图形并不能像上图那样对固定和比例误差容易地作出解释。
(3)总误差概念:
在常规测定中每个标本测定结果都会有误差,这个误差包括了各种类型的随机误差和系统误差,因此测定结果与真值的差异是随机误差(RE)和系统误差(SE)的总和,即总误差(TE)。
也可用TE=1.96s+|Bias|表示(95%允许误差限)。
所选用的检测方法的总误差必须在临床可接受的水平范围内(也就是允许总误差,TEa)。
也就是说任何一项检测项目大于可允许误差都不能被接受。
总误差概念和其与随机和系统误差之间关系见下图所示。
围绕中央值的分布表示随机误差。
而分布的中央值偏离其真值表示系统误差。
2.分析范围:
这种参数指的是“方法应用未经修改样本的浓度范围或其他量”。
通过线性试验,即候选方法检测含较宽范围的特定分析物量的参考溶液。
理想情况下,校准曲线(响应对分析物浓度之间关系图)应该是线性并通过原点。
如果曲线是线性,检测范围被称为方法的线性范围。
3.分析灵敏度:
国际理论和应用化学联合会(IUPAC.)将方法的分析灵敏度定义为校准曲线的斜率及对于规定量的变化分析程序产生信号的变化。
对于词语“分析灵敏度”和“检出限”经常是混淆甚至是误用。
存在这种混淆是因为词语是互相关联—两者认为是方法“敏感”的特性。
实际上,理想的方法是描述为具有高的分析灵敏度水平和低的检出限。
4.分析特异性:
这一词语是与准确度相关联,并指的是分析方法只确定分析物,而对其他相关的物质不起作用的能力。
分析的特异性也可受到血清或血浆中胆红素、血红蛋白和脂类等物质的影响。
这些成分可能通过它们的颜色、浊度或其他物理或化学特性来影响方法。
5.空白测定:
在测量程序过程中由于试剂和样本成分而观察到的响应被认为是“空白测量”。
通过下列试验可获得这些值:
(1)没有样本试剂溶液(即是试剂空白);
(2)样本溶液和缺少关键试剂的溶液(即是样本空白)。
6.检出限:
国际理论和应用化学联合会(IUPAC)将检出限定义为给定分析程序具有适当的确定检出的分析物的最小浓度或量。
检出限依赖于空白读数大小,并且被认为与这些测量的精密度有关系。
7.干扰:
干扰描述的是除了分析物以外,某些其他成分的影响或一组成分对分析物测量的准确度的影响。
一种例子是葡萄糖氧化酶反应测量葡萄糖,其中产物过氧化氢可能与尿酸而不是期望的色团起反应。
干扰可能是轻微的,例如,药物的存在与某些叠氮试剂起反应。
8.精密度:
分析方法对同一样本产生重复测量相同值的能力被称为它的精密度,也被称为随机分析误差。
精密度通常由同一材料至少分析20次并且计算标准差的重复试验来估计。
批内精密度是在同一分析批内重复地分析同一样本的变异性,或对一系列的临床标本在同一批内进行双份检测并计算双份测定的标准差。
当在同一天内在几个不同批重复检测同一样本时,可估计日内精密度或批间精密度。
这种变异性通常要比观察到的批内重复的变异性要高些。
日间精密度是当在不同天重复检测同一样本获得的变异性。
这种最后的估计值是性能的最实际的评价,因为它包括了由于不同操作人员、仪器日间的变化、不同移液器的使用、以及实验室的温度或其他条件的变化而导致方法性能的改变。
所有这三种类型精密度的分量可通过方差分析(ANOVA)计算进行估计。
美国国家临床实验室标准化委员会(NCCLS)文件已描述如何使用方差分析(ANOVA)估计每一精密度分量。
实际上,通过使用不精密度这一词语来代替精密度,因为它可以定量重复测量发生的变异性。
9.回收:
回收是指当已知量物质加入到真实样本中分析方法正确地测量分析物的能力。
回收测量是获得准确度信息的一种有效的方法,因为它可检验在真实样本的基质中存在所有其他成分分析方法是否能检测分析物。
当分析参考方法和参考物质受到局限或不可获得时,回收试验可以说是评价准确度的唯一实际的方法。
性能标准
为了客观地选择和评价候选的方法,在开始分析试验之前和在试图获得作出方法的适应性之前,需要建立性能标准。
如果没有首先制定性能准则,执行评价试验来估计误差和作出方法可接受性的结论将减少研究的价值和有效性,并可导致作出像“很好的质量”、“比较后很好”、“证明具有可接受的性能”主观陈述的结论。
(一)要求
性能目标应规定在特定浓度或分析物活性上允许的总误差。
在医学决定性水平(Xc)选择这些浓度,此种试验结果对于临床医师作出诊断、监测或治疗决定的解释时是非常关键的。
当分析物有不同的医学应用时可制定几个水平。
例如,血钙需要的关键浓度有①低钙血症;②正常的血钙;③高钙血症见下图。
因此,评价测量钙的候选方法需要在这些关键浓度上设计来估计误差。
(二)建立质量目标
几种信息资源可被用于建立总的分析误差限。
这些包括基于实验室试验的医学使用的经验的专业判断,临床医师的调查,分析物个体内生物学变异,基于当前分析技术水平的界限,及分析物参考区间分数计算的界限。
这些是不广泛应用的规范。
什么情况下适合依赖于卫生保健机构的医学任务,服务对象的患者群体,试验的特定应用,以及医师解释试验结果采用何种方式。
因此,性能目标对于不同的实验室可有不同,甚至是对于同一实验室由于应用的目的不同而不同。
例如,用于监测肾移植受体的肌酐方法比用于健康筛查的方法应有更严格的要求。
欧洲工作小组,使用生物学变异作为基础,推荐了三种水平的分析目标:
“最低的性能”、“期望的性能”和“最佳的性能”。
对于期望的性能,他们建议的精密度目标是1/2的试验的个体内生物学变异。
对于偏倚,他们推荐的是1/4的组生物学变异,或1/16参考区间,或者是缺乏其他准则时,采用两倍的理想的精密度。
美国临床实验室改进修正案(CLIA)法规对方法选择和评价过程最具有影响意义在于对特定的法定分析物建立了评价方法和实验室性能的固定限(见下表)。
在实际工作中,给定的分析方法的允许总误差必须小于分析物CLIA固定界限。
例如,为了实验室产生能力验证计划样本的可接受性能,Ehrmeyer和同事建议他们必须将偏倚降低到最小,并且将室内的变异系数降低到1/3的CLIA固定限目标。
Barnett和Westgard进一步建议方法的变异系数应不超过1/4的CLIA界限,这样包括了不稳定性能的可能性及使用成本效率的质量控制程序。
在这基础上,将CLIA’88限除以4可以与s规范进行比较。
因此,CLIA限能被用于建立候选方法的性能准则。
这是一种方法评价的实用和合理的方法,并且要比性能满足厂家提供的规定接受方法的实践要好得多。
评价分析方法
已制定了要求、建立了质量目标和选择了候选方法后,执行统计学上规定试验来收集所需要的数据,这样才能作出方法性能特征的评价。
下表是不同评价试验估计的误差判断可接受性准则。
不同评价试验估计的误差判断可接受性准则
Sabs是重复试验确定的标准差;是回收试验确定的平均回收(百分数);bias是干扰试验确定的平均差;a和b采用方法比较数据由回归分析确定的y-轴上的截距和斜率;Xc是医学解释是最为关键的决定性浓度水平;sA、BA和TEA分别是允许标准差(s)、允许偏倚和允许总误差。
(三)评价临床方法的文件
美国国家临床实验室标准委员会(NCCLS)多年来一直致力于制定一系列评价临床方法的文件。
EP5-A:
临床化学设备操作精密度评价:
批准指南。
用于临床化学设备进行精密度评价的实验设计及如何与生产厂声明的精密度进行比较。
EP6-A:
定量分析方法的线性评价:
统计方法提议指南第二版,用于在评价方法过程中检查检测方法的线性,也可作为常规质量保证的一部分,进行线性检查链及验证厂家声明的线性范围。
EP7-A:
临床化学实验干扰:
提议指南,提供背景信息和鉴定程序,用于干扰物对检测结果影响的定性。
EP9-A2:
用患者标本进行方法学比较和偏倚评估:
批准指南,主要用于检测两种临床方法或设备间的偏倚,和使用患者标本进行方法比较的实验设计及数据分析。
EP10-A2:
定量实验室方法的初步评价:
批准指南,提供了用于分析方法和设备操作的初步评价的实验设计和数据分析。
EP11-A:
用于体外诊断检测说明的统一描述:
提议指南。
EP12-A:
用于定性实验评价的用户协议:
提议指南。
EP13-R:
实验室统计—标准差:
报告。
EP14-A:
基质效应的评价:
批准指南。
EP15-A:
精密度和准确度性能的应用:
批准指南。
EP18-A:
检测单位使用的质量管理:
提议指南。
EP21-A:
临床实验方法总分析误差的评估:
提议指南。
六、应用范例:
血清葡萄糖
为了证实前面的信息是如何应用于实验室,下面将以实例进行描述。
此实例是关于血清葡萄糖测定方法的评价。
(一)分析需求
在常规工作时间以外的时间需要快速方法确定血清葡萄糖。
样本体积为0.2ml