ep5临床化学设备精密度性能的评价.docx
《ep5临床化学设备精密度性能的评价.docx》由会员分享,可在线阅读,更多相关《ep5临床化学设备精密度性能的评价.docx(33页珍藏版)》请在冰豆网上搜索。
ep5临床化学设备精密度性能的评价
临床化学设备的精密度评价
前言
目前临床化学文献包含了大量产品评估的实例。
这些评估使用了多种不同的实验和统计方法,而其中有些使用是不恰当或错误的。
目前几乎没有用于体外诊断设备的评估的指导原则。
有时由于文献中的评估缺乏足够的数据和描述而无法重现结果。
针对这一需求,委员会根据用户、厂商代表、统计学家、化学家、实验室人员和医务人员的经验编写了这一指导原则。
由于目前可用的体外诊断设备种类繁多,单一的实验设计显然不适于所有的设备。
因此,我们提出了指导原则这一框架,对可广泛适用于不同分析物和设备的时间、程序、材料、数据总结及解释技术提供了主要的概念性指导。
我们用一个典型实验设计的例子力图阐明评估的每个步骤。
在编写这个草案的每一步中,我们在许多推荐的时间,质控的内容和确定精密度组分的方法中认真选择。
我们力求在实验及公式的复杂性和操作的简便性之间建立平衡。
我们提供了附录(附录C),它可为修改设计和计算提供指导。
EP5早期的版本被实验室社团广泛的评论,并产生了不同的评论。
委员会感谢所有评论者的建议。
我们认真回顾了每一种意见并在文件中做了适当的修改。
但并非采纳了所有的意见。
对EP5-T的意见和小组委员会的回答都包含在附录D中。
欢迎对本版批评指正。
关键词:
评价草案,实验设计,医学设备,离群点,精密度,质量控制。
序言
1.1目的
本文件是为评价临床化学设备的精密度而提供的指导原则。
在很多情况下,这些技术可用于化学以外的其他领域。
当设备被修整后再与要求的精密度性能比较是无效的。
典型修整的例子有,不同试剂,校准液,控制品的使用,或操作程序与制造商标示的不同。
1.2一般精密度评价实验的概述
一般指导原则
(1)有足够的时间熟悉设备的操作和保养的原理。
(2)有足够的时间熟悉评价草案的步骤。
(3)整个评价期间设备需保养及做质控。
(4)应选择适当的样品进行适当长时间的实验,以得到足够的数据,来反应仪器在日常工作中长期真实的性能。
设备熟悉期
对设备的全面熟悉,包括原理、操作、设定、保养、故障处理等内容。
草案熟悉期
精密度实验的前5个操作日用于熟悉草案本身。
在实验实践过程中,应发现设备的任何严重问题,收集在实验结束时有用的数据,进行精密度和在本指导原则中未提到的其他工作特性如线性,漂移等的初步可接受性测试。
精密度评价实验
精密度评估实验推荐最少20个操作日。
因为日间精密度是分析中最常见的变异源,对性能的评价应持续足够长的时间,以确保总精密度得到适当的评价。
实验中的每一天应分别进行两批分析,每批应有两种样本,每种样本至少两个浓度水平。
除测试样本外,每批还应至少分析一个质控品。
推荐在评价期间仪器使用常规的质量控制程序和质控品(如果适当)。
完成精密度实验
草案熟悉期之后,实验应持续15天或以上。
每5个操作日结束后,应在质控图上重新计算控制限,并检查所有数据的可接受性。
精密度实验完成后,应对数据进行适当的统计计算。
与传统的精密度评价实验的比较
传统的精密度评价方法:
单批测试20次作为批内精密度;对一个给定浓度的样本每天进行一次(或几次)测试,共测10天或20天得出总不精密度(通常被错误的计算和误称为day-to-dayprecision日间精密度)。
这种方法有严重的缺陷,本草案特别不推荐。
用单批评价批内精密度存在很大的风险,因为实际上单批测试时的操作条件可能并不反应通常的操作参数,这对评价有不利影响。
进一步说,无法确定单批实验是否具有代表性。
因此,本文件推荐批内精密度评估由多批批内性能合并得到,这样可确保评估更有说服力和代表性,可推知在将来多种日常条件下的特性。
对于总精密度,虽然这里推荐的程序需要一些繁琐的计算,但不依赖于评价的天数和一天内的批数(与传统的方法不同)。
它可正确的合并精密度组成部分批内、批间和日间的影响(相对大小因方法而异),并可避免对总不精密度使用错误的术语(如day-to-dayprecision日间精密度)。
1.3精密度评价的统计功效
精密度和可信度
在设计一个评价实验时,必须预先决定怎样确定设备的真实精密度。
每次执行一定的精密度方案,就能获得一个设备真实精密度的评估。
在同一个实验室用一台受控的设备重复运行相同的草案,尽管真实精密度是一样的,却可得到不同的精密度评估结果。
可以料想到,这些精密度的评估分散在真实精密度的周围,并且从更多组观察中得到的评估将更紧密的围绕在真实精密度的周围。
在某种意义上,更可信的评估需要更多数量的观察。
评估越可信,对异于要求的性能的检测越有统计功效。
与制造商的统计学比较
用这个精密度评估实验,可将评估结果和制造商提供的批内和总精密度比较。
这个比较的统计功效可以计算,即根据评估的自由度计算评估与要求的性能在统计上有多大的差异。
这个极其重要的概念可以用来说明一个自由度为100的批内精密度评估与要求的性能有很小的偏离。
同样,一个自由度为10的批内精密度评估将检测到与要求的性能较大的差异,这样的精密度评估只有很低的统计功效。
如果评估的自由度为40,则其有较大的统计功效,并且评估可以检测到与要求的性能较小的差异,尽管这种差异在临床上仍然重要。
这在任何评估实验的设计中都是很重要的异方面。
1.4一般防护措施
所有的患者血液标本均存在潜在的感染性,必须预先处理。
美国疾病控制中心和NCCLS都有相关的指导文件。
设备熟悉期
目的
必须学习所需的操作,维护程序,样本准备方法,及定标和监控功能。
大多数临床化学设备制造商提供操作培训。
尽管这种培训是必须的,设备还是应当在各实验室建立并运行足够长的时间,以便理解涉及到的所有程序,并避免在实际性能评价中出现问题。
应当分析现有的样本,包括混合血清,控制品,残留血清(如果合适)和适合设备的所有任何其他实验物。
应当监控所有在日常操作中可能发生的意外(例如错误标志,错误修正,校准等)。
本期不应收集数据。
设备熟悉期应持续到使用者确信可操作设备为止。
时间
推荐熟悉期为5天。
可根据设备的简单或复杂程度,适当增减。
草案熟悉期
目的
评价实验经常涉及到一些在日常实验条件下通常不会遇到的步骤。
为了避免这些不熟悉的步骤给评价实验的结果带来不利影响,在草案开始前应进行几次实验。
本期可确保对草案的理解。
实验应当使用实验室常规使用的实验物和质控品,并按下节所述的方案进行。
时间
草案熟悉期应持续至获得数据无操作困难后至少5个操作日。
复杂设备如必要可适当延长时间。
数据的使用
在这5天内(或更长时间内)操作无困难的情况下收集的数据,可与执行草案时收集的数据合并使用。
所有数据应符合下述质量控制可接受性检查。
质量控制程序
本期应对设备进行常规质量控制。
本期数据收集完成后应计算实验控制限,并应满足用质控品测试的结果或生产商对设备的性能要求。
若不满足则应联系厂商调整该设备。
附加评价
本期还可对设备的线性、回收率等其他性能进行测试,以便发现设备是否存在其他严重的问题。
若有应联系厂商查找原因,并解决问题。
初步精密度实验
在本期结束或即将结束时,进行一次初步批内精密度测试。
连续测定一种适当的测试物20次(或小于20次的一个完整的批),计算SD和CV,与期望值比较。
严重不符应联系厂商解决问题后再进一步实验。
应该强调的是,用单批测试来判断设备的可接受性是不充分的,它仅用于确定继续评估前应当解决的问题。
检测离群点
精密度评价实验必须定义离群点的检测标准。
检测标准用于确定操作问题,不能歪曲结果数据和精密度评估。
假定适当的质量控制程序将用于实验中,建议用一个相当不充分的实验检定数据中明显错误的离群点。
离群点测试来源于初步精密度实验中收集的数据。
精密度评估实验中收集到的每批数据均是成对的,应用下列方法检测。
1)如果一对数据差的绝对值>倍初步批内精密度实验SD时,此对数据作废,应补做。
2)如果发现离群点,应查找原因,并重复此批。
数值来源于%以上分布概率。
注意:
此实验在初步精密度测试物浓度和评估测试物浓度接近时才采用。
精密度评价实验
精密度的内容
精密度评估实验的目的是评价设备的总精密度。
总精密度是设备在一个不定的长时间内的变异性。
一些变异源在一定程度上影响长期精密度。
通常在不必决定每个来源或组分相对大小的情况下,设计这样一个实验是充分的,以便所有的变异源影响总精密度评估。
用于描述与时间相关的总精密度内容的术语包括:
1)批内
2)批间
3)日内
4)日间
其中批内精密度和总精密度是最重要的。
本节描述的实验被设计用于实验室操作中设备总精密度和批内精密度的评估。
在本实验中没有合并可能很重要的变异源如校准物和试剂批号的不同,技术员/操作者的不同,但是建议生产厂商包含这些内容。
影响精密度的其他一些不需逐项评价的因素(样本预处理,测试物稳定性,携带率和漂移等)包含在内。
试剂与校准物
实验中应使用同一批号的试剂和校准物。
使用多批号的这些物质将增加观察到的变异性,而实验并不能将这些因素的影响分离。
试验物
基质
应与新鲜的临床病人标本性能接近。
可用稳定的、商品化的、蛋白质基质。
如果合适,稳定的冷冻混合血清是首选。
浓度
应根据一些准则认真选择试验物。
推荐两个浓度(也可更多)。
浓度应尽量选择横跨设备可测范围中有意义的部分。
如用2个以上的浓度时,增加的浓度应尽可能接近实验室“医学决定水平”。
如果为了将评估的结果和公布的性能要求比较,应选择符合要求水平的浓度。
实验次数和天数
一般指导原则
这里描述的实验和计算是评估设计的一个实例。
也可采用其他设计,但需要的计算和统计处理将有所不同。
精密度实验需要充足的数据,以便精密度评价能恰当的反应设备的真实精密度。
为了获得这样的结果,精密度评价实验至少需要20个可接受的操作日。
在实验开始的最初5天,实验者应熟悉如节所述的草案。
短批方法在2小时以内完成一批,而长批方法(例如RIA)通常每做一次转换需要更长的时间。
对长批方法,应该使用附录C所示的每天一批的程序;对于短批程序,评估样本可置于批内的任何位置测试。
特殊规程
每天应采取以下步骤:
1)分析2批或2个批号;
2)如有一批因质控规程或操作困难必须舍弃时,应增加1批;
3)在1批实验或1个批号中,对使用的每个浓度的实验物两等分分析;
4)每批实验均应包含常规质控样品;
5)每批实验改变试验物和质控品的分析次序;
6)模拟实际操作,每批至少加入10个患者的样品;
7)一天内如做多批时,各批实验之间要至少间隔2个小时。
数据记录
附录A为用于总结数据的样本数据记录表。
这种类型的小结对以下所述的统计分析很有用。
如果批数,天数或观察数变了,可以创建类似的表格,将结果数据转入其中,并且相应调整必要的计算。
质量控制程序
一般指导原则
正常的质控应贯穿整个评价实验。
每批实验中至少有一个适当浓度的质控品。
如果通常使用两个或以上浓度的质控品,这种方法应持续整个评价实验。
统计学质控图
在草案熟悉期结束时应建立设备的统计质控图(如可接受的精密度数据收集期的前5天)。
按下列程序进行。
1)根据通常的惯例从最初的数据中计算中线、警戒限、失控限;
2)在图上绘出随后所有的质控数据;
3)若有任何一点失控,应确定原因并重做该批;
4)每收集5天的数据后,由所有迄今收集的可接受数据重新计算每个图的中线、控制限;
5)假如原来可接受的结果现在不能被接受的话,继续精密度实验直到获得适当的天数;
6)保留舍弃批数据记录。
精密度的统计计算
将数据收集并转移到适当的表格后,应当进行本节所述的计算。
附录B为一个完成的样本数据记录表及相关计算的实例。
每一个浓度应分别计算,并且所有的数据应检查是否符合节中叙述的离群点基准。
批内精密度评价
计算公式:
;(公式1)
I=总天数(通常为20);
j=一天内的批数(1或2);
Xij1=第i天第j批重复第一次的结果;
Xij2=第i天第j批重复第二次的结果。
用上面的公式需要每天两批测试的两个结果。
如果某天只有一批可用,该批就不能用上面的公式。
(参见附录C每天只有一批或混合单批和多批的公式。
)
总精密度评价
决定总精密度评价需要几个量,需要以下计算。
(公式2)
I=天数(每天2批);
=第i天第一批的平均值(重复两次的均值);
=第i天第二批的平均值(重复两次的均值);
A的计算是用所有天数的第一批分析均值与第二批分析均值差的平方和除以2I再开平方得到的。
一天只有一批的数据不能包含在内。
第二个量是:
(公式3)
I=天数;
=第i天所有结果的均值;
=所有结果的均值;
这是日均标准差,可用附录A中的#3数据表确定。
接下来的计算为:
(如为负数则定为0)
将负值调为0是统计学上常用的转换。
如果通过软件完成这些计算,就可确保完成上述转换。
总精密度评估用下列的标准差公式计算:
(公式4)
从这个公式可以通过计算所有观察的数据的标准差得到ST的不同结果。
上述公式是评估总精密度SD的正确方法,因为它适当的统计了日间批间和批内的组分。
与总精密度评估的标准差相应的变异系数,用ST除以被分析物的浓度再乘100计算。
结果以百分比表示。
注:
用A和B这些量来评价精密度的日内和日日组分。
(见附录C)
与制造商的要求或其他性能参数的比较
在上一节得到的精密度评估应该与设备性能要求的精密度比较。
可用下面介绍的卡方(X2)统计学方法。
为了用这种方法,将要求的性能表示成点评估(例如标准差)。
将上节得到的批内和总精密度分别进行比较。
批内精密度比较
性能要求的标准差用
表示。
卡方测试用使用者和制造商评估的批内精密度的平方。
进行这个测试必须知道
(使用者的变异评估)的自由度。
在本草案所述的实验中是,
的自由度与用于计算它的数据对的数目一样。
因此,它就等于实验中的批数,以下用R表示。
本测试包含以下计算:
(公式5)
这里:
=使用者批内标准差评估的平方;
=生产商要求的批内标准差的平方;
R=总批数(
的自由度)。
计算的
应当与
值统计表中自由度R95%以上的临界值比较(见表1)。
如果计算值小于表中的值,则评估与要求值无显著差异,并且要求精密度这一部分有效。
注:
评估有可能大于制造商的要求,但仍无显著差异。
总精密度比较
可用一个与上述相似的卡方测试比较评估的总精密度与制造商要求的或使用者机构医学应用所需的总精密度。
但是与批内精密度评估不同的是,确定精确的ST自由度涉及复杂的计算。
由于草案结构的原因,使用者不能假定所有的观察都是独立的,在评估之前必须先假定自由度(可用总观察数-1)。
缺乏独立性的ST的自由度T可用下面的公式计算。
令:
ME=
(批内均方)
MR=2A2(批均方)
MD=4B2(日均方)
这里:
,A和B已在定义,
(公式6)
取与计算值最接近的整数作为ST的自由度。
用这个值,适当的统计如下:
(公式7)
这里:
=使用者总标准差评估的平方。
=制造商要求的或医学需要的总标准差的平方。
T=ST的自由度。
如果计算的
值小于95%以上
的临界值(见表1),总精密度评估所示的精密度性能是可接受的。
如果计算的
值大于95%以上
的临界值(见表1),精密度性能不在要求的界限内,或者不能被定义的医学应用所接受。
使用者的评估可能大于制造商要求的SD但仍可接受。
由于使用者的实验基于有限的观察数,可以预期有围绕计算的
和ST的真值的取样误差。
使用者的实验越大,评估越接近真实值。
卡方测试用于决定你的评估是否明显大于制造商所提供的。
包含分析物列表的明确的可接受标准差未在本文件范围内。
建议向使用机构的医务人员咨询或研究技术文献,以便为每种分析物的可接受标准差建立一个合适的量化的定义或标准。
制造商依据本指导原则设立精密度性能要求
考虑因素
制造商可使用本文件所述的实验建立批内和总标准差(点评估)及变异系数的精密度性能要求。
但是制造商的目的应当是用足够的精力建立这些点评估,以便能够适用于在方法、设备或装置日常使用中可能遇到的广泛不同的操作环境。
制造商可以选择单一批号的试剂、校准周期、设备和操作者进行最少20天来评估总精密度。
这种方法最小化了那些增加长期不精密度的因素的影响,并且增加了使用者在他们的实验室不能获得相似结果的风险。
这种风险可通过合并多设备,多操作者,多批号试剂和校准液及校准周期(如果适当)而减少,但这通常增加精密度标准差。
然而,多因素的应用可以更好的反应多数客户作出的结果范围。
合并多因素
有两种方法合并反应多因素的数据。
方法一:
使用多批号试剂,校准周期,多操作者和多设备进行20天或以上的上述基本的一天两批的评价实验。
数据可根据前面提供的公式分析和总结,但是现在这些数据可以反应实验设计中合并的那些因素对精密度性能的影响。
这些评估可能更好的反应了实验室得到的精密度范围。
方法二:
允许使用多台设备,每天提供两批以上的测定。
在这种情况下,应当用通常的嵌套的差异分析来决定属于每个设备的合并多试剂和校准物批号、校准周期和操作者的变异组份。
然后将每个设备的评估合并来建立精密度性能要求。
这种方法可以反应不同设备间精密度性能的差异,而不必合并实际的设备间组分,但不适用于单设备使用者。
这个过程的确切计算超越了本文件的范畴,但可在差异分析的标准参考书中找到。
性能声明报表格式
标注精密度性能要求应包括以下内容:
1)制定要求时所用样品的浓度。
2)批内精密度标准差的点评估(单值参数评估)。
3)批内变异系数百分比(可选)。
4)总精密度标准差的点评估。
5)总精密度变异系数百分比(可选)。
6)实验最少天数。
7)最少总批数。
8)总观察数(可选)。
9)用于评价的设备数(可选)。
10)试剂批号。
11)循环校准和校准物批号(可选)。
12)在描述精密度性能要求时,不得使用批批,批间,日日,日间等名词,因为它们的定义和计算含糊不清。
13)建议提供一个以自由度(df)为索引的期望的最大批内标准差和总的标准差(可接受限)的表。
这给方法的使用者提供了一个在一些小的验证实验中计算得到的评估略高于性能要求的SD(批内和总的)时的评定基准。
推荐用表2为要求的SDS因数建立一个与下面的表相似的标注表。
声明的批内SD:
@240mg/dl
使用者实验的df
可接受的SD最大值
10
20
30
40
100
表1:
的临界值
使用者df差异评估
95%临界值
99%临界值
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
50
60
70
75
79
80
90
100
表2:
使用者SD评估可接受因数
使用者SD评估的df
95%使用者评估的95%以上可接受限*
10
20
30
40
50
60
70
80
90
100
*通过本因数,制造商实验的多点评估将获得更大的可接受限。
表3:
本文所用标识符
批内标准差评估;
I总天数(通常为20);
J一天内的批数(通常为2);
Xij第i天第j批的结果;
第i天第1批重复两次结果的均值;
第i天所有结果的均值;
所有结果的均值;
A批间标准差;
B日间标准差;
Sdd日间标准差评估;
Srr批间标准差评估;
ST总精密度标准差评估;
要求的批内标准差;
R总批数(
的自由度);
TST自由度;
ME批内均方;
MR批均方;
MD日均方;
制造商要求的总标准差或医学要求的标准差。
附录A:
样本数据记录表
数据表#1
精密度评估实验
浓度:
试剂来源/批号:
分析物:
校准液来源/批号:
设备:
天数
日期
第一批
第二批
第一批均值
第二批均值
日均值
结果1
结果2
结果1
结果2
1
2
3
4
……
17
18
19
20
数据表#2
精密度评估实验
分析物/浓度:
设备:
天数
第一批
第二批
(第一批均值-第二批均值)2
(结果1-结果2)2
(结果1-结果2)2
1
2
3
4
……
17
18
19
20
求和
(1)
(2)
(3)
数据表#3
使用数据表2列出的
(1)
(2)(3)的结果
参考:
=
这里I=总天数;
=
来自数据表1;
B=日间标准差=;
=
计算T(总标准差评估的自由度)
ME=
=MR=2A2=MD=4B2=
=……
=……(最接近整数)
数据表#4
精密度评估实验与要求的比较
1.批内精密度
使用者浓度水平=
使用者SD=要求浓度水平=
使用者SD2=自由度(R)=
要求SD=
要求SD2=
(A)(使用者SD2/要求SD2)×R=
(B)卡方临界值(来自表1)=
不能接受(A>B)
可接受(A≤B)
2.总精密度
使用者浓度水平=
使用者SD=要求浓度水平=
使用者SD2=自由度(T)=
要求SD=
要求SD2=
(A)(使用者SD2/要求SD2)×T=
(B)卡方临界值(来自表1)=
不能接受(A>B)
可接受(A≤B)
注:
“SD”指批内精密度,总精密度或制造商要求的标准差。
附录B:
完成的样本数据记录表实例
数据表#1
精密度评估实验
浓度:
高试剂来源/批号:
AA-LOT87011
分析物:
葡萄糖校准液来源/批号:
AA-LOT87011
设备:
XYZ
天数
日期
第一批
第二批
第一批均值
第二批均值
日均值
结果1
结果2
结果1
结果2
1
7/8
242
246
245
246
244
2
7/9
243
242
238
238
238
3
7/10
247
239
241
240
243
4
7/11
249
241
250
245
245
5
7/14
246
242
243
240
244
6
7/15
244
245
251
247
249
7
7/16
241
246
245
247
246
8
7/17
245
245
243
245
245
244
9
7/18
234
239
244
245
241
10
7/21
244
246
247
239
245
23