EP9中文版用患者样本进行方法比较和偏差估计.docx

资源描述

EP9中文版用患者样本进行方法比较和偏差估计.docx

《EP9中文版用患者样本进行方法比较和偏差估计.docx》由会员分享，可在线阅读，更多相关《EP9中文版用患者样本进行方法比较和偏差估计.docx（25页珍藏版）》请在冰豆网上搜索。

EP9中文版用患者样本进行方法比较和偏差估计.docx

EP9中文版用患者样本进行方法比较和偏差估计

用患者样本进行方法比较和偏差估计

1序言

1.1目的

本文件给临床实验室设备的用户和制造商提供了在测试同一分析物时,设计实验来评价两种方法间的偏差的指导原则。

理想情况下，测试（或候选）方法应当与参考方法比较。

但是对用户来说，比较方法通常是目前的日常方法，并且评价的目的是确定这两种方法在实验统计的功效内是否产生相等的结果。

在这种情况下，主要关注的是确定测试方法是否是当前方法合适的替代品。

本指导原则允许两种方法间的偏差评估（期望差异）在不同的浓度进行评价。

如果比较方法与制造商在声明陈述中所用的相同，可以将统计的实验结果与制造商的声明比较来确认可接受性能。

1.2一般比较实验的概述

评价一种分析方法需要下面的内容：

●操作者有足够的时间熟悉设备操作和维护步骤。

●操作者有足够的时间熟悉评价方案。

●确保在整个实验期内测试和比较方法在合适的质量控制中。

●有足够的数据来确保测试和比较方法有代表性的数据。

（多少数据构成足够的数据取决于两种方法的精密度和干扰影响，和两种方法间偏差的量，和可用的样本分析物值的范围，以及测试的医学要求。

）。

在设备熟悉期，测试和比较方法的操作者必须全面的熟悉两种方法的设定，操作，维护，故障排除和质量控制。

本期可以先于评价实验的其他部分或与制造商的培训期一致。

对两种方法运行日常实验室质量控制程序。

在熟悉期之后，可以开始方法比较实验。

工作组推荐至少40个患者样本在至少5个工作日进行分析。

在更长时间分析更多的样本，同时按照制造商的建议进行定标，可增加实验的可靠性和有效性。

对每一个患者样本用测试和对比方法进行双份测试。

对每种方法的双份测定，在相应方法的同一批内分析。

只要可能，至少50％的测试样本应当在实验室参考区间之外。

1.3本文所用的符号（略）

1.4定义（略）

2设备熟悉期

测试和比较方法的操作者必须熟悉下面的内容：

●操作

●维护步骤

●样本准备方法

●定标和监控功能。

如果制造商提供培训，可作为熟悉期的一部分。

在实验室建立和运行设备足够长的时间，以确保操作者理解所有的步骤，并能恰当的操作设备。

工作组推荐5天作为设备熟悉期。

对于极其简单的设备，稍短的时间就够了；对复杂的，多通道的设备，需要更长的时间。

操作者应当实践分析实际的样本材料，使他们注意到其他设备在日常操作中可能发生的意外（例如错误标志，错误修正，定标等）。

在本期不应收集数据。

直到操作者可以自信的操作设备，设备熟悉期才能结束。

（这一步骤可能对所有的用户不是必须的。

）在开始方法比较评估前，确保日常质量控制程序和适当的控制限在使用中。

3方法比较实验·

3.1测试样本

按照公认的实验室惯例和制造商的建议收集和处理患者样本。

3.1.1储存

储存的条件和持续时间取决于被分析成分的稳定性。

如果可能，避免储存样本。

3.1.2被排斥的样本

如果一个样本被排斥，记录排斥的原因。

3.2对比方法

对于比较方法，用实验室目前的方法，制造商标注声明所用的方法，或公认的参考方法。

这个实验给出了在任意特定浓度两种方法间的偏差和偏差的可能区间的评估。

因此两种方法间的差异可归因于测试方法的误差。

比较方法应满足下列条件：

●具有优于测试方法的精密度，如果需要，可通过重复获得。

●如果可能，不受已知的干扰的影响。

●用与测试方法相同的单位。

●如果可能，具有相对于（可追踪的）国家标准或参考方法的偏差。

本实验没有分离来自被比较的每种方法的偏差的不同来源。

（关于基质效应觉察的信息，见最新版的NCCLS文件EP14－基质效应评价。

）干扰影响可能对方法间差异有尽可能多的不精密度影响。

（干扰对每一种方法影响的合适的定性，可通过一个单独的实验确定；见最新版的NCCLS文件EP7－临床化学的干扰测试。

）

3.3测试范围

评价测试方法应越过临床上有意义的范围，如医学决定水平。

通常，范围扩展到从低于到充分高于期望的参考范围。

分析物浓度应当分布在超越可报告范围到尽可能扩展的范围。

可报告范围是制造商声明的可以提供可接受性能的分析物浓度区间。

表1a和1b给出了推荐的分布，它考虑了一组分析物异常的可用性。

3.3.1可报告范围

研究的范围受两种方法可报告范围的限制。

对比方法的范围应当至少与测试方法的范围一样宽，以便比较在可报告范围限的偏差。

3.4样本数

最少分析40个符合上述标准的样本。

更多的样本将提高统计评价的可信度和增加合并未预期的干扰物质的影响的机会（个体特异性偏差）。

数据记录表的例子见图A1和A2。

3.4.1重复测定

为下列原因，每个样本应获得足够的量：

1）可用测试方法进行双份测定；2）可用比较方法进行双份测定；3）如果需要，可进行后续研究。

3.4.2混合的样本

如果一个样本需要的体积无法从一个单独的样本获得，混合来自两个（但不要更多）具有相似病史和大约相同成份水平的患者样本以获得少量的混合液。

用这些少量的混合液进行两组重复性分析。

如果样本为全血，混合需要血清学的兼容性。

注意：

合并的作用可通过平均单独或特定的样本偏差而被掩盖，这样可以导致两种方法可比性的乐观的图形。

3.5样本次序

分配选择的样本的第一部分在批内有序排列。

以相反的顺序进行第二部分（平行双份）。

颠倒第二部分的顺序可最小化批内双份测定的均值受携带和漂移的影响。

尽可能随机排列序列中的样本。

例如，样本可按下列顺序进行测试：

1，2，3，4，5，6，7，8和8，7，6，5，4，3，2，1。

比较和测试方法都遵照颠倒的步骤，但每种方法最初的序列可以不同。

3.6持续时间

对于一个给定的样本，不管这个样本是新鲜的还是储存的，应在2个小时内用对比和测试方法进行分析。

如果使用储存的样本，应确保它们均储存在保证它们稳定性的情况下，并符合测试和对比方法的要求。

对两种程序在相同的情形下保存样本，可避免引入储存条件的差异。

如果方法对比实验在精密度实验（EP5）之后进行，每天可以选择并分析8个以上的样本。

如果方法对比实验和精密度实验同时进行，在草案熟悉期后10到15天每天仅能分析4个样本。

将患者样本分散在很多天和很多批会更好。

3.7在收集中对数据进行检查

3.7.1分析系统误差

当设备提示有错误情况发生时，记录在这段时间内收集的数据，但在最后的数据分析时不要包括这些数据。

3.7.2人为误差

记录操作者可证明的出错的任何数据，但在最后分析时不要包括这些数据。

3.7.3其他有差异数据的评价

记录没有发现错误没有经过编辑的成对的双份数据点。

如果找不到差异的原因，保留原始数据在数据组中，进行4.1和4.4节的离群点检查。

3.8质量控制

在实验中遵照实验室日常质量控制程序。

保留控制图表，重复两种方法中任意一种显示失控的任意批，直到获得需要的样本数目。

3.9被拒数据的证实

认真证实和保留任何需要拒绝数据的情况，同时记录任何发现的可接受的原因和问题。

4初步数据检查

图1给出了本节所述检查步骤的概述。

图2给出了过程中单独步骤的逻辑流程图。

在阅读以下章节时参考这些图表。

4.1方法内重复测试的离群点的检查

应当对所有的点和已经移走的离群点进行分析。

对测试方法（Y）和比较方法（X）的双份测定提供下面的步骤。

分析应当按两种方式进行：

1）对所有的点2）对所有已经被移走的离群点。

按如下计算每个样本双份测定间差值的绝对值。

这里i=样本数（从1到N，N为总的样本数）。

计算每种方法双份测试间差值的绝对值的平均值：

计算每种方法绝对差均值的4倍为可接受限（对可报告值进行舍入操作）。

如果某个绝对差超出了合适的（X或Y）限制值，用标准化（相对的）绝对差对每种方法进行附加计算；这样：

相对差值的均值的4倍的限制，为标准化值提供了测试限。

如果一个单独的数据点落在范围和相对范围程序之外，研究为什么会这样，并将该样本从数据组中删除。

删除来自该样本的所有数据（X和Y），继续分析数据。

如果一个以上的样本被删除，对差异产生的原因进行详细的调查。

如果问题的来源被确定，单独追溯到这些样本，取代数据组中的那些样本。

问题的原因必须被证实。

如果问题可被更正但不能追溯到特定的样本，必须重新收集全部的数据。

如果问题既没有发现也无法被更正，评价重复性测定间最大差异相对于方法精密度允许的医学决定限的大小。

如果没有超出此限，按随后的步骤重测这些数据。

如果超出此限，停止实验并通知制造商。

（被据数据的证明见3.9节。

）

4.2将数据作图

用这些数据做4个图。

第一个是

（双份测定的均值）对

（双份测定的均值）的散点图，将测试方法作为Y变量，比较方法作为X变量（见图B1）。

画出两个轴的原点和刻度，并画一条通过原点的斜率为1.0的直线。

第二个是用相同的方法画出每个

对

的散点图（见图B2）。

第三个是偏差图，X变量取决于比较方法是否为参考方法。

如果是，则第三个图是Y均值与X均值差（

－

）或每个化验对

值的偏差图（见图B3）。

这个图的水平中心线为0值。

同前，第四个图是每个单独的Y与

均值的差

对相同的

值作图（见图B4）。

如果比较方法不是参考方法，或不能确定，则第三个图是Y均值与X均值差（

－

）或每个化验对（

＋

）/2值的偏差图（见图B3）。

这个图的水平中心线为0值。

同前，第四个图是每个单独的Y与

均值的差

对相同的（

＋

）/2值作图（见图B4）。

这4个图都很有用，因为它们间刻度的差异可用于平衡对测试和对比方法比较的关于非线性关系，离群点和非恒定变量影响的决定。

4.3线性关系的目视检查

检查这些图在整个测试范围内X（对比方法）和Y（测试方法）的线性关系。

通常非线性出现在浓度值的端点。

如果是这样的话，在开始变成非线性时截断数据点。

检查剩余的线性部分，确定是否足够宽，以覆盖医学有用的范围。

如果是这样，分析在该范围的附加样本，取代这些超出的样本。

然后按第4节开始再次检查新的数据。

如果非线性部分明显，或如果线性部分太小，停止实验并通知制造商。

如果非线性的原因可以确定并更正，重新开始实验。

4.4方法间离群点的目视检查

检查数据图A和数据图C有无可察觉的明显的离群点。

如果没有这样的点，前进到4.5节。

如果离群点存在，进行下面的与4.1节中双份测定相似的计算。

计算方法间差的绝对值及它们的平均值；

这里i＝样本数1到40，j＝双份测定数1或2。

计算测试限（TLE）为4*

，对可报告值进行舍入操作。

比较每个

与测试限，并标记超出该限的任意点。

计算方法间相对差值的绝对值和它们的平均值；

计算相对测试限为4*

，并比较每一个

与此限（不对此限舍入）。

标记任何超出此限的点。

没有通过两个检测的任意点

都为离群点。

最多可有2.5％的数据可从数据组中去除。

如果超过2.5％的数据在检查中被确定为离群点，调查可能的干扰，人为错误和设备故障。

如果几种分析物在同一设备上同时进行评价，检查异常样本其他分析物的结果。

同时回顾该批的质量控制结果。

如果无法找到明显的原因，或差异超出了医学重要性的边界，停止实验或另加40个样本。

如果发现一个以上的离群点，但离群点没有超出医学重要差异，保留并使用这些数据。

如果详细的调查给出了离群点的原因，分析附加的样本，并用这些数据增加数据组。

4.5X足够范围的检查

回归分析的结果仅在数据的某一假设为真时才有效。

其中一个假设是，X变量已知且没有误差。

在临床实验室，这并不是真实的，因为每个测试都有固有误差。

但是，如果数据范围足够宽，这个误差对回归评价的影响很小，可认为被忽略。

为了克服这个问题，修正系数r可被用于评价X范围足够的粗略指导。

r的公式如下：

这里，

作为一般的指导，如果r≥0.975（或等价的r2≥0.95），X的范围可被认为足够了。

如果数据产生的r满足这个需要，X的误差足以被数据范围补偿，可用简单的线性回归评价斜率和截距。

如果r2<0.95，则数据的范围必须通过化验附加样本来扩展。

然后，重新开始检查全部数据。

如果范围无法扩展，用6.2节所述的分区偏差程序取代线性回归来评价平均偏差。

注意：

这个程序评估了数据的范围；没有测试范围内数据的分布。

还必须在整个范围内获得平均的分布。

5线性回归

5.1计算

对于这批成对的观察结果（xij,yij）,斜率b和y截距a按下面的公式计算。

计算每对X结果的平均值＝

。

对于个体的Ys对X平均值，

对Y均值对X均值，

这里，

这样，计算的线用下面的方程描述：

对于任意给定的浓度值（X），可用方程产生一个测试方法的预期值（

）。

保留这个回归结果以备随后的使用。

仅评价斜率和截距也可用其他的回归方法，如Deming（当λ＝1的特定情形为直角）或Passing-Bablok.。

在满足这样的模型后，遵照下面的所有其他步骤。

应当用直角回归或Deming程序计算评估的标准误差，该值可能任意低，除非基于垂直面而不是直交距离来计算标准误差。

5.2恒定分散的目视检查

检查散点和偏差图（图B1到B4）是否具有恒定的散度。

尽管很少有方法在测试的整个可报告范围内具有恒定的不精密度（对恒定的散度有贡献），目视检查可确定在范围的上下限标准差间是否有显著的重大的差异（大约3：

1或更大）。

如果数据显示适度的恒定分散，用6.1节描述的线性回归程序计算平均偏差。

在这种情况下，仍可用普通的最小二乘法回归评价斜率和截距。

即使分散不是恒定的，斜率和截距的评级也没有偏差（在统计意义上）。

但在这种情况下，评价的标准差对测试回归线附近的可变性是不可用的。

用6.3节描述的分区残差程序评估可变性和陈述平均偏差。

当仅有40个样本（80对分析点）可用时，确定足够的恒定散度很困难。

因此，工作组推荐如果疑为不恒定分散，应收集更多的样本。

另外，存在标准统计程序用于修正存在非恒定分散的回归。

这些技巧包括使用转换的数据（例如对数和加权平均）。

6计算预期的偏差和它的可信区间

6.1线性回归程序（当数据通过足够范围和统一散度检查时）

给定数据点与回归线在Y方向的差值，叫做该点的残差。

评价的标准差是这些残差的标准差，因而是回归线附近点的分散度的测定。

一个点（

）的残差可用下列公式计算。

平均值（

）：

通过对单个的

进行下列计算得到评估的标准差：

平均值

在给定的医学决定水平Xc的预期偏差BC的评估给出如下：

BC（在Xc的真实偏差）的95％的可信区间给出如下：

用第7节的程序对这些统计进行说明。

6.2当数据没能通过足够范围检查时用分区个体差异计算平均偏差（分区偏差程序）

把这些数据按X值递增的顺序列成表格，然后把这些数据分成3组（低，中，高），每组包括大约相同数量的数据点。

基于每对数据的X值进行分组。

可通过计数偏差图2N/3处的点确定3组的边界。

（这样分配落在边界上的点，保证每组具有大约相当数量的点。

）将数据标注在每个数据所属的记录表内。

然后，用下面的公式对每组分别计算平均偏差：

NK=第K组中数据点的数目。

这个计算序列计算了组中每一点的偏差（差）和这些偏差的标准差。

的值是对适当浓度范围评估的预期（平均）偏差，3个

取代了6.1节中的

。

如果3个

接近相同，则报告3个的平均值作为

。

临床应用的医学决定水平，根本不依赖于数据划分的范围。

如果显示重要的医学决定水平接近两个分区的边界，移动分区，以避免偏差估计的不连续。

在医学决定水平浓度XC的预期偏差

的95%可信区间可通过为XC选择合适的K获得，进行下面的计算：

6.3当数据具有非恒定（变化的）精密度时用分区残差计算预期偏差（分区残差程序）

如6.2节所述，把数据分成三组，每组数据点大致相同。

然后，分别对每组进行下列计算，这里NK=第K组中数据点的数目（K＝1，2，3）。

在给定医学决定水平XC的预期偏差评估

为：

并且BC的95%可信区间可通过为XC选择合适的K获得，进行下面的计算：

7说明结果并与内部性能标准比较

在大多数情况下，对目前方法和候选代替方法间的差异有兴趣。

在这种情况下，在医学决定点XC将预期偏差的可信区间与可接受误差定义比较。

每个实验室应当开发自己的标准（咨询医学人员和或技术文献）。

如果预期偏差的可信区间包含了定义的可接受偏差，则这些数据没有显示候选方法的偏差与可接受偏差不同。

但是，期望偏差的可信区间没有包含定义的可接受偏差，则可得出下面两个决定中的一个：

●如果可接受偏差小于预期偏差可信区间的下限，可得出下面的结论：

预期偏差很可能（>97.5％）大于可接受偏差，因此候选方法的性能和目前的方法不相等，并且不能被定义的应用接受。

●如果可接受偏差大于预期偏差可信区间的上限，可得出下面的结论：

预期偏差很可能（>97.5％）小于可接受偏差，因此候选方法的性能等同于目前的方法，并可被定义的应用接受。

如果没有观察到等价，仍然相信候选方法更特效，而不是拒绝这种方法，在使其进行日常使用前，对其获得新的临床数据（如新的参考范围）。

记住为实验室开发的标准应当定义两种方法间允许的差异。

在比较两种方法的允许误差时，医学上精密度允许误差的标准可能没有单独给出。

误差限的指导原则可以在被研究的测试的个体内生物差异的文献中找到。

如果制造商提供了测试方法的方法比较数据，可以进行性能的附加评估。

但是，为了与制造商的数据进行有效的比较，对比方法和操作步骤必须与制造商的一样。

如果制造商对平均偏差的声明被包含在95％的可信区间，可以得到结论，候选方法可以提供相等的结果。

8制造商修正

8.1实验设计

制造商应当获得最少100个患者样本，分散在方法或设备声称的整个可报告范围内。

特别的，如果在多个地点收集样本或需要研究其他因素，制造商可选择使用超过100个患者样本。

患者样本可用于多种分析物评估。

8.2数据分析

按本文件所述的基本步骤进行收集的数据的初步检查。

制造商可以选择用任意有效的统计程序分析数据，但是，终点必须是测试和对比方法在相关医学决定点的偏差估计。

为了评估参量的误差，制造商应当计算回归斜率和区间的标准差及用于声明偏差的点的预期值的标准差。

如果标准差太大而不能接受，需要附加数据。

避免无用的步骤，例如测定在垂直方向上评估的标准差。

8.3偏差性能声明的陈述

下面的项目应当包含在制造商对方法比较偏差的声明中。

除非比较方法是建立的参考方法，不应使用术语“精密度”。

列出的项目可被有选择的包含在制造商的判断中。

●与线性回归线吻合的斜率和截距（通过任意方法）。

●回归中所用的总点数。

●在规定的医学决定点（在通常公认的决定点或参考区间的终点）从回归线计算的偏差。

●数据的范围（包含在回归中的X的最大和最小值）。

●在回归中用的对比方法。

●回归中用的是单个测定值还是重复测定的均值，如果是均值，是重复几次的均值。

对X和Y都必须注明。

●数据在垂直方向（Y）评估的标准差，是否在声称的可报告范围内一致；或在多数浓度范围内的标准差，是否全部的评估不合适。

●斜率和截距的可信区间。

●在每个水平偏差的可信区间。

●修正系数。

●绘出观察数据的散点图，x轴和y轴用相同的刻度和范围，标出所有的数据，包括用不同标识符标出的被确定为离群点的数据点。

散点图应当包括适合的回归线（如果合适）和等值线（X=Y）。

●用来符合线性回归线的方法（一般最小二乘法，加权回归，Deming，直角回归）和说明最适线的散点图。

●测试方法（Y）用来收集数据的天数和定标周期。

展开阅读全文