EP9用患者样本进行方法比对及偏倚估批准指南设计第二版.docx

资源描述

EP9用患者样本进行方法比对及偏倚估批准指南设计第二版.docx

《EP9用患者样本进行方法比对及偏倚估批准指南设计第二版.docx》由会员分享，可在线阅读，更多相关《EP9用患者样本进行方法比对及偏倚估批准指南设计第二版.docx（45页珍藏版）》请在冰豆网上搜索。

EP9用患者样本进行方法比对及偏倚估批准指南设计第二版.docx

EP9用患者样本进行方法比对及偏倚估批准指南设计第二版

EP9-A2第22卷第19册

替代EP9-A第15卷第17册

用患者样本进行方法比对及偏倚估：

批准指南——第二版

这个文件介绍的程序供两个临床方法间的偏倚评估及采用一分为二的患者标本和资料数据的方法学比较实验设计。

通过NCCLS认同过程制定全球应用的指南

NCCLS……

通过自愿认同的方式服务于全世界医学科学团体

NCCLS是一个国际性、多学科、非盈利、制定标准、教育型组织，在临床检验界内促进标准和指南的使用和发展。

为患者检验和相关临床检验组织制定标准和指南在全球范围内得到一致认同过程。

NCCLS制定标准的原则是从质量效益和成本效益两方面考虑，为患者检验和临床检验组织服务。

除了制定和促进标准、指南的推广外，NCCLS还提供了一个开放、无偏见的论坛，供发表影响患者检验和临床检验质量的批评性言论。

出版物

NCCLS文件以标准、指南和委员会报告出版。

标准：

通过认同过程形成文件，对材料、方法或不能修改的实践方式明确规定其特定的基本要求。

另外，标准也可以包含明确规定的选定要素。

指南：

通过认同过程形成文件，制定常规实验操作程序、方法或材料的规范。

使用者可以使用或修改指南以满足特定的需要。

报告：

没有经过认同过程，由理事会颁布。

认同过程

NCCLS认同过程，建立正式规范的程序如下：

1.项目的授权；

2.文件的制定和公开评审；

3.根据使用者的反馈评论修订文件；

4.文件被接受为标准或指南。

大多数NCCLS文件只有“建议”和“批准”两个层次的认同过程，根据领域评价或资料收集的需要，文件也可以有中间（如“试行”）认同层次。

建议：

作为NCCLS的建议标准或指南处在被临床检验界评审的第一阶段，此文件需接受广泛、全面的技术审核，包括对范围、方法、用途及技术和编写内容的逐行逐字的审核。

试行：

当一种推荐方法对某一领域的评审有明确的需要或者当某一建议性方案需要收集特定的数据时，才制定试行标准或指南。

同样，试行标准或指南也应接受审核，以保证其有效性。

批准：

批准的标准或指南已在临床检验界得到认同。

应审核并评价最终文件的有效性，确保达到认同（即对以前的版本的意见已圆满解决），并确定对新加的认同文件的需要。

NCCLS标准和指南为实验室实践提供了一个认同意见。

NCCLS标准和指南的条款较应用规定或多或少要严格些，因此使用NCCLS文件不能减轻使用者对遵守应用规定的责任。

使用者的评论对认同过程很重要。

任何人均可以提出评论，根据认同过程由编写文件的NCCLS委员会记录全部评论。

在下一个层次文件出版时，这些评论或者修改了的文件由委员会在附录中予以反馈。

极力鼓励读者以任何方式、在任何时间对任何NCCLS文件提出评论。

评论寄往NCCLS行政办公室。

自愿参与

强烈希望各专业的实验室专家能自愿参加NCCLS项目。

用患者标本进行方法比对及偏倚评估；批准指南-第二版

摘要

NCCLS文件EP9-A2（用患者标本进行方法比对及偏倚评估；批准指南-第二版）是为实验室人员和生产厂商制定的。

它叙述了测定两种方法之间相对偏倚的程序，也叙述了采用一分为二的患者样本设计方法比对试验时所需要考虑的因素。

本文包括实验概述、样品数据记录及计算表、总流程图及为初步数据分布的详细流程图，以进行方法比对。

文件为不熟悉此程序者提供了样本散点图和偏倚图作为附加帮助。

最后一节包括对生产厂商进行偏倚评估以及表示偏倚的声明格式的建议。

摘要

委员会成员

积极成员

前言

质量系统方法

1.介绍和范围

常规比对试验的概述

文本中使用的符号

定义

2仪器熟悉阶段

3方法比对试验

3.1实验样本

3.2比对方法

3.3测量范围

3.4样本数

3.5样本编号

3.6时间和期限

3.7数据收集过程中的检查

3.8质量控制

3.9删除数据的原则

4初步数据检查

4.1方法内双份数据的离群值检验

4.2数据作图

4.3线性相关的目测检查

4.4方法间离群值的目测检查

4.5X值合适范围的检验

5线性回归

5.1计算

5.2分散均匀性的目测检查

6计算预期偏倚及其可信区间

6.1线性回归法（当数据通过合适范围及均匀离散度检查时）

6.2当数据未通过合适范围及均匀离散度检查时，使用分布个别差异计算平均偏倚（分部偏倚法）

6.3当数据有不恒定（可变的）精密度时，用分部残差计算预期偏倚（分部残差法）

7结果解释以及内部性能标准比较

8制造商的修改

8.1实验设计

8.2数据分析

8.3偏倚性能的声明

参考文献

附录A：

样本数据记录表

附录B：

散点图举例

附录C：

计算举例

附录D：

线性计算

评价和工作组反馈小结

团体评价和委员会反馈小结

相关系数（r）:

两个随机变量协方差的比率。

Deming回归：

根据方法比较实验中两方法的允许测定误差评估斜率和截距参数的一种方法，每种方法的测定误差均用于评估程序。

待测物：

一种待测量的物质。

Passing-Bablok：

根据方法比较实验中使用非参数程序评估斜率和截距参数的一种方法。

真值：

多次重复测量结果的均值与可接受参考值间的符合程度。

（注：

真值的测量通常用偏倚表示。

）

2仪器熟悉阶段

待评方法和参比方法的操作者必须熟悉以下工作：

●操作

●保养程序

●样本准备方法

●校准和监控功能

生产厂商提供的培训可以作为仪器熟悉阶段的一部分。

实验室中需有足够的时间开启和运行仪器以确保操作者理解仪器的全部步骤并能正确操作。

工作组建议花5天时间熟悉仪器，对于非常简单的仪器时间可以短一点，对于多通道仪器时间可能长一点。

操作者应该用实际样本进行分析，以注意到常规工作中发生的所有可能的偶然事故（如错误信号、错误纠正、校准等），在此过程中不应该收集数据。

当操作者能够自信的操作仪器，熟悉仪器的阶段才可结束。

（用户评价不需进行此步骤）在方法比对评估之前，确保有适当控制限的常规质量控制程序。

3方法比对实验

3．1检测样本

按照实验室操作规范和制造商的推荐收集和处理患者标本。

3．1．1储存

储存时间和条件取决于待测成份的稳定性，如果可能，避免储存标本。

3．1．2拒收标本

如果一个标本被拒收，要记录拒收原因。

3．2参比方法

实验室当前使用的方法，生产厂家声明的方法和公认的参考方法都可作为参比方法。

如果参比方法是参考方法，新方法和参考方法间的测定差值作为偏倚；如果参比方法不是参考方法，新方法测定的真值不能被确定，两方法间测定差值不能作为偏倚而仅仅是差值而已，指定的方法作为参比方法的参考方法，“偏倚”也被使用在这个文件中。

本实验提供了两方法间在特定浓度的偏倚估计值和偏倚的可信区间，所以两方法间的差值可归因于待评方法的误差，参比方法应该做到如下几点：

●具有比待评方法更好的精密度；

●可能的情况下，不受已知干扰物质的干扰；

●使用与待评方法相同的单位；

●可能的情况下，与标准品或参考方法有已知的相对偏倚（可溯源）。

本实验并不能将不同来源的误差归咎于被比较的每一方法。

干扰可能与精密度一样影响两方法间测定结果的差值。

3．3测定范围

应在有临床意义的范围内，即医学决定水平范围内评价待评方法。

通常应从低值参考范围到高值参考范围。

分析物浓度应尽可能分布在测定范围内均匀分布。

分析测定范围是分析物测定浓度区间。

表1a和表1b提供了推荐范围，考虑了待测物的异常情况。

3．3．1分析测定范围

实验的范围受两种方法分析测量范围的限制。

参比方法的范围应至少与待评方法的范围相同，以便在分析测定范围内可以比较。

3．4样本数

为了满足上述标准要求，至少需分析40个样本。

增加样本数将提高统计估计值的可信度，并且增加了把未预计的干扰物发生的影响包括在内的机会。

3．4．1双份测定为了以下原因，每份样品必须有足够量：

（1）能够用待评方法作双份测定；

（2）能够用参比方法作双份测定；（3）如果需要应能继续进行追踪实验。

3.4.2混合样本

如果从一个患者得不到所需的样本量，可以将两个（但不能多于两个）病史相同，被测物浓度也大致相近的患者标本混合使用，成为“微混合样本”。

用“微混合样本”进行双份测定。

如果样本是全血，需要进行血清学配型。

注意：

这种混合过程由于平均化可能掩盖了特殊性或者样本特定的偏倚而导致两种方法比较的乐观假象。

3.5样本测定序列

在样本的双份测定中，指定第一次测定顺序。

按反向顺序检测第二次（双份）。

顺序中的浓度应尽可能随机排列。

第二次标本的反向顺序可以减少交叉污染及漂移对重复测定标本平均值的影响。

例如：

样品可以按下述顺序进行，1、2、3、4、5、6、7、8和8、7、6、5、4、3、2、1。

参比方法和待评方法均应按上述步骤进行，但每种方法可以有不同的开始顺序。

3.6时间和期限

对于一个给定的标本，参比方法和待评方法均应在分析物稳定的时间段内测定。

对于全部标本，均应在两小时内测定完毕。

如果可能，最好使用测定当天的标本。

如果使用储存标本，储存方式必须能确保样本的稳定性，以满足参比方法和待评方法的要求。

对两种方法用同样的方式储存样本，以避免储存条件的不同引入一个新的变量。

如果在精密度实验之后进行方法比对实验，一天最多能选择并测定8个标本。

如果精密度实验和方法比对实验同时进行，在熟悉仪器后，每天只能检测4个标本，在10～15天内完成。

将患者标本分布在不同天内和不同批内更好。

3.7数据收集过程中的检查

3.7.1分析系统误差

仪器显示存在误差时收集的数据需成文，但在最后的数据分析中不要包括在内。

3.7.2人为误差

记录任何操作者造成的有文件的误差，但在最后的数据分析中不要包括在内。

3.7.3其他不一致数据的处理

没有查出错误的不一致双份数据时，也应记录而不是剪辑。

不能确定不一致的原因时，则应在数据表上保留原始数据，必须按照4.1节和4.4节进行离群值的检验。

3.8质量控制

实验中应遵循实验室和/或制造商的常规质量控制程序。

保留质控图，任一方法出现失控时应重新测定，直到达到要求的样本数为止。

3.9删除数据的文件化

任何需要删除的数据均应仔细形成文件并保留，记录所发现的原因和问题。

4初步数据检查

图1概述了本节中所要描述的数据检查程序，图2本方法中每一步骤的逻辑流程图。

阅读以下章节时可参考这些图。

图1流程图概述图2详细流程图

否

好

调查

r2≥0.95

否

是

D.检查线性

是

否

是

否

是

接下页

否

是

字

计算Sy.x预期偏倚及其可信区间

是

否

使用分区偏倚程序

4.1方法内双份测定的离群值检查

该方法要用到所有数据点及已删除的离群值，用以下公式计算测量值（Y）和比较值（X）的双份测定结果。

分析时要用到两种方法：

1）所有数据，2）删除离群值后的数据。

计算每个样品双份测定差值的绝对值：

DXi=︱xi1-xi2︱

DYi=︱yi1-yi2︱

其中i=样品号（由1到N，N=样品总数）。

计算每个方法双份测定的差值绝对值的均值：

取各方法的平均绝对差值的四倍作为每个方法的“可接受”限（取舍到报告值的前一位）。

如果任一绝对差值超过此限（X或Y），用标准化（相对）绝对差值进行另外的计算，即：

以相对差值均值的4倍作为标准化的检测界限。

如果有一个值超过上述“可接受”限或相对范围的检测界限，检查原因，并从数据组中删除此值。

将该标本的所有数据（X和Y）删除后再继续分析。

如果删除的数据超出一个，则需扩大调查范围，查找出现偏差的原因。

如果能够找到问题所在并能追踪到引起偏差的样品，则应替换这些样品，且将问题记录在案。

如果能纠正问题但不能追踪到特定样品，则所有数据组必须重新收集。

如果既找不到问题也不能纠正，则可将两次重复测定差值的最大值与此方法在接近的医学决定水平处允许的不精密度进行比较，如未超过允许范围，则可继续进行随后步骤。

如超出允许范围，则应停止实验并通知厂家（参见3.9节关于删除数据的文件）。

4.2数据作图

将数据作四张图：

第一张图是

（双份测定的均值）对

（双份测定的均值）的散点图，以待评方法的结果为Y，参比方法的结果为X（见图B1）。

使XY轴的原点和刻度一致，作一条通过原点，斜率为1的直线。

第二张图是以每个Yij的结果对

的均值按上述相同方式作图（见图B2）。

第三张图是偏倚图，这种方法要求X轴变量的比较方法为参考方法。

每个样品测定的Y与X的均值之差（

—

）相对于

作图（见图B3），此图的水平中心线为零值。

第四张图同上，是单次测定的Y值与

的差值（

—

）相对于

作图（见图B4）。

如果比较方法不是参考方法或不能确定，那么第三张图就是个样品测定的Y与X的均值之差（

—

）相对于（

）/2作图（见图B3），此图的水平中心线为零值。

同样第四张图是单次测定的Y值的差值与（

）/2的差值相对于（

）/2作图（见图B4）。

这四张图是非常有用的，因为差值的大小可用来判定非线性关系，离群值，待测和参比方法比较的非齐性方差。

4.3线性关系的目测检查

在整个测量范围内，检查X（参比方法）和Y（待评方法）的数据图是否呈直线关系。

如果线性关系看来满意，则按4.4节给出的方法检查数据（如需了解其它相关信息，请参考最新版本的NCCLS的文件EP-6：

定量测量方法的线性评估）。

如果存在明显的非线性关系，目测数据是否存在直线部分。

通常，非直线部分出现在浓度范围的两端，如果是这样，则将开始出现非线性部分的数据点去掉，检查剩下部分的线性关系，同时判断此部分是否包含了医学上有意义的浓度范围。

如果是，可在这部分范围内另选样品进行测定，以代替被删除的样本。

可按4.4节重新检查新数据。

如果非线性部分明显或直线部分太短，停止评价并通知厂家。

如果非线性的原因可检查出来并能纠正，则重新开始实验收集新的数据进行评价。

4.4方法间离群值的目测检查

检查数据图A和图C，目测有无离群值。

如果没有，按4.5节继续进行评价。

如果有离群值，则可进行类似4.1节用于双份测定的下述计算方法。

计算两种方法的绝对差值及其平均值，即：

Eij=︱yij-xij︱

i=样本号1…40和j=双份测定中的1和2。

计算检测限（TLE），即4·

，用四舍五入到报告值的前一位。

把每一个Eij与TLE值比较，并标记超出TLE值的点。

计算两种方法的相对差值及其平均值，即：

计算相对检测限值为4·

，把每一个

与此检测限值比较（不用四舍五入），并标记超出检测限值的点。

任何一点（Xij，Yij）如未通过上述两种检测方法，则判断为离群点。

每组数据中被删除的离群值不能超过2.5%。

如果发现有超过2.5%的离群点，则应调查是否存在干扰、人为错误或仪器故障。

如果有几个分析物同时在同一仪器设备上评价，检查出现明显偏差的样本的其它分析物的结果，同时也应检查同一分析批的质量控制结果。

如未能查到明显原因，而测定值之间的差值已超出有医学上有临床意义的界限，则应停止实验，或另做40个新样品。

如果出现一个以上的离群点，但它们并未超出医学上有临床意义的界限，则可保留并使用这些数据。

如果进一步扩大调查范围查到离群值原因，则分析更多样品，以增加数据量满足实验要求。

4.5X值合适范围的检验

对数据有必要作出一些假设，才能保证回归分析的结果有效。

假设之一是X值没有误差。

在临床实验室，这是不可能的，因为每一个检测都存在内在误差。

但是如果数据的取值范围足够宽，则此种误差对回归结果的影响可以忽略不计。

X值的取值范围是否够宽，可用相关系数r做粗略的估计。

r的计算公式如下：

其中：

一般情况下，如果r≥0.975（或r2≥0.95），则可认为X值取值范围合适。

如果根据测定数据算出的r能满足上述要求，则可认为X的误差已被数据范围所抵消。

这时就可用简单的直线回归来估计斜率和截距。

如果r2≤0.95，则必须分析更多的样品以扩大数据浓度分布范围，然后再重新分析全部数据。

如果X的取值范围无法扩大，则可采用6.2节中描述的分部偏倚法代替回归方法来评价平均偏倚。

5线性回归

5.1计算

对于成对的数据（Xij-Yji），斜率b和截距a的计算公式如下：

为每个样品两次测定X值的平均值，单个Y对X的均值：

平均Y对平均X值：

此处：

可用以下方程表示：

对于任何给定的X值，用此方程可以计算待评方法的Y的估计值（

）。

保留此回归结果，以备后用。

另外一些回归方法，如Deming法或正交回归，仅仅能用于估计斜率和截距。

按直线模型拟合，即可按以下步骤进行。

千万不可用正交回归或Deming法计算估计值的标准差，因为此值被人为的降低（除非按垂直轴来计算标准误）。

5.2目测检查离散度

目测离散图和偏倚图（图B1到图B4），检查离散的均匀性。

尽管在整个分析测量范围内具有恒定的不精密度（均匀的离散度）的方法很少，但目测检查可以看出在数据范围上限和下限的标准差之间是否有显著性差异（3：

1或更大）

展开阅读全文