设计病例报告表CRFs经验之谈临床科研数据库构建四.docx

资源描述

设计病例报告表CRFs经验之谈临床科研数据库构建四.docx

《设计病例报告表CRFs经验之谈临床科研数据库构建四.docx》由会员分享，可在线阅读，更多相关《设计病例报告表CRFs经验之谈临床科研数据库构建四.docx（6页珍藏版）》请在冰豆网上搜索。

设计病例报告表CRFs经验之谈临床科研数据库构建四.docx

设计病例报告表CRFs经验之谈临床科研数据库构建四

设计病例报告表（CRFs）经验之谈！

临床科研数据库构建（四）

临床科研是每一位医生的必争之地，然而也是最痛的痛点之一。

如何设计临床科研，如何积累有价值的科研数据，如何将收集的数据转换成科研的成果，并且将科研成果转换为公众健康意识是永恒的话题。

如何设计临床科研更多的是临床经验与方法学的结合，LinkLab一直致力于提供或基础或实用的关于科研方法学的文章；然而，如何积累有价值的科研数据更多的是执行层面的部分，包括如何设计CRFs、如何构造电子数据采集系统（EDC）、如何检查数据质量、清理和分析数据、整合数据库，也包括对数据录入员的管理等。

串接这两部分的核心就是CRFs，也是医生的痛点所在。

痛点一：

CRFs设计难度大，且耗时

CRFs的设计是临床科研项目的核心，根据某一研究目的确定需要收集的信息并且规定收集的整个标准流程。

除了必要的科研想法和试验设计外，一些方法是可以降低设计CRFs难度的。

痛点二：

数据收集成本高

每一个科研项目常有不同的CRFs设计，变量名或收集的流程可能存在很大的差异。

•数据录入员进行数据收集前，需要耗时培训和长期适应才能保证对CRFs内问题的了解。

这样无形增了科研项目执行的培训成本；另外，也容易出现理解错误而导致不合适的执行行为;

•数据需要重复收集。

对于一个设计完备的数据库，可以用于一个领域内多方面的分析，首先，也许很多的科研并不需要重新收集数据；对于需要重新收集数据的临床科研，如何设计良好则可以从电子病例／医学仪器等方面获得高质量的共享数据；另外，也许发动患者主动录入数据是另一种突破，当然是通过直接的输入，通过可穿戴设备，又或者是社区医生的介入。

当然如何调动患者积极性，如何保证数据正确性都是挑战的。

痛点三：

各数据库间不认识

中国医学研究者拥有最多的病例数据，但又是最缺少数据的。

怎么说呢?

1）创建CRFs时没有统一标准；

2）各CRFs间使用不同的标准，导致后期无法合并使用。

正因为数据间缺少一致性而导致了数据的分散而不可用，可谓是坐拥数据金山却无法享用的状态。

痛点四：

数据分析成本高

同样是因为CRFs设计规范的差异，包括变量名、收集方式等，导致数据分析员分析每一个项目时都需要重新熟悉数据数据库，甚至重新进行编码；如果需要进行数据库合并更是难上加难。

⚠关键：

数据库必须保证一致性！

1.统一变量名（数据编码）：

编码的数据便于数据录入，帮助统计师对数据进行解释和分析;

2.要求数据的一致性：

包括日期、小数点、测量单位、选项设置（不明／不适用／不可用／未实施）等格式一致性；

3.通用标识性变量和时间变量应该出现在CRFs或数据采集系统，至少包括方案编号、受试者ID、SiteID和访视日期；也可添加申办方ID、受试者姓名缩写、表单ID、CRF版本号等信息；

4.对CRF内的问题进行详细说明，保证收集内容理解的一致性；

5.根据统一标准／方法学进行CRF设计（明天一期将重点讲述）。

保证CRFs一致性的好处：

1.最大化的重复利用产生的数据、CRFs和电子数据库

Ø同一治疗领域，科研目的也许千差万别，分析角度也大相径庭；但CRFs的内容却有很多可以重复利用的部分；如果保持所有CRFs具有相同的编码系统，统一的格式，将大大减少制作CRFs的时间；

2.减少研究机构重复培训和数据质疑的数量，提高首次填写的一从性和数据质量；

3.基于对CRFs标准的熟悉度，可以提高数据录入的速度和质量，并减少内部培训的负担；

4.可使数据元的再利用成为可能，减少系统间的重复作业，并改善数据的可靠性，同时收集到的数据可以相互匹配轻松扩大数据库信息量；

5.降低统计分析的难度

Ø收集的数据除了可能需要满足FDA提交数据的要求外，最重要的莫过于导出数据进行统计分析。

那么CRFs的设计将直接决定数据导出的友好性。

如果一个设计精良，编码统一的CRFs将大大降低统计分析的难度，提高准确性;

6.促进数据分享，保障数据存储。

具体该怎么设计呢?

建议先阅读LinkLab从哈佛著名的护士研究学习如何构建数据库

（一）

（二）（三），将极大帮助您理解下面的内容。

绝招：

一旦决定使用统一标准，那么就可以利用很多标准化的共享资源。

其中最大的资源就是“CDASH”。

⚠ClinicalDataAcquisitionStandardsHarmonization（CDASH）定义了临床数据收集的基本标准，并且开发了一些列新药研发临床试验的CRFs基本内容标准（即，定义了最常用的变量库）。

一、CDASH提供了设计数据收集系统的方法学

ClinicalDataAcquisitionStandardsHarmonization（CDASH）定义了临床数据收集的基本标准，并且开发了一些列新药研发临床试验的CRFs基本内容标准（即，定义了最常用的变量库）。

尽管这是为新药研发企业准备的，但是我们为什么不能偷师呢

先附上CDASH推荐的CRFs制作流程：

（引用自：

CDASHstandardv1.1,2011）

从上图可以看出，CRFs制作绝对不是一个人的事情，而是整个临床科研过程中所有角色都应该参与撰写、修改、测试和确认的过程。

整个CRFs制作流程必须严格控制，正如上图所示。

当研究方案通过后，就进入草拟CRFs阶段。

需要注意：

1.仅采集必要的数据：

仅采集将用于分析的数据和避免荣誉的数据采集

Ø采集的变量并不是越多越好，因为数据的质量和数据量成反比，但收集成本和时间与数据量成正比。

同时，从伦理上来说，也应该把控数据采集的量。

比如，过度采集PK数据，就会对受试者身体造成负担；

2.采集的数据应该与统计分析计划相关：

根据统计分析计划，保证所有分析涉及的变量以符合统计要求的方式被合理收集；

3.数据采集标准化：

使用CDASH数据标准。

重点说一说数据库编码问题：

a．CRFs内的问题名建议使用CDSIC受控术语（CDSICControlledTerminology）。

比如，twiceperday＝BID，DiastolicBloodPressure＝DIABP等。

受控术语列表下载链接：

http:

//www.cancer.gov/research/resources/terminology/cdisc，或在微信留言索取；如果在列表中没有，尽量使用列表中的变量名，或根据实验目的创建新的变量名，但必须保证在同一组织内使用统一标准；

b．同一研究机构内所有科研项目的CRFs使用统一变量名；

c．如果CRFs需要翻译成其他的语言，需要保证语义上一致，并且保证与整个CRFs设计同步进行；

数据采集标准化的好处请见上一期内容；

4.使用清晰简洁的问题名、提示和说明，保证CRFs内的问题和收集说明不会引起误导。

比如，使用标准日期格式（dd/mm/yyyy）、指明小数点应记录的位数、测量单位、设置“不明／不适用／不可用／未实施”选项，如果数据可以从其他问题延伸而来则不必要收集，使用合理的跳转关系避免混淆等；

5.每一个问题都应该有独立的操作说明，以免需要附加额外的说明文档进行说明；

6.设置数据清理的提示语：

数据库应该包含一些提示是否完成某些检查的问题。

比

如：

“否／是－评价是否完成”优于“勾选是否未实施”：

因为“否／是－评价是否

完成”可以得到完全的信息，然而“否／是－评价是否完成”，如果用户未选择不能

确定是做了，还是漏了；

7.避免“自由文本”，因为他需要编码后才能分析；

8.强烈建议使用电子数据采集系统（EDC＝eCRFs）进行数据收集，可以加快数据分析过程，项目管理和统计检查。

完成CRFs设计后，进入测试和审阅阶段。

应该涉及到的人员包括：

PI、医学监察员（medicalmonitor）、临床监察员（clinicalresearchassociates）、临床协调员（clinicalresearchcoordinators）、临床数据经理（clinicaldatamanager）、生物统计师、药品安全监督员等角色。

只有所有角色对CRFs具有相同的理解，并且是填写友好的，数据符合统计标准的情况下才有意义开始临床研究。

定稿CRFs后，各类人员需要共同批准后开始数据的收集。

一旦开始数据收集后，除不可抗拒因素外，不建议修改CRFs。

二、充分利用CDASH中已经储备的CRF模版

CDASH根据常用的数据收集的类型进行归纳总结，提供了非常完备的模版库供我们参考。

模版涉及如下方面：

尽管这是为企业新药研发而设计的，但在临床研究中都可以参考，非常有价值。

举一个例子说明：

这是一个来自CDASH官网的eCRF的例子，并且提示常规需要收集的变量包括：

•AETERM-不良事件名称

•AESTDAT-不良事件发生日期

•AESTTIM-不良事件发生时间

•AEENDAT-不良事件缓解日期

•AEENTIM-不良事件缓解时间

•AEREL-与试验药物的关系

•AEACN-措施记录

•AEACNYN-采取措施（是／否）

•AEOUT-不良事件结局

•AESEV-严重程度

•AETOXGR-毒性级别

•AESER-严重不良反应事件SAE

•AESAEDAT-报告严重不良反应事件日期

•AESCONG-认知异常或出生缺陷

•AESDISAB-致残

•AESDTH-致死

•ASSHOSP-导致住院

•AESLIFE-生命受到威胁

•AESMIE-其他医学重要事件

•AEDRYN-因不良事件退出试验（是／否）

注意：

其中中文之前的编号的规律，简略说域名（domain）＋变量缩写。

比如，AE代表不良反应，TERM代表变量名称。

大部分的变量名CDSIC已经做了规定，至于如何创建CDSIC没有包含的变量名，以及如何设计和理解数据库导出格式等内容。

我们未来讲解一起再学习。

总之，CDASH就是我们一个很好的制作CRFs的开始。

他给我们提供了很多CRFs常用收集的数据模版，帮助我们规范CRFs的制作和使用规范，大大降低制作CRFs的难度，也为后期数据分析奠定基础。

（参考网址：

http:

//www.cdisc.org/cdash）

展开阅读全文