1、SDTMIG学习总结CDISCSDTMIG学习笔记学习心得:SDTM数据集与一般数据集的区别:1. 数据集个数不同按照数据变量的不同来源分为不同的域,而一般的临床试验只有一个或少量几个数据集。也就是数据不是按照在CRF表中的位置来收集的,而是按不同topic。2. 个人记录与事件记录一般数据集每个人一条记录,SDTM数据集每个人的每个事件、每次用药或每次不良反应一条记录。变量的数量减少,记录的条数增多。也就意味着每个受试者每次访视每个时间点可能有许多条观测记录。3. 由于变量之间存在关联,所以SDTM有关联数据集4. CDISC的重点是如何确定记录的唯一性,比如多阶段多时间多剂量的试验,就需要
2、有三个变量来区别。5. 元数据:关于数据的数据,按照一定的标准,从信息资源中抽取出相应的特征,组成一个特征元素集合。包括描述一个具体对象所需要的数据项集合、各项数据语义定义、规则和语法定义。元数据标准的制定为提高数据库建库质量,使诗句加工达到规范化、标准化,促进科学数据标准化,加强数据交流。6. 作用:变量名标准化,变量取值标准化7. 并不是所有的域和变量都要使用,根据研究内容来选择ThismodeldescribesthecontentsandstructureofdatacollectedduringaclinicaltrialThepurposeistoprovideregulatory
3、authorityreviewers(FDA)acleardescriptionofthestructure,attributesandcontentsofeachdatasetandvariablessubmittedaspartofaproductapplication1. 域1.1定义:一组具有共同主题并在逻辑上相关的观测结果集合。Adomainisdefinedasacollectionofobservationsthatshareacommontopic.每个域采用唯一的两字符(英文缩写)代码加以区别,如不良时间域(AE,AdverseEvent)域是SDTM的核心,所有变量按不同的
4、来源被分类到相关的域。比如下图中展示提交的SAS数据集。CM(concomitantandpriormedication)伴随用药域、DA(DrugAccountability)药物发放回收记录域和DM(DEMOGRAPHICS)人口学资料域等。 域名和变量名是固定不能变的。在所有域中使用SDTM规定的变量标签 研究中只需提交实际采集的域,具体采集哪些数据由研究内容决定,而不是基于SDTM。 扩展内容:如果现有的域不能满足要求,可以创建自定义域(相关内容未包括)1.2 域模型1.2.1 域可以分为五类Special-PurposeDomainsGeneralObservationClass(3
5、种Interventions,Events,Findings),Findingabout,TrialDesignRelationshipDatasets。下图是SDTMvesion3.2中包括的所有域。1.2.2域模型假设变量名最长为8个字符变量筛选:每个域中有各种变量,研究者应按需要选择合适的变量。域中的变量按照需求的不同可分为必需变量(域中必须有且值不能为空)、预期变量(域中必须有但可以为空值)和许可变量(有数据才提交)变量顺序:对于GeneralObservationClass中的变量顺序,应先按标识变量、主题变量、修饰语变量到时间变量依次排列,每种变量类型内按照SDTM表中变量描述排序
6、。扩展内容:域可以被分割,如将调查量表QS域分为临床整体印象(QSCG)、痴呆易于康奈尔量表(QSCS)和细微精神状况检查(QSMM),操作方法不详述。受试者:在标签或注释中将“病人”或“志愿者”统称为“受试者”。在所有的域数据集中都应该包含唯一的标示符(USUBJID)。一般可用:研究编号、临床中心编号和受试者编号联接起来作为USUBJID。文本数据大小写:建议大写文字形式递交文本数据(如果是英文的话),长文本或标签文本及已经是大小写的受控术语除外。缺失值:单个数据项缺失以空来表示,如果有STAT变量和REASND变量则还需在STAT中录入NOTDONE,在REASND中录入原因。分类变量:
7、CAT、SCAT、GRPID、SPID、REFIDCAT与SCAT在采集之前就已知,是固有属性,用于受试者之间分组GRPID通常在数据采集之后由申办者指定,受试者之内分组数据对各受试者之间具有相同值的数据用CAT与SCAT,而对受试者之间具有不同值时用GRPID自由文本:其他,请说明。P36页一个变量的多个取值受控术语:一个星号*或两个星号*代表相应的变量应该被填入意义明确的一组数值(受控术语)。一个星号表示受控术语来自申办者自定义的值,两个星号表示来自外部已出版的数据源。 建议受控术语应大写,除了本来就是小写的或计量单位 放入define.xml 不能用数字代码每个通用观察域必须要有一个主题
8、变量,一个时间变量主题变量:事件类TERM,干预类TRT,发现类TEST;必须有受控术语时间变量:国际标准日期时间格式ISO8601YYYYMMDDThh:mm:ss年月日T小时:分钟:秒0不能省略,不能有空格。时间变量的片段名为DTC。 时间成分缺失:恰当右缺失中间缺失补充单个连字符。不确定时间的表示时间间隔变量DURYYYYMMDDThh:mm:ss/YYYYMMDDThh:mm:ss或者PnYnMnDTnHnMnS或PnW确定开始时间和间隔YYYYMMDDThh:mm:ss/PnYnMnDTnHnMnS确定结束时间和间隔PnYnMnDTnHnMnS/YYYYMMDDThh:mm:ss 研
9、究日变量DYDY=(DTC的日期部分)-(RFSTDTC的日期部分)+1,如果DTC和RFSTDTC相同或在其后DY=(DTC的日期部分)-(RFSTDTC的日期部分)+1,如果DTC在RFSTDTC之前 访视对于非计划中的访视:VISITNUM值 相关时间变量STRF和ENRF是分别与RFSTDTC和RFENDTC比较,可能的值是BEFORE,DURING,DURING/AFTER,AFTER,ONGOING,U(Unknown)等STTPT参考的开始时间点,STRTPT表示与STTPT相比较 任何域的日期都应该记录在DTC数据标准化ORRES记录原始结果,但STAT为“未检测”或来源为衍生
10、(DRVFL=“是”)时,它可以为空。ORRES有值时,字符型变量STRESC必须有值,STRESC可以由ORRES转换而来,也可以是根据ORRES值指定的相应值然后将STRESC中的值转入数值型变量STRESN如果原始数据中含有字符,如等,则字符应该复制到STRESC中,而STRESN则为空。未测项目CRF表中数据缺失,且没有对选项是/否或已测/未测作出明确选择时如果一组检测项目未作,则相应的变量值为:TESTCD为ALL;TEST应为模块名称CAT应为测试组的名称ORRES为空STAT为未测REASND如果采集了,可能是标本遗失 心电图的总体解释作为一条新纪录显示TEST不能超过40字符,
11、如果超过了,可以提供其在电子CRF的链接;如果CRF表中没有,则创建一个pdf文档来储存全部文本描述。 超过200字符的文本,前200字符存储在标准域变量里,剩下的每200字符应该在SUPP中存储为一条记录。变量名是在原始的标准域变量名称后面添加一个从1开始一位的整数,如果变量名已经到了8个字符,则最后一个字符用该数字替代。1. 人口学数据域DemographicsDM每个受试者一条记录,DM域includesessentialstandardvariablesofeachsubject必需变量:STUDYID,DOMAIN,USUBJID,SUBJID,SITEID,SEX,ARMCD,AR
12、M,COUNTRY预期变量:RFSTDTC,RFENDTC,AGE,AGEU许可变量:INVID,INVNAM,BIRTHDTC,RACE,ETHNIC,DMDTC,DMDY变量说明STUDYID:研究唯一标示符DOMAIN:域名DMUSUBJID:受试者唯一标示符,可以是STUDYID-SITEID-SUBJID组成SUBJID:受试者编号SITEID:研究中心编号SEX:性别受控术语F(Female),M(Male),U(Unknown),UNDIFFERENTATEDARMCD:最长20字符,计划分组代码ARM:计划分组描述COUNTRY:国家受控术语C66785各国英文缩写,如中国CH
13、NRFSTDTC:受试者第一次暴露于研究治疗的日期/时间RFENDTC:受试者结束试验的日期/时间,常等于最后一次暴露于研究治疗的日期/时间AGE:年龄AGEU:年龄单位受控术语DAYSHOURSMONTHSWEEKSYEARSINVID:研究者标识符,如果SITEID等于INVID(一个中心一个研究者)则不需要INVNAM:研究者姓名BIRTHDTC:出生日期/时间RACE:人种受控术语AMERICANINDIANORALASKANATIVE/ASIAN/BLACKORAFRICANAMERICAN/NATIVEHAWAIIANOROTHERPACIFICISLANDER/WHITEETHN
14、IC:族裔受控术语HISPANICORLATINO/NOTHISPANICORLATINO/NOTREPORTED/UNKNOWDMDTC:采集日期DMDY:采集数据研究日如果DMDTCRFSTDTC,则DMDY=DMDTC-RFSTDTC+1如果DMDTCRFSTDTC,则DMDY=DMDTC-RFSTDTC 每个受试者只提交一条DM记录 ARM/ARMCD的值必须与实验分组的数据集(TA)的一致如果需要递交筛选失败的受试者数据,应把他们放入DM域中,ARMCD=SCRNFALL;ARM=筛选失败。还可在Disposition实施情况域(DS)中放入一条记录标明筛选失败发生的时间。如果没有筛
15、选失败,但也没有分配到任何分组,则ARMCD=NOTASSGN;ARM=未分配。 受试者水平的受试人群标志(如COMPLT,SAFETY,ITT和PPROT等)可放入补充修饰数据集SPPDM。 如果是混血人种,则RACE为MULTIPLE,具体人种情况放入SUPPDM。或者也可指定一个主要人种,其余信息放入SUPPDM。或者采用“其他,请说明”采集自由文本信息,则RACE值为其他,而把具体内容放入SUPPDM。 Safetypopulationflag/randomizednumber/randomizedflag?2. 注释域CommentsCOTheCommentsspecial-purp
16、osedomainprovidesasolutionforsubmittingfree-textcommentsrelatedtodatainoneormoreSDTMdomainsorcollectedonaseparateCRFpagededicatedtocomments.Commentsaregenerallynotresponsestospecificquestions;instead,commentsusuallyconsistofvoluntary,free-textorunsolicitedobservations.CO域是为了提交与域数据相关的自由文本型注释,以及CRF表中专
17、门的注释。必需变量:STUDYID,DOMAIN,USUBJID,COSEQ,COVAL许可变量:RDOMAIN,IDVAR,IDVARVAL,COREF,COEAL,CODTCCOSEQ:同一USUBJID受试者不同注释的序号COVAL:注释的内容,超过200字则依次记录在COVAL1-COVALn中IDVAR:父表中用于指明注释与哪个记录相关IDVARVAL:IDVAR的值COREF:与注释相关的参考,如CRF页码COEVAL:注释的初始作者CODTC:注释表的注释时间/日期 CO域的三个来源:a,与特定域或记录无关联,这种情况下RDOMAIN,IDVAR,IDVARVAL值为空;b,域特
18、定域相关联,但无关联记录,RDIMAINS值为相关域的代码,变量IDVAR,IDVARVAL为空;c,与特定记录或一组记录相关联,RDOMAINS为相关域代码,IDVAR和IDVARVAL分别为所关联的变量名和值。3. 受试者元素表SubjectElementsSETheSubjectElementsdatasetconsolidatesinformationaboutthetimingofeachsubjectsprogressthroughtheEpochsandElementsofthetrial.SE域整合了每一受试者在试验过程中经历的各时期(Epochs)和元素(Elements)的
19、时间信息。受试者在试验中的实际经历,而试验设计相关的TA(TrialArm)或TE(TrialElements)域中是设计的时期和元素,并不一定是实际的。必需变量:STUDYID,DOMAINS,USUBJID,SESEQ,ETCD,SESTDTC预期变量:SEENDTC许可变量:ELEMENT,TAETORD,EPOCHSEUPDESETCD:ELEMENT的伴随变量,8字符以内。如果受试者实际经历的元素与计划不同,被视为新元素,ETCD=UNPLANELEMENT:元素的名称,如果ETCD=UNPLAN,则为空值SESTDTC:元素开始日期/时间SEENSTC:元素结束日期/时间TAETO
20、RD:受试者被分配组别内元素计划序号EPOCH:与受试者所分配组内的计划元素序列相关联元素的时期SEUPDES:非计划元素描述 强烈建议递交受试者元素数据集 根据定义,元素的结束日期SEENDTC值将和下一个元素的开始日期SESTDTC相同 SE域与其他域不同,SESTDTC是必需变量,不能为空4. 受试者访视域SubjectVisitSVTheSubjectVisitsdatasetprovidesreviewerswithasummaryofasubjectsVisits.ComparisonofanindividualsubjectsSVdatasetwiththeTVdatasetwh
21、ichdescribestheplannedVisitsforthetrial,quicklyidentifiesmissedVisitsand“extra”Visits.受试者访视域是关于受试者访视时间,综合了分散在其他包含访视变量的域中的信息。SV域记录的是受试者实际的访视情况,而TV(TrialVisit)域则记录的是计划中的访视。必需变量:STUDYID,DOMAIN,USUBJID,VISITNUM预期变量:SVSTDTC,SVENDTC许可变量:SVSTDY,SVENDY,SVUPDESVISITNUM:访视编号,用于排序;小数可用于插入非计划访视VISIT:访视名称VISITDY
22、:计划访视研究日SVSTDY:访视开始日期相对RFSTDTC的研究日SVENDY:访视结束日期相对RFENDTC的研究日SVUPDES(descriptionofunplannedvisit):非计划访视描述 非计划内访视应在SVUPDES中记录原因,VISITNUM用小数表示 VISITDY是一次访视的计划的研究日,非计划访视不填 SVSTDY是一次访视的实际的研究日,是SVSTDTC相对RFSTDTC5. 干预类5.1 既往和伴随用药ConcomitantMedicationsCMCasereportform(CRF)datathatcapturestheconcomitantandpri
23、ormedications/therapiesusedbythesubject.必需变量:STUDYID,DOMAIN,USUBJID,CMSEQ,CMTRT许可变量:CMGRPID,CMSPID,CMMODIFY,CMDECOD,CMCAT,CMSCAT,CMPRESP,CMOCCUR,CMSTAT,CMREASND,CMINDC,CMCLAS,CMCLASCD,CMDOSE,CMDOSTXT,CMDOSEU,CMDOSFRM,CMDOSFRQ,CMDOSTOT,CMDOSRGM,CMROUTE,CMSTDTC,CMENDTC,CMSTDY,CMENDY,CMDUR,CMSTRF,CMENR
24、F,CMSTRTPT,CMSTTPT,CMENRTPT,CMENTPTCMSEQ:序号CMGRPID(GroupID):组别ID,用来把一组在单独域中相关的记录捆在一起,支持域内或域间关系CMSPID(Sponsor-DefinedIdentifier):申办者定义的编号,比如预先打印在CRF表上的识别符或伴随药物的行号CMTRT(ReportedNameofDrug,Med,orTherapy):药品本名CMMODIFY:修正的药品名,为了便于编码CMDECOD:标准的药物名称,可从词典中得到,如WHODrug受控术语CMCAT:药物类别受控术语CMSCAT:药物子类受控术语CMPRESP(
25、Pre-Specified):药物是否在CRF表上预设受控术语(NY)CMOCCUR:预设药物是否使用受控术语(NY)CMSTAT:如果预测药物未使用,则CMSTAT为NOTDONE;如果使用则为空值CMREASND:如果CMSTAT为NOTDONE,则描述原因,否则为空CMINDC:适应症,给与药物的原因CMCLAS(CLASS):药物类别,受控术语CMCLASCD(CLASSCODE):药物类别代码,受控术语CMDOSE:每次用药剂量CMDOSEU:剂量单位,受控术语(UNIT)CMDOSFRM:剂型,受控术语(FRM)CMDOSFRQ:期间给药频率,受控术语(FRQ)CMDOSTOT:每
26、日总剂量CMDOSRGM(doseregimen):计划服药方案CMROUTE:给药途径,受控术语(ROUTE)CMSTDTC:开始用药时间CMENDTC:结束用药时间CMSTDY:开始用药研究日CMENDY:结束用药时间CMDUR:持续时间CMSTRF(StartRelativetoReferencePeriod):相对于RFSTDTC,受控术语(STENRF):AFTER/BEFOR/COINCIDENT/DURING/(DURING/AFTER)/ONGOING/UNKNOWN.CMENRF:类似于CMSTRF,受控术语(STENRF)CMSTTPT(StartReferenceTime
27、Point):开始参考时间CMSTRTPT(StartRelativetoReferenceTimePoint):相对CMSTTPT,受控术语(STENRF)CMENTPT(EndReferenceTimePoint):结束参考时间CMENRTPT(EndRelativetoReferenceTimePoint):相对CMENTPT,受控术语(STENRF) CMDOSFRQ=PRN表示按需用药(Asneeded)5.2 暴露ExposureEXTheExposuredomainmodelrecordsthedetailsofasubjectsexposuretoprotocol-specif
28、iedstudytreatment.暴露域记录了受试者于试验方案定义的研究治疗的细节。必需变量:STUDYID,DOMAIN,USUBJID,EXSEQ,EXTRT预期变量:EXDOSE,EXDOSU,EXDOSFRM,EXSTDTC许可变量:EXGRPID,EXSPID,EXCAT,EXSCAT,EXDOSTXT,EXDOSFRQ,EXDOSTOT,EXDOSRGM,EXROUTE,EXLOT,EXLOC,EXTRTV,EXVAMT,EXVAMTU,EXADJ,TAETORD,EPOCH,EXSTDTC,EXENDTC,EXSTDY,EXENDY,EXDUR,EXTPT,EXTPTNUM,E
29、XELTM,EXTPTREFEXDOSRGM(DoseRegimen):计划治疗方案EXLOT:批号EXDIR(Directionality):给药部位EXADJ:剂量调整原因5.3嗜好品使用SubstanceSUTheintentofthedomainistocapturesubstanceuseinformationthatmaybeusedtoassesstheefficacyand/orsafetyoftherapiesthatlooktomitigatetheeffectsofchronicsubstanceuse.这个域的目的是为了获取嗜好品的使用信息,可用于评估长期使用嗜好品对治
30、疗有效性及安全性可能存在的作用必需变量:STUDYID,DOMAIN,USUBJID,SUSEQ,SUTRT许可变量:若干 如果在病例报告表内嗜好品使用信息采集超过一个,那么可加入VISITNUMV3.2新增ExposureascollectedECTheExposureasCollecteddomainmodelreflectsprotocol-specifiedstudytreatmentadministrations,ascollected.EC域是EX域的补充,记录EX域中没有的一些信息。V3.2新增proceduresPRTheProceduresdomainmodelreflect
31、scollecteddetailsdescribingasubjectstherapeuticanddiagnosticprocedures 应用条件:I. 疾病筛查II. 内窥镜检查III. 诊断试验IV. 治疗过程V. 手术过程6.2不良事件AdverseEventsAETheAdverseEventsdatasetincludesclinicaldatadescribinganyuntowardmedicaloccurrenceinapatientorclinicalinvestigationsubjectadministeredapharmaceuticalproductandwhichdoesnotnecessarilyhavetohaveacausalrelationshipwiththistreatm
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1