真实世界研究的方法与实践_精品文档.docx
《真实世界研究的方法与实践_精品文档.docx》由会员分享,可在线阅读,更多相关《真实世界研究的方法与实践_精品文档.docx(5页珍藏版)》请在冰豆网上搜索。
真实世界研究的方法与实践
1从大型研究结果引出的思考
SymplicityHTN-1是首个肾交感神经消融(renalsympatheticdenervation,RSD)治疗高血压的临床研究[1],45例难治性高血压患者接受了RSD治疗,结果显示术后即刻与术前相比平均诊室血压降低,术后1个月显著降低。
随后,该研究进一步扩大样本量至153例,随访2年结果显示,患者血压水平有明显的下降[2]。
最终3年的随访结果显示[3],术后12个月、24个月、36个月,患者血压分别降低27/12mmHg、30/13mmHg、32/14mmHg。
术后随访1个月、6个月、12个月、24个月、36个月时,分别有69%、81%、83%、85%、93%的患者收缩压降低10mmHg以上,提示部分患者可能存在延迟起效。
虽然该研究提示RSD具有良好的安全性和有效性,但是不能排除安慰剂效应和观察者偏倚,因此提出需要进行前瞻性随机临床研究。
为解决HTN-1试验设计的局限性,2010年SymplicityHTN-2试验采用多中心、前瞻性、随机对照设计[4],106例难治性高血压患者按1∶1比例随机分组,一组接受导管消融术和常规降压药物治疗,另一组仅接受降压药物治疗。
6个月随访时,与基线血压水平相比,手术治疗组血压下降32/12mmHg,药物治疗组血压无明显改变,两组间平均血压差为33/11mmHg,存在明显差异。
随后,该试验对照组中35例患者接受了RSD治疗,再随访6个月后平均收缩压显著下降(24mmHg)[5]。
此项随机试验证实了以前的研究结果,但也同样有局限性。
第一,样本量相对较小。
第二,随访时间有限。
第三,继发性高血压筛查有限,患者用药依从性不可控。
第四,以诊室血压作为主要观察结果而非24小时动态血压监测易产生测量误差和观察者偏倚。
第五,顽固性高血压定义和药物治疗不严格。
第六,患者不设盲故不能排除安慰剂效应。
基于以上理由,SymplicityHTN-3多中心试验于2011年开展[6]。
该研究为单盲、随机、对照研究,入选530名难治性高血压患者,随机分为RSD组和单纯药物治疗组(按2∶1比例随机分组),主要研究终点指标为术后6个月患者诊室收缩压变化,次要终点指标是术后6个月患者24小时血压动态监测的平均变化,主要安全性终点指标是术后6个月内主要不良事件发生率。
该试验设有非常严格的入组标准,排除首次动态血压评估平均收缩压<135mmHg的患者,同时,对临床观察人员设盲并应用自动血压计监测诊室血压。
此外,所有随机进入对照组的患者均需接受假手术治疗。
然而,出乎意料的是,试验没有达到最初设定的主要终点。
尽管没有安全性方面的相关事件发生,但受试者的收缩压未曾持续性下降。
这是一个让人意外的结果,但底特律医学中心医学博士CindyGrines说:
“我认为这个研究结果并不能终结这种去肾神经支配手术的开展。
相反这个试验结果可能仅仅是由于方法学的错误所造成”。
随机对照临床试验(randomizedcontrolledtrial,RCT)是目前公认的治疗性或预防性临床研究方法的金标准,用于临床医学研究已有50多年的历史。
RCT是将符合要求的研究对象分别分配到试验组和对照组,在同一条件下,同期按预期方案给予干预措施和观察,对试验结果进行测定和评价。
RCT的严谨设计可以避免研究中可能存在的选择性偏倚和测量性偏倚,确保研究结果的真实性,是获得证据、制定诊疗策略的主要依据之一。
RCT研究获得的只是理想条件下或某一年龄段或疾病亚组人群干预措施的结果,尚不能代表临床实践中的真实状况。
此外,RCT常涉及到医学伦理学问题;观察时间很有限,有时不可避免地出现过多的失访、退出、沾染或干扰影响研究结果事件;不能满足不同危险度个体的循证治疗;甚至某些疾病无法实施RCT(如手术治疗与非手术治疗比较)。
那么我们是否会有更好的选择来进行临床研究呢?
2随机对照试验和真实世界研究
真实世界研究(realworldstudy,RWS)起源于实用性临床试验,是指在较大的样本量(覆盖具有代表性的更大受试人群)基础上,根据患者的实际病情和意愿非随机选择治疗措施,开展长期评价,并注重有意义的结局治疗,以进一步评价干预措施的外部有效性和安全性,1993年Kaplan等[7]首次在论文中使用。
其涵盖的范围较随机对照试验更宽,除治疗性研究外,还可用于诊断、预后、病因等方面的研究。
针对严格的解释性RCT纳入人群限制较多用药条件控制严格,使得研究结果的内部真实性较高,外部真实性却较差,研究结果的实际应用推广受限等问题,国际上在实用性RCT的基础上,提出了真实世界研究的概念和方法,通过“真实世界样本”来反映真实世界总体,最初主要用于对药物临床不良反应的监测,就某药物在现实临床中监测到的不良作用,采用药物流行病学分析方法,辨别是否属于该药的不良反应;其后逐步发展到上市药物有效性和安全性再评价及临床干预措施的评价,主要是在不限定临床干预措施的情况下研究其效果。
RCT从医疗者角度评估医疗手段的“效力”(efficacy),是确定医疗手段有效性和安全性的标准方法。
RWS在真实医疗过程中进行观察性临床研究,用于观察药物、新疗法在广泛真实医疗过程中的疗效和不良反应,是从患者角度评估医疗措施的“效果”(effectiveness)。
需要注意的是,效力并不等于效果。
RCT关注效力研究(efficacytrials),即药物与干预措施能否在理想、严格控制的环境下产生预期的效果,着重于内部有效性,不易普遍化;选择人群观察时间短,人群样本小,测量手段主要有中间终点如糖化血红蛋白、肺功能-第一秒用力呼气量、血压等,当然如果随访时间较长也有硬终点如病死率等。
RWS关注效果研究(effectivenesstrials),即评价药物在真实临床环境下的治疗效果,重在外部有效性;缺乏控制,存在选择性偏倚、观察性偏倚等混杂因素,需要有不同于RCT的统计方法进行校正,测量手段有死亡率、无症状时间、患者生存质量等[8,9]。
真实世界数据或真实世界研究覆盖多种研究类型及数据资源,包括患者注册研究、已有的电子健康记录、常规收集的服药数据、患者原始数据、人群健康调查等,数据来源广泛。
在多种数据类型中,临床终点指标(如发病率、死亡率)、患者报告的终点事件、安全性数据、疾病进展的自然病史均可直接供他国参考,而处方类型、经济学模型数据、流行病学数据则要分别结合当地经济及政策、疾病及国家具体情况考虑,治疗路径、使用资源、患者服务经验则因各国具体国情不一无法参考。
在具体的设计和各自的局限性上,RCT和RWS有很大的差别(见表1)。
由于RWS是观察性研究,研究对象纳入限制较少、人群异质性较大、自主选择治疗措施可造成的选择偏倚以及重要预后因素在组间分布的不均衡性,需要进行多重倾向性评分减少这些影响。
倾向性评分的概念最早由Rosenbaum和Rubin在1983年首次提出[10],其基本原理是用一个倾向指数表示多个协变量的影响,根据倾向指数进行不同对比组间的匹配、分层或加权,即均衡对比组间协变量的分布,最后在协变量分布均衡的层内或者匹配组中估计处理效应。
在大样本的情况下,经过倾向评分值调整的组间个体,除了暴露因素和结局变量分布不同外,其他协变量应当均衡可比,相当于进行了“事后随机化”,使观察性数据达到“接近随机分配数据”的效果[11]。
表1
表1
表1RCT与RWS设计的区别和局限性
指标
RCT
RWS
患病人群
严格有限样本,设计者制定纳入标准和排除标准。
宽泛大样本,无需制定纳入标准和排除标准,符合治疗适应证的患者均可纳入。
分组方法
按随机、安慰剂对照的原则将样本分为治疗组及安慰剂对照组。
在非随机开放、无安慰剂对照的情况下将患者分为暴露组和公认有效的对照组。
研究过程
在较短时间内通过研究方案的治疗和随访得出结果。
通过长时间专门的治疗和随访(质控伦理),在完备注册信息和数据库支持下得出结果。
局限性
结论外推性差,这一直是制约其发展的重要原因。
观察者偏倚,且样本量大、随访时间长造成其研究成本高,庞大的数据收集量也增大了工作难度,并有可能存在潜在编码错误和数据丢失的问题。
表1RCT与RWS设计的区别和局限性
虽然二者差别巨大,但并不是对立关系,而是互补与承启关系。
RCT是评价任何临床干预措施的基础,用于评价有效性和安全性,没有RCT,任何外部有效性的结果都将受到质疑。
在RCT的基础上制定相应的治疗指南,新的临床干预措施得以真正用于临床,但指南是一种推荐,它告诉医生哪些应该做或可以做,而不是哪些必须做,指南不能替代临床经验。
所以,就需要RWS作为有效补充,RWS用于决定效应性,能够用于决定临床实践中真实的效益、风险和治疗价值,使临床研究的结论在RCT后回归真实世界。
3真实世界研究例子
2012年,Chitnis等用多重倾向性分析的方法比较几种血管紧张素转换酶抑制剂(angiotensin-convertingenzymeinhibitors,ACEI)对心力衰竭患者死亡率的影响[12],这是真实世界研究的一个例子。
该研究纳入了139994例心力衰竭患者,其中69.50%(97293例)接受赖诺普利、21.79%(30503例)接受福辛普利、8.41%(11775例)接受卡托普利和0.30%(423例)接受依那普利的治疗,以卡托普利为参照,比较不同ACEI治疗的粗略死亡率。
研究中共有47个基线危险因素(协变量),在这些基线危险因素中仅11项治疗组间无差异,36项差异有统计学意义,但是建立倾向性评分模型、经过标准化倾向性权重评估后,绝大多数协变量差异无统计学意义,仅3项(肾衰竭、消化系统疾病、贫血和凝血异常)仍有差异,倾向性评分后显示各治疗组间具有可比性(图1)。
最终研究结论显示,与卡托普利相比,福辛普利和赖诺普利显著降低心力衰竭患者死亡风险,依那普利与卡托普利在此方面无显著差异。
该研究首次在现实世界人群证实了不同ACEI对于心力衰竭患者预后会产生不同的影响,对未来ACEI的治疗及研究提供了新的参考思路,可以使更多患者受益于更好ACEI的治疗。
同时,多重倾向性分析方法的应用,为现实世界治疗数据分析提供了有效的方法和思路。
图1
·FigureOption
ViewDownloadNewWindow
图1倾向性评分柱状图各组之间的重叠允许对治疗和对照药物的效应进行直接估计,体现了对所有观测的背景特征差异的校正。
各组间的重叠相当大,显示各组之间具有可比性。
2011年,Petrella等在《临床治疗学》杂志发表血管紧张素受体拮抗剂(angiotensinreceptorblocker,ARB)对比其它类降压药物真实世界研究回顾性分析[13],回顾性分析纳入17万加拿大高血压患者数据,坚持使用降压药治疗超过9个月,旨在比较ARB对比非ARB治疗方案的降压疗效,主要观察终点指标为血压达标率(目标血压值<140/90mmHg)。
真实世界临床数据显示,以ARB为基础的联合治疗方案血压达标率更高,其中,ARB/氢氯噻嗪联合治疗方案血压达标率较高。
2011年,Vegter等进行ACEI和ARB的依从性、坚持率及换药模式的研究[14],纳入1999-2010年间的超过50000例患者处方,处方用药包括ACEI:
卡托普利、依那普利、赖诺普利、培哚普利、雷米普利、福辛普利;ARB:
氯沙坦、缬沙坦、厄贝沙坦、坎地沙坦、奥美沙