二维测量与三维测量方法对肺部肿瘤治疗后疗效评价的比较Word格式文档下载.docx
《二维测量与三维测量方法对肺部肿瘤治疗后疗效评价的比较Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《二维测量与三维测量方法对肺部肿瘤治疗后疗效评价的比较Word格式文档下载.docx(12页珍藏版)》请在冰豆网上搜索。
但是,WHO标准存在许多问题。
比如没有规定靶病灶的大小、数目,对PD的标准不够明确等。
这些具体细节上的缺陷导致不同的研究者评价同一个患者的治疗疗效时可能得出不同的评价结果。
比如,有些研究者用所有病灶的测量值的和评估疗效,而部分研究者会用单个病灶的测量值进行评估,从而造成疗效评价结果的不同。
这显然会降低临床试验的可比性和结论的可靠性。
而且,WHO的测量方法沿用之前NCI标准的面积法,在肿瘤测量准确性方面未见明显改善,仍具有较高的测量误差,1980年Lavin等[11]发现WHO对PD标准阈值过低,不可避免的测量误差会导致四分之一的假阳性率,即在病灶真实大小无变化时有25%的概率评效为PD。
1985年,Warr等[12]的研究发现因为WHO标准对病灶的定义模糊和肿瘤测量上的误差造成的疗效评价偏倚约为5-10%。
1999年,James等[13]提出用单径法取代双径法对肿瘤进行测量。
James等对肿瘤的直径、双径乘积、肿瘤细胞数之间的关系进行了研究。
发现当肿瘤为球形病灶时,根据数学理论公式推算出,肿瘤的直径与肿瘤细胞数量的变化关系比肿瘤双径乘积与肿瘤细胞数量的变化关系更密切,认为单径法比双径法更精确[图1]。
在此理论基础上,James等用单径法与双径法评价8个临床试验中的569位肿瘤患者的疗效,结果显示单径法优于双径法。
图1.示球形病灶肿瘤细胞数量的变化与最大径变化、双径乘积变化的关系[13]。
表明肿瘤细胞数量与最大径的线性关系更为密切。
根据上述研究结果,2000年欧洲抗癌治疗研究组织EuropeanOrganizationforResearchandTreatmentofCancer(EORTC),美国国家癌症研究所(theNationalCancerInstituteoftheUnitedStates),加拿大癌症研究所(theNationalCancerInstituteofCanada)在WHO标准的基础上进行了必要的修改和补充并发布了ResponseEvaluationCriteriainSolidTumors(RECIST)[14],RECIST采用横断面上最长径的长度的总和,即单径测量法测量肿瘤大小。
同时规定了基线可测量病灶的大小,划分了靶病灶与非靶病灶,规定了靶病灶的数目、选择标准,规定了基线肿瘤负荷及推荐使用的影像设备。
此外RECIST规定单径增加20%,相当于体积增加73%为PD。
于此同时科学家们分别用WHO标准与RECIST标准对14个临床试验的4614位患者进行了疗效评价,发现两种方法评效结果有很好的一致性。
尽管对PD的规定进行了改动,但两种方法评效的PD也具有较好的一致性[表2],在234例评效为PD的患者中,两种方法同时评效PD的为215例,用WHO方法评效PD更早的为17例,用RECIST评效PD更早的为2例。
表1WHO标准和RECIST对肿瘤测量的定义和疗效评价的标准
WHO标准
RECIST
测量方法
双径法
(肿瘤最大径与其最大垂直径的乘积)
单径法
(肿瘤最大径)
CR
全部肿瘤病灶消失
PR
缩小50%以上
缩小30%以上
SD
非PR/PD
PD
增长25%以上
增长20%以上
表2用WHO标准、RECIST标准评效PD的病例数[14]
病例数
百分比
疾病进展(PD)
234
100
出现新病灶评效为PD
118
50
发现病灶增大评效为PD
116
用WHO、RECIST标准评效,PD日期相同
215
91.9
用WHO、RECIST标准评效,PD日期不同
19
8.1
用WHO标准,评效为PD的时间更早
17
7.3
用RECIST标准,评效为PD的时间更早
2
0.9
RECIST的这些具体规定规范了疗效评价的具体操作,提高了研究结果的可靠性、可比性和重复性,但是随着科学家们的对RECIST的不断深入研究,还是发现了一些其他问题。
第一、RECIST在缺乏科学根据及理论辩证基础上规定了靶病灶的数目。
每个肿瘤病灶对治疗的疗效反应可能是不同的,RECIST对靶病灶数目的规定,可能会影响其可靠性,因为被选的靶病灶可能无法表示整体肿瘤负荷[15]。
Chojniak等[16]研究发现,选择单个或部分病灶用RECIST或WHO标准进行评价,有可能得出不同的结果,靶病灶数目的选择会影响疗效评价结果。
虽然最理想的方法是对所有病灶进行测量从而得出整体的疗效评估结果,但是,在实际工作中有些病灶很难测量或者根部无法进行测量,而且庞大的工作量未必能得到更有意义或更令人满意的结果。
普遍认为测量病灶数目越多,疗效评估错误的可能性越小。
有学者认为[17]选择两个病灶进行疗效评价是比较合适的,但Schwartz[18]等做了相关研究,认为RECIST标准选择4个或4个以上病灶可以有效减少差异性。
第二、RECIST规定了可测量的最小病灶的大小(用常规技术时可测量直径≥20mm、用螺旋CT时可测量直径≥10mm),这项规定限制了RECIST在仅有较小肿瘤病灶的患者中的使用。
Watanabe等[19]对RECIST的可靠性以及RECIST和WHO标准的重复性进行了研究,认为虽然对最小靶病灶的规定限制了RECIST的应用范围,但是RECIST与肿瘤体积之间存在一定相关性,而且RECIST与WHO之间有较好的重复性,RECIST标准适用于化疗后疗效评价。
但是病灶大小的限制忽略了小病灶的变化,这是否会对整体疗效产生显著影响仍需要进一步研究。
第三、RECIST规定单径增加20%,相当于体积增加73%为PD,,而WHO标准规定双径法增加25%,相当于体积增加40%为PD。
提高PD的标准阈值,主要是为了减少小结节的测量误差对整体疗效评价的影响,从而避免过度评价PD的情况。
PD阈值的不同导致两种评价标准有可能得出不同的疗效评价结果和疾病进展时间(timetoprogress,TTP)。
学者对RECIST和WHO标准的评价进行了比较研究证实两种评价标准之间存在较好的一致性[20-23],但是也有一些研究发现[24]两种评效方法的结果存在统计学差异,建议在临床工作中正确认识和对待这种差异,同时提出要理清两种评效方法中的异同并分出其优劣,需要更久的时间进行前瞻性研究来证实。
第四、根据RECIST标准,肿大的淋巴结作为肿瘤转移病灶,可视为可测量的靶病灶。
按RECIST的测量方法,应该测量其长径作为转移灶的大小。
但是研究者们发现,淋巴结的大小变化主要发生在其短径(25-28),根据长径判断淋巴结大小变化有可能导致错误的评价结果。
除此之外,由于RECIST是在上世纪90年代拟定并在2000年颁布的,最近几年先进影像学成像技术和设备的价值没有充分体现在RECIST中[3、28-30],同时功能影像学的发展也对RECIST提出了新的问题。
为了适应新影像技术与临床实践的需要,同时充分利用先进影像技术与后处理技术带来的更多有价值的信息,2009年RECIST小组对其进行了更新和调整颁布了RECIST1.1版[31]。
RECIST1.1版也运用基于肿瘤负荷的解剖成像技术进行疗效评价,并以循证医学为基础,采用了欧洲癌症治疗研究组织(EORTC)实体瘤临床试验数据库中6500例患者、18000多靶病灶的检验数据,在RECIST1.0的基础上做了更新。
在RECIST1.1版中,用于判断疗效的可测量靶病灶数目从最多10个、每个器官5个改为最多5个、每个器官2个。
PD的定义不仅仅为原靶病灶长径总和增加20%,还包括其绝对值增加5mm,出现新病变也视为PD,但是多个靶病灶中的单个病灶消失后又重新出现不足以证明其为PD。
该标准还新增了短径≥10mm、<15mm的淋巴结为有病理意义的淋巴结,并规定淋巴结应测量其短径。
除此之外,还对骨性病变、囊性变边和局部治疗病变做了一些规定,同时指出疗效评价时若要在肿瘤解剖体积测量的基础上增加功能评估尚待积累大量数据,功能评估可补充用于新病灶评价。
2009年Jong-MuSun等[32]对104例非小细胞肺癌患者分别用RECIST1.0及RECIST1.1进行疗效评价,发现有6例评效结果不一致。
虽然两种评效结果的平均PFS均为4.3m,但是有三例由PD改评为PR的患者其PFS有增加,提出RECIST1.1可能更准确的反应肿瘤负荷。
虽然做了相应的更新和补充,RECIST1.0和1.1版仍然存在缺点和不足,其最根本的缺点是:
RECIST建立在假设肿瘤病灶是形态规则的球形、病灶的生长按照球形均匀生长模式的基础上,以二维最长径的变化代表肿瘤病灶整体的大小变化,忽略了病灶在纵轴上的变化,从而无法提供病灶全面的信息。
肿瘤病灶的形态多种多样,有近似球形的病灶,也有形态不规则的病灶,即便是球形病灶,其各部位的肿瘤生长方式也不同,不一定会按照球形模式生长。
因此仅用最大单径来判断肿瘤大小是不全面的。
Yankelevitz[33]等报道了一例恶性结节主要在Z轴(纵轴)生长,在二维横断面用单径法及双径法均未发现明显变化的病例,证实了二维测量只能反映肿瘤在横断面上的大小变化,而不能代表肿瘤在三维空间整体的变化。
另一方面,二维单径测量法的主观性比较强。
目前最常用的测量方法是在CT工作站横断面图像上进行电子测量或在带有标尺的横断面CT胶片上进行手动测量。
尽管CT的密度分辨率较高,但是这种测量容易受到主观影响以及CT参数等的客观影响。
而且,在测量过程中难以保证在重复检查图像中找出与前次检查完全匹配的横断面,扫描定位不一致也会影响结果。
2.三维体积测量法的提出
由于最大单径无法代表肿瘤病灶真实的大小,采集了整个肿瘤全部数据的三维体积测量受到了人们越来越多的关注并被越来越多的人们所推荐[34、35]。
用治疗前后的体积变化评价治疗疗效的重要性曾在30多年前就被提出[36],对体积测量的可行性和可靠性一直存在争议。
近年来,随着医学影像技术的迅猛发展,多排螺旋CT广泛应用于临床,其快速、薄层、高分辨率、各相同性的扫描技术可以提供非常清晰的3D重建图像,对病灶的测量也更加准确,一些医疗设备中也配备了肺结节体积分析软件,可以半自动测量肺结节三维体积,也使对于病灶的体积测量成为可能。
2.1三维体积测量法的准确性及其影响因素
三维体积测量方法是基于后处理图像得出的,因此会受CT扫描、后处理参数等的影响。
为了研究肺结节三维体积测量准确性的影响因素,许多学者进行了模型肺结节和体内肺结节的研究,研究结果发现:
在肺结节特征方面,三维体积测量误差与肺结节大小负相关[37-42],与肺结节形态[33、39、43]肺结节周围有无血管、胸膜等结构、肺结节位置[40、43]等相关。
在扫描及后处理参数方面,三维体积测量误差与扫描层厚正相关[37、38、44],与重建算法[45、46]有相关性,与视野、重建间隔[37、41]、重建中心[41]无关。
呼吸运动[48、49]、剂量[40、50]是否对测量有影响尚待进一步研究。
静脉注射对比剂可以增加肺结节的体积[51]。
因此,进行肿瘤疗效评价时,要保证治疗前后的CT检查扫描参数、重建参数的一致性,还要考虑到造影剂对肿瘤体积的影响。
2007年Das等[47]研究不同的16排螺旋扫描机器对相同小结节的测量误差,发现机型不同其测量误差也不同,但这种差异在可接受范围内。
Gietema等[52]认为肺结节测量误差的产生主要是由于小结节形状的不规则及肺结节边缘不规整,因此,在使用软件法对肺实质内结节进行半自动体积测量要特别注意小的不规则肺结节测量,测量者应在软件分割程序中进行有效干预以提高测量的准确性。
2.2二维测量方法与三维测量方法的比较
2.2.1二维体积测量法与三维单径测量法的重复性比较
测量的重复性(repeatability)是对肿瘤大小及大小变化进行正确测量和评估的前提,许多学者对单经测量、双径测量和体积测量的重复性进行了研究。
Erasmus2003[22]等对直径在18-80mm的肺部病灶进行单径、双径测量,发现两种方法的测量者间重复性欠佳,会导致不同的疗效评价结果。
Revel等2004[34]对54个直径小于20mm的肺结节进行二维双径测量,发现测量的重复性欠佳。
因此,单径、双径测量在不同大小病灶的测量中一致性和重复性均欠佳。
Revel等2004[34]对54个直径3~18mm的实性非钙化肺结节进行三维体积测量,每个结节由3位医生连续测量3次,评价三维体积测量分析软件的可重复性(repeatability)。
52个(96%)结节被成功分离并计算体积,对每个结节的9次测量中,52个肺结节中35个(67%)肺结节体积测量未见变异,17个(33%)肺结节出现测量误差,其变异系数为2.26%。
Gietema等2006[43]在肺癌筛查中使用软件法对肺实质内非钙实性肺结节进行半自动体积测量,发现两位测量者在430枚肺结节(15-500mm3)体积测量中,其测量结果相关系数达0.99,其中383枚肺结节(约占89.1%)体积测量结果一致。
47枚(约10.9%)肺结节体积测量出现差异。
其中16例(约占3.7%)测量差异在10%以上,这种差异的产生主要是由于小结节形状的不规则及肺结节边缘不规整。
Zhao等[53]研究单径法、双径法、体积法在不同大小肿瘤病灶(直径在10-50mm)中的测量变异。
研究者对最大单径约9-90mm的32位非小细胞肺癌患者进行同一天重复性CT扫面(coffeebreakscan),扫描间隔小于15分钟,在此期间患者要从扫描床上下来,第二次进行扫描时重新上扫描床,并假定在扫面间期(小于15分钟)内肿瘤大小没有发生变化。
两次扫描的所有参数均保持一致。
由三位测量者对32个肿瘤病灶进行单径、双径的测量,同时用计算机辅助技术测量单径、双径和体积。
研究者比较前后两次扫描的重复性(reproducibility)和对第一次扫描的前后两次测量的可重复性(repeatability)。
结果发现,reproducibility和repeatability均有很高的一致性(一致性相关系数≥0.96)。
计算机辅助体积测量的重复性更高(一致性相关系数,1.00)。
计算机测量的单径、双径、体积法在两侧重复检查中的95%置信区间的中分别为(-7.3%,6.2%),(-17.6%,19.8%),(-12.1%,13.4%),而三位测量者的单径法和双径法的95%置信区间最高的为(-18.3%,15.5%),(-25.6%,22.3%),最低的为(-22.8%,23.0%),(-38.9%,39.1%)。
RECIST和WHO对PD的阈值分别为单径法增加20%和双径法增加25%,与前面提到的测试者的95%置信区间很接近,用RECIST及WHO评价标准很有可能判断为PD。
因此,测量者使用单径法或双径法测量肿瘤大小重复性欠佳、测量误差较大,评效结果的可靠性值得怀疑。
而体积测量法具有非常好的重复性和一致性,是一种稳定的测量方法。
Worman[47]、Goodman等[54]、Bolte等[55]也在研究中得出类似的结论:
体积测量方法更加稳定,其重复性及测量者间一致性好于二维直径测量。
综上所述,对不同大小的肺内病灶,三维体积测量的一致性和重复性均高于二维的单径、双径测量。
2.2.2三维体积测量与二维单径测量对肿瘤治疗疗效评价的比较
Fraioli等在2006年[56]对9位患者的24个病灶(直径小于20mm)进行研究,由2个测量者分别进行测量,对每个病灶及每位患者均按照表2的标准进行疗效评价。
研究结果发现由于测量者间的变异,两位测量者以RECIST标准对24个肺转移瘤评估中有三个结节疗效分类出现差异。
在9位患者评估中,2位患者疗效评价分类出现差异。
而软件法自动容积测量及疗效评估与测量者手工测量比较:
有3个肺转移瘤疗效评估结果不一致,有1位患者疗效评估出现差异。
说明在不同测量者对恶性肺结节评估意见不一致时,三维体积测量能为疗效评估提供重要的参考标准。
Marten等[57]对50位肺部转移患者的202个病灶进行了研究,由两位测量者分别测量所有病灶的治疗前后最大单径和体积(体积范围range=3.16–5,195.13mm3),用RECIST标准及由RECIST标准按照球形模式计算得出的体积标准(表2)对病灶进行疗效评价。
测量者内部相对测量误差(relativemeasurementerror,RME)在单径测量为2.34%-3.73%,在体积测量中为0.15%-0.22%,单径测量的误差显著高于体积测量。
对疗效评价的一致性,在200个疗效评价结果中,体积测量法在测量者之间及测量者内部得出完全一致的结果。
而在单径测量法测量者间以及测量者自身的一致性均减低,有28个测量结果在体积法及单径法中不一致。
因此得出结论:
体积测量比单径测量具有更好的一致性和重复性,体积测量法得出的疗效评价结果更加稳定,体积测量法与单径测量法评效的结果有一部分不一致。
Brown[58]、Tran[59]等对圆形和卵圆形肺结节进行了单径、双径及体积测量,并用三种方法分别进行疗效评价,发现双径法与单径法的一致性好,体积法与单径法、双径法之间的一致性较差。
表2球形肿瘤的直径(RECIST)、面积(WHO)、体积的对应关系
直径
面积
体积
缓解
进展
减少20%
减少30%
减少50%
增加12%
增加20%
增加25%
增加26%
增加30%
减少36%
减少75%
增加44%
增加56%
增加59%
增加69%
减少49%
减少65%
减少87%
增加41%
增加73%
增加95%
增加100%
增加120%
注:
表中增粗数字分别代表RECIST标准和WHO标准中部分缓解、疾病进展变化阈值
Zhao等在2006年[60]对15位原发肺癌患者非手术治疗前后(相隔三周)的胸部CT进行单径、双径、体积的测量,研究发现:
73%(11人)患者体积变化大于20%,却只有7%(1人)和28%(4人)患者在单径和双径测量中也有大于20%的改变。
47%(7人)的患者体积变化大于30%时,只有13%(2人)在双径测量中有大于30%的改变,而在单径测量中未发现改变大于30%的患者。
研究者认为,在治疗后体积发生显著变化时,二维测量的单径和双径均为发现显著变化或仅有较小的变化。
体积测量能敏感的检测到大于20%的体积变化,因此体积测量能够更早、更好、更敏感的发现肿瘤大小的早期变化。
2007年Gietema[48]也得出相似结论,认为对于形态不规则的肺结节体积增加25-30%的可信度为95%,而对于规则的球形结节95%置信区的体积变化阈值可以降低到15%。
Zhao等在2009年[61]用体积变化预测表皮生长因子(EGFR)的生物学活性,并以EGFR突变作为金标准。
在48例肺癌患者中,用治疗后3周的体积变化、单径变化预测EGFR的突变情况,发现前者较后者有相同的特异性、更高的敏感性,其阳性预测值为86%,由于单径变化,认为体积变化能更早的预测疗效。
2007年Schwartz等[62]也发现以表2的体积阈值判断PR,体积测量较单径测量更早评效PR,较单径测量更早的预测临床疗效。
但目前无明确的体积评效阈值,需要进一步研究体积变化与其他生物学指标。
综上所述,三维体积测量较二维单径测量更全面的反映肿瘤病灶真实的大小变化,而且三维测量的重复性与准确性高于二维测量。
按球形模式及表2的标准比较三维测量与RECIST、WHO标准对肺部肿瘤治疗后疗效进行评价,多数学者认为三维测量法得出的结果与RECIST、WHO标准的结果不一致。
三维测量法能比单径法、双径法更早、更好的发现肿瘤大小变化,是一种敏感的检测手段。
三维体积在预测EGFR突变方面较单径测量更敏感。
目前尚缺乏关于体积变化预测患者长期预后的研究,如果要用体积测量法对肿瘤治疗后疗效进行评价,需制定全新的体积评效阈值标准,研究体积变化与临床疗效的关系。
参考文献
1.JemalA,SiegelR,WardE,HaoY,XuJ,andThunMJ.Cancerstatistics.CACancerJClin2008;
58:
71–96.
2.ZhaoB,SchwartzLH,LarsonSM.ImagingSurrogatesofTumorResponsetoTherapyAnatomicandFunctionalBio