張富利,崔德琪,王秋生,韋凌宇,朱林林,郁艷軍,李海鵬,王雅棣
1.解放軍總醫(yī)院第七醫(yī)學(xué)中心,北京100700;2.北京連心醫(yī)療科技有限公司,北京100083;3.北京航空航天大學(xué)自動(dòng)化科學(xué)與電氣工程學(xué)院,北京100083
放射治療是惡性腫瘤的三大治療手段之一,超過70%的惡性腫瘤患者需要接受放射治療[1]。精確勾畫腫瘤靶區(qū)和危及器官(OARs)的輪廓是實(shí)現(xiàn)精確放射治療的前提和保障[2]。通常情況下,放射腫瘤醫(yī)師根據(jù)患者的定位CT 圖像手動(dòng)勾畫靶區(qū)和OARs,勾畫過程較為耗時(shí)費(fèi)力,不同醫(yī)師之間受主觀性因素影響導(dǎo)致勾畫結(jié)果存在較大差異,而且大量重復(fù)性的工作降低了醫(yī)師對(duì)患者進(jìn)行診療的效率[3-4]。近年來,自動(dòng)勾畫已成為放療領(lǐng)域的研究熱點(diǎn)之一,基于圖譜庫(Atlas)和深度學(xué)習(xí)(Deep Learning,DL)的自動(dòng)勾畫方法是目前兩種主要的自動(dòng)勾畫技術(shù)。前者通過構(gòu)建對(duì)比數(shù)據(jù)模板影像庫,采用剛性和形變配準(zhǔn)的方法實(shí)現(xiàn)靶區(qū)和OARs 自動(dòng)勾畫[5-8];后者基于神經(jīng)網(wǎng)絡(luò)DL 算法,運(yùn)用標(biāo)準(zhǔn)數(shù)據(jù)集對(duì)其進(jìn)行有效訓(xùn)練,通過算法邏輯實(shí)現(xiàn)自動(dòng)勾畫。本研究主要目的是評(píng)估基于DL 和Atlas 的自動(dòng)勾畫方法在不同部位腫瘤放療中OARs 自動(dòng)勾畫的精確度,為臨床應(yīng)用提供參考依據(jù)。
隨機(jī)選取解放軍總醫(yī)院放療科2016年7月~2019年3月40 例腫瘤患者,其中頭頸部、胸部、腹部和盆腔腫瘤患者各10 例。定位時(shí)均采用仰臥位,采用CT模擬定位系統(tǒng)(Philips Big bore,USA)進(jìn)行掃描,頭頸部腫瘤掃描層厚3 mm,層間距3 mm,其余3 個(gè)部位腫瘤均選擇掃描層厚5 mm,層間距5 mm。
將掃描獲取的CT圖像分別傳至ADAC Pinnacle3治療計(jì)劃系統(tǒng)(Treatment Planning System,TPS,version 9.10,Philips Radiation Oncology systems,Madison,WI)工作站。首先由專業(yè)放療醫(yī)師參考ICRU 62號(hào)報(bào)告手動(dòng)勾畫OARs,包括腦、腦干、眼球、晶體、下頜骨、雙肺、心臟、脊髓、雙腎、膀胱、直腸、股骨頭,共12 類17 個(gè)OARs。然后使用Pinnacle3TPS的MBS(Model-based Segmentation)功能模塊自動(dòng)勾畫上述病例CT 影像中的OARs,該模塊采用基于圖譜庫的方法實(shí)現(xiàn)自動(dòng)勾畫。
U-net 網(wǎng)絡(luò)由Ronneberger 等[9]提出,對(duì)完全卷積神經(jīng)網(wǎng)絡(luò)(Fully Convolutional Networks,FCN)進(jìn)行改進(jìn),不同于FCN 的跳層連接方式,U-net 使用跨層連接方式,通過剪裁和復(fù)制(crop and copy)方式建立上下文之間的聯(lián)系,使得分割結(jié)果更為精確、影像細(xì)節(jié)還原性更好。U-net架構(gòu)適用于醫(yī)學(xué)影像的語義分割,一方面醫(yī)學(xué)圖像邊界模糊、梯度復(fù)雜,需要提取較多的高分辨率信息(淺層特征),另一方面人體內(nèi)部結(jié)構(gòu)相對(duì)固定,分割目標(biāo)在圖像中的分布更規(guī)律,語義簡單明確,而低分辨率信息(深層特征)能夠提供這一信息,U-net 將低分辨率信息和高分辨率信息完美結(jié)合在一起,其架構(gòu)如圖1所示。
圖1 U-net CNN架構(gòu)Fig.1 U-net CNN architecture
分別選取89例頭頸部腫瘤患者數(shù)據(jù)、596例胸部腫瘤患者數(shù)據(jù)、185例腹部腫瘤患者數(shù)據(jù)和96例盆腔腫瘤患者數(shù)據(jù)作為訓(xùn)練集,用以調(diào)整CNN的參數(shù),本研究選取40 例患者數(shù)據(jù)作為驗(yàn)證集評(píng)估模型的性能。所有訓(xùn)練和測(cè)試實(shí)驗(yàn)均在顯存容量11 GB 的NVIDIA GeForce GTX 1080 Ti GPU上運(yùn)行。
以醫(yī)生手動(dòng)勾畫的OARs 輪廓體積作為基準(zhǔn)真值,采用形狀相似性系數(shù)(Dice Coefficient,DC)、Jaccard 系數(shù)(Jaccard Coefficient,JC)、Hausdorff 距離(HD)、體積差異(Volume Difference,VD)指標(biāo)定量評(píng)估兩種自動(dòng)勾畫方法獲得的OARs 輪廓體積的精確性。為了確保手動(dòng)勾畫OARs的精確性,每個(gè)病例手動(dòng)勾畫完成后均由副主任醫(yī)師及以上資格的醫(yī)師修改、審批。
1.5.1 DC
用于評(píng)價(jià)R與G兩個(gè)集合之間的重合性,其計(jì)算公式為:
其中,R為自動(dòng)勾畫結(jié)果;G為手動(dòng)勾畫結(jié)果,即真值(ground truth)。其值的范圍從0 到1,越接近于1,表示兩種勾畫方式的重合性越好。
1.5.2 JC
用于度量R、G兩個(gè)集合之間的相似性,其計(jì)算公式為:
其中,0≤JC(R,G)≤1,JC值越大,樣本相似度越高。
1.5.3 HD
用來衡量R、G在三維空間上的表面距離,其計(jì)算公式為:
1.5.4 VD
指分割結(jié)果體積與真值(ground truth)體積差異占真值體積的百分比,越接近0越好:
其中,G為真值,R是自動(dòng)分割結(jié)果。
采用SPSS 20.0 統(tǒng)計(jì)學(xué)軟件行Wilcoxon 符號(hào)秩檢驗(yàn),顯著性水平α=0.05,P<0.05 表示差異有統(tǒng)計(jì)學(xué)意義。
表1列出了評(píng)估基于Atlas 和DL 方法自動(dòng)勾畫全腦、腦干、晶體、下頜骨、左右肺、膀胱、直腸等OARs 幾何精確性的指標(biāo)。文獻(xiàn)[10-11]指出,DC 值大于0.7 表明兩個(gè)輪廓重復(fù)性尚可,分割效果可以接受。從表1中可以看出,除直腸外,采用DL方法勾畫的多數(shù)OARs 的DC 指標(biāo)高于0.7,優(yōu)于Atlas 方法,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。此外,DL 方法的JC、HD、VD 普遍優(yōu)于Atlas 方法,其JC 值除晶體、直腸、脊髓外也都大于0.7。HD中最大的是脊髓,兩種方法均超過20 mm。DL 方法中VD 絕對(duì)值較大的是直腸。
從圖2中可以看出,DL方法自動(dòng)勾畫的OARs與手動(dòng)勾畫真值一致性較好,基本上能為臨床所接受。
精確的靶區(qū)和OARs 勾畫是放射治療的重要前提之一。通常情況下,放射腫瘤醫(yī)師在臨床工作中OARs 的勾畫工作量較大、重復(fù)性工作較多,另受放射腫瘤醫(yī)師主觀性以及各自專業(yè)水平的限制,難以保證輪廓勾畫的一致性。因此,自動(dòng)勾畫已成為目前的研究熱點(diǎn)之一,旨在確保勾畫精確度的前提下,提高勾畫效率、減少不同勾畫者間以及勾畫者自身的差異。
截至目前,已有多款自動(dòng)勾畫軟件應(yīng)用于放療臨床工作中,這其中主要包括MIM 軟件(MIM Software Inc.,Cleveland,OH)、Eclipse 治療計(jì)劃系統(tǒng)中 的SmartAdapt 模 塊 和Velocity 模 塊(Varian Medical Systems,Palo Alto,CA)、ABAS 軟件(Atlasbased autosegmentation,Elekta Medical System,Stockholm,Sweden)、RayStation 治療計(jì)劃系統(tǒng)中的RayDeformable 模 塊(RaySearch Laboratories,Stockholm,Sweden)。這幾款軟件能夠執(zhí)行3DCT、4DCT、MRI 或PET/CT 等不同模態(tài)影像間的形變配準(zhǔn)[12-15]。這些方法的共同點(diǎn)是基于圖譜庫自動(dòng)勾畫,對(duì)待分割的目標(biāo)影像與包含真值的圖譜庫影像進(jìn)行形變配準(zhǔn),將后者中的標(biāo)記結(jié)構(gòu)自動(dòng)傳播到目標(biāo)圖像上。但是,有研究報(bào)道不同配準(zhǔn)算法存在較大差異。基于特征的深度學(xué)習(xí)方法可解決此類問題,通過捕獲不同算法間的差異并將其納入預(yù)測(cè)模型以解決臨床工作中可能遇到的問題,國內(nèi)外許多學(xué)者都對(duì)此進(jìn)行探討[16-22]。
本文研究結(jié)果顯示,基于DL 的自動(dòng)勾畫結(jié)果總體上優(yōu)于基于Atlas 的自動(dòng)勾畫結(jié)果。前者的DC 值除直腸外均大于0.7,顯示出較高的精確度。JC 值除晶體、直腸、脊髓外也都大于0.7,可能原因?yàn)榫w、脊髓體積較小,而直腸受個(gè)體化差異影響大。HD 中,最大的是脊髓,超過20 mm,原因可能是脊髓體積較小而層面數(shù)又較多所致。VD 值絕對(duì)值較大的是晶體、直腸,可能原因基本同上。
表1 基于Atlas與DL方法自動(dòng)勾畫結(jié)果評(píng)價(jià)指標(biāo)(±s)Tab.1 Comparison of evaluation parameters between Atlas-and DL-based auto-segmentation results (Mean±SD)
表1 基于Atlas與DL方法自動(dòng)勾畫結(jié)果評(píng)價(jià)指標(biāo)(±s)Tab.1 Comparison of evaluation parameters between Atlas-and DL-based auto-segmentation results (Mean±SD)
a表示兩種自動(dòng)勾畫方法DC值的Wilcoxon檢驗(yàn)P值;b表示兩種自動(dòng)勾畫方法JC值的Wilcoxon檢驗(yàn)P值;c表示兩種自動(dòng)勾畫方法HD值的Wilcoxon檢驗(yàn)P值;d表示兩種自動(dòng)勾畫方法VD值的Wilcoxon檢驗(yàn)P值。
危及器官P值全腦腦干左眼右眼左晶體右晶體下頜骨心臟左肺右肺左腎右腎膀胱直腸左股骨頭右股骨頭脊髓DC Atlas 0.96±0.04 0.67±0.09 0.64±0.12 0.67±0.11 0.43±0.12 0.46±0.17 0.81±0.04 0.73±0.21 0.95±0.03 0.96±0.02 0.81±0.17 0.82±0.12 0.84±0.10 0.51±0.16 0.68±0.20 0.61±0.18 0.75±0.18 DL 0.98±0.00 0.87±0.03 0.89±0.02 0.88±0.02 0.76±0.06 0.74±0.09 0.88±0.02 0.90±0.04 0.95±0.02 0.97±0.01 0.91±0.02 0.88±0.04 0.89±0.07 0.65±0.23 0.83±0.08 0.85±0.07 0.72±0.17 JC Atlas 0.93±0.07 0.51±0.10 0.48±0.13 0.52±0.11 0.28±0.10 0.31±0.13 0.69±0.06 0.61±0.22 0.90±0.05 0.91±0.03 0.71±0.20 0.71±0.16 0.74±0.13 0.36±0.15 0.55±0.23 0.47±0.20 0.62±0.21 DL 0.96±0.01 0.76±0.05 0.79±0.03 0.78±0.03 0.62±0.07 0.59±0.11 0.78±0.03 0.81±0.06 0.91±0.03 0.93±0.02 0.83±0.03 0.79±0.05 0.81±0.10 0.51±0.21 0.72±0.11 0.75±0.10 0.59±0.19 HD/mm Atlas 5.69±1.98 7.89±1.05 4.11±1.46 3.78±1.19 2.39±0.46 2.55±1.21 17.23±6.34 16.03±10.53 18.93±13.90 14.38±6.01 7.42±6.41 6.65±3.37 11.70±5.46 19.80±7.63 14.19±8.78 14.76±6.74 24.10±17.41 DL 4.26±0.74 4.36±1.08 2.70±0.55 2.81±0.64 1.81±0.39 2.25±0.93 5.10±2.59 10.06±8.62 12.94±14.93 8.64±4.47 3.87±1.17 4.54±1.06 7.79±5.89 14.00±6.87 6.93±7.93 6.23±7.243 21.50±22.78 VD Atlas 0.00±0.10 0.27±0.23-0.54±0.28-0.59±0.25-0.49±0.31-0.37±0.50-0.02±0.15-0.22±0.31 0.03±0.08 0.04±0.05 0.03±0.19 0.15±0.19 0.12±0.24 0.34±0.29 0.26±0.24 0.31±0.35 0.27±0.46 DL-0.01±0.01-0.07±0.09-0.01±0.08-0.03±0.10 0.02±0.25 0.12±0.30-0.17±0.06 0.16±0.08-0.05±0.05-0.04±0.03-0.07±0.06-0.08±0.11 0.01±0.12-0.29±0.40-0.01±0.20-0.05±0.21 0.18±0.48 0.172a,0.173b,0.022c,0.074d 0.005a,0.005b,0.005c,0.007d 0.008a,0.008b,0.008c,0.008d 0.008a,0.008b,0.051c,0.008d 0.028a,0.028b,0.027c,0.028d 0.012a,0.012b,0.484c,0.069d 0.007a,0.007b,0.005c,0.037d 0.001a,0.001b,0.030c,0.001d 0.309a,0.309b,0.001c,0.001d 0.047a,0.049b,0.007c,0.001d 0.015a,0.015b,0.003c,0.049d 0.177a,0.201b,0.039c,0.003d 0.011a,0.011b,0.019c,0.209d 0.034a,0.012b,0.041c,0.005d 0.033a,0.046b,0.009c,0.009d 0.004a,0.004b,0.002c,0.002d 0.029a,0.019b,0.163c,0.000d
圖2 基于DL方法自動(dòng)勾畫OARs結(jié)果示意圖(綠色線條為手動(dòng)勾畫輪廓,紅色線條為自動(dòng)勾畫輪廓)Fig.2 DL-based automatic segmentation results(the green lines were manual segmentations,and the red lines were automatic segmentations)
盡管在設(shè)計(jì)治療計(jì)劃之前仍需對(duì)基于DL 方法自動(dòng)勾畫的OARs進(jìn)行修改,但已在很大程度上減少了放射腫瘤醫(yī)師的工作量。下一步,通過繼續(xù)增大訓(xùn)練集的數(shù)據(jù)量從而包括更多的腫瘤患者特征,有望進(jìn)一步提高基于DL 方法模型的魯棒性,從而更好地輔助放射腫瘤醫(yī)師,使腫瘤患者獲益。