馬秀瑞 張建英 李婷婷 張玉潔 肖 寒 孫 菁 吳泇俁 嵇衛(wèi)星
(復(fù)旦大學(xué)附屬中山醫(yī)院放療科 上海 200032)
放射治療的重要目標(biāo)是提高腫瘤控制率,同時降低正常組織的不良反應(yīng)發(fā)生率。要達到這一目標(biāo),靶區(qū)和正常器官的準(zhǔn)確勾畫是整個治療過程的關(guān)鍵一環(huán)。但是,由于個人的主觀辨識能力不同和軟件勾畫精度不同,靶區(qū)與正常器官的勾畫結(jié)果往往差異較大[1-2]。為了保證勾畫結(jié)果的一致性,目前臨床上主要使用基于圖譜庫(Atlas)[3-4]和基于深度學(xué)習(xí)的自動勾畫方法?;趫D譜庫(Atlas)的自動勾畫方法在臨床上使用已有一段時間,該方法的精度受到建模數(shù)據(jù)和配準(zhǔn)方式的影響,普適性較差?;谏疃葘W(xué)習(xí)的自動勾畫方法使自動勾畫精度到達了一個新的水平,已有部分產(chǎn)品逐步投入臨床,如AccuContour[5]、DeepViewer[5]、AI Contour[6]等。在 相 關(guān) 的 產(chǎn) 品 和文獻中,一般采用自動與人工勾畫的幾何差異,如戴斯相似系數(shù)(Dice similarity coefficient,DSC)、豪斯多夫距離(Hausdorff distance,HD)等,來評估自動勾畫結(jié)果。例如,據(jù)Sahiner等[7]統(tǒng)計顯示,在部分研究中,肺、肝、脾、腎的DSC可以達到0.94~0.97,胰腺、膀胱、前列腺的DSC為0.71~0.87,部分靶區(qū)的DSC在0.6~0.9,不同器官和靶區(qū)的自動勾畫準(zhǔn)確性差異較大。
僅帶有幾何評估參數(shù)的自動勾畫技術(shù)是否可以直接用于臨床,臨床關(guān)注的問題是自動與人工勾畫導(dǎo)致的劑量差異有多大,是否會對治療及預(yù)后產(chǎn)生影響。Zhu等[8]研究了自動與人工勾畫在食管癌中的劑量差異,兩種勾畫方式導(dǎo)致的危及器官的劑量差異<1 Gy或1%,在臨床上可以接受;該研究中,肺、心臟、脊髓以及脊髓PRV的DSC分別為0.97、0.93、0.84和0.92,但是二者之間的關(guān)系作者并未進一步分析。那么,一個好的幾何參數(shù)是否意味著劑量差異很小?這是決定該自動勾畫技術(shù)能否用于臨床的關(guān)鍵。本研究采用自動及人工兩種方式勾畫同一器官,研究這兩種勾畫方式的DSC與對應(yīng)的劑量參數(shù)差異之間的關(guān)系,分析基于深度學(xué)習(xí)的自動勾畫技術(shù)應(yīng)用于臨床的可靠性。
數(shù)據(jù)收集本研究已通過復(fù)旦大學(xué)附屬中山醫(yī)院醫(yī)學(xué)倫理委員會審核(批件號:B2021-546),所有患者均已簽署知情同意書。研究中使用的數(shù)據(jù)來自2019年3月至2021年3月在復(fù)旦大學(xué)附屬中山醫(yī)院放療科進行過上腹部調(diào)強放療的43例患者?;颊吣挲g37~87歲,其中男性32人,女性11人;肝癌13例,膽囊癌2例,胃癌4例,胰腺癌18例,后腹膜6例;放射治療計劃單次劑量在175~200 cGy,次數(shù)25~28次。所有患者的CT圖像均采用仰臥位-頭先進(head first supine,HFS)的方式,由西門子模擬定 位 設(shè) 備(CT Siemens Somato,德 國Siemens Healthcare公司)進行采集。每層圖像重建分辨率為512×512,層厚為3 mm。將這些患者的CT圖像和治療計劃文件以DICOM格式從原始治療計劃系統(tǒng)(Monaco,瑞典Elekta AB公司)中導(dǎo)出,并利用開源軟件dicompyler[9]對這些文件進行姓名和治療號匿名化處理。
器官的人工和自動勾畫參考文獻用DSC評估自動勾畫的結(jié)果[7],本研究也采用該評價參數(shù)。DSC介于0到1,數(shù)值越大代表自動勾畫的效果越好。本研究選擇胃和十二指腸兩個器官進行分析研究。胃和十二指腸的人工勾畫由經(jīng)驗豐富的劑量師參照RTOG指南[10]重新勾畫,并由主管醫(yī)師審核確認(rèn)。胃的勾畫范圍:賁門(靠近心臟)、胃底、胃體、胃竇和幽門;十二指腸的勾畫范圍:上部、降部、水平部和升部。AccuContour系 統(tǒng)[5]是由廈門Manteia公司開發(fā)的一種基于深度學(xué)習(xí)的自動勾畫軟件。該系統(tǒng)可對患者CT圖像中頭頸部、胸部、上腹部和下腹部的多種器官和靶區(qū)(鼻咽癌、食管癌、直腸癌等)進行自動勾畫。本研究基于AccuContour系統(tǒng)對43例患者進行胃和十二指腸進行自動勾畫,排除胃或十二指腸切除者,共得到40例胃部和38例十二指腸的勾畫結(jié)果,通過DSC進行體積間的相關(guān)性分析。
劑量參數(shù)處理分析文獻發(fā)現(xiàn),胃和十二指腸相關(guān)不良反應(yīng)的評價參數(shù)較多,常見的有V25、V35、最大劑量等[11-13]。其中V25、V35分別是指劑量體積直方圖曲線(dose volume histogram,DVH)上25 Gy及以上劑量和35 Gy及以上劑量對應(yīng)的百分體積。因此,本研究設(shè)定的劑量參數(shù)包括DVH參數(shù)、最大劑量和平均劑量,其中DVH參數(shù)是指從DVH曲線上得到的參數(shù),包括V5到V50,以5Gy遞增。這些參數(shù)反映了臨床常用的劑量限值類型,可以代表串行和并行兩類器官。其中ΔVx(x代表不同的劑量),ΔDmax以及ΔDmean的計算公式如下:
如公式(1)到(3)所示,auto和manual分別表示自動及人工勾畫。本研究認(rèn)為同一個患者的胃和十二指腸勾畫結(jié)果是兩個獨立樣本,因為器官的自動勾畫由對應(yīng)的模型來完成,一個器官的勾畫結(jié)果并不會影響另外一個器官。對差異為0的結(jié)果,人工檢查自動和人工勾畫的結(jié)果,若二者都為0,則刪除該數(shù)據(jù)。為了減少數(shù)據(jù)量對統(tǒng)計結(jié)果的影響,本研究對數(shù)據(jù)進行了分組。分組原則是以DSC的0.01為遞進步長,如果該區(qū)間內(nèi)的數(shù)據(jù)量≥10個,則以該區(qū)間為一組,不做進一步處理,否則按照臨近原則,將該組數(shù)據(jù)與下一組數(shù)據(jù)進行合并,直至組內(nèi)樣本量≥10個,不同數(shù)據(jù)對應(yīng)DSC的加權(quán)平均值為這一組數(shù)據(jù)的DSC。
統(tǒng)計學(xué)處理采用SPSS 21.0軟件對體積與DSC間的關(guān)系進行Spearman相關(guān)分析。因為每組DSC對應(yīng)的劑量學(xué)數(shù)據(jù)為偏態(tài)分布,所以在分析時采用中位數(shù)及四分位距表示每組數(shù)據(jù)的分布。
自動與人工勾畫結(jié)果比較同一個患者部分層面胃和十二指腸的勾畫差異如圖1所示。其中1A、1B、1C分別代表胃和十二指腸在橫斷面、矢狀面和冠狀面的勾畫結(jié)果。深藍色和紅色代表胃的人工和自動勾畫結(jié)果,天藍色和洋紅色代表十二指腸的人工和自動勾畫結(jié)果。胃的自動勾畫結(jié)果要優(yōu)于十二指腸的自動勾畫結(jié)果。在很多地方,即使有明顯的灰度差異,十二指腸的自動勾畫模型仍然不能完美地勾畫出所有的體積。本研究進一步分析了自動與人工勾畫結(jié)果體積之間的關(guān)系,圖2A和2B分別代表胃和十二指腸的結(jié)果。就體積而言,胃的自動與人工勾畫結(jié)果相關(guān)性較高,而十二指腸的體積相關(guān)性較差。對數(shù)據(jù)進行線性擬合,胃的R2達到0.9491,斜率為1.0812,接近1,說明二者勾畫結(jié)果一致性較高。十二指腸體積的R2為0.452,斜率為0.7476,二者的一致性較差。
圖1 胃與十二指腸自動勾畫的結(jié)果Fig 1 Results of automatic delineation for stomach and duodenum
圖2 自動勾畫與人工勾畫體積之間的關(guān)系Fig 2 Volume relationship between auto and manual contoured structures
DSC與不同類型劑量限值的關(guān)系分析ΔVx、ΔDmean以 及ΔDmax與DSC之間的關(guān)系如圖3~5所示。針對胃和十二指腸兩種器官,ΔVx和DSC之間呈現(xiàn)出類似的規(guī)律(圖3A、3B)。將兩個器官的數(shù)據(jù)融合在一起,并進行分組,統(tǒng)計每組數(shù)據(jù)的中位數(shù)及四分位距(圖3D)。隨著DSC增大,ΔVx的四分位距縮小明顯,而且中位數(shù)越來越趨近于0。以散點圖的方式將DSC>0.85的部分放大顯示(圖3C),當(dāng)DSC>0.95以后,ΔVx都能到達5%以下,且大部分低于3%。
圖3 胃和十二指腸ΔVx與DSC間的關(guān)系Fig 3 Relationship betweenΔVx and DSC in stomach and duodenum
針對胃和十二指腸兩種器官,ΔDmean和DSC之間呈現(xiàn)出類似的規(guī)律(圖4A、4B)。利用與圖3D一樣的方法處理兩個器官的數(shù)據(jù),ΔDmean的四分位距隨著DSC增大而明顯縮小,中位數(shù)也同樣越來越趨近于0(圖4D)。以散點圖的方式將DSC>0.85的部分放大顯示(圖4C),當(dāng)DSC>0.95以后,ΔDmean降到2 Gy以下,且大部分低于1 Gy。
圖4 胃和十二指腸ΔDmean與DSC的關(guān)系Fig 4 Relationship betweenΔDmean and DSC in stomach and duodenum
ΔDmax與DSC之間的關(guān)系如圖5所示。對于ΔDmax,并未發(fā)現(xiàn)如上兩種劑量限值類似的規(guī)律,即人工與自動勾畫結(jié)果的劑量差異會隨著DSC的增大而減小。在胃的某個勾畫結(jié)果中,在DSC高達0.975時,最大劑量的差異仍然達到-20.93 Gy。
圖5 胃和十二指腸ΔDmax與DSC的關(guān)系Fig 5 Relationship betweenΔDmax and DSC in stomach and duodenum
在基于深度學(xué)習(xí)的自動勾畫研究中,用DSC來評估兩個輪廓之間相似程度是被普遍采用的方法。一般認(rèn)為DSC>0.7表示自動和人工勾畫效果好,是可以接受的結(jié)果[14],符合臨床使用的要求。在分析幾何評估參數(shù)與劑量差異關(guān)系的文獻[15]中,二者的相關(guān)性往往較差,即較高的DSC與較低的劑量差異不相關(guān)。與以往研究不同的是,在本研究中,對于平均劑量以及DVH參數(shù),劑量差異將會隨著DSC的增加而減小。但是DSC>0.7并不能達到臨床接受的標(biāo)準(zhǔn),在本研究中DSC應(yīng)該高于0.95。如果某個器官為并行器官,即以平均劑量以及DVH參數(shù)作為劑量評估參數(shù),而且該器官的自動勾畫結(jié)果DSC大于0.95,那么將該器官的自動勾畫結(jié)果用于臨床將較為安全。Kaderka等[16]研究發(fā)現(xiàn),即使DSC很小,有時候其劑量學(xué)參數(shù)也符合臨床要求。本研究也發(fā)現(xiàn)了類似現(xiàn)象,即使DSC很低,仍有很多劑量參數(shù)差異集中在0附近。
另外,在本次研究中最大劑量差異并不會隨著DSC增大而減小,這表明DSC并不是適合預(yù)測最大劑量的幾何參數(shù)。但是,無論是哪種幾何評估參數(shù),器官所有位置的勾畫誤差都會同等地影響最后的幾何評估參數(shù),而放療中的劑量分布是有方向的,越接近靶區(qū)劑量越大,因此不同劑量場處,相同的幾何誤差也會導(dǎo)致不同的劑量差異。所以,即使是同一個危及器官,針對不同病種訓(xùn)練不同的勾畫模型,并在臨床使用前評估該模型的幾何評估參數(shù)以及對應(yīng)的劑量差異,將有更為重要的臨床意義,也是我們下一步工作的重點。
目前,針對一些小體積器官,如小腸、胰腺、血管等,因為圖像占比小、形狀變化大等原因,其勾畫精度仍難以令人滿意[7]。本研究的結(jié)果也體現(xiàn)了這一點,比較胃和十二指腸的自動勾畫結(jié)果,以DSC來衡量,十二指腸要低于胃。由于通用的神經(jīng)網(wǎng)絡(luò)架構(gòu)[17]在描述小體積目標(biāo)時不夠精確,因此研究性能更優(yōu)的、針對小體積器官的自動勾畫網(wǎng)絡(luò)對臨床實踐有著重要意義。
病例的增多會增加結(jié)論的可靠性,但是在我們科的臨床實踐中上腹部的病例并非主流,我們搜索了相關(guān)的病例,符合倫理標(biāo)準(zhǔn)的如本文中所示。為此,本研究特意選擇胃和十二指腸兩個形態(tài)上差異極大的器官進行分析,我們認(rèn)為在兩類器官上都體現(xiàn)出來的結(jié)論具有一定的普遍性。本研究的另一個局限性是所有數(shù)據(jù)均來自單一中心,在人工勾畫時可能存在一定主觀偏差,因此也期待其他中心進行類似研究,以得到更加普遍的結(jié)論。
綜上所述,本研究比較了胃和十二指腸自動勾畫的DSC與各類型劑量差異的關(guān)系,發(fā)現(xiàn)DVH參數(shù)和平均劑量差異隨著DSC增加而減小,最大劑量差異與DSC無關(guān)。從安全性考慮,即使較好的DSC也不能保證所有類型的劑量差異都符合臨床要求。因此,將基于深度學(xué)習(xí)的自動勾畫技術(shù)安全地用于放療,除了需要DSC以外,對應(yīng)器官勾畫模型導(dǎo)致的劑量參數(shù)差異也是必須考慮的參數(shù)。
作者貢獻聲明馬秀瑞資料收集,數(shù)據(jù)處理,統(tǒng)計分析,論文撰寫。張建英研究設(shè)計,資料收集,論文修改。李婷婷,張玉潔,肖寒,孫菁,吳泇俁資料收集,論文修改。嵇衛(wèi)星研究設(shè)計,數(shù)據(jù)處理,統(tǒng)計分析,論文修改。
利益沖突聲明所有作者均聲明不存在利益沖突。