劉淵,程玉玉,賀睿敏,周衛(wèi)兵,賀秋冬,肖若冰,賀陽,謝常軍,謝海輝,文洪永,陳娟,何堯林
1.中南大學湘雅醫(yī)院腫瘤科,湖南長沙410008;2.郴州市第一人民醫(yī)院核醫(yī)學科,湖南郴州423000;3.南華大學船山學院,湖南衡陽421001;4.南華大學附屬第二醫(yī)院放射治療科,湖南衡陽421001
鼻咽癌作為一種常見的頭頸部惡性腫瘤,有地方聚集的特點,在我國華南地區(qū)發(fā)病率較高[1],臨床表現為早期無特異性癥狀、淋巴結轉移率高等[2]。目前放射治療聯合化療、靶向藥物等綜合治療手段已經取得比較理想的治療效果[3]。除治療方式外,患者病情的個體差異(原發(fā)灶外侵范圍、乏氧狀態(tài)、淋巴結轉移和是否有遠處轉移等)也是影響治療效果的重要原因[4]。其中淋巴結轉移狀況對遠處轉移發(fā)生率有重要影響[5],對引流區(qū)所有的淋巴結施行均勻的高劑量照射將會導致較高的并發(fā)癥[6],所以能否準確地識別轉移淋巴結是提高鼻咽癌療效的關鍵因素之一。通常情況下,經過影像手段的人工識別可以較為準確地判斷患者淋巴結轉移情況,但由于使用的判斷標準為基于CT、MRI圖像中淋巴結形態(tài)學的差異,對影像醫(yī)師的經驗要求較高,不利于快速鑒別診斷[7-9]。隨著圖像處理技術的發(fā)展,以影像組學為基礎的機器學習方法在鑒別轉移淋巴結方面展現較強的潛力[10-11],其可以通過挖掘圖像中包含的高通量數據信息進行深層次、多維度的分析,為臨床實踐中的計算機輔助診斷提供可能。
本研究針對鼻咽癌轉移淋巴結進行分析,結合PET鑒別結果與現行鑒別標準對其中轉移淋巴結識別進行研究。希望構建一個自動、量化鑒別轉移淋巴結的模型,為臨床快速診斷或輔助診斷研究提供一種新思路。
選擇2017年7月~2018年6月于郴州市第一人民醫(yī)院和中南大學湘雅醫(yī)院收治的50例鼻咽癌患者治療前CT、PET/CT圖像作為研究材料進行回顧性分析?;颊咂骄挲g53歲(18~74歲),男39例,女11例。納入研究中的患者均經過活檢病理學、影像學檢查確診為鼻咽癌伴有局部淋巴結轉移,無遠處轉移發(fā)生,無多發(fā)腫瘤存在。病理分型明確鼻咽癌原發(fā)灶T分期:T1期7例,T2期19例,T3期17例,T4期7例。研究中CT及PET檢查前患者均未接受放療、化療及其他治療方式,兩種檢查間隔不超過15 d。
CT圖像為TOSHIBA Aquilion 16型和GE 64排LightSpeed CT平掃及靜脈灌注增強掃描獲得的平掃及動、靜脈時相的增強圖像,掃描條件120 kV,110 mA,層厚3 mm,掃描范圍包括顱頂至鎖骨下2 cm。PET掃描設備為飛利浦Ingenuity TF PET/CT,掃描范圍包含CT檢查所掃描部位。研究中所使用示蹤劑放射化學純度>99%,pH=7.0,患者由體質量計算靜脈注射劑量18F-FGD,通常為0.10~0.12 MCi/kg。
研究中將體積>1 cm3的淋巴結作為感興趣區(qū)域(Regions of Interest,ROI)。主要選擇咽后淋巴結、頸部II區(qū)、Ⅲ區(qū)淋巴結等轉移概率較高的區(qū)域進行勾畫。圖像勾畫使用MIM Maestro軟件(MIM software,Cleveland,OH),由2名腫瘤放療專業(yè)醫(yī)師分別進行手動勾畫,勾畫結果由第3位高年資醫(yī)師進行檢查,手動勾畫完成后統一對所有ROI邊緣進行平滑處理。淋巴結分類使用2種方法:(1)使用PET圖像中SUVmax>2.5;(2)2013年鼻咽癌轉移淋巴結鑒別專家共識中CT圖像最大橫截面短軸長度對淋巴結進行是否轉移的分類[7],任意滿足上述2條件的淋巴結認為為轉移結節(jié),均不滿足上述2條件的淋巴結認為是良性結節(jié)。
使用IBEX[12]進行影像特征的提取,提取出的特征大體分為4類:(1)灰度強度(Intensity direct);(2)強度直方圖(Intensity histogram);(3)形狀特征(Shape-based);(4)紋理特征(Textrue-based)。先后獲得病變部位特征共50個,其中的非相關性特征和冗余特征會造成數據過擬合并且影響模型精確度,因此必須對所有特征進行篩選,使用R語言中的最小冗余最大相關性算法去除冗余特征和不相關特征,并對所有特征數據進行線性歸一處理,最后篩選出18個特征分組。
1.5.1 數據分割本研究共獲得143枚淋巴結,經檢驗得出的轉移淋巴結103枚,機器學習模型中使用100枚淋巴結特征作為訓練組,43枚淋巴結作為測試組,訓練集與測試集數據量對比為7:3,使用K-fold 5折交叉驗證進行模型的交叉驗證評估,算法選擇邏輯回歸(圖1)。
1.5.2 懲罰項系數C和閾值選取為了使得模型不出現過擬合的現象,采用L1正則化規(guī)則,如式(1)所示:
圖1 預測模型流程圖Fig.1 Flow chart of prediction model
式中,前半部分為正則化項(包含w的范數),后半部分為損失函數,C為正則化系數λ的倒數,其控制了兩者在最終的損失函數中所占的比重,C值過小說明模型復雜度小,會出現欠擬合,C值過大會導致模型泛化能力過強,導致過擬合。因此須選擇一個使模型獲得最佳泛化能力的C值。
在邏輯回歸模型求解過程中,分類器將樣本輸出結果映射到取值為(0,1)的范圍內,評估模型精確性時,可以進行自定義分類閾值使得模型獲得更好的分類效果:
特征提取使用Embedded嵌入法,首先使用隨機森林算法對數據進行驗證,得到各個特征的權重系數,去除權重值排名前五的特征,對剩余的特征使用單變量統計檢驗,再以一個特定的打分函數如式(3)返還特征的得分值,最終統計出各個特征對預測目標的相關性系數:
其中,P_value為去除某項特征后的假設檢驗P值。
使用5折交叉驗證分別經過5次迭代計算得出的模型平均得分(表1),當C值為10時,模型的得分均值達到飽和值0.68,故懲罰項系數C的最佳取值為10。
通過設置不同閾值來判斷模型分類精度(圖2),不同閾值的模型測試結果如表2所示。如圖2所示,當閾值為[Threshold(閾值)>0.3,Predict(預測值)=1]時,模型的綜合效果最佳。當閾值為0.3時模型的測試結果如表3所示,經計算,模型敏感度為90.0%(27/30),特異性為76.9%(10/13),精確度為86.0%(37/43)。
表1 不同C值的模型平均得分Tab.1 Mean score of model for different C values
經過特征提取后所得特征相關系數如圖3所示,圖3所示以下特征可作為預測淋巴結轉移的重要特征:(1)最大橫截面直徑(Diameter);(2)平均寬度(Mean Breadth);(3)灰度強度能量(Intensity Direct Energy);(4)像素數量(Number of Voxel);(5)頻度(Busyness);(6)形態(tài)密實度(Shape-Compactness)。
初診鼻咽癌患者中,頸部淋巴結轉移發(fā)生率超過80%[2,13]。由于轉移淋巴結的存在,鼻咽癌患者發(fā)生遠處轉移的概率也會隨之提升[5]。通過以放射治療為主的綜合治療方案,可以取得較好的療效。在鼻咽癌病例的靶區(qū)勾畫過程中,需要將淋巴結引流區(qū)(GTVnd)納入照射區(qū)域。常用的放療方案有全頸部照射和選擇性頸部照射。研究證明選擇性頸部照射在療效方面與全頸部照射無明顯差異,并且在保護敏感器官方面具有一定的優(yōu)勢,例如選擇性頸部照射幾乎不會出現顱后神經損傷[6,14]。此外,對部分轉移概率極低的淋巴結分區(qū)納入臨床靶區(qū)也會增加(如口癥、放射性皮炎、顱神經損傷等)并發(fā)癥的發(fā)生率[15-17]。所以,根據淋巴結轉移情況施行針對性的個體化放療方案,將有利于治療方案的選擇和改善患者預后。
現行轉移淋巴結鑒別中依據為CT、MRI圖像中最大橫截面短軸長度和中央壞死、包膜外侵犯或不均勻強化的表現情況等形態(tài)學判斷標準,而本文未采用MRI圖像,是因為MRI圖像與CT圖像所使用的特征集不同,多種特征集合的結合產生的多模態(tài)結構數據可能會帶來一些不確定因素。相對于現行影像學判斷標準,影像組學可以通過分析圖像中所包含的高通量數據信息來判斷淋巴結轉移情況。很多研究說明了影像組學與機器學習方法結合在鑒別轉移淋巴結方面具有一定的潛力[18-20]。
圖2 不同閾值的真實值與預測值混淆矩陣圖Fig.2 Confusion matrix diagrams of actual and predicted values with different thresholds
表2 不同閾值測試結果Tab.2 Test results of different thresholds
本研究在構建分類模型時,適當使用正則化懲罰系數和模型鑒別閾值等優(yōu)化方案,在不使用任何方案的前提下,模型的初始精度為68.5%,而經過優(yōu)化后的模型精度為86.0%,因此,在模型構建過程中針對性地使用一些優(yōu)化方案對提高模型精度很有幫助。
圖3 特征相關性系數柱狀圖Fig.3 Histograms of feature correlation coefficients
研究中也存在一些不足。首先為了減少創(chuàng)傷,抑制轉移,本文未采用淋巴結穿刺行病理檢查。其次對淋巴結進行判斷時依據PET中的SUVmax>2.5與CT中最大橫截面短軸長度,而PET對直徑小于10 mm的ROI具有較高的假陽性率[21-22],雖然兩種判斷方式的結合可以一定程度上提高對轉移淋巴結分類的準確率,但是對僅滿足某一標準的淋巴結認為轉移可能對機器學習中獲得的特征集合有一定的干擾。另外,受限于短期內接受CT與PET檢查的患者數量較少,研究中獲得的嚴格滿足轉移與良性的淋巴結數量較少,后續(xù)希望能夠通過多中心聯合搜集更多滿足要求的病例資料或前瞻性研究,提高研究中鑒別的準確性。
本研究通過使用機器學習方法構建轉移淋巴結鑒別模型,可以初步實現對轉移淋巴結的鑒別。這一模型對臨床中快速判斷鼻咽癌淋巴結轉移情況,為放射治療中計算機輔助靶區(qū)勾畫提供一種淺顯的新思路。