徐丹陽 高振華,2,* 孟悛非
1.中山大學附屬第一醫(yī)院放射科(廣東 廣州 510080)
2.中山大學附屬第一醫(yī)院惠亞醫(yī)院放射科(廣東 惠州 516081)
骨肉瘤是一種侵襲性骨惡性腫瘤,好發(fā)于兒童和青少年的四肢骨,自然預后極差,早期易發(fā)生血液轉移[1]。影像學檢查是骨肉瘤診斷和臨床評估的重要手段,貫穿臨床診治全過程。初診患者推薦X線平片結合MRI確立骨肉瘤的影像學診斷,評估骨肉瘤的手段包括MRI和正電子發(fā)射斷層掃描(PET)[2]。動態(tài)對比增強MRI可以測量組織微血管特性,包括組織灌注、毛細血管通透性等,因此在臨床中廣泛應用于化療反應的評估,是骨肉瘤預后的潛在生物標志物[3-5]。磁共振彌散加權(DWI)也可用于骨肉瘤化療反應的評估[6-7]。18F-FDG PET/CT可用于骨肉瘤分期和監(jiān)測化療反應[8]。影像學檢查結果還可以指導臨床醫(yī)師對患者進行評估,制定個性化藥物治療策略[9]。影像學資料的分析在診斷、治療方案的制定及預后檢測方面有重要作用,但是這種對腫瘤特征的判讀受到放射科醫(yī)生認知和經(jīng)驗的影響,主觀、定性的特征評估降低了結果的可靠性,所以尋找一種客觀定量的圖像分析方法是影像學發(fā)展的必然趨勢。
影像組學是醫(yī)學成像分析技術發(fā)展的新產(chǎn)物,可以從醫(yī)學圖像中提取并分析大量高級的定量影像學特征,從而量化圖像上病變的異質性[10]。影像組學通過大量提取放射學圖像中的影像特征,將醫(yī)學圖像轉換為數(shù)據(jù),然后進行數(shù)據(jù)分析及模型構建,最終幫助在臨床診治中的決策[11]。在骨肉瘤診治中,每位患者都會進行影像學檢查,這意味著這些醫(yī)學圖像都將成為影像組學數(shù)據(jù)的來源。近年來,越來越多的研究將影像組學特征與病理、分子、基因等微觀信息相關聯(lián),一些研究已成功地通過圖像特征來揭示病變特征、判斷治療反應和患者預后[12-14]。同理在骨肉瘤中,影像組學通過定量分析,可以檢測骨肉瘤潛在的、無法用肉眼識別的特征,彌補常規(guī)影像分析的不足,這可能對將來骨肉瘤的精準診治有重要指導意義。
影像組學在骨肉瘤的實踐涉及四個主要步驟:(1)圖像采集和處理;(2)圖像分割;(3)特征提取和選擇;(4)模型建立。
1.1 圖像采集和處理腫瘤的優(yōu)質影像采集將為影像組學的后續(xù)步驟打下堅實的基礎,可以從X線平片、CT、MRI、PET-CT和超聲等各種成像方式獲取影像數(shù)據(jù)。影像組學結果的準確性和可重復性取決于所采集圖像的質量。但是當從圖像中提取數(shù)據(jù)時,可能會引入一些由非潛在的生物學效應因素引起的變化,這些因素包括成像參數(shù)、空間分辨率和灰階分辨率[11]。因此,為確保一致性和可比性,應制定標準影像學掃描程序,保證掃描設備與參數(shù)一致,并在特征提取之前對圖像數(shù)據(jù)進行預處理。解決空間分辨率異質性可以通過對多光譜成像模式或同一成像模式中不同序列共配準,將體素重采樣為各向同性像素或體素;對灰階分辨率的異質性,可以采用灰階歸一化的方法解決[15]。
1.2 圖像的分割在圖像中準確分割骨肉瘤區(qū)域對于輔助化療術前計劃的制定和術后療效評估有重要意義。在采集了大量標準化的骨肉瘤圖像數(shù)據(jù)后,需對骨肉瘤病灶進行分割,通常通過在腫瘤邊緣內(nèi)繪制感興趣區(qū)(region of interest,ROI)來實現(xiàn)分割,包括手動分割和自動分割。手動分割準確性好,但較為費時,且受主觀因素影像導致其可重復性差。因此,臨床上需要骨肉瘤區(qū)域的自動分割。近年來,隨著計算機科學的發(fā)展,骨肉瘤影像學圖像的半自動和自動分割方法學的發(fā)展較為迅速,包括無監(jiān)督聚類方法、有監(jiān)督機器學習方法、基于卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNM)的方法、基于全卷積網(wǎng)絡(full convolutional network,F(xiàn)CN)的方法、基于多重監(jiān)督殘差網(wǎng)絡(multiple supervised residual networks,MSRN)的方法等[16]。即使有很多可用的方法,但仍然沒有適合所有類型圖像的通用分割方法,這就需要在實踐中探索出準確性高、效率高、自動化程度高和重復性好的骨肉瘤圖像分割方法。
1.3 圖像特征的提取及選擇圖像分割后,可以從已識別的圖像中提取各種定量特征。影像組學特征通??梢苑譃椋阂浑A、二階和高階特征和基于變換的特征。一階特征,也稱為語義特征,不考慮體素之間的空間關系,通過分析定義的ROI內(nèi)的灰度直方圖獲得,最常見的基于直方圖的特征包括灰度均值、極值、標準差、偏度、峰度、熵和隨機性[17]。二階統(tǒng)計特征也稱為紋理特征,圖像紋理是指感知或測量強度級別的空間變化,可以從不同的矩陣計算紋理特征,包括灰度共生矩陣(gray level concurrence matrix,GLCM),灰度大小區(qū)域矩陣(Gray level size zone matrix,GLSZM),灰度游程長度矩陣(gray level run length matrix,GLRLM),高階或更高階特征通過統(tǒng)計方法分析三個或更多體素之間的空間關系,包括鄰域灰度差值矩陣(neighbourhood gray-tone difference matrix,NGTDM)等[18]。高階或更高階特征在數(shù)學轉換后可形成基于變換的特征,轉換包括分形分析、小波變換和高斯濾波圖像的拉普拉斯變換[19]。并非所有提取的特征都用于最終分析,最近的研究表明過多的特征可能會使假陽性風險增高[20]。所以要從所提取的數(shù)百個特征中選擇要進一步研究的特征,使用性能最佳且非冗余的特征來創(chuàng)建高質量的數(shù)據(jù)庫,避免過度擬合[11]。
1.4 模型建立和驗證選擇理想的影像組學特征后,下一步進行模型構建。有多種統(tǒng)計學方法和機器學習(ML)算法可以應用于影像組學模型構建,包括列線圖,線性回歸,邏輯回歸(logistic regression,LR),隨機森林(random forests,RF)和Cox比例風險回歸等[21]。及其學習針對不同研究,要根據(jù)樣本量及影像組學研究目的的不同選擇適合的模型,在實際研究中可以對多個模型進行測試選擇性能最佳的模型。例如Yin等[22]在研究骶骨腫瘤中構建了深度神經(jīng)網(wǎng)絡(deep neural network,DNN)模型,并應用機器學習算法構建了邏輯回歸(LR),隨機森林(RF),支持向量機(support vector machine,SVM),k近鄰算法(k-nearest neighbors,KNN)四個模型。
構建的影像組學模型必須進行內(nèi)部和(或)外部驗證,評估模型的性能及適用性,確保模型對所有目標患者的通用性。最常使用受試者操作特征曲線(receiver operating characteristic,ROC)曲線和曲線下面積(area under curve,AUC)評估模型性能,其他還包括決策曲線分析(decision curve analysis,DCA)[23]。ROC曲線可以在任何閾值下顯示模型的疾病識別能力,比較兩個或多個模型時,在同一坐標軸繪制ROC曲線,可直觀顯示模型的優(yōu)缺點[22]。決策曲線分析(decision curve analysis,DCA)用于評估列線圖是否足以用于臨床實踐[23]。
在2021年4月在外文數(shù)據(jù)庫PubMed/Medline、Embase中,使用關鍵詞“osteosarcoma”分別搭配“radiomics”“deep learning”“machine learning”進行電子搜索,在中文數(shù)據(jù)庫CNKI和萬方數(shù)據(jù)庫中,使用關鍵詞“骨肉瘤”分別搭配“影像組學”“深度學習”進行電子搜索,包含骨肉瘤影像組學研究可以總結如表1。兩項研究是多中心的,其中3項研究針對平片,8項研究針對CT,5項研究針對18F-FDG PET/CT,8項研究針對MRI。
表1 包括骨肉瘤在內(nèi)的影像組學研究概述
3.1 鑒別診斷骨肉瘤與其他腫瘤鑒別骨腫瘤的良惡性是臨床上的首要問題?;仡櫸墨I,3項有關X線平片影像組學的研究均對如何鑒別骨肉瘤與其他良性骨腫瘤進行了研究,構建了深度學習神經(jīng)網(wǎng)絡,或聯(lián)合代謝組學、RNA序列進行研究,經(jīng)過驗證均得到了較為理想的結果。其中一項研究納入病例較多,納入5個中心1356例患者,建立深度學習模型,根據(jù)術前X平片對原發(fā)性骨腫瘤進行分類,并與放射科醫(yī)生肉眼分類進行比較,鑒別良惡性,但是該研究納入的惡性骨腫瘤未說明是否僅為骨肉瘤[24]。另外兩項研究的病例數(shù)比較少,僅納入了20~30個骨肉瘤患者[25-26]。
一項針對骨肉瘤CT圖像的研究也在鑒別骨腫瘤良惡性方面進行了探索,Yin等[22]的研究旨在對骶骨發(fā)生的腫瘤進行良惡性鑒別,納入的病例數(shù)也較多,共459例骶骨腫瘤,訓練組321例,驗證組138例。提取每個患者1316個影像組學特征,分別構建了深度神經(jīng)網(wǎng)絡(DNN)模型和四個機器學習算法,包括邏輯回歸(LR),隨機森林(RF),支持向量機(SVM)和k近鄰算法(KNN),采用ROC曲線下面積(AUC)和精度(ACC)評估模型性能,結果發(fā)現(xiàn)性別和年齡是鑒別腫瘤良惡性重要指標;LR在驗證組中性能最佳(AUC為0.84,ACC為0.81),DNN模型在鑒別骶骨腫瘤良惡性方面性能好(AUC為0.83,ACC為0.76)。
骨肉瘤MRI影像組學研究中進行骨腫瘤鑒別的研究也有一項。Dai等[42]的研究選擇35例骨肉瘤和31例尤文肉瘤的MRI的T2加權壓脂圖像(T2FS)和對比增強的T1加權圖像(CET1WI),使用LASSO方法選擇了T2-FS的9個特征和CET1WI的7個特征,同樣采用ROC曲線下面積(AUC)評估模型性能,結果顯示T2FS和CET1WI鑒別兩個腫瘤的AUC值分別為0.881和0.765,表明影像組學可以實現(xiàn)骨肉瘤與尤文肉瘤的鑒別,且T2FS圖像的診斷價值更高。
3.2 預測骨肉瘤化療反應提早并準確了解不同骨肉瘤患者對新輔助化療的敏感性,對監(jiān)測骨肉瘤治療效果、優(yōu)化后續(xù)治療方案以及判斷預后相當關鍵。故而許多骨肉瘤影像組學的研究著眼于骨肉瘤化療反應的預測。其中有2項研究針對CT圖像,有4項針對18F-FDG PET/ CT,有4項研究針對MRI。
有2項研究針對CT圖像,Lin等[28]的研究結合了CT影像組學特征和臨床因素開發(fā)了諾模圖模型,對腫瘤化療后的組織學反應敏感性進行預測;Xu等[30]的研究將圖像中的感興趣區(qū)(ROI)擴大,對骨肉瘤腫瘤區(qū)域和非腫瘤區(qū)域均進行影像組學分析,結果發(fā)現(xiàn)結合腫瘤和非腫瘤區(qū)域特征所構建的影像組學分析模型比單獨腫瘤特征區(qū)域構建的模型的性能高[AUC之比為(0.8207±0.0043)∶(0.7799±0.0044)]。
在4項針對18F-FDG PET/CT的影像組學研究中,Bailly等[33]和Song等[36]的兩組研究同時預測了骨肉瘤的預后。Kim等[34]、Song等[36]和Sheen等[37]的三組研究均證實了基于18F-FDG紋理特征的機器學習方法可以預測化學療法反應,W.Kim等[34]還構建了深度學習算法,結果顯示使用卷積神經(jīng)網(wǎng)絡(CNN)深度學習體系結構的9個影像組學特征的準確率最高(85%)。
另外有4項研究針對MRI。Baidya Kayal等[39]探討定量體素內(nèi)非相干運動(IVIM)參數(shù)及其直方圖分析對骨肉瘤新輔助化療后變化和治療反應評估中的作用,選擇新輔助化療前、第1個化療周期后、第3個化療周期后共三次MRI掃描,得到彌散加權圖像(DWI)后評估表觀擴散系數(shù)(ADC)、IVIM參數(shù)–擴散系數(shù)、灌注系數(shù)(D*)、灌注分數(shù)(f)相對百分比變化,結果顯示定量的IVIM參數(shù),尤其是D*和f及其直方圖,可以作為非侵入性標志物用于骨肉瘤新輔助化療過程中的早期化療反應的評估。Dufan等[40]的研究針對T1WI和T1WI增強掃描圖像,自動提取87個放射特征,使用支持向量機(SVM)構建模型,結果顯示,AUC為0.98,靈敏性為100%,特異性86%,表明基于MRI數(shù)據(jù)的影像組學在化療前可以預測患者的化療反應。Lee等[41]的研究選擇DWI和ADC圖像選擇特征構建模型,結果顯示該模型可提高診斷骨肉瘤患者新輔助化療反應不良診斷的準確性。Chen等[44]的研究選擇T1加權壓脂增強序列(CE FS T1WI)提取影像組學特征,比較了四種分類方法,包括最小絕對收縮和選擇算子邏輯回歸(LASSO-LR),支持向量機(SVM),高斯過程(GP)和樸素貝葉斯(NB)算法,結果顯示基于LASSO-LR選擇的13種影像組學特征構建的模型與化療反應顯著相關,訓練組AUC為0.882,驗證組AUC為0.842。
3.3 判斷骨肉瘤預后骨肉瘤影像組學研究中所納入的預后指標包括轉移、術后復發(fā)和5年生存率,總生存率等,其中有5項研究針對CT圖像,有3項針對18F-FDG PET/CT,有3項研究針對MRI。
4項針對CT圖像的研究中,Wu等[23]和Xu等[27]的研究通過術后5年生存率判斷患者預后。Wu等[23]的研究顯示影像組學列線圖模型在預測患者術后5年生存率方面比僅用臨床特征構建的臨床模型效能更高。Xu等[27]的研究顯示骨肉瘤3D圖像特征比2D圖像特征有更好的預測性能。Liu等[29]的研究對骨肉瘤術后的1年內(nèi)的早期復發(fā)進行術前預測,所構建的影像組學列線圖模型在判別復發(fā)風險高低方面均取得了很好的結果。Cho等[31]研究的就非骨肉瘤病灶本身,而是研究肺結節(jié),通過CT紋理分析實現(xiàn)了骨肉瘤肺轉移結節(jié)與非轉移性結節(jié)的鑒別。Pereira等[32]的研究從骨肉瘤的CT圖像中提取影像組學特征,使用三種常用的機器學習模型,在評估骨肉瘤患者發(fā)生肺轉移的風險方面取得了很好的結果,其中隨機森林算法預測的準確性最高,測試集的 AUC為 0.79 和準確性為73%。
3項研究針對18F-FDG PET/CT圖像,Bailly等[33]的研究在骨肉瘤單因素和多因素分析中,形狀特征中的病灶長度與骨肉瘤患者的總生存期和和無進展生存期顯著相關,但顯示影像組學定量指標與預后無顯著相關性。Song等[36]的研究顯示PET紋理分析可以預測新輔助化療后患者的無進展生存期,但常規(guī)參數(shù)中的腫瘤代謝體積(MTV)的預測能力更佳。Sheen等[37]的研究顯示,SUVmax(maximum standard uptake value)和高階特征GLZLM_SZLGE(Gray-Level Zone Length based on intensity–size–zone Matrix_short-zone low grey-level emphasis)是轉移風險評估的獨立預測因子,提示可以使用這兩個特征可以開發(fā)多變量模型,這將會有利于高轉移風險患者的提前治療。
在3項針對MRI的研究中,Zhao等[38]的研究選擇彌散加權磁共振圖像(DWI-MRI),結果顯示腫瘤大小、治療前的堿性磷酸酶(ALP)水平和化療的療程數(shù)與骨肉瘤總生存時間相關。Chen等[43]的研究選擇T1加權壓脂增強序列(CE FS T1WI)對手術切除后骨肉瘤的1年內(nèi)早期復發(fā)骨肉瘤進行術前預測,其中所選擇的6個特征取得了良好的預測效果,訓練組AUC為0.907,驗證組AUC為0.811。陳海妹等[45]的研究,提取了T1WI中2個與骨肉瘤術后1年內(nèi)復發(fā)相關的影像組學特征,所構建的列線圖取得了良好的預測效果,證明了基于T1WI的影像組學列線圖可作為一種預測骨肉瘤1年內(nèi)復發(fā)情況的非侵入性的量化工具。
影像組學將骨肉瘤的分析定量化,研究潛力巨大,但是仍然存在一些局限性,限制了其在臨床的應用。首先,沒有標準化的數(shù)據(jù)收集和研究方法,CT、MRI等圖像的采集缺乏標準化是骨肉瘤影像組評估的一個主要問題,不同研究中心的圖像采集與分割、特征提取、影像組學分析軟件等也均存在差異,會造成影像組學原始數(shù)據(jù)存在誤差;骨肉瘤影像組學也缺乏標準化分析方法,使得不同研究之間缺乏可比性。其次,骨肉瘤的數(shù)據(jù)量較少,影像組學應用的可重復性難以確定。與肝癌等腫瘤相比,骨肉瘤相對較少,前所有已發(fā)表的有關骨肉瘤影像組學的研究多數(shù)是在單個中心進行,使用的樣本量較少。而且大部分研究都是回顧性的,可能會造成選擇偏倚和較高的假陽性。最后,信息利用不足也是限制骨肉瘤影像組學研究的一大障礙,特別是基于MRI的骨肉瘤影像組學研究中,如何進行骨肉瘤多參數(shù)MRI 序列間的優(yōu)化整合是一大挑戰(zhàn)。目前骨肉瘤MRI 影像組學模型往往基于單一序列,浪費大量多參數(shù)MRI 的信息,為充分利用骨肉瘤形態(tài)、空間、功能等信息,必須充分利用多參數(shù)MRI 的各種序列,進行序列間的優(yōu)化整合。
目前的骨肉瘤個體化診療研究主要基于遺傳學方法(包括基因組學、轉錄組學、蛋白質組學和代謝組學等)通過活檢尋找對骨肉瘤有效的治療靶點[46]。所以,骨肉瘤影像組學進一步的研究應將影像組學圖像標志物與基因、蛋白等生物學標志物聯(lián)合起來。影像基因組學將基因組學與影像組學結合起來,或許可以彌補侵入性診斷的不足,甚至可以避免一部分侵入性病例診斷,這可能是未來研究的重點和難點。
相信未來多研究中心會有更大的醫(yī)療數(shù)據(jù)庫,影像組學和人工智能技術也將進一步發(fā)展,若可以將專家經(jīng)驗的傳統(tǒng)影像分析、影像組學分析、基因和蛋白組學分析結合起來,將會為患者提供更精準的治療,這將為包括骨肉瘤在內(nèi)的疾病管理帶來巨大利益。