林濤,劉愛連
大連醫(yī)科大學附屬第一醫(yī)院放射科,遼寧 大連 116011;*通信作者 劉愛連 liuailian@dmu.edu.cn
肝細胞癌是全球范圍內第四大最常見癌癥相關死亡原因,具有惡性程度高、預后差的特點[1]。盡早、全面地評估肝細胞癌,進而采取科學的干預手段至關重要。評估肝細胞癌的“金標準”包括穿刺、術后病理及免疫染色,然而,穿刺為有創(chuàng)操作,而且結果易受腫瘤取材的影響;術后病理及免疫染色只能術后獲得,不能為術前制訂診療方案提供幫助。醫(yī)學影像具有快速成像、便捷、無創(chuàng)的特點,且能涵蓋腫瘤全貌,逐漸成為臨床上評價肝細胞癌的有效檢查手段之一,但臨床應用主要局限在對肝細胞癌的定性特征以及半定量、定量的研究,定性研究依賴于影像科醫(yī)師的肉眼及主觀經(jīng)驗[2-3],難以挖掘其內部與病理、免疫及生物學行為等相關的深層次信息;定量及半定量研究易受感興趣區(qū)放置及相應后處理軟件開發(fā)、運行的影響;兩者對肝細胞癌的評估價值依然有限。
影像組學的出現(xiàn)最大程度地挖掘了影像潛力,為臨床無創(chuàng)、準確評估肝細胞癌提供可能。影像組學研究是目前最常用的醫(yī)學圖像分析技術,而傳統(tǒng)機器學習則是其中最常用的工具,深度學習的興起進一步推動了醫(yī)學圖像分析領域的發(fā)展。本文對基于醫(yī)學影像的傳統(tǒng)機器學習方法建立的影像組學及深度學習方法在肝細胞癌的研究進展進行綜述,旨在為進一步研究提供參考。
1.1 概念 影像組學通過對影像圖像進行高通量挖掘和量化,獲得大量定量特征進行分類和預測,進而無創(chuàng)、全面評估腫瘤異質性[4]。影像組學特征是其中基本的組成元素,與常規(guī)影像特征不同,影像組學特征是計算機基于醫(yī)學圖像自動提取的肉眼難以感知的定量特征,可能包含更多反映潛在病理生理學表現(xiàn)的信息[5]。邏輯回歸、支持向量機等傳統(tǒng)機器學習方法是影像組學研究中最常用的工具。
1.2 傳統(tǒng)機器學習方法建立的影像組學在肝細胞癌中的應用
1.2.1 診斷及鑒別診斷 Wu等[6]發(fā)現(xiàn)與基于單一序列MRI影像組學模型相比,聯(lián)合平掃多序列MRI(同反相位、T2WI及擴散加權成像序列)影像組學模型鑒別肝細胞癌與血管瘤的價值更高,且邏輯回歸是表現(xiàn)最佳的分類器,在測試集中的曲線下面積(AUC)、敏感度及特異度分別為0.89、82.2%及71.4%(優(yōu)于決策樹、K近鄰及隨機森林);而陳茂東等[7]在基于增強MRI的類似研究中發(fā)現(xiàn),支持向量機模型的效能優(yōu)于邏輯回歸。上述研究表明,基于不同序列的MRI以及選擇不同的分類器,均會影響最終構建模型的效能。除在良惡性鑒別中有一定價值外,影像組學在不同組織病理類型肝內膽管細胞癌的鑒別中同樣具有潛力[8-9]。
1.2.2 對病理相關指標進行術前預測 病理分級是影響肝細胞癌肝內復發(fā)的重要因素之一,病理分級程度越高的肝細胞癌越容易肝內復發(fā)[10]。寧培鋼等[11]及Wu等[10]的研究表明基于增強CT及平掃MRI的影像組學在術前預測肝細胞癌病理分級中均有較高的價值。
微血管侵犯(microvascular invasion,MVI)定義為內皮細胞構成的血管間隙存在腫瘤細胞,是肝細胞癌患者術后早期復發(fā)和生存的主要獨立預測因子,無法肉眼獲得,只能在顯微鏡下觀察,MVI的存在通常預示肝細胞癌有很強的侵襲力,預后往往很差[12]。既往文獻[13-17]表明影像組學可用于預測肝細胞癌的MVI,但多數(shù)研究對象是整個腫瘤。由于MVI多發(fā)生在腫瘤邊緣,部分學者也提取并研究了腫瘤周圍的影像組學特征:Zhang等[15]構建了基于增強肝膽期MRI的腫瘤聯(lián)合瘤周影像組學模型,結果顯示在測試集的AUC、敏感度及特異度分別達到0.83、90%、75%,表明腫瘤聯(lián)合瘤周影像組學模型在術前預測MVI中有較高的價值;同時在測試集中,聯(lián)合模型的AUC較臨床模型顯著提升。Feng等[16]也對肝細胞癌瘤內及瘤周進行研究,得到了類似的結果。然而上述研究[15-16]并未單獨基于腫瘤本身構建影像組學模型,無法確定瘤周組學特征是否真正對術前預測MVI有幫助。Dong等[13]基于術前肝細胞癌超聲,分別建立了腫瘤、瘤周、腫瘤聯(lián)合瘤周3種影像組學模型,發(fā)現(xiàn)3種模型的AUC分別為0.708、0.710、0.680,無顯著差異,指出將瘤周組學特征納入其中,并不能給最終預測模型的效能帶來顯著提升,Nebbia等[17]的研究也證明了這一觀點。盡管如此,依然不能直接否定瘤周組學的價值,不排除結果受制于樣本量不足的可能,需要未來增加樣本量繼續(xù)研究。
細胞角蛋白-19、Ki-67及Glypican 3等特定細胞表達的蛋白,通常與肝細胞癌的侵襲及復發(fā)密切相關。最新研究[18-20]指出,影像組學在肝細胞癌術前上述蛋白的預測中均有較高的價值,聯(lián)合臨床及常規(guī)影像學特征后,模型的效能均能得到不同程度的提高。
1.2.3 預后預測及療效評估 肝部分切除術是早期可切除肝細胞癌的首選療法,但術后依然存在復發(fā)的可能性,約82.5%的肝切除術后患者死于肝內復發(fā)[21]。術前預測肝細胞癌復發(fā)的可能性有助于早期干預、制訂科學的治療方案,進而延長患者的生存期及提高生存質量。多項基于CT、MRI的研究表明[22-24],影像組學能有效預測肝細胞癌切除術后復發(fā)。Wang等[25]的研究證實基于MRI的影像組學能有效預測肝細胞癌患者5年生存率,為臨床制訂圍術期治療方案及預后監(jiān)測提供幫助。Song等[26]對基于增強MRI的影像組學與肝細胞癌介入術后無復發(fā)生存期的相關性進行研究,發(fā)現(xiàn)影像組學能有效預測肝動脈化療栓塞(transcatheter arterial chemoembolization,TACE)治療后肝細胞癌患者的無復發(fā)生存期,最終的聯(lián)合模型一致性達到0.802。
Sun等[27]探討了基于術前多參數(shù)MRI影像組學預測不能切除的肝細胞癌TACE治療后早期進展的價值,在測試集中,基于擴散加權成像、T2WI及表觀擴散系數(shù)及多參數(shù)聯(lián)合組學模型的AUC分別為0.729、0.729、0.714及0.800,既體現(xiàn)了影像組學預測肝細胞癌TACE術后早期進展的價值,也表明了多參數(shù)MRI的潛力。
2.1 概念 深度學習是具有多個隱藏層的深度神經(jīng)網(wǎng)絡,也是一種表示學習方法,通過提供的已有數(shù)據(jù)集,利用復雜的多層神經(jīng)網(wǎng)絡體系結構,學習最佳特征,進而自行執(zhí)行給定任務。與影像組學依賴于預定義、人工特征不同,深度學習算法能夠創(chuàng)建或識別更加本質有效的深度特征[28]。深度學習算法的訓練常通過使用標記的訓練數(shù)據(jù)的監(jiān)督學習完成,從隨機初始配置開始,調整網(wǎng)絡權重找到在訓練數(shù)據(jù)集上表現(xiàn)最佳的一組參數(shù)[29]。卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)是最常用的深度學習網(wǎng)絡,在圖像的識別及分類中有較高的價值[30]。CNN通常由輸入層、隱藏層及輸出層構成,隱藏層又由卷積層、池化層及完全連接層組成;卷積層及池化層用于提取圖像的高維特征,完全連接層完成特征的整合及轉換[29]。只要擁有適當標注的數(shù)據(jù)集和不斷增強的處理能力,深度學習可以實現(xiàn)從原始輸入到期望輸出的映射,幾乎不存在人為因素帶來的影響,能最大可能地挖掘數(shù)據(jù)自身的潛力。
2.2 深度學習在肝細胞癌中的應用
2.2.1 對肝細胞癌進行檢出及肝臟占位分類 Kim等[31]提出了一種基于MRI肝膽期圖像的全自動深度學習模型檢出肝細胞癌,該模型利用微調的CNN,在最終的外部驗證集中具有較好的肝細胞癌檢出能力,敏感度及特異度分別為87%、93%,優(yōu)于經(jīng)驗不足的影像科醫(yī)師。多位學者對深度學習在肝占位中的分類價值展開深入研究[32-34],結果表明CT和MRI是目前開展深度學習最常用的影像檢查,其中涉及的深度學習網(wǎng)絡主要為CNN;在相似的結構框架下,研究者們分別建立了適應各自研究的深度學習模型,均獲得了較高的分類效能,證實在包括肝細胞癌在內的肝臟占位分類中,基于醫(yī)學影像的深度學習方法具有較好的研究及應用前景。
2.2.2 對病理指標進行術前預測 Yang等[35]采用多通道融合三維卷積神經(jīng)網(wǎng)絡(MCF-3DCNN)評價了基于動態(tài)對比增強MRI的深度學習在肝細胞癌病理分級中的診斷性能,發(fā)現(xiàn)MCF-3DCNN完全鑒別肝細胞癌病理分級的平均準確率為0.739 6±0.010 4。周慶[28]研究表明基于MRI的深度學習在肝細胞癌病理分級預測中具有較高價值,而且在DenseNe和SENet網(wǎng)絡結構的基礎上提出了一種全新的CNN結構SE-DenseNet,并證實此網(wǎng)絡結構較DenseNet具有更好的分類性能。
2.2.3 預后預測、療效評估 Zhang等[36]研究了基于增強CT的深度學習在術前預測TACE聯(lián)合索拉非尼治療的肝細胞癌患者總生存期的價值,結果顯示深度學習模型在測試集及驗證集中的一致性指數(shù)為0.717、0.714,聯(lián)合臨床特征后,聯(lián)合模型的預測效能在驗證集中由0.679顯著提升至0.730(P=0.023),表明基于增強CT的深度學習方法能夠術前預測可能受益于TACE和索拉非尼聯(lián)合治療的肝細胞癌患者,可以幫助臨床醫(yī)師篩選潛在患者,提高臨床診療的凈獲益。
與總生存期相同,療效評估同樣影響醫(yī)療方案的科學制訂。Peng等[37]嘗試建立基于CT的深度學習模型,用于預測接受經(jīng)TACE的中期肝細胞癌患者的術前反應,發(fā)現(xiàn)在獨立的兩個驗證集中,深度學習模型對完全緩解、部分緩解、穩(wěn)定及疾病進展的準確度分別為85.1%和82.8%,表明深度學習能幫助臨床醫(yī)師篩選TACE可能受益的肝細胞癌患者,從而實現(xiàn)治療價值的最大化。
Brehar等[38]基于超聲進行探索,發(fā)現(xiàn)基于深度學習的模型獲得了最佳表現(xiàn)(準確度、敏感度和AUC均>90%,特異度>88%),指出深度學習較傳統(tǒng)機器學習具有更高的肝細胞癌檢出性能。為了比較傳統(tǒng)機器學習與深度學習在預測肝細胞癌MVI中的價值,Jiang等[39]率先基于CT圖像進行研究,發(fā)現(xiàn)在訓練集中基于傳統(tǒng)影像組學聯(lián)合臨床特征模型的AUC為0.952,而基于深度學習的AUC則為0.980;在測試集中,兩者的AUC分別達0.887、0.906,雖然無論在訓練集還是測試集,兩種模型的AUC均無顯著差異(推測可能是小樣本量導致),但也對開展進一步的相關研究提供了新的思路。上述研究[38-39]表明,在基于傳統(tǒng)機器學習建立的影像組學和深度學習在肝細胞癌的相關應用中,目前此類研究的數(shù)量以及涉及的樣本量相對較少,尚不能得到肯定的答案,仍需進一步研究考證。
采用傳統(tǒng)機器學習建立的影像組學與深度學習方法在肝細胞癌的病灶檢出、分類、病理指標預測、預后預測及療效評估中具有較高的價值。但目前仍存在制約機器學習發(fā)展的問題,如過分依賴于大量醫(yī)學影像數(shù)據(jù)及不斷增強的數(shù)據(jù)處理能力、容易出現(xiàn)模型的過擬合、模型需要嚴格的臨床驗證、深度學習過程缺乏可解釋性等。相信隨著未來成像及計算機技術的不斷發(fā)展,上述問題均會得到解決。