楊浩然,馬密密,曹新山
近年來,隨著標準化掃描協(xié)議和人工智能的不斷發(fā)展,從圖像中獲取更多定量信息以實現(xiàn)自動化和可重復(fù)性分析成為了一種可能,因此影像組學(xué)應(yīng)運而生。影像組學(xué)是一個新興的醫(yī)工交叉研究領(lǐng)域,其概念最早由荷蘭學(xué)者Lambin等[1]于2012年提出,即從醫(yī)學(xué)圖像中提取高通量特征,采用計算機算法將影像學(xué)數(shù)據(jù)轉(zhuǎn)化為具有高分辨率的可挖掘數(shù)據(jù)空間的學(xué)科。
原發(fā)性肝癌是我國目前第4 位常見惡性腫瘤及第2 位腫瘤致死病因。其中肝細胞癌(hepatocellular carcinoma,HCC)占75%~85%[2]。肝癌在空間和時間上是異質(zhì)性的,侵入性檢查不能提供全面信息,肝細胞癌的診斷特別是早期診斷在較大程度上依靠無創(chuàng)影像[3-4],新興的影像組學(xué)尤其是基于影像組學(xué)的肝細胞癌多中心研究逐步開展并取得了較大成績。
本文基于影像組學(xué)的肝細胞癌多中心研究最新進展進行綜述。
從計算機輔助診斷系統(tǒng)到影像組學(xué),是一個圖像可轉(zhuǎn)換量化數(shù)據(jù)不斷增多,醫(yī)學(xué)成像數(shù)據(jù)信息整合程度不斷加深的過程。影像組學(xué)的本質(zhì)是對擁有高通量特征的醫(yī)學(xué)圖像進行定量化分析[5]。由于惡性腫瘤在空間和時間上的異質(zhì)性[6],穿刺活檢等有創(chuàng)檢查不能體現(xiàn)腫瘤的預(yù)后及預(yù)測治療反應(yīng)等信息。目前臨床上需要精確分層,對常規(guī)影像學(xué)數(shù)據(jù)量化分析主要是惡性腫瘤。從圖像中提取影像組學(xué)特征,設(shè)置算法對數(shù)據(jù)進行分類,根據(jù)數(shù)據(jù)之間潛在的關(guān)系生成復(fù)雜的推斷,學(xué)習(xí)數(shù)據(jù)中的模式,利用學(xué)習(xí)的模式進行決策,總結(jié)出診斷性實驗?zāi)P?。這個過程被定義為機器學(xué)習(xí)[7]。隨著算法的改進,深度學(xué)習(xí)作為機器學(xué)習(xí)的分支逐步應(yīng)用于醫(yī)學(xué)領(lǐng)域[8]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是深度算法的一種,其結(jié)構(gòu)類似于生物神經(jīng)系統(tǒng),可以自動從數(shù)據(jù)中學(xué)習(xí)區(qū)分特征,模仿人進行決策,推進了組學(xué)模型臨床應(yīng)用的進程[9]。
影像組學(xué)是圖像分析,圖像是基礎(chǔ),標準化高質(zhì)量影像圖像的獲取與重建是影像組學(xué)研究的先決條件[10],絕大多數(shù)影像組學(xué)研究是在單一醫(yī)療科研機構(gòu)中進行,這固然可以降低因掃描機型及參數(shù)不一致等因素造成的圖像所攜帶組學(xué)特征信息誤差,卻也降低了研究的可重復(fù)性與泛化能力[11]。確定影像組學(xué)模型潛在臨床價值,開展大型多中心研究成為熱點,它是實現(xiàn)影像組學(xué)方法向臨床環(huán)境更快轉(zhuǎn)移的重要途徑和目標。
多中心研究指由多個單位的研究者合作,按同一個方案同時進行的研究。它的主要優(yōu)點是具有更大的數(shù)據(jù)集和從不同樣本中獲得的結(jié)果具有更高的統(tǒng)計相關(guān)性。然而從幾個中心收集數(shù)據(jù)是復(fù)雜的,無論圖像是本地存儲還是利用分布式學(xué)習(xí)[12]存儲和分析在一個中央數(shù)據(jù)庫、掃描器模型、采集協(xié)議和重建設(shè)置的可變性在目前的臨床實踐中是不可避免的。大多數(shù)組學(xué)特征已被證明對這些因素的變化敏感[13]。將它們集中起來進行統(tǒng)計分析并建立的模型要么隱藏現(xiàn)有的相關(guān)性,要么產(chǎn)生錯誤發(fā)現(xiàn)[14]。因此不同成像方案之間不能立即進行比較,需要協(xié)調(diào)策略對各獨立數(shù)據(jù)進行整合,這類協(xié)調(diào)策略簡稱為標準化,它的實現(xiàn)形式可以分為兩個思路,一種旨在消除或減少在組學(xué)特征提取之前圖像之間的差異,方法是圖像標準化;另一種旨在消除或減少提取特征和提取特征后特征之間的差異,方法是修改算法或后驗處理。前者對應(yīng)了圖像域協(xié)調(diào)策略,包括標準化成像,特定條件下的規(guī)范化合并,以及圖像預(yù)處理。后者對應(yīng)了特征域協(xié)調(diào)策略,可分為根據(jù)可靠性選擇組學(xué)特征和去除無關(guān)因素校正方法。上述協(xié)調(diào)策略各有其優(yōu)勢與不足,可根據(jù)臨床實踐單獨或聯(lián)合應(yīng)用于影像組學(xué)多中心研究。
影像組學(xué)在肝細胞癌診斷和與其他肝臟疾病鑒別上顯示出了較大潛力[15]。王禹博等[16]用擴散加權(quán)成像建立的影像組學(xué)特征模型對肝細胞癌和肝血管瘤進行鑒別。Gu等[17]使用支持向量機建立MRI 組學(xué)列線圖模型識別肝細胞癌潛在標志物。上述模型實現(xiàn)臨床應(yīng)用還需要驗證,但它們提供了一個思路,即通過MRI 影像組學(xué)多中心研究訓(xùn)練一種精準診斷肝細胞癌的無創(chuàng)手段[18]。
術(shù)前的病理分級預(yù)測是對腫瘤治療方式進行評估選擇的有效手段。許露露等[19]、Hui 等[20]用紋理分析比較術(shù)前MRI 紋理與肝細胞癌的相關(guān)性,推測肝細胞癌的早期復(fù)發(fā)?;谟跋窠M學(xué)評估肝癌病理特征[21],可指導(dǎo)臨床作出合理的治療選擇。微血管浸潤(microvascular invasion,MVI)是手術(shù)切除后復(fù)發(fā)因素之一,目前只能通過術(shù)后病理切片診斷。段亞陽等[22]、Jiang 等[23]使用機器學(xué)習(xí)和深度學(xué)習(xí)算法,建立多組結(jié)合模型預(yù)測MVI 狀態(tài)。兩組研究均驗證了瘤周特征對預(yù)測MVI 的重要影響,也提及當前MVI 組學(xué)研究的局限,為開展多中心研究拓展了思考方向。
借鑒影像組學(xué)研究臨床意義,結(jié)合多中心研究改進驗證,是開展多中心研究的重要方式。具有潛在臨床應(yīng)用意義的肝細胞癌術(shù)后預(yù)測分為兩個方向,一是預(yù)測肝癌早期復(fù)發(fā)和術(shù)后生存期。李琳等[24]用支持向量機、隨機森林[25]等機器學(xué)習(xí)方法對影響患者生存和復(fù)發(fā)的因素做了分析解釋,Zhang 等[26]、Huang等[27]開發(fā)釓塞酸增強MRI組學(xué)特征模型,對肝癌術(shù)后發(fā)展進行預(yù)測。另一個是探究經(jīng)導(dǎo)管肝動脈化療栓塞術(shù)(transcatheter arterial chemoembolization,TACE)后肝癌患者預(yù)后情況。Sun 等[28]基于術(shù)前多參數(shù)MRI 提取組學(xué)特征,建立影像組學(xué)模型提示TACE 治療的預(yù)后情況。Song 等[29]建立增強MRI 影像組學(xué)-臨床聯(lián)合模型(clinical radiomics combination,CRC)預(yù)測術(shù)后復(fù)發(fā)情況。
肝細胞癌多發(fā)生在肝硬化患者中,影像組學(xué)作為無創(chuàng)性肝硬化結(jié)節(jié)的良惡性鑒別方法,對HCC 的篩查、評估和治療具有重要價值。Mokrane 等[30]選擇來自27 個機構(gòu)的178 個肝硬化病例,經(jīng)圖像標準化處理后,對多期肝硬化結(jié)節(jié)分割提取特征,使用機器學(xué)習(xí)方法對特征進行篩選,建立模型。訓(xùn)練后的組學(xué)模型經(jīng)過多折交叉實驗驗證,展現(xiàn)了在多中心環(huán)境中的良好效能。該模型能夠適用多中心研究有一個關(guān)鍵因素是掃描采集參數(shù)雖存在不同,但在分割和門靜脈造影增強方面,在動脈期和門靜脈期之間變化中結(jié)節(jié)的某一影像組學(xué)特征是穩(wěn)定的。值得注意的是,本研究模型診斷效能主要體現(xiàn)在一個組學(xué)特征,該特征區(qū)分良惡性病變有較高的準確率,但肝癌與其他惡性腫瘤存在重疊。后續(xù)研究可以通過引入非影像組學(xué)參數(shù),增加模型維度。
MVI是肝細胞癌手術(shù)切除后長期生存和復(fù)發(fā)的重要指標,因此準確評估MVI在監(jiān)測HCC預(yù)后中意義重大。Zhang等[31]納入了來自兩個獨立機構(gòu)的637例患者。使用Z-scores方法對測試集和獨立驗證集的特征根據(jù)訓(xùn)練隊列的均值和標準差進行歸一化,以消除特征之間價值尺度不一帶來的差異。在多中心試驗中,試驗者為了使用來自不同獨立機構(gòu)的數(shù)據(jù),使用了歸一化方法。對每個數(shù)據(jù)集的特征分別規(guī)格化,這樣做消除了數(shù)據(jù)集之間的特征變異性,構(gòu)造的影像組學(xué)特征不會過度擬合。并用多變量Logistic回歸開發(fā)了預(yù)測MVI狀態(tài)和風(fēng)險的兩個影像組學(xué)模型,得出灰度行距矩陣-長行程高灰度強調(diào)度是預(yù)測MVI 的一個重要的跨模影像組學(xué)特征。該研究使用二維ROI 提取特征,缺少三維分段的相關(guān)信息,另外沒有對HCC 的形態(tài)學(xué)特征進行評估。在未來的研究中應(yīng)嘗試比較二維和三維成像數(shù)據(jù)的MVI評價模型的預(yù)測性能。
術(shù)后復(fù)查是HCC 切除術(shù)后的患者主要死因,預(yù)后分級是個體化治療的關(guān)鍵,然而目前尚無公認的HCC 風(fēng)險分層方法。據(jù)Ji 等[32]了解的信息,其團隊研究是第一個使用影像組學(xué)預(yù)測早期HCC手術(shù)切除后復(fù)發(fā)的多機構(gòu)研究,他們從3個獨立機構(gòu)收集了470 例患者提取的3384 個工程特征,使用聚合的機器學(xué)習(xí)框架確定了一個有3 個特征的影像組學(xué)模型。與不使用影像組學(xué)的競爭模型和廣泛使用的分期系統(tǒng)相比,該模型結(jié)合臨床來源后準確地預(yù)測了術(shù)前或術(shù)后HCC 的復(fù)發(fā),并可給出復(fù)發(fā)風(fēng)險低、中、高的3 個風(fēng)險層次,顯示了其優(yōu)越的預(yù)測性能。Wang 等[33]將201 例肝癌患者納入多中心研究,從術(shù)前MRI 中提取組學(xué)特征。采用隨機森林方法構(gòu)筑組學(xué)特征模型,開發(fā)了一個結(jié)合組學(xué)特征和臨床危險因素的影像組學(xué)模型。以上研究都強調(diào)了影像組學(xué)和現(xiàn)有變量的互補性,證明了使用多中心試驗建立影像組學(xué)模型對肝細胞癌預(yù)后預(yù)測是可行的。外科醫(yī)生可據(jù)風(fēng)險高低進而選擇肝部分切除術(shù)或肝動脈化療栓塞。Meng 等[34]的回顧性研究納入了接受TACE 作為初始治療的162例不可切除的初治HCC患者的多中心數(shù)據(jù),從動脈期和門脈期的圖像的瘤內(nèi)和瘤周區(qū)域提取影像組學(xué)特征。使用最小絕對收縮和選擇算子方法(least absolute shrinkage and selection operator,LASSO)對組學(xué)特征降維,并在訓(xùn)練隊列中進行特征歸一化,使用單因素多因素回歸分析確定組學(xué)特征和臨床生存因素之間的聯(lián)系,開發(fā)了CRC模型。經(jīng)過一致性指數(shù)分析,驗證了影像組學(xué)特征可以作為預(yù)測接受TACE 的HCC 患者預(yù)后情況的獨立生物學(xué)指標,結(jié)合臨床模型后預(yù)測效果表現(xiàn)更好。Jin 等[35]針對TACE 術(shù)后肝外播散和血管侵犯的預(yù)測,引入了3 個機構(gòu)256 例接受TACE 作為首選治療的患者,提取組學(xué)特征后,對所有圖像重采樣標準化體素間距,使用固定bin 值離散化,以歸一化體素強度。該研究同樣建立了CRC 模型。根據(jù)決策曲線分析,該影像組學(xué)研究可以作為臨床判斷術(shù)后風(fēng)險的工具提供可靠預(yù)測。值得一提的是,上述研究均未探討深度學(xué)習(xí)方法,深度學(xué)習(xí)可以根據(jù)臨床目標自動學(xué)習(xí)圖像中的特征表示。應(yīng)當在以后的研究中引入深度學(xué)習(xí),提高多中心影像組學(xué)模型診斷效能。
最新的肝癌影像組學(xué)中多中心研究已經(jīng)涉及早期診斷和鑒別診斷、評估MVI、術(shù)后預(yù)測等方面。已經(jīng)囊括了影像組學(xué)研究的幾個主要方向,還具有多中心樣本建模的高魯棒性和外部驗證的強可重復(fù)性等優(yōu)勢。筆者總結(jié)影像組學(xué)現(xiàn)有應(yīng)用,思考開展多中心研究的實用性和可行性?;贛RI 的肝癌影像組學(xué)多中心研究還較少,這可能受限于MRI 在肝癌診斷中的應(yīng)用少于多期增強CT檢查和不同機構(gòu)MRI序列參數(shù)的不統(tǒng)一。本研究列舉了部分多中心研究的協(xié)調(diào)策略,諸如標準化成像、圖像規(guī)范化合并、Z-score 特征選擇等。在機器學(xué)習(xí)的訓(xùn)練過程中,圖像預(yù)處理也是一種常見標準化方法,在相同尺度的特征下,機器學(xué)習(xí)具有更好的表現(xiàn)。經(jīng)多中心訓(xùn)練組內(nèi)外部驗證,這些方法表現(xiàn)出消除不同數(shù)據(jù)集之間特征變異性的優(yōu)勢。建立的多中心組學(xué)模型,與臨床因素結(jié)合后對預(yù)測效果的提升,可以看到選擇協(xié)調(diào)策略在多中心研究的潛在作用。這就為影像組學(xué)結(jié)合臨床提供了良好的條件。
開展大型多中心研究是加快影像組學(xué)方法在臨床應(yīng)用的關(guān)鍵。然而,現(xiàn)有肝癌影像組學(xué)多中心的研究確存在一定局限性。在數(shù)據(jù)層面,部分研究存在選擇偏倚,影響整合數(shù)據(jù)的可信度。在工程層面,復(fù)雜的算法涉及工學(xué)領(lǐng)域,臨床醫(yī)生等獨立研究人員無法對模型校準和改進。由此可見,影像組學(xué)擴展到臨床仍有許多問題亟待解決,需要放射科醫(yī)生與多學(xué)科研究人員密切配合。未來,隨著成像標準化協(xié)議的普及,以及機器學(xué)習(xí)、多中心數(shù)據(jù)融合技術(shù)的發(fā)展,擁有高效、無創(chuàng)等優(yōu)勢的影像組學(xué)方法將有望優(yōu)化肝癌醫(yī)療決策,造?;颊摺?/p>
作者利益沖突聲明:全體作者均聲明無利益沖突。