閆夢(mèng)夢(mèng) 綜述,王衛(wèi)東,郎錦義 審校
610041 成都,四川省腫瘤醫(yī)院·研究所,四川省癌癥防治中心,電子科技大學(xué)醫(yī)學(xué)院
影像組學(xué)是一種大數(shù)據(jù)圖像分析方法, 通常收集的是計(jì)算機(jī)斷層掃描成像(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)和正電子發(fā)射型計(jì)算機(jī)斷層顯像(positron emission tomography,PET)等醫(yī)學(xué)影像[1]。超聲因具有易操作、成像快、價(jià)格低和安全等優(yōu)勢(shì), 使不少研究者嘗試將超聲應(yīng)用于影像組學(xué)。目前影像組學(xué)的技術(shù)流程已十分清晰(如圖1),但其中的一些步驟,如多中心驗(yàn)證、數(shù)據(jù)的標(biāo)準(zhǔn)化、算法的可重復(fù)性和可靠性等仍有進(jìn)步空間。影像組學(xué)推動(dòng)了腫瘤精準(zhǔn)放射治療的進(jìn)程,基于影像組學(xué)的放療新技術(shù)已提高了某些癌癥的局控率和患者生存率[2]。
影像組學(xué)的圖像收集多是源于CT、MRI和PET圖像。臨床上通常使用CT檢查肺部病變,但MRI的時(shí)效性要優(yōu)于CT[3],故MRI越來越多地應(yīng)用于肺癌的輔助診斷和療效評(píng)估。PET有其獨(dú)特優(yōu)勢(shì),相對(duì)于常規(guī)CT圖像,PET提供的定量特征信息更全面。無論哪種成像方式,影像數(shù)據(jù)都應(yīng)結(jié)合臨床病例信息或基因、病理數(shù)據(jù)[4]。
Larue等[5]人認(rèn)為定量圖像分析缺少明確的標(biāo)準(zhǔn),主要表現(xiàn)在設(shè)備成像和圖像重建的參數(shù)設(shè)置,計(jì)算出來的圖像特征的數(shù)量遠(yuǎn)超研究的病人數(shù)量等方面。Li等[6]分析了收集的MRI圖像特征,認(rèn)為MRI影像組學(xué)特征結(jié)合基因檢測(cè)技術(shù),可用于預(yù)測(cè)乳腺癌的術(shù)后復(fù)發(fā)。 Zhang等[7]認(rèn)為乳腺腫瘤的鑒別診斷時(shí),從超聲圖像中提取的量化特征有診斷意義。
感興趣區(qū)通常是指病灶部位,有三種分割方式:手動(dòng)勾畫,人機(jī)交互勾畫和全自動(dòng)勾畫。臨床常使用手動(dòng)勾畫,近些年多種分割算法應(yīng)用于靶區(qū)勾畫,但人工跟蹤分割算法仍被用作金標(biāo)準(zhǔn)。目前的自動(dòng)勾畫和半自動(dòng)勾畫算法各有優(yōu)劣,自動(dòng)且高精度分割算法為未來發(fā)展方向。
圖1影像組學(xué)的流程
Figure 1. The flow work of radiomic
勾畫好靶區(qū)后,即可提取腫瘤特征。常用的特征有強(qiáng)度、形狀、紋理和小波等。每類特征都有數(shù)十種以上的信息,要提取更有效的特征信息,需對(duì)特征進(jìn)行統(tǒng)計(jì)分析。常用的分析方法有重測(cè)信度分析,主成分分析,相關(guān)性分析和聚類分析。
Parmar等[8]設(shè)計(jì)了兩個(gè)獨(dú)立的放射培訓(xùn)組(310例)和實(shí)驗(yàn)組(154例),從464例肺癌患者的治療前CT圖像中提取了共440個(gè)放射特征進(jìn)行算法評(píng)估,確定基于特征選擇方式WLCX (穩(wěn)定性=0.84±0.05, AUC=0.65±0.02) 的Wilcoxon測(cè)試和隨機(jī)森林分類器(RSD=3.52%, AUC=0.66±0.03)具有高預(yù)測(cè)性和穩(wěn)定性。
相同類型的特征會(huì)有不同的預(yù)測(cè)功能。例如,很多圖像可以提取紋理特征,分析患者CT的紋理特征可提高腫瘤療效評(píng)估的準(zhǔn)確率,紋理特征在術(shù)后預(yù)測(cè)肺癌早期復(fù)發(fā)時(shí),也有統(tǒng)計(jì)學(xué)意義[9-11]。一些研究證實(shí),基于CT的三維體積的定量特征能更早展示腫瘤變化[12-15]。
影像組學(xué)提取具有代表性的圖像特征作為新的生物標(biāo)記,對(duì)臨床輔助決策、治療效果和預(yù)后跟蹤有重要的意義。目前,其主要應(yīng)用在輔助診斷和療效預(yù)測(cè)?,F(xiàn)有研究大多基于CT和MRI圖像,入組病例多為肺癌、頭頸癌、結(jié)腸癌和前列腺癌[17-18],許多研究表明PET在肺癌的診斷和預(yù)測(cè)中有獨(dú)特的優(yōu)勢(shì)[19-21]。
Aerts等[16]通過提取肺部和頭頸部腫瘤患者的CT圖像定量特征,認(rèn)為影像組學(xué)可用于肺癌和頭頸部腫瘤的預(yù)后識(shí)別。Shiradkar等[20]提出了一種基于影像組學(xué)制訂放療計(jì)劃的框架,在定位前列腺癌時(shí),比普通方法有更高的準(zhǔn)確率。但這項(xiàng)研究的樣本數(shù)量過少,還需進(jìn)一步驗(yàn)證。Coroller等[21]從肺腺癌患者CT圖像中提取的影像組學(xué)特征顯示, 一些特征預(yù)測(cè)遠(yuǎn)轉(zhuǎn)移和生存率的準(zhǔn)確率很高。Parmar等[8]通過研究頭頸部患者的CT圖像特征發(fā)現(xiàn),特征選取的數(shù)目、圖像降維方式和分類器的選用一定程度上影響影像組學(xué)預(yù)測(cè)效果。
影像組學(xué)技術(shù)高效、安全、無創(chuàng)且無痛。目前主要用來做輔助診斷和療效評(píng)估,作為新興技術(shù),它跳過了腫瘤異質(zhì)性的障礙,有望成為臨床輔助診斷和治療工具。
影像組學(xué)蘊(yùn)含的定量特征信息為腫瘤精準(zhǔn)放療的整個(gè)過程提供了新的視角、新的方法和新的能力?;谟跋窠M學(xué)的放療新技術(shù)對(duì)有些類型的癌癥已提高了局控和患者生存率。如立體定向放射治療(SBRT)用于NSCLC,精準(zhǔn)的高劑量極大地提高了局控和整體生存率[22-26]。一些研究表明,對(duì)無法手術(shù)的患者和高齡患者,SBRT能夠精準(zhǔn)定位靶區(qū),已成為一種實(shí)用的治療方式[27-31]。而PET/CT檢查已成為新的實(shí)體瘤療效評(píng)估標(biāo)準(zhǔn)的重要參照,其影像組學(xué)特征在預(yù)測(cè)患者SBRT后的局控方面有重要意義。對(duì)精準(zhǔn)放療的應(yīng)用主要表現(xiàn)在:
許多影像組學(xué)特征可反映不同腫瘤類型。例如,通過CT密度直方圖診斷惡性肺結(jié)節(jié),彌散加權(quán)MR成像的定量特征診斷內(nèi)部抑制水分子活動(dòng)的肺部惡性腫瘤。
精準(zhǔn)放療要求精確定位靶區(qū)范圍,靶區(qū)的確定與腫瘤的侵襲與轉(zhuǎn)移相關(guān)聯(lián)。有研究發(fā)現(xiàn)NSCLC患者的CT圖像直方圖和分型維度等特征可定性描述腫瘤的侵襲與轉(zhuǎn)移[27]。
影像組學(xué)圖像的定量特征與腫瘤基因和蛋白質(zhì)水平改變有關(guān),結(jié)合病理數(shù)據(jù)有很好的基因表型預(yù)測(cè)能力。Aerts等[16]發(fā)現(xiàn),CT紋理特征參數(shù)可定性反映基因表達(dá)模式。
影像組學(xué)對(duì)放療方案的制定有輔助和檢驗(yàn)的作用,Larue等[5]發(fā)現(xiàn)一些定量圖像特征會(huì)相互依賴,做放療計(jì)劃時(shí),應(yīng)采用標(biāo)準(zhǔn)化的方式和合適的特征。為了減少危機(jī)器官的劑量并增加癌變部位劑量,Shiradkar等[20]制作了基于影像組學(xué)標(biāo)簽的前列腺癌放療計(jì)劃框架,效果明顯。
近期許多研究發(fā)現(xiàn),影像組學(xué)特征在術(shù)后預(yù)測(cè)方面有很高的準(zhǔn)確率,這使腫瘤的精準(zhǔn)放療又進(jìn)一步。Parmar等[8]通過機(jī)器學(xué)習(xí)的方法,優(yōu)化了特征選擇方式,從而確定了兩個(gè)具有高準(zhǔn)確度的預(yù)測(cè)模型。CT三維多平面重組技術(shù)為觀察靶區(qū)提供了新的視角,其體積特征對(duì)觀察腫瘤病理變化有重要意義[13-14]。而不同的圖像特征的預(yù)測(cè)效果可能會(huì)有所不同,這時(shí)要考慮特征的提取方法、特征的穩(wěn)定性和分類器的選用[8]。
影像組學(xué)的處理流程日趨完善,成效可觀,但相關(guān)技術(shù)和算法的優(yōu)化仍是挑戰(zhàn),主要表現(xiàn)在技術(shù)的可重復(fù)性,大數(shù)據(jù)的利用和數(shù)據(jù)共享等方面(如圖2)。
基于影像組學(xué)建立起來的模型是否具有普遍適用性至關(guān)重要,其中包括影像獲取的標(biāo)準(zhǔn)化、特征提取的標(biāo)準(zhǔn)化和高通量特征的穩(wěn)定性。影像組學(xué)的圖像收集主要是通過CT、PET和MRI,近期亦有對(duì)超聲圖像的研究。但是不同廠商的設(shè)備在獲取圖像時(shí)的參數(shù)設(shè)置可能不同,同一臺(tái)設(shè)備的不同參數(shù)也會(huì)使圖像產(chǎn)生差異。故從圖像中提取的特征信息的抗干擾性和穩(wěn)定性也就決定了影像組學(xué)模型的適用性。不同的影像設(shè)備圖像獲取和成像算法標(biāo)準(zhǔn)可能不同,造成灰度、小波等圖像特征的差別很大。此外,數(shù)據(jù)的過度擬合,對(duì)邊緣模糊的腫瘤分割方式等都會(huì)降低特征的穩(wěn)定性。
圖2影像組學(xué)面臨的主要挑戰(zhàn)
Figure 2. The challenges of radiomic
不同于傳統(tǒng)簡(jiǎn)單的響應(yīng)方式,高級(jí)圖像特征更復(fù)雜,且對(duì)癌癥類型、圖像獲取參數(shù)和圖像噪聲等的變化更敏感。一些研究檢驗(yàn)了高級(jí)圖像特征的穩(wěn)定性和魯棒性[32]。Hunter等[33]人檢驗(yàn)了NSCLC患者的圖像特征的可重復(fù)性。他們確定了一系列可重復(fù)的(一致性相關(guān)系數(shù)>0.9)、非冗余的(平均相似距離>0.1)和有效的圖像特征。Leijenaar等[34]發(fā)現(xiàn)大多數(shù)PET衍生的圖像特征都有較高的可重復(fù)性(71%)和穩(wěn)定性(91%),表明影像組學(xué)的進(jìn)一步研究是有根據(jù)的。Gillies等[35]人描述了一個(gè)樂觀而清晰的放射學(xué)的未來前景,并強(qiáng)調(diào)了影像組學(xué)的最大挑戰(zhàn):再現(xiàn)性、數(shù)據(jù)共享和標(biāo)準(zhǔn)。
臨床數(shù)據(jù)龐大,而可用數(shù)據(jù)相對(duì)較少。影像組學(xué)不僅要分析數(shù)據(jù),還要存儲(chǔ)數(shù)據(jù)。通過影像組學(xué)特征提取軟件可以獲取成千上萬的特征, 但通常臨床研究中的病例只有數(shù)百例,特征數(shù)量和病例的比例懸殊, 在數(shù)據(jù)分析中面臨所謂的“維度災(zāi)難”的問題[36]。此外,還要對(duì)研究人員可能會(huì)問到的問題和所需數(shù)據(jù)類型分類,平衡臨床上數(shù)據(jù)收集的效率和實(shí)用性。這要求高性能計(jì)算機(jī)服務(wù)器和高人力投入。機(jī)器學(xué)習(xí)可解決大數(shù)據(jù)的問題,但仍有挑戰(zhàn):可用數(shù)據(jù)相對(duì)較少,難以建立因果關(guān)系的映射。它雖然能給出關(guān)于疾病的分析結(jié)果,卻不能給出推理證明。機(jī)器學(xué)習(xí)基于大數(shù)據(jù)建立模型,應(yīng)用于影像組學(xué)的輔助診斷、療效評(píng)估和預(yù)后分析等方面。例如,利用機(jī)器學(xué)習(xí)確定病人基因類型和靶向藥物從而避免使用穿刺活檢;基于皮膚癌圖像數(shù)據(jù),通過遷移學(xué)習(xí)技術(shù)建立深度學(xué)習(xí)網(wǎng)絡(luò)模型,精準(zhǔn)分類皮膚癌。Aerts等[16]利用機(jī)器學(xué)習(xí)的方法,將1 019例肺癌和頭頸癌患者的影像和病理數(shù)據(jù)結(jié)合起來,定量分析降維后的圖像特征。結(jié)果顯示影像組學(xué)標(biāo)簽的預(yù)后價(jià)值明顯。
機(jī)器學(xué)習(xí),或者說強(qiáng)化學(xué)習(xí)的關(guān)鍵在于數(shù)據(jù)與結(jié)果間的映射。即如何讓強(qiáng)化學(xué)習(xí)模型評(píng)價(jià)自己得出的結(jié)果的優(yōu)劣,并不斷進(jìn)行強(qiáng)化學(xué)習(xí),來提升分類的準(zhǔn)確度和預(yù)測(cè)的精確度。這需要解決三個(gè)問題:一是量化特征與標(biāo)簽(如腫瘤療效)的匹配,二是如何讓模型評(píng)價(jià)自己的得出結(jié)果,三是如何讓模型根據(jù)自己的評(píng)價(jià)結(jié)果提高準(zhǔn)確度。
建立基于影像組學(xué)的生物標(biāo)志物,最大的挑戰(zhàn)是多個(gè)中心之間共享圖像數(shù)據(jù)和元數(shù)據(jù)。多中心試驗(yàn)具有不同的患者群體,可創(chuàng)建足夠大的數(shù)據(jù)庫以獲得統(tǒng)計(jì)能力[34-36]。數(shù)據(jù)共享是所有生物醫(yī)學(xué)研究中的共同挑戰(zhàn),除了克服文化、行政、管理和個(gè)人問題之外,還有數(shù)據(jù)保護(hù)、大數(shù)據(jù)傳輸?shù)燃夹g(shù)問題[36-40]。
影像組學(xué)早期用于評(píng)價(jià)放療效果,而目前結(jié)合臨床信息已能用于腫瘤分型、鑒別診斷、臨床決策和療效監(jiān)測(cè)等方面,推動(dòng)了腫瘤的精準(zhǔn)放療。我們相信,隨著人工智能算法的演進(jìn),影像組學(xué)模型將對(duì)靶區(qū)的定位更加精準(zhǔn),且對(duì)放療效果的預(yù)測(cè)更加準(zhǔn)確。
作者聲明:本文第一作者對(duì)于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;
利益沖突:本文全部作者均認(rèn)同文章無相關(guān)利益沖突;
學(xué)術(shù)不端:本文在初審、返修及出版前均通過中國知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)學(xué)術(shù)不端檢測(cè);
同行評(píng)議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。