曲曉霞, 鮮軍舫
影像組學(xué)(radiomics)和醫(yī)學(xué)影像人工智能(artificial intelligence,AI)在全身各部位或器官疾病的顯示、診斷和鑒別診斷、分期和分級(jí)、術(shù)前評(píng)估、療效監(jiān)測和預(yù)后等方面的研究廣泛開展[1-2],影像AI產(chǎn)品也幾乎涉及所有器官或疾病,部分產(chǎn)品已取得國家藥監(jiān)局三類醫(yī)療器械注冊(cè)證[3],顯著提高了診療水平和效率,促進(jìn)了個(gè)性化診療的實(shí)施。頭頸部器官和結(jié)構(gòu)多,病變發(fā)病率較低,雖然全國各地臨床和影像科都希望借助影像組學(xué)和AI來規(guī)范和提高頭頸部影像學(xué)水平,對(duì)影像組學(xué)和AI在頭頸部的研究和推廣應(yīng)用寄予了很高的期望,但由于頭頸部情況特殊,與其它部位相比,影像組學(xué)和AI的研究相對(duì)困難、步履維艱,AI研究需要的樣本量大,故頭頸部疾病的AI相關(guān)研究開展起來更難。此外,絕大部分影像組學(xué)和AI的研究是基于技術(shù)導(dǎo)向和論文導(dǎo)向,而不是基于目標(biāo)和問題導(dǎo)向;同時(shí),大部分影像醫(yī)師對(duì)影像組學(xué)參數(shù)及含義缺乏了解,也極大地阻礙了其發(fā)展。因此,我們要積極轉(zhuǎn)變意識(shí),認(rèn)真總結(jié)和分析,找到問題和癥結(jié),推進(jìn)頭頸部影像組學(xué)和醫(yī)學(xué)影像AI的發(fā)展。
1.影像組學(xué)的參數(shù)及內(nèi)涵
影像組學(xué)采用高通量特征提取算法對(duì)影像學(xué)數(shù)據(jù)進(jìn)行定量分析,提取全部特征,然后對(duì)這些影像組學(xué)特征進(jìn)行定量分析,挑選出能預(yù)測診斷、療效和預(yù)后等的特征集合,即“影像組學(xué)標(biāo)簽(radiomic signature)”。影像組學(xué)是將影像的定量分析與機(jī)器學(xué)習(xí)等方法有機(jī)結(jié)合起來,充分應(yīng)用影像組學(xué)標(biāo)簽建立預(yù)測診斷、療效和預(yù)后等的模型,突破了以往僅僅只是形態(tài)學(xué)和半定量分析的局限性和瓶頸,為臨床決策和精準(zhǔn)診療提供個(gè)性化的量化信息[2]。影像組學(xué)包括影像數(shù)據(jù)采集、標(biāo)注與分割、特征提取和定量分析、特征選擇、模型建立及臨床驗(yàn)證等步驟,尤其是臨床驗(yàn)證和推廣應(yīng)用是影像組學(xué)的靈魂和目的,沒有臨床驗(yàn)證和推廣應(yīng)用,即使再好的影像組學(xué)標(biāo)簽和模型,也都只是空中樓閣和海市蜃樓。
影像組學(xué)特征可以分為形狀特征、一階直方圖特征以及二階直方圖或紋理特征[2]。形狀特征指選取感興趣區(qū)大小的特征及與球體相似程度的特征,包括體積、表面積、最大徑、有效直徑、表面體積比、致密度、偏心度和球形度等。一階直方圖特征指與體素強(qiáng)度分布有關(guān)的特征,可反映體素的對(duì)稱性、均勻性以及局部強(qiáng)度分布的變化,包括最小值、最大值、平均數(shù)或中位數(shù)、標(biāo)準(zhǔn)差、偏度和峰度等,常由直方圖分析計(jì)算獲得。二階直方圖或紋理特征是指體素空間分布強(qiáng)度等級(jí)的特征,主要包括灰度共生矩陣(gray level co-occurrence matrix,GLCM)和灰度級(jí)長矩陣(gray level run-length matrix,GLRLM)等。灰度共生矩陣是表示灰度值的矩陣,包括熵(與異質(zhì)性有關(guān))、能量(與均勻性有關(guān))、對(duì)比度、同質(zhì)性(與局部灰度均衡性有關(guān))、不相似性和相關(guān)性?;叶燃?jí)長矩陣是指在圖像的二維矩陣中預(yù)設(shè)方向上強(qiáng)度相同的連續(xù)體素的長度[2]。
2.影像組學(xué)在診斷和鑒別診斷方面的研究進(jìn)展
基于MRI或CT的影像組學(xué)特征顯著提升了腮腺[4-5]、淚腺[6]、眼球[7]、眼眶[8]、鼻竇[9]和甲狀腺[10]等部位良惡性病變的鑒別能力,敏感度為75%~100%,特異度為88%~93%?;贑T 影像組學(xué)特征建立的邏輯回歸模型鑒別頭頸部淋巴結(jié)木村病和淋巴瘤的AUC分別達(dá)到0.987(訓(xùn)練組)和0.938(訓(xùn)練組),具有很高的診斷效能[11]。本期發(fā)表的《基于CT影像組學(xué)模型鑒別頭頸部良、惡性淋巴結(jié)》[12]一文中,CT影像組學(xué)模型顯著提高了對(duì)頭頸部淋巴結(jié)良惡性的鑒別診斷效能,ROC曲線下面積(AUC)達(dá)到了0.958。
頸部淋巴結(jié)轉(zhuǎn)移是甲狀腺乳頭狀癌復(fù)發(fā)及遠(yuǎn)處轉(zhuǎn)移的高危因素,術(shù)前準(zhǔn)確檢出淋巴結(jié)轉(zhuǎn)移對(duì)選擇治療方案和評(píng)估預(yù)后具有重要價(jià)值。本期發(fā)表的《基于CT增強(qiáng)圖像影像組學(xué)預(yù)測甲狀腺乳頭狀癌頸部淋巴結(jié)轉(zhuǎn)移》[13]的研究中,結(jié)果表明基于CT增強(qiáng)圖像使用非線性判別分析的診斷模型的錯(cuò)判率僅3.08%,敏敏度和特異度分別達(dá)98.46%和95.38%。本期發(fā)表的《4D-CT影像組學(xué)模型鑒別甲狀旁腺良性病變與淋巴結(jié)的應(yīng)用初探》[14]一文的結(jié)果表明,基于CT平掃和增強(qiáng)掃描及聯(lián)合診斷模型在鑒別甲狀旁腺腺瘤或增生與頸部淋巴結(jié)中的診斷效能較高,AUC為0.869~0.962、敏感度為0.813~0.934、特異度為0.693~0.933。
基于MRI的灰度共生矩陣紋理特征預(yù)測舌癌患者頸部淋巴結(jié)轉(zhuǎn)移的研究結(jié)果顯示,熵用于預(yù)測是否轉(zhuǎn)移的AUC為0.90,閾值為7.19,敏感度為80.0%,特異度為86.7%;厚度的AUC為0.81,閾值為11.19mm,敏感度為78.0%,特異度為81.7%。而影像醫(yī)師基于MRI表現(xiàn)診斷頸部淋巴結(jié)轉(zhuǎn)移的敏感度僅65.0%,特異度為80.0%[15]。
3.影像組學(xué)在腫瘤分級(jí)及分期方面的研究進(jìn)展
一項(xiàng)基于磁共振表觀擴(kuò)散系數(shù)(ADC)圖的紋理分析預(yù)測舌和口底鱗狀細(xì)胞癌組織學(xué)分級(jí)(Ⅰ、Ⅱ、Ⅲ級(jí))的結(jié)果表明:ADC值第10百分位數(shù)(ADC10)、熵及聯(lián)合模型的ROC曲線下面積(AUC)分別為0.72、0.75和0.81[16],預(yù)測能力優(yōu)于單一的ADC值。
影像組學(xué)在喉及下咽癌、舌和口底鱗狀細(xì)胞癌的分期方面也取得了較好的效果。喉及下咽鱗狀細(xì)胞癌侵犯甲狀軟骨的臨床分期為T4期,常需進(jìn)行全喉切除術(shù)。基于增強(qiáng)CT的影像組學(xué)特征預(yù)測喉及下咽鱗狀細(xì)胞癌侵犯甲狀軟骨的AUC為0.876~0.905,顯著高于放射科醫(yī)師的診斷效能(AUC為0.721)[17]。
4.影像組學(xué)在預(yù)后預(yù)測方面的研究進(jìn)展
基于增強(qiáng)CT影像組學(xué)特征的列線圖預(yù)測喉鱗狀細(xì)胞癌術(shù)后總生存率的C指數(shù)在訓(xùn)練隊(duì)列和驗(yàn)證隊(duì)列分別為0.817和0.913,預(yù)測效能明顯提高[18]?;赥2WI和增強(qiáng)后T1WI的影像組學(xué)特征顯著提高了晚期鼻咽癌預(yù)后的預(yù)測能力,C指數(shù)為0.761,優(yōu)于T2WI或增強(qiáng)后T1WI的影像組學(xué)特征,也優(yōu)于TNM分期[19]。
5.頭頸部影像組學(xué)研究的局限性及改進(jìn)措施
頸部淋巴結(jié)轉(zhuǎn)移對(duì)于預(yù)后和是否實(shí)施頸淋巴結(jié)清掃非常關(guān)鍵,因此,影像組學(xué)在頸部淋巴結(jié)轉(zhuǎn)移診斷方面的研究比較多,診斷效能較高,但實(shí)際情況可能并非如此,由于對(duì)頸部淋巴結(jié)轉(zhuǎn)移的判斷標(biāo)準(zhǔn)是以區(qū)域淋巴結(jié)全部轉(zhuǎn)移或無轉(zhuǎn)移來定的,結(jié)果的可靠性需要采用淋巴結(jié)影像與病理點(diǎn)對(duì)點(diǎn)對(duì)照的前瞻性研究方案來驗(yàn)證和糾正。此外,相關(guān)文獻(xiàn)顯示影像組學(xué)分析在兩種或幾種具體疾病方面的診斷效能也比較高,但與臨床實(shí)際場景不一致,應(yīng)該是將該部位的所有病變納入研究對(duì)象,在今后的研究設(shè)計(jì)中要重點(diǎn)關(guān)注上述結(jié)果的可重復(fù)性和可靠性的問題。
在組學(xué)分析過程中,需在病變或結(jié)構(gòu)內(nèi)勾畫感興趣區(qū)(ROI),勾畫方法有手動(dòng)法、半自動(dòng)法和自動(dòng)法。手動(dòng)勾畫法的準(zhǔn)確性較高,對(duì)不規(guī)則病變或結(jié)構(gòu)的邊界勾畫相對(duì)精準(zhǔn),但受人為主觀因素的影響較大,可重復(fù)性相對(duì)較低,耗時(shí)較長,效率較低,而且對(duì)于大樣本量研究,手動(dòng)勾畫的工作量更大,投入的人力、物力和財(cái)力更多。與手動(dòng)法相比,半自動(dòng)或自動(dòng)勾畫標(biāo)注法的可重復(fù)性較高,效率也比較高。其中,半自動(dòng)法為目前影像組學(xué)研究中勾畫ROI的主要方法。但是頭頸部結(jié)構(gòu)精細(xì),病變小,部分病變常累及鄰近的不規(guī)則間隙、神經(jīng)和血管,采用半自動(dòng)勾畫法的效果不佳[20],通常需采用手動(dòng)勾畫。因此,頭頸部病變的影像組學(xué)研究開展起來比較困難,這可能是頭頸部病變影像組學(xué)發(fā)表的文章較少、臨床工作中應(yīng)用更難的主要原因之一。怎樣提高頭頸部病變或結(jié)構(gòu)的勾畫效率和可重復(fù)性是頭頸部影像組學(xué)研究和應(yīng)用的重大挑戰(zhàn),是頭頸部影像組學(xué)未來能否順利發(fā)展和提升的關(guān)鍵點(diǎn)之一。
與其它領(lǐng)域的組學(xué)研究一樣,人們寄希望于影像組學(xué)能夠獲得疾病的生物標(biāo)志物,盡管研究報(bào)道影像組學(xué)特征對(duì)診斷、療效評(píng)估和預(yù)后預(yù)測有較高的敏感度、特異度和符合率,但在臨床實(shí)際工作中需要驗(yàn)證和檢測。驗(yàn)證分為內(nèi)部驗(yàn)證和外部驗(yàn)證,內(nèi)部驗(yàn)證可消除過擬合形成的結(jié)果虛高的情況。
鼻骨區(qū)是顱面部外傷中最常受累部位,但由于鼻骨區(qū)體積較小且解剖結(jié)構(gòu)細(xì)微,該部位骨折容易被漏診及誤診。本期發(fā)表的《鼻骨區(qū)骨折深度學(xué)習(xí)模型的建立和臨床效能評(píng)估》[21]一文中使用CT圖像深度學(xué)習(xí)法建立AI模型,對(duì)鼻骨區(qū)骨折進(jìn)行探測,結(jié)果顯示:AI模型檢出骨折的敏感度為86.64%,特異度為41.99%,符合率為68.71%,能夠提高低年資醫(yī)師對(duì)鼻骨區(qū)骨折的診斷效能,縮小與高年資醫(yī)師之間的差距。
甲狀腺癌術(shù)前對(duì)甲狀腺結(jié)節(jié)良、惡性進(jìn)行判斷至關(guān)重要。本期發(fā)表的《基于CT雙期增強(qiáng)圖像的深度遷移學(xué)習(xí)模型對(duì)甲狀腺良惡性結(jié)節(jié)的分類研究》[22]一文中,對(duì)比分析了3種深度遷移學(xué)習(xí)(deep transfer learning,DTL)模型(VGG19、ResNet50和DenseNet201)對(duì)甲狀腺良惡性結(jié)節(jié)的鑒別診斷效能,結(jié)果顯示DenseNet201模型獲得了最好的訓(xùn)練和測試結(jié)果,在訓(xùn)練集和測試集中的最高預(yù)測符合率分別為1.00和0.98。
由于AI技術(shù)要求樣本量較大,所以其在頭頸部的研究和試驗(yàn)產(chǎn)品相對(duì)較少。盡管如此,相信通過努力,AI可通過對(duì)頭頸部疾病的檢測和測量以及通過結(jié)構(gòu)式標(biāo)準(zhǔn)報(bào)告來規(guī)范影像報(bào)告,將會(huì)為臨床提供診斷、治療前評(píng)估、疾病監(jiān)測和預(yù)后的定量信息,助力個(gè)性化臨床決策和精準(zhǔn)診療。
頭頸部病變的發(fā)病率相對(duì)較低,樣本量一般較小,與其它部位常見病變相比,其影像組學(xué)和AI算法結(jié)果的可靠性和可重復(fù)性更要值得重視,希望通過嚴(yán)格規(guī)范的多中心研究獲得較大樣本量病例,來提高結(jié)果的可靠性和可重復(fù)性。第二,與其它部位一樣,目前對(duì)這些通過影像組學(xué)或AI算法獲得的影像學(xué)參數(shù)或標(biāo)志物的生物學(xué)意義尚知之甚少,有的可能完全不知道。盡管文獻(xiàn)報(bào)道過一些影像學(xué)參數(shù)或標(biāo)志物與腫瘤分級(jí)、炎性細(xì)胞浸潤、基因表達(dá)、基因突變和信號(hào)傳導(dǎo)通路等具有相關(guān)性,但仍要進(jìn)一步研究影像組學(xué)或AI算法,解開“黑箱”之謎,弄清楚這些參數(shù)代表的臨床和/或分子含義。第三,從知識(shí)維度來講,知識(shí)可分為“明知識(shí)”和“潛知識(shí)”?!懊髦R(shí)”(或者稱為“顯知識(shí)”)是可以表達(dá)的知識(shí),而“潛知識(shí)”(或者稱為“默知識(shí)”)是可以感受但沒法清楚表達(dá)的知識(shí)。而“暗知識(shí)”的概念是隨著機(jī)器學(xué)習(xí)深入發(fā)展應(yīng)運(yùn)而生的[23],是指機(jī)器能夠明白、但人既不能清楚表達(dá)又不能夠直觀感受的知識(shí),其擴(kuò)大了以前的知識(shí)維度。在臨床實(shí)際工作中,醫(yī)師如何充分利用只有機(jī)器才能夠明白的“暗知識(shí)”為頭頸部疾病的精準(zhǔn)診療、隨訪監(jiān)測和預(yù)后預(yù)測提供更多信息,是頭頸部AI和影像組學(xué)未來發(fā)展的方向和目標(biāo),也是其能夠真正走進(jìn)臨床并充分發(fā)揮作用的必由之路和希望之路。第四,從目前研究現(xiàn)狀和發(fā)表的論文來看,與其它部位一樣,大多數(shù)頭頸部疾病的影像組學(xué)和AI研究是基于技術(shù)驅(qū)動(dòng)和論文導(dǎo)向,而真正基于目標(biāo)導(dǎo)向和問題導(dǎo)向的研究相對(duì)較少。因此,我們既要重視影像醫(yī)師基本功和臨床思維的培養(yǎng),又要進(jìn)一步明確臨床問題并開展“以患者為中心、以臨床問題為導(dǎo)向”的AI和影像組學(xué)研究,充分挖掘和提取頭頸部影像信息,為患者提供個(gè)性化臨床決策和精準(zhǔn)診療。