孟鈺婷 徐姣娜 裘可凡 牛國(guó)忠*
作者單位: 310053 浙江中醫(yī)藥大學(xué)第四臨床醫(yī)學(xué)院(孟鈺婷 徐姣娜 裘可凡)310006 浙江大學(xué)附屬杭州市第一人民醫(yī)院(牛國(guó)忠)
腦卒中是世界范圍內(nèi)死亡和殘疾的主要原因,全球終生風(fēng)險(xiǎn)約為25%[1]。我國(guó)腦卒中也是致殘率第一的疾?。?]。在臨床實(shí)踐中,顱腦計(jì)算機(jī)斷層掃描(computed tomography,CT)或磁共振成像(magnetic resonance imaging,MRI)是腦卒中分析研究和臨床決策的支柱。近年來(lái),隨著現(xiàn)代醫(yī)療服務(wù)數(shù)字化,在大數(shù)據(jù)領(lǐng)域,人工智能有助于高效數(shù)據(jù)處理、分析和生產(chǎn)數(shù)據(jù)建模。機(jī)器學(xué)習(xí)是人工智能的核心,是一種自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并提供預(yù)測(cè)的算法,而深度學(xué)習(xí)(deep learning,DL)是機(jī)器學(xué)習(xí)領(lǐng)域的重要分支,已經(jīng)引起了研究者巨大的興趣。
深度學(xué)習(xí)是一類模式分析方法的統(tǒng)稱,它使用復(fù)雜的多層神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu),將輸入信息轉(zhuǎn)換為多層抽象層次自動(dòng)學(xué)習(xí)數(shù)據(jù),這些技術(shù)的強(qiáng)大之處主要基于其自動(dòng)提取相關(guān)特征的能力[3]。深度學(xué)習(xí)可以分為監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí),在監(jiān)督學(xué)習(xí)中,計(jì)算機(jī)被給予標(biāo)記的數(shù)據(jù)集,其中對(duì)象已被預(yù)分類,并且該算法尋找區(qū)分每個(gè)分類中對(duì)象的特征。相反,對(duì)于無(wú)監(jiān)督學(xué)習(xí),沒有使用標(biāo)準(zhǔn)的圖像或分類,計(jì)算機(jī)本身必須確定類別[4]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)是深度學(xué)習(xí)代表的算法之一,它就像是人類的神經(jīng)網(wǎng)絡(luò),低級(jí)信息輸入與神經(jīng)元的下一級(jí)形成連接,第二層中的每個(gè)神經(jīng)元可以組合來(lái)自較低級(jí)別神經(jīng)元的輸入以形成更新、更復(fù)雜輸出,隨著中間層或隱藏層數(shù)量的增加,最高層輸出的允許復(fù)雜性和豐富性也隨之增加。簡(jiǎn)單的基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法通常只包括少數(shù)這些層,深度學(xué)習(xí)算法包括更多層與層的連接[3-4]。在圖像識(shí)別任務(wù)中,其中深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural networks,DCNN)是最常用的模型[5]。深度學(xué)習(xí)可以在幾天內(nèi)從標(biāo)記的數(shù)據(jù)集中自動(dòng)創(chuàng)建這樣的分類器,在冗雜的數(shù)據(jù)中自動(dòng)提取相關(guān)特征,從而達(dá)到人工分類無(wú)法實(shí)現(xiàn)的目標(biāo),已經(jīng)在許多醫(yī)學(xué)疾病的診斷和預(yù)后預(yù)測(cè)展現(xiàn)出獨(dú)特的優(yōu)勢(shì)。
2.1 輔助診斷 缺血性腦卒中診斷的金標(biāo)準(zhǔn)是MRI,但CT和CT 灌注成像(CT perfusion imaging,CTP)也是不可或缺的手段,由于不同的影像手段優(yōu)勢(shì)不同,醫(yī)師主觀判斷存在一定的局限性,如何從輔助檢查的資料中更快獲得更多有用的信息是亟待解決的問題,而深度學(xué)習(xí)在這方面取得了一定進(jìn)展。在缺血性腦卒中的輔助診斷時(shí),需要減少計(jì)算時(shí)間,提高敏感度和特異度,降低假陽(yáng)性率。深度學(xué)習(xí)的優(yōu)勢(shì)主要體現(xiàn)在對(duì)血管的評(píng)估、卒中梗死面積的分割、各類評(píng)分等方面,有助于更好更快輔助診斷腦梗死。
在 自 動(dòng) 檢 測(cè)AIS 方 面,CETINOGLU 等[11]基 于MobileNetV2 和EfficientNet-B0 CNN 模型在彌散加權(quán)圖像(diffusion-weighted imaging,DWI)上識(shí)別缺血性腦卒中及其血管區(qū)域分類,并取得了很高的準(zhǔn)確率,有助于進(jìn)一步應(yīng)用于自動(dòng)檢測(cè)中風(fēng)。WANG 等[12]基于非對(duì)比計(jì)算機(jī)斷層掃描(noncontrast computed tomography,NCCT)和CT 血管造影(CT angiography,CTA)圖像,利用端到端3D 卷積神經(jīng)網(wǎng)絡(luò)模型在識(shí)別AIS 位置和體積方面,與CTP-RAPID 診斷準(zhǔn)確性相當(dāng),在沒有CTP 的基層醫(yī)院幫助臨床醫(yī)師檢測(cè)AIS 病變等方面具有很高的潛力。在AIS 診斷中,MRI 中的DWI 比CT 檢測(cè)更加可靠[13],而NISHIO 等[14]開發(fā)一個(gè)基于NCCT 自動(dòng)化AIS 檢測(cè)系統(tǒng),通過(guò)構(gòu)建兩階段DL 檢測(cè)模型,采用You Only Look Once v3模型聯(lián)合Visual Geometry Group 16的減少假陽(yáng)性模型,顯著提高放射科醫(yī)師檢測(cè)AIS 的靈敏度。
在卒中梗死面積分割方面,DL 也展現(xiàn)出獨(dú)特的優(yōu)勢(shì)。準(zhǔn)確的醫(yī)學(xué)圖像分割可以進(jìn)一步幫助臨床醫(yī)師評(píng)估患者對(duì)AIS的治療反應(yīng),并為手術(shù)計(jì)劃和康復(fù)策略提供可靠的依據(jù)[15]。在圖像分割方面,F(xiàn)CN、U-Net、GAN 和Transformer 都具有較強(qiáng)的特征提取能力[16]。此外為了彌補(bǔ)模型的短板,很多研究衍生出一些改進(jìn)模型。在2018 年的群島挑戰(zhàn)(AIS 病變分割),大部分團(tuán)隊(duì)都是使用CNN 的DL 方法,并且取得了不錯(cuò)的成績(jī)。SONG 等[9]使用深度學(xué)習(xí)生成對(duì)抗網(wǎng)絡(luò)算法,用CTP 數(shù)據(jù)創(chuàng)建了偽DWI 圖像,使用鑒別器比較真?zhèn)蜠WI,并提取區(qū)分的特征以提高其預(yù)測(cè)偽DWI 病變的能力,再對(duì)偽DWI 圖像進(jìn)行分割,該方法平均Dice 系數(shù)(dice score coefficient,DSC)為(0.51±0.31),優(yōu)于傳統(tǒng)基于閾值的腦血流量方法[17]。YU等[18]使用注意力門控DCNN 探索單獨(dú)訓(xùn)練、預(yù)訓(xùn)練和閾值訓(xùn)練三種不同方法,結(jié)果表明預(yù)先練習(xí)模型在訓(xùn)練最小和最大再灌注模型比單獨(dú)訓(xùn)練兩個(gè)模型和利用依賴于表觀擴(kuò)散系數(shù)和達(dá)峰時(shí)間的閾值訓(xùn)練表現(xiàn)出色,證明使用預(yù)訓(xùn)練預(yù)測(cè)中風(fēng)成像的可行性。由于相較于健康組織,病變梗死面積較小,這導(dǎo)致了分類不平衡,這會(huì)導(dǎo)致有偏見的學(xué)習(xí),從而損害細(xì)分績(jī)效。CLèRIGUES 等[19]采用對(duì)稱模態(tài)增強(qiáng)進(jìn)行預(yù)處理,使用平衡訓(xùn)練補(bǔ)丁采樣策略和動(dòng)態(tài)加權(quán)損失函數(shù)的小斑塊來(lái)解決類別不平衡的問題。KUMAR 等[20]則使用了Classifier 分類器網(wǎng)絡(luò)過(guò)濾掉所有不需要非病變圖像切片。由于DL 模型圖像分割需要利用大量的數(shù)據(jù)和高質(zhì)量的體素級(jí)標(biāo),大多數(shù)基于CNN 的方法都需要對(duì)大量完全標(biāo)注的主題進(jìn)行訓(xùn)練,需要花費(fèi)大量時(shí)間,ZHAO 等[21]使用398 個(gè)弱標(biāo)記和5 個(gè)完全標(biāo)記的主題的弱監(jiān)督學(xué)習(xí)方法來(lái)促進(jìn)AIS 病變較高的分割精度。CHEN 等[15]研究一種改進(jìn)的平均教師網(wǎng)絡(luò)和對(duì)抗網(wǎng)絡(luò)相結(jié)合的半監(jiān)督分割架構(gòu),將對(duì)抗網(wǎng)絡(luò)深度集成到改進(jìn)的多尺度平均教師模型中,用于腦損傷的分割。不但提高了分割結(jié)果,整體性能也優(yōu)于目前最先進(jìn)的一致性訓(xùn)練和形狀感知學(xué)習(xí)半監(jiān)督醫(yī)學(xué)圖像分割方法。
在評(píng)估血管方面,NIELSEN 等[22]比較基于門控循環(huán)單元DL 模型和基于專家對(duì)大腦中動(dòng)脈M1 段機(jī)械取栓再通的評(píng)估在改良腦梗死溶栓分級(jí)(modified thrombolysis in cerebral infarction score,mTICI)上具有一致性,證明DL 在自動(dòng)TICI評(píng)分具有較大潛力。STIB 等[23]提出基于DenseNet-121 DL 檢測(cè)大血管閉塞模型,通過(guò)使用延遲期CTA 提高了診斷性能。ROSA 等[24]提出以動(dòng)脈輸入函數(shù)為主要輸入模型,用一種端到端的監(jiān)督CNN 來(lái)估計(jì)灌注成像中的血管功能,在血管功能估計(jì)方面和核心病變量化方面達(dá)到了評(píng)估的水平。
關(guān)于阿爾伯塔腦卒中計(jì)劃早期診斷評(píng)分(alberta stroke program early ct score,ASPECT),CHENG 等[25]采用DL 的自動(dòng)軟件工具(eDWI-ASPECTS)計(jì)算的DWI-ASPECTS,其性能與神經(jīng)放射科醫(yī)師對(duì)評(píng)分評(píng)估相當(dāng),但由于評(píng)分規(guī)則的不確定和中線移位干擾導(dǎo)致M5、內(nèi)囊和尾狀核區(qū)域的評(píng)分一致性較差或中等。
2.2 臨床干預(yù)及預(yù)后預(yù)測(cè) 中風(fēng)是導(dǎo)致長(zhǎng)期殘疾的主要原因,其預(yù)后與及時(shí)干預(yù)直接相關(guān),而神經(jīng)影像數(shù)據(jù)與預(yù)測(cè)治療結(jié)果之間的重要相關(guān)性。在臨床干預(yù)及預(yù)后預(yù)測(cè)這方面,深度學(xué)習(xí)可以發(fā)揮其獨(dú)特的優(yōu)勢(shì)。利用深度學(xué)習(xí)模型可以預(yù)測(cè)最終梗死面積,幫助醫(yī)師及患者選擇臨床治療方案。HO[26]開發(fā)一種基于自編碼器架構(gòu)的DL 算法,從磁共振灌注成像(perfusion-weighted imaging,PWI)中提取潛在代表性成像特征(即深度特征)來(lái)預(yù)測(cè)卒中的發(fā)病時(shí)間,為指導(dǎo)AIS 治療的操作決策提供了支持。WANG 等[27]開發(fā)和評(píng)估一種DL 模型,以動(dòng)態(tài)敏感對(duì)比灌注MRI 中的灌注病灶為監(jiān)督,從而自動(dòng)化識(shí)別動(dòng)脈自旋標(biāo)記圖像中的低灌注病灶和半暗帶。DEBS等[28]將再灌注狀態(tài)納入CNN 的模型在預(yù)測(cè)最終梗死面積方面,比臨床使用的灌注-擴(kuò)散失配模型獲得了更高的AUC和Dice 相似系數(shù)。通過(guò)比較再灌注成功與失敗情況下梗死率的預(yù)測(cè),有助于估計(jì)治療效果并指導(dǎo)患者治療決策的選定。WOUTERS 等[29]采用深度神經(jīng)網(wǎng)絡(luò)模型通過(guò)CT 源灌注圖像預(yù)測(cè)了急性大血管AIS 患者的最終梗死體積并得出了單個(gè)梗死生長(zhǎng)速率,可以幫助醫(yī)師預(yù)測(cè)不同情況下的最終梗死體積,包括再通時(shí)間和mTICI 評(píng)分。此外,HILBERT 等[30]使用殘差網(wǎng)絡(luò)模型的自動(dòng)圖像分析在預(yù)測(cè)AIS 患者血管內(nèi)治療后的預(yù)后上優(yōu)于基于放射圖像生物標(biāo)志物的預(yù)測(cè)。在另一研究中,NISHI 等[31]采用DL 獲得預(yù)后信息能夠更好預(yù)測(cè)大血管閉塞患者的長(zhǎng)期臨床結(jié)局,與基于DWI-ASPECTS 和缺血性核心梗死體積數(shù)據(jù)相比。但在ASPECTS 0~4 分/大缺血核心梗死體積≥70 mL 亞組的患者中,不具有優(yōu)勢(shì)。
腦梗死出血性轉(zhuǎn)化(Hemorrhagic transformation,HT)是卒中的嚴(yán)重并發(fā)癥之一,精準(zhǔn)預(yù)測(cè)患者出血的可能性對(duì)疾病治療及預(yù)后起著重要的作用。YU 等[32]使用基線MRI 的門控注意力U-net模型不但能預(yù)測(cè)沒有再灌注信息的AIS患者3~7 d 的梗死灶,并提供了包括水腫和HT 面積在內(nèi)的亞急性腦卒中病變的綜合估計(jì)。JIANG 等[33]開發(fā)和驗(yàn)證基于多參數(shù)磁共振成像的CNN 模型自動(dòng)化預(yù)測(cè)AIS 患者血管內(nèi)取栓后HT 具有較高的準(zhǔn)確性和較好的泛化能力。其中用切片數(shù)據(jù)集可以用來(lái)進(jìn)行模型訓(xùn)練并替換感興趣體積數(shù)據(jù)集,而提出的基于DWI、PWI 和臨床多參數(shù)DL 模型的預(yù)測(cè)性能和泛化性最好,可以協(xié)助血管內(nèi)治療后的AIS 患者的圍手術(shù)期管理。
人工智能初步代替人工在醫(yī)療上的作用是大家廣泛關(guān)注的話題,DL 作為人工智能的先進(jìn)方向,既是機(jī)遇又是挑戰(zhàn)。3.1 缺少多中心大樣本的檢驗(yàn) 雖然DL 被各類學(xué)者廣泛研究,但大多數(shù)是單中心小樣本小范圍的研究,所研究的數(shù)據(jù)缺乏廣普性,而且大多數(shù)研究的局限性都有提及模型的過(guò)擬合和缺乏魯棒性,因而在未來(lái)需要建立多中心大樣本的數(shù)據(jù)庫(kù),以供學(xué)者研究、檢驗(yàn)?zāi)P托阅?,改善模型上不足。此外,?duì)多廠商掃描儀提出規(guī)范化的標(biāo)準(zhǔn),使其獲得的圖像數(shù)據(jù)統(tǒng)一化,這也有利于DL 模型更好適用于臨床。
3.2 DL 被稱為黑盒,其學(xué)習(xí)和分類機(jī)制過(guò)于復(fù)雜和難以理解,難以解釋單個(gè)結(jié)果的來(lái)源,不能解釋如何通過(guò)DL 模型精確計(jì)算結(jié)果,臨床決策的理想循證使得醫(yī)學(xué)適用性受到質(zhì)疑。因而需要進(jìn)一步研究模型可視化,以提供洞察網(wǎng)絡(luò)的決策過(guò)程。
3.3 人工智能應(yīng)用于醫(yī)學(xué)需要多學(xué)科聯(lián)合研究。人工智能研究員對(duì)臨床了解不深入,而臨床工作者對(duì)深度學(xué)習(xí)知識(shí)比較薄弱,研究結(jié)果適用于對(duì)描述的研究人群具有相似特征的患者,還無(wú)法廣泛應(yīng)用于現(xiàn)實(shí)臨床的情況在應(yīng)用。這需要臨床科室、輔助科室和研究人工智能的團(tuán)隊(duì)聯(lián)合采取多學(xué)科合作方式來(lái)達(dá)到共贏。而真正適用于臨床實(shí)際情況的模型,需要臨床醫(yī)師的輔助、大量訓(xùn)練和不斷改進(jìn)來(lái)提高模型的性能。
DL 廣泛應(yīng)用于AIS 在輔助診斷和臨床預(yù)測(cè)愈后,并起到了重要作用。在目前深度學(xué)習(xí)模型無(wú)法代替醫(yī)務(wù)人員的臨床診斷,但在無(wú)論是在自動(dòng)檢測(cè)卒中、對(duì)血管的評(píng)估、分割病變還是并發(fā)癥的預(yù)測(cè)方面,DL 從大量冗雜的信息中精確地提取出高質(zhì)量信息,可以使醫(yī)務(wù)人員在臨床工作中能更好更快診斷從而做出有益于治療方案,提高治療決策的速度,對(duì)于不熟悉中風(fēng)成像的醫(yī)療保健專業(yè)人員則可以起到提示作用。深度學(xué)習(xí)體系對(duì)于醫(yī)師而言還是相對(duì)陌生的領(lǐng)域,需要聯(lián)合人工智能工程師進(jìn)行深度學(xué)習(xí)體系結(jié)構(gòu)的改進(jìn)和發(fā)展。DL 目前仍存在過(guò)度擬合、訓(xùn)練時(shí)間和機(jī)制的復(fù)雜性等因素的限制,把深度學(xué)習(xí)合理應(yīng)用,將在醫(yī)療上達(dá)到革命性的進(jìn)展,相信在未來(lái),DL 將應(yīng)用于更廣泛的空間。