楚 陽,徐文龍
(中國計量大學(xué)信息工程學(xué)院,浙江 杭州 310018)
阿爾茲海默癥AD(Alzheimer’s Disease)為一種不可逆轉(zhuǎn)的進行性神經(jīng)退行性疾病,約占目前所有癡呆病例的70%~80%。其表現(xiàn)為大腦記憶功能逐漸退化,認知功能逐步降低,語言表達能力出現(xiàn)障礙,甚至人格方面發(fā)生變化。晚期AD患者,往往個人生活不能自理,甚至不能識別出家人,最終記憶穩(wěn)步惡化。該疾病一般開始于中年或者老年時期,可能是由神經(jīng)元和周圍蛋白質(zhì)的積累而引發(fā)的,與神經(jīng)細胞突觸功能障礙、腦部萎縮、腦神經(jīng)元細胞死亡有關(guān)[1]。有研究人員稱,由AD所引起的腦部相關(guān)變化有可能早于出現(xiàn)AD癥狀至少20年[2]。
按照發(fā)病過程情況,可將AD分為:正常對照組NC(Normal Controls)、主觀記憶抱怨SMC(Subjective Memory Complaints)、輕度認知功能障礙早期EMCI(Early Mild Cognitive Impairment)、輕度認知功能障礙晚期LMCI(Late Mild Cognitive Impairment)和AD。其中,對于早期的AD患者,被稱為輕度認知障礙階段MCI(Mild Cognitive Impairment)。這一階段被認為是從健康者到AD患者的過渡。統(tǒng)計顯示,患有MCI的65周歲及以上的人員中,有近40%的患者會在接下來的5年內(nèi)發(fā)展成為AD患者[1]。
目前關(guān)于該疾病的發(fā)病原因還有待明確,同時由于AD的病情多樣化,這給疾病的預(yù)防、診斷和治療造成了非常大的困難。研究發(fā)現(xiàn),從MCI到AD的年轉(zhuǎn)化率高達10%[3]。AD患者提早被確診難度大,且晚期患者治療效果不明顯,對AD進行早期分類研究具有重要臨床意義。
由臨床可知,AD的確切診斷需要依靠患者死亡后的腦組織檢查[4]。隨著計算機技術(shù)的不斷發(fā)展,計算機輔助AD早期診斷的分類研究成為可能。機器學(xué)習(xí)ML(Machine Learning)在醫(yī)學(xué)診斷中得到了廣泛應(yīng)用,特別是近些年來,一些先進的腦部神經(jīng)成像技術(shù),如核磁共振成像技術(shù)MRI(Magnetic Resonance Imaging)、正電子發(fā)射斷層掃描技術(shù)PET(Positron Emission computed Tomography)等不斷發(fā)展成熟,一些高維度的更大規(guī)模的神經(jīng)影像圖像為計算機輔助診斷CAD(Computer Aided Diagnosis)提供了更廣泛的素材,也極大地激發(fā)了廣大科研人員將此用于AD早期診斷的研究熱情,同時也為研究者開發(fā)更好的診斷模型提供了有力支持。
本文旨在綜述基于計算機輔助診斷技術(shù)的AD早期分類研究,把傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)應(yīng)用于AD的早期診斷中。計算機輔助AD檢測系統(tǒng)的典型框圖如圖1所示。

Figure 1 Block diagram of computer-aided AD classification system圖1 計算機輔助AD分類系統(tǒng)框圖
本文利用當(dāng)下先進的復(fù)雜高維度腦部神經(jīng)影像數(shù)據(jù)(如MRI、PET等)和其它有價值的生物學(xué)標(biāo)記(聲音、腦電圖、腦磁圖、手寫字跡、身體、精神檢查、神經(jīng)心理學(xué)測試)等,對AD早期階段MCI患者進行分類研究,對比采用不同生物學(xué)標(biāo)記和不同分類方法的計算機輔助診斷研究,通過不同方式的分類方法,總結(jié)了近些年來將計算機輔助工具用于人腦醫(yī)學(xué)影像數(shù)據(jù)的AD早期診斷分類研究現(xiàn)狀,并提出了對未來AD研究方向的展望。
采用計算機輔助手段進行AD早期診斷的研究方法目前主要有傳統(tǒng)的機器學(xué)習(xí)方法和深度學(xué)習(xí)方法。前者在AD早期診斷方面已經(jīng)有了十余年的發(fā)展歷程,有比較成熟的研究,研究者們采用不同的機器學(xué)習(xí)算法對AD進行分類研究。
深度學(xué)習(xí)作為機器學(xué)習(xí)的一個新的發(fā)展分支,在近些年取得了很大的發(fā)展,已被廣泛應(yīng)用于語音識別、機器翻譯、自動駕駛和機器視覺等多領(lǐng)域。憑借深度學(xué)習(xí)更深層次的網(wǎng)絡(luò)模型,可提取到更加抽象的圖像特征,進而得到更高的分類準(zhǔn)確率。在深度學(xué)習(xí)方法的有關(guān)研究中,特別是卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Networks)的使用,其分類結(jié)果已經(jīng)被證明優(yōu)于現(xiàn)有的機器學(xué)習(xí)方法[5]。
本文將從傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)兩方面來描述基于計算機輔助診斷的AD早期分類研究。
使用傳統(tǒng)機器學(xué)習(xí)方法進行AD分類研究一般需經(jīng)過以下步驟:(1)數(shù)據(jù)預(yù)處理;(2)特征提?。?3)特征選擇;(4)基于特征分類。
2.1.1 數(shù)據(jù)預(yù)處理
在獲取到醫(yī)學(xué)影像學(xué)數(shù)據(jù)等AD生物學(xué)標(biāo)記后,需要對所獲得的數(shù)據(jù)進行預(yù)處理,主要的預(yù)處理環(huán)節(jié)包含了前連合AC (Anterior Commissure)和后連合PC(Posterior Commissure)對齊校正、顱骨分離、腦組織分割和配準(zhǔn)等。AC-PC線用于基準(zhǔn)線校正,防止因獲得的影像數(shù)據(jù)未確定AC-PC基準(zhǔn)線而給后續(xù)實驗造成誤差。顱骨剝離,排除非腦部結(jié)構(gòu),減少不必要的干擾。顱骨剝離后,需對圖像不均勻部分進行校正。由于磁共振等影像采集設(shè)備的工作特點,所采集的影像中難免混雜有噪聲,濾除影像中的噪聲,對于實驗是非常必要的。圖2展示了不同預(yù)處理過程的分類情況。

Figure 2 Original image data preprocessing圖2 原始影像數(shù)據(jù)預(yù)處理
2.1.2 特征提取
特征提取是機器學(xué)習(xí)中模式識別和圖像處理過程中的常見應(yīng)用。旨在從原始數(shù)據(jù)中除去因特征過多而產(chǎn)生過擬合問題的冗余部分,以便節(jié)省內(nèi)存空間和提高計算能力,改善分類效果,同時也屬于降維過程。
特征提取重點針對所提取特征的大小、形狀和體積等要素來進行分類研究。AD早期診斷研究將主要涉及到海馬區(qū)、內(nèi)嗅皮層結(jié)構(gòu)等。常見的特征提取對象主要有以下幾種形式:(1)基于體積特征形式;(2)基于厚度特征形式;(3)基于形態(tài)特征形式;(4)基于紋理特征形式;(5)基于體素形態(tài)學(xué)分析形式。
(1)基于體積特征。
已有研究指出,有關(guān)海馬區(qū)在AD早期已出現(xiàn)萎縮,研究顯示約50%的AD患者存在海馬區(qū)萎縮[6]。因此,可將海馬體積作為AD診斷的生物標(biāo)志物特征。
(2)基于厚度特征。
Lerch等[7]研究發(fā)現(xiàn),AD患者相對于正常對照組NC的整個腦部皮質(zhì)厚度有明顯差異,反映為大腦多部位的皮質(zhì)厚度減小。已有的臨床研究發(fā)現(xiàn),腦部萎縮引起的腦部體積變化是AD早期階段出現(xiàn)的一重要生物標(biāo)記物。
(3)基于形態(tài)特征。
海馬區(qū)、內(nèi)側(cè)顳葉萎縮所造成的腦部體積變化,已作為生物標(biāo)記物特征用于AD早期檢測中。Gerardin等[8]在研究中發(fā)現(xiàn),AD早期患者的腦部海馬區(qū)還未出現(xiàn)萎縮時就已經(jīng)存在形態(tài)上的改變。以形態(tài)特征作為生物標(biāo)記物特征用于AD早期診斷,表現(xiàn)更加敏感的特性。
(4)基于紋理特征分析。
紋理是一種視覺特征,反映影像或圖像的同質(zhì)現(xiàn)象,體現(xiàn)物體表面緩慢變化或者呈現(xiàn)周期性變化的組織結(jié)構(gòu)特征屬性。Freeborough等[9]采用紋理特征進行分類時發(fā)現(xiàn),可以通過紋理質(zhì)地分析得到AD患者和正常對照組(NC)之間顯著的差異。
(5)基于體素形態(tài)學(xué)分析。
體素(Volume Pixel)即體積元素,相對于二維空間的最小單位——像素,是數(shù)字?jǐn)?shù)據(jù)于三維空間分割的最小單位。體素形態(tài)學(xué)分析VBM(Voxel-Based Morphometry)是基于體素單位針對MRI醫(yī)學(xué)影像的綜合、客觀和自動分析方法,能夠用來對活體人腦組織進行形態(tài)學(xué)方面的科學(xué)研究。通過VBM定量計算,分析MRI影像中不同體素所對應(yīng)的腦灰質(zhì)、白質(zhì)密度和體積的相對變化,可用于AD早期診斷研究。Karas等[10]采用VBM技術(shù)進行AD研究時發(fā)現(xiàn),AD患者和正常對照組存在GM(Grey Matter)體素形態(tài)學(xué)上的差異。
2.1.3 特征選擇
特征選擇指的是從一組特征中選擇出最有效的特征,以達到降低維度的目的,這是模式識別過程中的一個重要環(huán)節(jié)。特征選擇通過對腦部感興趣區(qū)域ROI(Region of Interest)進行分割獲取。根據(jù)實驗設(shè)定,可以將ROI定位為全腦區(qū)、海馬區(qū)、腦灰質(zhì)(GM)、腦白質(zhì)(WM)、腦脊液(CSF)和內(nèi)側(cè)顳葉區(qū)等區(qū)域。在所有的腦部ROI中,大腦海馬區(qū)是最早受影響的區(qū)域之一[11],是AD病因?qū)W的重要解剖區(qū)域。Amoroso等[12]提出將雙側(cè)海馬的形狀和體積特征作為生物標(biāo)記物用于AD早期分類研究。
2.1.4 基于分類算法
采用傳統(tǒng)機器學(xué)習(xí)手段用于AD早期診斷分類研究已不斷趨于系統(tǒng)化、成熟化。機器學(xué)習(xí)輔助手段用于AD早期分類的算法主要有以下幾類:(1)支持向量機SVM(Support Vector Machine);(2)Logistic回歸;(3)線性判別分析LDA(Linear Discriminant Analysis);(4)貝葉斯分類器;(5)隨機森林;(6)K近鄰KNN(K-Nearest Neighbor)等。
(1)支持向量機SVM。
支持向量機SVM是一類監(jiān)督學(xué)習(xí)方式,是能對數(shù)據(jù)進行二分類的廣義線性分類器。決策邊界是樣本數(shù)據(jù)求解的最大超平面。在AD早期診斷分類研究中,SVM用于AD分類的頻率是最高的。Kim等[13]利用支持向量機提取特征后,再進行AD分類。
(2)Logistic回歸。
Logistic回歸又被稱為Logistic回歸分析,是一種廣義線性回歸分析模型,在醫(yī)學(xué)影像中多用于疾病診斷,常用于二分類研究。當(dāng)學(xué)習(xí)訓(xùn)練樣本量大時,可以取得較好的分類效果。Ieracitano等[14]采用Logistic回歸算法,基于單模態(tài)或多模態(tài)生物特征進行AD分類。
(3)線性判別分析(LDA)。
線性判別分析算法是對費舍爾的線性鑒別方法的歸納,其目的在于尋找2類失誤特征的線性組合來分類,常用于評估患者病情程度和對疾病的預(yù)測判斷等。當(dāng)樣本數(shù)據(jù)較少時,也可取得較Logistic回歸更好的分類效果。Ahmad等[15]利用生物標(biāo)記物模式和靜息狀態(tài)下的功能磁共振成像(FMRI),標(biāo)記影響較大的海馬區(qū)(HP)、顳中回區(qū)(MTG)、內(nèi)嗅皮層和后扣帶回PCC (Posterior Cingulate Cortex)等區(qū)域,再采用LDA對AD進行分類研究。
(4)貝葉斯分類器。
貝葉斯分類器,通過被分類對象的先驗概率,用貝葉斯公式計算得到被分類對象屬于某一類別屬性的最大概率值。該分類器擁有較小的分類錯誤率,常用于模式識別等領(lǐng)域。Yubraj等[16]提出將皮質(zhì)厚度和皮質(zhì)下體積作為生物學(xué)標(biāo)記用于AD分類,使用主成分分析PCA(Principal Component Analysis)方法進行降維,并使用貝葉斯分類器進行分類研究。
(5)隨機森林。
隨機森林是一種融合多個決策樹算法的分類器,該分類器輸出由每一個決策樹輸出類別的眾數(shù)來確定。相對于決策樹算法有更高的準(zhǔn)確率,且能處理更多的輸入數(shù)據(jù)。Dimitriadis等[17]在AD 分類研究中,提出使用隨機森林算法從特征集的子集選擇多個生物特征,融合這些生物標(biāo)志物特征采用隨機森林算法進行分類。
(6)K近鄰(KNN)。
KNN算法屬于機器學(xué)習(xí)算法中較為簡單的一種,分類依據(jù)是樣本數(shù)據(jù)點特征空間中最近的K個樣本是否屬于某同一個類別。K近鄰算法常用于分類和回歸分析中。Farouk等[18]在結(jié)構(gòu)核磁共振圖像(SMRI)中提取生物學(xué)標(biāo)志物信息,融合灰度共生矩陣提取紋理特征和基于體素的形態(tài)學(xué)特征,采用KNN算法進行AD早期分類。
深度學(xué)習(xí)是機器學(xué)習(xí)方法的一種,屬于機器學(xué)習(xí)的子集。通過深層次的學(xué)習(xí)過程學(xué)習(xí)輸入數(shù)據(jù)特征,其結(jié)構(gòu)類似于模仿人類大腦分析處理信息的神經(jīng)網(wǎng)。自2006年以來,由于深度學(xué)習(xí)計算能力的不斷提高和數(shù)據(jù)量的不斷增大,深度學(xué)習(xí)已經(jīng)得到了充分發(fā)展,特別是深度學(xué)習(xí)模型和算法的逐漸改進,其輸出準(zhǔn)確率不斷刷新。得益于以上優(yōu)勢,深度學(xué)習(xí)已廣泛應(yīng)用于自然語言處理、無人駕駛、語音識別和機器視覺等各領(lǐng)域。用于AD分類的深度學(xué)習(xí)網(wǎng)絡(luò)模型主要有以下幾類:(1)LetNet-5;(2)AlexNet;(3)VGGNet(Visual Geometry Group Network);(4)GoogLeNet;(5)ResNet(Residual Network);(6)DenseNet(Dense convolutional Network);(7)3D-CNN(3D-Convolutional Neural Network)等。研究者利用這些網(wǎng)絡(luò)模型或者基于以上模型的改進模型進行AD分類研究。
2.2.1 神經(jīng)網(wǎng)絡(luò)分類模型
(1)LetNet-5。
LeCun等[19]提出的卷積神經(jīng)網(wǎng)絡(luò)(CNN)是第1個真正意義上的多層次結(jié)構(gòu)學(xué)習(xí)模型,LetNet-5為卷積神經(jīng)網(wǎng)絡(luò)(CNN)的一種經(jīng)典框架,其結(jié)構(gòu)如圖3所示。LetNet-5網(wǎng)絡(luò)模型共有包含輸入層在內(nèi)的8層網(wǎng)絡(luò)構(gòu)成,其中包含2個卷積層和2個下采樣層,屬于經(jīng)典的CNN結(jié)構(gòu)。Sarraf等[20]基于MRI影像,采用LeNet模型進行AD和NC的分類研究。LetNet-5能夠獲得原始圖像的有效表征,僅使用極少的預(yù)處理也能識別原始圖像規(guī)律,但鑒于其模型的特點,處理較大規(guī)模數(shù)據(jù)和復(fù)雜問題時結(jié)果欠理想。

Figure 3 LeNet-5 network model圖3 LeNet-5網(wǎng)絡(luò)模型
(2)AlexNet。
AlexNet是由Hinton和Krizhevsky等[21]在2012年提出的,該模型首次在CNN中成功應(yīng)用了Dropout策略、ReLu函數(shù)和LRN(Local Response Normalization)層等,解決了深層神經(jīng)網(wǎng)絡(luò)過擬合的問題,同時使用GPU進行加速運算操作,實現(xiàn)了在大規(guī)模圖像數(shù)據(jù)集上的深層卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。Afzal等[22]通過預(yù)訓(xùn)練的AlexNet網(wǎng)絡(luò)模型,選取開放獲取系列成像研究數(shù)據(jù)集OASIS(the Open Access Series of Imaging Studies)數(shù)據(jù)集中199名受試者數(shù)據(jù)進行AD和NC的分類研究,分類準(zhǔn)確率達到98.41%。
(3)VGG。
VGG模型是由牛津大學(xué)的Oxford Visual Geometry Group提出的,其通過增加網(wǎng)絡(luò)深度來提升網(wǎng)絡(luò)最終性能。它的2種結(jié)構(gòu)VGG16和VGG19除了深度不同外,在本質(zhì)上沒有太大區(qū)別。相比AlexNet而言,VGG采用連續(xù)的3*3卷積核代替11*11,7*7,5*5的較大卷積核,實現(xiàn)了增加網(wǎng)絡(luò)深度來學(xué)習(xí)更加復(fù)雜特征的同時減少模型參數(shù)的目的。Jain等[23]通過VGG-16網(wǎng)絡(luò)模型,采用MRI單模態(tài)影像進行NC、MCI和AD三分類研究,實驗數(shù)據(jù)來源于AD神經(jīng)影像學(xué)計劃數(shù)據(jù)集ADNI,選取50個樣本用于實驗,其分類準(zhǔn)確率能達到99.14%。
(4)GoogLeNet。
GoogLeNet是由Szegedy等[24]提出的,不同于AlexNet、VGG等網(wǎng)絡(luò)結(jié)構(gòu)通過增加網(wǎng)絡(luò)層數(shù)來獲得好的訓(xùn)練效果,GoogLeNet采用average pooling代替參數(shù)量大的全連接層,同時使用inception模塊來代替一般的卷積層,1*1卷積層的使用對模型降維和參數(shù)的減少起了重要作用。這些方法,提高了計算資源的利用率,使其能夠在計算量不變的情況下提取到更多的特征,訓(xùn)練效果也得到提升。Sarraf等[20]分別基于MRI和FMRI模態(tài)影像數(shù)據(jù),從ADNI數(shù)據(jù)集中分別獲取144例FMRI和302例MRI樣本數(shù)據(jù),采用GoogLeNet網(wǎng)絡(luò)模型從大量訓(xùn)練圖像中提取低層到高層特征,實驗訓(xùn)練集和測試集占比為3∶1,GoogLeNet模型在FMRI影像下對AD和NC分類的平均準(zhǔn)確率為94.24%?;贛RI影像的GoogLeNet和LeNet模型的分類平均準(zhǔn)確率分別為98.74%和97.88%,GoogLeNet模型表現(xiàn)更優(yōu)秀。
(5)ResNet。
殘差神經(jīng)網(wǎng)絡(luò)ResNet于2015年被提出,它“簡單與實用”并存,一些研究方法也都建立在ResNet50或者ResNet101模型的基礎(chǔ)上,其在目標(biāo)檢測、分類、分割和識別等領(lǐng)域都得到了廣泛的應(yīng)用[25]。ResNet內(nèi)部的殘差模塊使用了skip connection(跳躍連接)的殘差結(jié)構(gòu),加深了網(wǎng)絡(luò)層次,同時提高了網(wǎng)絡(luò)性能,消除了因網(wǎng)絡(luò)層次加深而出現(xiàn)的梯度爆炸、網(wǎng)絡(luò)無法收斂和網(wǎng)絡(luò)退化等問題。特點是易于優(yōu)化,并且可通過增加一定的深度來提高準(zhǔn)確率。Ji等[26,27]分別在單模態(tài)MRI和多模態(tài)MRI、FDG-PET影像下,基于ResNet網(wǎng)絡(luò)模型進行AD分類研究。
(6)DenseNet。
Huang等[28]提出了DenseNet模型,雖然其結(jié)構(gòu)并不算復(fù)雜,但特征提取卻很高效。ResNet模型構(gòu)建前面層和后面層的skip connection,有助于梯度反向傳播和訓(xùn)練深層網(wǎng)絡(luò);GoogLeNet構(gòu)建了inception模塊,加大了模型寬度,實現(xiàn)了降維和多尺度再聚合。DenseNet模型不同于ResNet和GoogleNet模型,它建立前面所有層和后面層的密集連接(dense connection),并通過特征在channel上的連接實現(xiàn)特征重用(feature reuse),在計算成本和參數(shù)更少的情況下,得到了較ResNet網(wǎng)絡(luò)更優(yōu)秀的性能。
(7)3D-CNN。
3D-CNN是在2D-CNN的基礎(chǔ)上改變而來的,是基于多場景中的多幅圖像,或者是在視頻連續(xù)幀之間的關(guān)聯(lián)信息背景下提出的[29]。其目的在于通過增加新維度(時間)信息,獲取圖像間的關(guān)聯(lián)信息,提取更具有表達性的特征,從而克服2D-CNN在捕捉時序信息上的缺陷。2D-CNN的卷積應(yīng)用于2D特征圖,3D卷積通過對堆疊連續(xù)幀組成的立方圖進行3D卷積,使卷積層中的特征圖均與其上一層中多個幀相連,以獲取空間和時間維度特征。Kompanek等[30]使用3D-CNN基于MRI影像對NC和AD進行分類,采用體數(shù)據(jù)增強(Volumetric Data Augmentation)方法,提高分類準(zhǔn)確率的同時也增強了網(wǎng)絡(luò)模型的泛化能力。
深度學(xué)習(xí)方法的優(yōu)點使得其非常適合醫(yī)學(xué)影像的高維度和高復(fù)雜結(jié)構(gòu),其在醫(yī)學(xué)圖像上應(yīng)用廣泛,如醫(yī)學(xué)圖像的分類與識別、定位與檢測、正常組織器官和病灶部位分割等。
本文所涉及到的文獻中有較多的是使用深度學(xué)習(xí)方法進行AD早期診斷研究,涉及不同神經(jīng)網(wǎng)絡(luò)模型。本文將從所使用模態(tài)的角度出發(fā)進行綜述。
2.2.2 基于單模態(tài)深度學(xué)習(xí)方法
模態(tài)是指事物發(fā)生或存在的一種形式,可以是聲音、圖像和文字等信息。對于AD早期診斷的研究來說,可以是MRI、PET和SPECT等AD生物標(biāo)記物。
將不同模態(tài)的生物標(biāo)記物用于AD早期分類研究,是深度學(xué)習(xí)方法應(yīng)用于生物醫(yī)學(xué)研究的主要任務(wù)之一。Barbaroux等[31]在探索AD分類任務(wù)時采用SCNN(Spherical CNN)模型對人腦皮質(zhì)進行分析,SCNN通過定義同3D旋轉(zhuǎn)等邊的球形輸入上的卷積算子,使規(guī)則CNN從平面數(shù)據(jù)擴展為球形數(shù)據(jù),實驗基于T1加權(quán)MRI影像的形態(tài)測量方法,其AD與NC的分類準(zhǔn)確率可達92.16%,表明了使用SCNN模型直接應(yīng)用于人腦皮質(zhì)判別分析的可行性和優(yōu)越性。
Kim等[32]基于FDG-PET影像數(shù)據(jù),采用含GAP層的改進型深度學(xué)習(xí)方法,基于ADNI和來自于西弗蘭斯醫(yī)院核醫(yī)學(xué)部Severance dataset影像數(shù)據(jù)集進行實驗,在AD與NC的分類結(jié)果中分別獲得91.02%和86.09%的準(zhǔn)確率。實驗應(yīng)用切片選擇性學(xué)習(xí)來降低計算量,同時使用遷移學(xué)習(xí)和代替全連接層的GAP層,避免過擬合的同時提高了模型泛化能力。不同數(shù)據(jù)集上的實驗結(jié)果顯示了GAP層的性能同全連接層在模型準(zhǔn)確性、敏感性、特異性方面具有統(tǒng)計學(xué)意義(p<0.01),同時也比較了不同數(shù)據(jù)集上模型在準(zhǔn)確性、敏感性、特異性方面沒有統(tǒng)計學(xué)上的顯著差異(p>0.05)。
Bin 等[33]提出使用可分離卷積層構(gòu)建的多個深層2D-CNN來學(xué)習(xí)腦局部的各種特征,基于OASIS橫斷面圖像數(shù)據(jù)集中SMRI影像進行AD分類研究,采用Xception和Inception version3結(jié)構(gòu)作為遷移學(xué)習(xí)模型,實驗結(jié)果表明了該模型在AD分類中的性能優(yōu)越性。
Suganthe等[34]提出建立深度卷積神經(jīng)網(wǎng)絡(luò)DCNN和基于VGG-16的卷積神經(jīng)網(wǎng)絡(luò)VCNN模型,利用ADNI數(shù)據(jù)庫的MRI影像對AD、NC、EMCI和LMCI 4個階段進行分類研究。通過改變卷積層數(shù)、卷積核大小和數(shù)量、dropout層、池化層等參數(shù)來對比模型分類結(jié)果,結(jié)果表明有7層卷積層的DCNN模型分類性能比4層卷積層的DCNN模型優(yōu)秀得多,其中AD與LMCI的分類準(zhǔn)確率達到93.76%。2個模型的對比實驗顯示了VCNN模型的準(zhǔn)確率要高于DCNN模型的,但其可訓(xùn)練參數(shù)量多于DCNN模型的。
2.2.3 基于多模態(tài)深度學(xué)習(xí)方法
多模態(tài)深度學(xué)習(xí)是相對于單模態(tài)而言的,指將多個單模態(tài)的信息用于深度學(xué)習(xí)方法中,以達到實現(xiàn)不同模態(tài)間的信息融合的目的。
很多研究者采用多模態(tài)數(shù)據(jù)用于AD早期分類研究。Huang等[35]基于海馬區(qū)TI加權(quán)核磁共振成像及FDG-PET影像下各種多模態(tài)特征信息,采用卷積神經(jīng)網(wǎng)絡(luò)進行AD分類研究。獲得NC與PMCI、SMCI和PMCI、AD與NC的分類準(zhǔn)確率分別為87.46%,76.90%和90.10%,結(jié)果表明結(jié)合多模態(tài)成像數(shù)據(jù)的分類結(jié)果優(yōu)于單模態(tài)形式的。
Forouzannzhad等[36]結(jié)合正電子發(fā)射斷層掃描(PET)和核磁共振成像(MRI)多模態(tài)成像技術(shù)和標(biāo)準(zhǔn)神經(jīng)心理學(xué)測試評分結(jié)果,采用深度神經(jīng)網(wǎng)絡(luò)DNN(Deep Neural Networks)對AD早期診斷進行分類研究。對正常對照組NC與早期輕度認知障礙EMCI的分類準(zhǔn)確率高達84.0%,對NC與晚期輕度認知障礙LMCI、CN與AD、EMCI與LMCI、EMCI與AD、LMCI與AD的分類準(zhǔn)確率分別為84.1%,96.8%,69.5%,90.3%和80.2%,而單獨在MRI影像上,NC與EMCI的分類準(zhǔn)確率僅為68.0%。研究表明多模態(tài)方法優(yōu)于單模態(tài)影像分析。
Kang等[37]基于SMRI和擴散張量成像DTI(Diffusion Tensor Imaging)雙模態(tài)數(shù)據(jù),構(gòu)建VGG16模型的遷移學(xué)習(xí)方法,用于EMCI和NC的分類研究。數(shù)據(jù)來源于ADNI數(shù)據(jù)集,實驗采用多模態(tài)融合策略,將具有相同索引的切片合并成RGB切片,組成切片數(shù)據(jù)集輸入模型進行訓(xùn)練,采用LASSO(Least Absolute Shrinkage and Selection Operator)算法提取與EMCI疾病相關(guān)部分特征,實驗獲得了94.2%的分類準(zhǔn)確率,敏感度高達97.3%。實驗結(jié)果表明多模態(tài)數(shù)據(jù)可以為區(qū)分EMCI和NC提供更多更有用的信息,且從臨床角度驗證了DTI。圖像可作為EMCI的一個重要生物標(biāo)志物。
Khvostikov等[38]通過對海馬感興趣區(qū)域進行SMRI和DTI成像模態(tài)的融合,并基于3D-CNN模型的AD分類算法,對比了單模態(tài)數(shù)據(jù)用于實驗的情況,在AD與MCI分類中,獲得了多模態(tài)情況下93.3%的準(zhǔn)確率,相對于SMRI單模態(tài)情況下65.8%的準(zhǔn)確率有較大優(yōu)勢。實驗中為了平衡數(shù)據(jù)量大小不同的類,采用數(shù)據(jù)擴充方法進行數(shù)據(jù)增強,以消除不同大小的數(shù)據(jù)量對網(wǎng)絡(luò)訓(xùn)練過程的影響。
AD的早期分類研究是一項復(fù)雜的任務(wù),所需要的數(shù)據(jù)樣本的特點如下:(1)需要具備一定規(guī)模;(2)樣本需由專業(yè)醫(yī)生進行標(biāo)注;(3)大量實驗數(shù)據(jù)和標(biāo)注的獲得,往往需要大量的人力、物力。不同研究者所使用的數(shù)據(jù)樣本主要來源于以下數(shù)據(jù)集:(1)阿爾茲海默癥神經(jīng)影像學(xué)計劃數(shù)據(jù)集(ADNI);(2)開放獲取系列成像研究數(shù)據(jù)集(OASIS);(3)澳大利亞成像、生物標(biāo)記技術(shù)和生活方式研究數(shù)據(jù)集(AIBL);(4)阿爾茨海默病最小間隔共振成像數(shù)據(jù)集(MIRIAD);(5)其它合作性的醫(yī)學(xué)影像學(xué)數(shù)據(jù)。
ADNI創(chuàng)建于2003年,是到目前為止較為成功也是應(yīng)用最多的針對AD的綜合研究數(shù)據(jù)集,它具有多中心、跨越多研究學(xué)科特點,主要研究人體腦部MRI神經(jīng)影像、人腦PET影像、其他人體生物標(biāo)記物如腦脊液(CSF)、血液生物標(biāo)記物,同時還包含有人體遺傳學(xué)信息、臨床資料、神經(jīng)心理學(xué)評估等信息。已招募來自于全球59個國家和地區(qū)的800名成年人作為受試者,年齡跨度在55~90周歲。為全球的AD研究提供了非常有價值的臨床醫(yī)學(xué)數(shù)據(jù),ADNI已經(jīng)成為研究人員采用的核心數(shù)據(jù)資源[39]。
OASIS數(shù)據(jù)集由2大類構(gòu)成,分別是橫斷面數(shù)據(jù)集和縱向面數(shù)據(jù)集。橫斷面數(shù)據(jù)集涵蓋了416名年齡在18~96周歲受試者的MRI數(shù)據(jù)資源??v向面數(shù)據(jù)集涵蓋了150名年齡在60~96周歲的受試者的MRI數(shù)據(jù)資源,且每個受試者一般都有2次或2次以上間隔滿一年的掃描數(shù)據(jù)。目前,OASIS是僅次于ADNI的核心數(shù)據(jù)資源[40]。
AIBL提供了1 000名年齡在60周歲及以上的受試者有關(guān)基線人口統(tǒng)計學(xué)、診斷、認知功能、健康和生活方式等方面的調(diào)查統(tǒng)計信息。約25%的受試者參與了匹茲堡化合物(PiB PET)和MRI腦成像的淀粉樣蛋白PET成像掃描。AIBL對受試者進行超過18個月間隔的重復(fù)評估,能更充分地確定不同的生物標(biāo)志物,并加強AD在認知參數(shù)和生活方式等因素參與下的預(yù)測性標(biāo)準(zhǔn)。AIBL在AD的科學(xué)研究中發(fā)揮著重要作用。
MIRIAD數(shù)據(jù)集受試者由輕度阿爾茲海默癥患者46人和正常對照組23人組成,包含了上述受試者一系列的縱向體積T1加權(quán)MRI掃描醫(yī)學(xué)影像圖像。以上這些影像均由同一位放射科技師采用相同掃描設(shè)備采集的相同序列的708次掃描結(jié)果組成。在這些圖像中,包含從基線起始的2周、6周、14周、26周、38周、52周、18個月和24個月不等的掃描間隔[41]。數(shù)據(jù)集包含了受試者關(guān)于性別、年齡和簡易精神狀態(tài)檢查得分等情況記錄。
一些研究人員傾向于使用本地數(shù)據(jù)集。如在研究AD等相關(guān)課題時,使用有些醫(yī)院的存檔數(shù)據(jù)或與醫(yī)院合作課題研究的就診者檢查數(shù)據(jù)。呂鴻蒙等[42]通過改進的AlexNet神經(jīng)網(wǎng)絡(luò)模型,對阿爾茲海默癥進行多分類研究。為了研究出符合中國居民實際的分類診斷系統(tǒng),除采用ADNI數(shù)據(jù)影像之外,還采用了首都醫(yī)科大學(xué)附屬北京天壇醫(yī)院提供的數(shù)據(jù)。
基于計算機輔助技術(shù)的AD分類研究,判斷其方法是否具有有效性、可靠性和普遍適用性,能否用于臨床輔助診斷,主要用以下幾個衡量標(biāo)準(zhǔn)來評價:(1)準(zhǔn)確率(Accuracy);(2)敏感度(Sensitivity);(3)特異度(Specificity);(4)精確度(Precision);(5)ROC(Receiver Operating Characteristic curve)曲線下的面積AUC(Area Under Curve)。
準(zhǔn)確率是在給定測試數(shù)據(jù)集上,分類器能正確分類的樣本數(shù)和總樣本數(shù)的比值,用ACC表示,反映了分類器準(zhǔn)確分類出AD、MCI和NC的概率,通常其值越高,分類器性能越好;敏感度又稱真陽性率,表示所有真陽性(正例)能被正確檢測的概率,用TPR表示,通常其值越大,表示AD病例漏診就越少;特異度一般用TNR表示,又被稱為真陰性率,表示所有真陰性(負例)被正確檢測的概率,衡量分類器對真陰性的識別能力,在AD分類中體現(xiàn)分類器能準(zhǔn)確分類出NC的能力,一般其值越大,表明正常人被誤診為AD的幾率就越小;精確度即PPV,指被分為真陽性(正例)的樣本實際為真陽性的比例;ROC曲線下的面積AUC是指以真陽性率(TPR)為縱坐標(biāo),假陽性率(FPR)為橫坐標(biāo)所繪制圖形的曲線下面積,通常其值越大,分類器分類性能越好。表1列出了這些評價標(biāo)準(zhǔn)的數(shù)學(xué)表達式。

Table 1 Common evaluation criterias and their mathematical descriptions表1 常用評價標(biāo)準(zhǔn)及其數(shù)學(xué)描述
其中,TP(True Positive)表示預(yù)測為陽性,實際也為陽性的樣本數(shù)量;FP(False Positive)表示預(yù)測為陽性,實際不是陽性的樣本數(shù)量;FN(False Negative)表示預(yù)測為陰性,實際為陽性的樣本數(shù)量;TN(True Negative)表示預(yù)測為陰性,實際也為陰性的樣本數(shù)量。
將人工智能用于生物醫(yī)學(xué)研究會因使用不同來源的數(shù)據(jù)、不同的生物標(biāo)記物而產(chǎn)生不同的研究結(jié)果;同樣,在數(shù)據(jù)來源相同的情況下,亦會因使用的算法不同而有不同的輸出。機器學(xué)習(xí)方法和深度學(xué)習(xí)方法均屬于人工智能范疇,且深度學(xué)習(xí)方法作為機器學(xué)習(xí)方法的一個新分支,運用到生物醫(yī)學(xué)研究中也會產(chǎn)生不同的研究結(jié)果。表2列出了不同模態(tài)的腦醫(yī)學(xué)影像及其功能和特點。
除表2列出的一些生物標(biāo)記物外,還有其他形式的標(biāo)記物,如彌散張量成像(DTI)、腦脊液(CSF)、視網(wǎng)膜圖像、腦電圖(EEG)、腦磁圖(MEG)和語音等。其中DTI是核磁共振成像的特殊形式,利用水分子的彌散各向異性成像,可用于腦白質(zhì)纖維等研究,是一種描述大腦結(jié)構(gòu)的新方法。
單一模態(tài)往往從某一個角度描述所要研究的對象,是在某一特定條件下獲得的關(guān)于研究對象的特征描述。深度學(xué)習(xí)受人腦神經(jīng)細胞活動啟發(fā),也貼近人類認識世界的形式,研究基于深度學(xué)習(xí)的多模態(tài)AD分類方法,賦予計算機處理“多視角”“多信息融合”、高復(fù)雜度、大數(shù)據(jù)量問題的能力。單一模態(tài)的影像在某一形態(tài)上巧妙地反映了AD病程不同階段的特征,在分類過程、特征提取上突出特異性;多模態(tài)融合方式,更能從結(jié)構(gòu)和功能等不同角度表征多種形式的信息,往往可增強模型泛化能力,相對于單一模態(tài)而言,更具全面性,同時能起到良好的優(yōu)勢互補作用。
傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)方法使用不同的特征提取方式,往往有不同的分類效果。傳統(tǒng)機器學(xué)習(xí)通常會將問題分解為多個子問題逐個解決,最終結(jié)合所有子問題結(jié)果獲得最后結(jié)果;而深度學(xué)習(xí)提倡的是end-to-end(端到端)的模式,從輸出端得到預(yù)測結(jié)果,利用與真實結(jié)果相比得到的誤差進行反向傳播,再通過模型優(yōu)化使誤差最小,并得到一個收斂的模型,從原始數(shù)據(jù)輸入到結(jié)果輸出,中間的神經(jīng)網(wǎng)絡(luò)成為一個整體,省去了傳統(tǒng)機器學(xué)習(xí)每個子任務(wù)執(zhí)行前復(fù)雜且耗時耗力的標(biāo)注工作。
深度學(xué)習(xí)相對于傳統(tǒng)機器學(xué)習(xí)最大的優(yōu)勢在于能夠自動提取特征,而傳統(tǒng)機器學(xué)習(xí)則需要利用特征工程人為對數(shù)據(jù)進行選擇。鑒于醫(yī)學(xué)影像的專業(yè)性和影像標(biāo)注的復(fù)雜性等特點,深度學(xué)習(xí)采用原始的神經(jīng)影像數(shù)據(jù)進行訓(xùn)練并學(xué)習(xí)特征,在大規(guī)模、高維度醫(yī)學(xué)影像的計算機輔助診斷研究中得到了大量的關(guān)注[43]。在深度學(xué)習(xí)方法的有關(guān)研究中,特別是卷積神經(jīng)網(wǎng)絡(luò)(CNN),其分類結(jié)果相對于傳統(tǒng)機器學(xué)習(xí)方法已經(jīng)被證明更具優(yōu)越性[5],且是未來研究的一個重要趨勢。

Table 2 Comparison of different modal biomarkers based on brain medical imaging表2 基于腦醫(yī)學(xué)影像的不同模態(tài)生物標(biāo)記物對比
本文通過以下幾個方面對AD分類進行對比分析:(1)傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)方法的AD分類對比;(2)單一模態(tài)情況下采用深度學(xué)習(xí)方法的AD分類對比;(3)多模態(tài)情況下,深度學(xué)習(xí)方法用于AD分類對比。
不同的研究方法往往會產(chǎn)生不同的分類結(jié)果,深度學(xué)習(xí)方法作為機器學(xué)習(xí)方法的一個新的分支,由于具有網(wǎng)絡(luò)層數(shù)多、能提取更深層特征信息、省去了一定的數(shù)據(jù)預(yù)處理工作、分類效果好等優(yōu)點,近些年得到廣泛運用,表3對比了不同文獻的研究情況。其中部分處理訓(xùn)練方式解釋為:雙樹復(fù)小波變換DTCWT(Dual Tree Complex;Wavelet Transform)+PCA+線性判別分析LDA(Linear Discriminant Analysis)+TSVM(Twin SVM);多元最小冗余最大相關(guān)性(MRMR)特征選擇算法+序列特征集合(SFC)算法+SVM;多任務(wù)深度學(xué)習(xí)MTDL(Multi-task deep learning)。
表4對比了傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)方法的分類情況,對比發(fā)現(xiàn),采用深度學(xué)習(xí)方法的分類準(zhǔn)確率在整體上優(yōu)于采用傳統(tǒng)機器學(xué)習(xí)方法的,尤其在AD與NC分類中;在選取具有相似數(shù)據(jù)量樣本的情況下,深度學(xué)習(xí)方法的分類準(zhǔn)確率也優(yōu)于傳統(tǒng)機器學(xué)習(xí)方法的,甚至超越了采用多模態(tài)的傳統(tǒng)機器學(xué)習(xí)方法,如Khan等[44]使用基于遷移學(xué)習(xí)的VGGNet-19網(wǎng)絡(luò)模型和Alam等[45]使用的DTCWT(雙樹復(fù)小波變換)方法的對比,前者對AD與NC的分類準(zhǔn)確率高達99.36%,高于后者的準(zhǔn)確率92.65%,且樣本量更少,表現(xiàn)出深度學(xué)習(xí)方法在特征提取上的相對優(yōu)越性。
本節(jié)將對單獨采用結(jié)構(gòu)型成像或功能性成像模態(tài)下,使用深度學(xué)習(xí)方法對AD分類情況研究。表5和表6對比了不同方法及其分類效果。其中,部分名詞解釋為:彌散張量成像DTI;多元最小冗余最大相關(guān)性(MRMR)特征選擇算法+序列特征集合(SFC)算法+SVM;奇異值分解技術(shù)(SVD)+核NNLS;韓國光州國家癡呆癥研究中心和相關(guān)癡呆癥數(shù)據(jù)集GARD;基于概率的集中模型PBEM(Probability-based ensemble model)。
通過表6可知,相同模態(tài)下取相似樣本量數(shù)據(jù),會因使用的深度學(xué)習(xí)模型不同而產(chǎn)生分類準(zhǔn)確率差異;如Jain等[22,44]均采用ADNI數(shù)據(jù)庫中的相同數(shù)量樣本,分別采用不同層數(shù)VGG網(wǎng)絡(luò)的模型,但得到的AD與NC的分類準(zhǔn)確率不相同;Cui等[46,47]在實驗中,選取了數(shù)量相近的樣本,分別采用3D卷積和2D卷積模型進行分類,前者分類準(zhǔn)確率高于后者超10%,反映出3D卷積模型用于3D影像的優(yōu)勢,可以充分利用影像的3D立體信息,減少影像2D切片化帶來的特征損失。

Table 3 Comparison between traditional machine learning methods and deep learning methods表3 傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)方法對比

Table 4 Classification results of traditional machine learning methods and deep learning methods表4 傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)方法的分類結(jié)果 %

Table 5 Comparison of different deep learning methods based on single mode表5 單模態(tài)下基于深度學(xué)習(xí)的方法對比
與單獨采用結(jié)構(gòu)型成像(SMRI)、功能性成像(PET、SPECT、FMRI等)單模態(tài)相對應(yīng),本節(jié)將充分結(jié)合不同模態(tài)影像,融合多特征信息,利用模態(tài)間互補特性,采用不同深度學(xué)習(xí)方法對AD分類進行對比分析,如表7和表8所示。其中,DMFNet表示深度多模型融合網(wǎng)絡(luò)。
表8對比了多模態(tài)下不同分類方法的AD分類情況,發(fā)現(xiàn)研究者多采用雙模態(tài)影像數(shù)據(jù)進行研究。在所有的分類中,對NC與MCI分類準(zhǔn)確率普遍低于對AD與NC的分類準(zhǔn)確率;采用相同模態(tài)的影像數(shù)據(jù),不同的分類模型準(zhǔn)確率差異較大;模態(tài)的選擇和分類方法以及樣本數(shù)量的差異都是最后分類準(zhǔn)確率的影響因素,但分類方法更為關(guān)鍵;如Liu等[27]和Vu等[59]在相同模態(tài)下所獲取的AD與NC分類準(zhǔn)確率幾乎相同,卻因使用的分類方法不同,使Liu等[25]能在受試樣本量少1/3的情況下獲取和Vu等[57]幾乎一樣的準(zhǔn)確率。
對近些年文獻的研究發(fā)現(xiàn),基于計算機輔助診斷技術(shù)的AD早期分類研究已經(jīng)取得了前所未有的發(fā)展,利用人工智能手段進行生物醫(yī)學(xué)研究也逐步趨于成熟,采用傳統(tǒng)機器學(xué)習(xí)分類算法和深度學(xué)習(xí)方法進行AD分類的準(zhǔn)確率不斷提高,但即便如此,也仍然存在一些問題,這對未來用于AD早期階段的研究帶來了挑戰(zhàn)。這些問題主要集中在構(gòu)建數(shù)據(jù)集、數(shù)據(jù)處理、研究方向和模型推廣泛化能力等方面。面對以上這些問題,應(yīng)充分做好迎接未來挑戰(zhàn)的準(zhǔn)備。

Table 7 Comparison of different deep learning methods based on multi-mode表7 多模態(tài)下基于深度學(xué)習(xí)方法對比

Table 8 Classification results of different deep learning methods based on multi-mode表8 多模態(tài)下基于深度學(xué)習(xí)方法的分類結(jié)果 %
在數(shù)據(jù)集方面,依然存在數(shù)據(jù)集資源有限和部分?jǐn)?shù)據(jù)缺失的情況。利用計算機輔助方法進行AD早期分類研究時,分類準(zhǔn)確率在很大程度上取決于數(shù)據(jù)樣本量的大小和受試者不同模態(tài)的生物標(biāo)記物是否缺失。小的樣本集在網(wǎng)絡(luò)訓(xùn)練過程中,易出現(xiàn)過擬合現(xiàn)象,同時訓(xùn)練集和測試集數(shù)據(jù)相互混雜、破壞相互獨立性等情況都會對最終分類準(zhǔn)確率帶來負面影響。與單模態(tài)神經(jīng)成像方法相比,多模態(tài)成像方法在分類上有明顯優(yōu)勢,表現(xiàn)為時間和空間分辨率的提高,多樣化生物信息功能互補等。由于在最初采集受試者數(shù)據(jù)時,可能存在成像設(shè)備的限制、受試者人員關(guān)于隱私的要求、運行成本、受試者縱向數(shù)據(jù)研究的缺失等因素,并不能充分保證數(shù)據(jù)集包含滿足實驗和臨床需要的所有模態(tài)數(shù)據(jù)。時代發(fā)展的同時,醫(yī)學(xué)影像學(xué)也取得了很大的進步,是否可以在患者或是受試者進行影像采集時同時獲得獨立且具有互補性的多模態(tài)數(shù)據(jù)將是未來的一個挑戰(zhàn)。
在過去的十多年中,AD早期分類研究是眾多學(xué)者的研究重點。但是,未來的研究中,可以在分類研究的基礎(chǔ)上,把對AD早期診斷的分類轉(zhuǎn)化為對AD早期的預(yù)測,以早期預(yù)測為重點。這不僅是一種新的挑戰(zhàn),對潛在AD早期患者進行必要的臨床治療干預(yù)、提高其生活質(zhì)量和生存率也將具有重要的現(xiàn)實意義。
在模型的推廣和泛化能力等方面,依然存在著問題和挑戰(zhàn)。對于已經(jīng)訓(xùn)練好的模型,能否在其他新出現(xiàn)的患者數(shù)據(jù)上依然具有好的效果,這是一個需要面對的挑戰(zhàn)??赏茝V性也同樣體現(xiàn)在所使用的數(shù)據(jù)集和實驗研究方案的可重復(fù)操作性上,盡可能地選擇公共的大型數(shù)據(jù)集,使用更加詳盡的數(shù)據(jù)處理方式和更優(yōu)秀的分類算法,這對再現(xiàn)實驗、模型推廣、算法改進、提高科研成效等將產(chǎn)生強有力的推進作用。
某些疾病存在異質(zhì)性,AD的發(fā)病機制較為復(fù)雜,不同個體發(fā)病機理多少存在一定差異。近些年來對于AD異質(zhì)性的研究相對較少,本文所描述的有關(guān)傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)方法對AD潛在的臨床病理亞型早期診斷的分類研究可能并不適用。Murray等[63]研究發(fā)現(xiàn),基于體素的形態(tài)學(xué)研究表明,非典型AD的影像學(xué)特征和海馬備用亞型相同,這些非典型受試者存在頂葉萎縮現(xiàn)象,但海馬體體積比典型AD患者高。其中海馬體積保留現(xiàn)象的AD亞型可能占AD病例的25%,這將在一定程度上影響海馬體萎縮同認知能力下降之間的聯(lián)系。有關(guān)AD異質(zhì)性的問題情況,不應(yīng)被研究者所忽視。因此,在基于計算機輔助診斷技術(shù)進行AD早期分類的研究中,能夠針對AD異質(zhì)性生物標(biāo)記物開發(fā)和研究具有針對性和個性化的工具應(yīng)該成為未來的一個研究方向和挑戰(zhàn)。
針對數(shù)據(jù)處理問題,基于ROI的研究需要加強。圖像感興趣目標(biāo)區(qū)域或者對病灶的檢測是診斷的關(guān)鍵部分,加強對ROI的研究,可以提高檢測準(zhǔn)確率或者減少臨床醫(yī)生的讀片時間??梢栽O(shè)法實現(xiàn)在全圖像空間中定位出ROI,再在感興趣區(qū)域進一步識別出特定病灶區(qū);而影像在輸入網(wǎng)絡(luò)前,需要進行一系列標(biāo)準(zhǔn)化的預(yù)處理,這個過程并未實現(xiàn)完全的自動化。數(shù)據(jù)預(yù)處理能在模型訓(xùn)練時加快收斂速度,且能提高模型性能,但是預(yù)處理的過程又太繁瑣,同時需要一定的專業(yè)背景知識,如何使用未處理的影像數(shù)據(jù)進行模型訓(xùn)練并能取得良好的分類效果,是未來需要應(yīng)對的挑戰(zhàn)。
在未來的研究中,應(yīng)從多角度、多模態(tài)方式出發(fā),綜合多方面特征來進行研究,尋找不同生物標(biāo)記物的最佳組合。應(yīng)不斷注重研究方法和所使用的模型,不斷優(yōu)化模型參數(shù),以構(gòu)造最優(yōu)模型。特別要注重研究用于臨床診斷的可行性和適用性,切實提高計算機輔助診斷技術(shù)在阿爾茲海默癥研究中的綜合意義。
本文回顧了近些年來基于計算機輔助診斷技術(shù)進行AD早期分類研究的情況。本文分析研究發(fā)現(xiàn):在AD早期分類研究中,分類的準(zhǔn)確率和敏感度對生物標(biāo)記物的選擇有較高的依賴性。對于特征提取和ROI的分割,如海馬區(qū)、杏仁體、內(nèi)側(cè)顳葉區(qū)、灰質(zhì)和白質(zhì)等,將這些區(qū)域作為特征提取對象區(qū)域?qū)⒂兄谔嵘鼳D早期分類效果。在采用計算機輔助診斷技術(shù)進行AD早期分類的研究中,神經(jīng)影像學(xué)數(shù)據(jù)具有重要的研究意義。神經(jīng)影像學(xué)數(shù)據(jù)MRI、PET和FMRI等屬于高維度圖像,含有空間結(jié)構(gòu)或者時間序列信息,結(jié)構(gòu)復(fù)雜,反映了受試者生理狀態(tài)和病灶區(qū)域的變化等情況。基于傳統(tǒng)機器學(xué)習(xí)或深度學(xué)習(xí)分析方法對影像圖數(shù)據(jù)進行AD分類研究,通過人工智能算法,最終實現(xiàn)輔助臨床診斷研究。在AD早期分類研究中,相對于單模態(tài)生物標(biāo)記物,多模態(tài)生物標(biāo)記物特征融合可以提供更高的分類準(zhǔn)確率。將遷移學(xué)習(xí)用于深度學(xué)習(xí)方法中,能夠在一定程度上克服由于數(shù)據(jù)不足造成的過擬合問題;深度學(xué)習(xí)方法中,CNN的淺層中包含了圖像更一般的特征,該特征對諸多圖像分類任務(wù)有利,且應(yīng)用轉(zhuǎn)移性好,在有限的數(shù)據(jù)樣本下,相對于無遷移學(xué)習(xí)方法的其他一般網(wǎng)絡(luò)模型,CNN具有更好的分類性能。關(guān)于AD早期診斷,各種方法和分類算法所得出的分類結(jié)果,最終還需要結(jié)合具有相應(yīng)臨床經(jīng)驗的醫(yī)生仔細嚴(yán)格的檢查和論證才能給出最后的確診結(jié)果,才能真正發(fā)揮好基于計算機輔助診斷技術(shù)用于AD早期分類的現(xiàn)實作用。