肖君超, 曾衛(wèi)明, 楊嘉君, 石玉虎, 徐艷紅, 焦 磊
1(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
2(上海交通大學(xué)附屬第六人民醫(yī)院 神經(jīng)內(nèi)科,上海 201306)3(上海交通大學(xué)附屬第六人民醫(yī)院 放射科,上海 201306)
最近幾年,由于電子計(jì)算機(jī)和通信技術(shù)的發(fā)展,電子醫(yī)療成為一個(gè)新型的領(lǐng)域,得到快速發(fā)展,許多醫(yī)療形式逐步出現(xiàn)[1-3],預(yù)測(cè)和診斷疾病是一個(gè)重要方面.從醫(yī)療檢測(cè)和可穿戴設(shè)備上,獲得健康狀態(tài)信息,醫(yī)師能為病人做出診斷,或預(yù)測(cè)病人病情未來發(fā)展情況,幫助病人延緩病情.
偏頭痛是一種比較常見的疾病,會(huì)出現(xiàn)經(jīng)常性的頭痛,同時(shí)伴隨有畏光、嘔吐、惡心等生理反應(yīng)的慢性神經(jīng)綜合征[4]. 偏頭痛發(fā)病率較高,在醫(yī)學(xué)界多年研究中,也沒有找到偏頭痛致病機(jī)制的有效依據(jù),對(duì)于偏頭痛的診斷還缺乏足夠的生物學(xué)標(biāo)志[4,5].
靜息態(tài)功能核磁共振成像技術(shù),是一種非侵入式探測(cè)神經(jīng)元活動(dòng)的測(cè)量方法,受到很多學(xué)者關(guān)注. 靜息態(tài)功能核磁共振成像,在分析大腦網(wǎng)絡(luò)中起著重要的作用[6-8],已經(jīng)應(yīng)用在分析各種精神疾病上[9],比如:老年癡呆[10]、帕金森[11]和精神分裂癥[12].
近年來,由于深度學(xué)習(xí)在語音識(shí)別和圖像處理中,取得突破性的進(jìn)展,被廣泛應(yīng)用在各種工程領(lǐng)域. 最近,國內(nèi)外很多學(xué)者將深度學(xué)習(xí)用于功能核磁共振成像數(shù)據(jù)分析,診斷阿爾茨海默癥,得到相對(duì)理想的預(yù)測(cè)效果.在用深度學(xué)習(xí)診斷阿爾茨海默癥中,更多論文采用softmax分類器與深度模型一起訓(xùn)練. 此類算法根據(jù)softmax分類器分類正確率為依據(jù),調(diào)整深度模型各個(gè)隱藏層神經(jīng)單元的權(quán)重,使得分類正確率達(dá)到一個(gè)理想的結(jié)果之后停止迭代. 此類算法與傳統(tǒng)的淺層分類器相比,分類正確率更高[13,14]. 由于此類算法在提取數(shù)據(jù)特征時(shí),用到大量的先驗(yàn)信息,即已經(jīng)擁有大量的確診病例,可以在實(shí)驗(yàn)樣本數(shù)相對(duì)豐富的條件下,訓(xùn)練網(wǎng)絡(luò)達(dá)到理想效果. 由于阿爾茨海默癥臨床癥狀表現(xiàn)明顯,在確診上相對(duì)容易,獲得較多的實(shí)驗(yàn)樣本并不困難.而偏頭痛在臨床診斷上相對(duì)復(fù)雜,病例確診相對(duì)困難,較難獲取大量實(shí)驗(yàn)樣本數(shù)據(jù). 采用softmax分類器與深度模型一起訓(xùn)練的算法,因?yàn)閷?shí)驗(yàn)樣本較少效果并不理想. 本文采用深度學(xué)習(xí)的深度自編碼器算法,該算法根據(jù)輸入樣本數(shù)據(jù)和輸出樣本數(shù)據(jù)的差異,更新各隱藏層神經(jīng)元權(quán)重,因此在提取實(shí)驗(yàn)樣本數(shù)據(jù)特征時(shí),不需要知道實(shí)驗(yàn)樣本數(shù)據(jù)是健康被試或偏頭痛患者. 該算法不需要過多確診病例樣本來訓(xùn)練神經(jīng)網(wǎng)絡(luò),提取有效特征. 這符合人們?cè)趯?duì)偏頭痛的致病機(jī)理尚不明確的前提下,有效檢測(cè)偏頭痛. 本文最后實(shí)驗(yàn)結(jié)果說明,深度自編碼器獲取的數(shù)據(jù)特征,應(yīng)用到各種分類算法中都能提高分類正確率.
本文偏頭痛數(shù)據(jù)為上海交通大學(xué)附屬第六人民醫(yī)院(東院)經(jīng)過臨床確診的24例數(shù)據(jù),去除不合格的數(shù)據(jù)后還剩17例,平均年齡為45.6歲. 同期選取了100個(gè)正常人作為健康對(duì)照組,平均年齡43.5歲. 該fMRI數(shù)據(jù)采用Siemens MRI儀(3T)數(shù)據(jù)獲取時(shí),要求被試者保持大腦清醒,并平躺于MRI儀器內(nèi),不做任何思考. 掃描參數(shù):采用單次激發(fā)敏感梯度回波平面成像,切片數(shù)為38,覆蓋整個(gè)腦區(qū),TR 3.0 s,掃描分辨率為64×64,片內(nèi)分辨率為4 mm×4 mm,片厚度4 mm.
采用SPM8[15]對(duì)靜息態(tài)功能磁共振數(shù)據(jù)進(jìn)行預(yù)處理,主要進(jìn)行時(shí)間層矯正、頭動(dòng)矯正、圖像標(biāo)準(zhǔn)化等步驟. 在頭動(dòng)矯正過程中,配準(zhǔn)時(shí)在任何方向上位移>1.5 mm或頭部轉(zhuǎn)動(dòng)>1.5°的數(shù)據(jù)均被丟棄; 帶通濾波器參數(shù)為0.01 Hz 自動(dòng)解剖標(biāo)簽?zāi)0錥16]將小腦去除在外,大腦被分為90個(gè)腦區(qū). 通過計(jì)算每個(gè)腦區(qū)之間的皮爾森相關(guān)系數(shù),可以獲得一個(gè)90×90的對(duì)稱矩陣. 然后獲取該對(duì)稱矩陣的上三角部分,并且將其所有元素放在一行,作為一個(gè)被試樣本的特征數(shù)據(jù). 自動(dòng)編碼器可以自動(dòng)獲取待分析數(shù)據(jù)的特征,而不需要專家通過先驗(yàn)知識(shí)提取特征. 經(jīng)典自動(dòng)編碼器有一個(gè)輸入層、一個(gè)隱藏層和一個(gè)輸出層. 輸入層和輸出層的神經(jīng)元個(gè)數(shù)相等. 自動(dòng)編碼器是無監(jiān)督學(xué)習(xí)方法,復(fù)雜的高維數(shù)據(jù)被自動(dòng)編碼為低維數(shù)據(jù). 自動(dòng)編碼器嘗試逼近一個(gè)恒等函數(shù),從而使得輸出值接近于輸入值x. 自動(dòng)編碼器由兩個(gè)函數(shù)組成,第一個(gè)是編碼函數(shù),映射高維數(shù)據(jù)到隱藏特征h,分別表示權(quán)重和偏置. 第二個(gè)是解碼函數(shù),映射隱藏特征h到,是輸入數(shù)據(jù)x的一個(gè)近似值與第一個(gè)函數(shù)參數(shù)意義相同.代表數(shù)據(jù)維數(shù)的映射規(guī)則,N表示輸入數(shù)據(jù)的維數(shù),K表示隱藏層神經(jīng)元的個(gè)數(shù). ?1(·)表示激活函數(shù),w1是一個(gè)N×K的矩陣,b1表示偏置向量. 解碼函數(shù)映射隱藏特征h到x的重構(gòu)數(shù)據(jù)?公式表示為: ?2、w2和b2表示的意義與公式(1)相同. 自動(dòng)編碼器的參數(shù) θ ={θ1,θ2}通過減小損失函數(shù)值來確定,損失函數(shù)能最小化重構(gòu)誤差使得公式如下: 這是一個(gè)最基本的自動(dòng)編碼器的構(gòu)成,下面將介紹如何將它們組合在一起構(gòu)造出深度模型. 如圖1所示構(gòu)造具有3個(gè)隱藏層的自動(dòng)編碼器.可以看出,第一個(gè)隱藏層神經(jīng)元個(gè)數(shù)少于輸出層神經(jīng)元個(gè)數(shù). 第二個(gè)隱藏層神經(jīng)元個(gè)數(shù)少于第一個(gè)隱藏層神經(jīng)元個(gè)數(shù),以此類推,每一個(gè)隱藏層神經(jīng)元個(gè)數(shù)都少于前面隱藏層神經(jīng)元個(gè)數(shù),最后輸出層神經(jīng)元個(gè)數(shù)擴(kuò)大到與輸入層神經(jīng)元個(gè)數(shù)相同. 加入輸出層是為了損失函數(shù)可以估算,最后輸出數(shù)據(jù)與輸入數(shù)據(jù)的區(qū)別,從而可以根據(jù)區(qū)別程度,更新自動(dòng)編碼器的權(quán)重. 自動(dòng)編碼器自動(dòng)提取的突顯特征在最后一個(gè)隱藏層,用第三個(gè)隱藏層輸出的數(shù)據(jù),作為自動(dòng)編碼器自動(dòng)獲得的特征. 通過逐漸減少隱藏層神經(jīng)元個(gè)數(shù),迫使自動(dòng)編碼器學(xué)習(xí)輸入數(shù)據(jù)低維表示. 這種結(jié)構(gòu)能捕獲到輸入數(shù)據(jù)特征在特定空間上的分布,并且將高維的復(fù)雜數(shù)據(jù)降低到低維數(shù)據(jù). 用Adadelta優(yōu)化算法訓(xùn)練整個(gè)網(wǎng)絡(luò),它能根據(jù)學(xué)習(xí)環(huán)境自動(dòng)調(diào)節(jié)學(xué)習(xí)參數(shù). 激活函數(shù)采用非線性函數(shù)Relu,通過采用非線性激活函數(shù),自動(dòng)編碼器能學(xué)習(xí)到,不同于采用主成分分析得到的數(shù)據(jù)特征. 自動(dòng)編碼器獲得的特征,可以用帶有少量參數(shù)的非線性函數(shù)表示更復(fù)雜的函數(shù). 因此,深度模型完全不同于淺層模型[17] 圖1 構(gòu)造擁有三個(gè)隱藏層的深度自動(dòng)編碼器 深度自動(dòng)編碼器中,輸入層、輸出層、各個(gè)隱藏層神經(jīng)元個(gè)數(shù)和激活函數(shù)如表1所示,此模型迭代訓(xùn)練7000次之后,作為訓(xùn)練完成的深度自動(dòng)編碼器. 本文用兩種方法訓(xùn)練分類器,其一,如圖2(a)所示,用自動(dòng)解剖標(biāo)簽?zāi)0瀚@得fMRI樣本特征,訓(xùn)練傳統(tǒng)分類器,測(cè)試分類正確率. 其二,如圖2(b)所示,用模板獲得的特征訓(xùn)練自動(dòng)編碼器,已訓(xùn)練的自動(dòng)編碼器提取精細(xì)特征之后,訓(xùn)練傳統(tǒng)分類器. 表1 深度自動(dòng)編碼器各層神經(jīng)元個(gè)數(shù)和激活函數(shù) 圖2 分類器訓(xùn)練方法 根據(jù)自動(dòng)解剖模板獲取的特征,作為原始特征,自動(dòng)編碼器自動(dòng)獲得的特征,作為精細(xì)特征,分別用這兩種特征,比較各種分類算法達(dá)到的正確率. 分別用線性支持向量機(jī)(線性-SVM)、k近鄰、徑向基核函數(shù)支持向量機(jī)(RBF-SVM)和決策樹進(jìn)行分類. 分類算法各參數(shù)配置為scikit-learn軟件包中,各種算法的默認(rèn)配置.首先,選10個(gè)偏頭痛原始特征和10個(gè)健康人原始特征,作為訓(xùn)練數(shù)據(jù),訓(xùn)練以上4種分類器和深度自動(dòng)編碼器. 將剩下的7個(gè)偏頭痛數(shù)據(jù),加上另外隨機(jī)選取的7個(gè)健康對(duì)照組數(shù)據(jù),作為測(cè)試數(shù)據(jù),驗(yàn)證各種分類器分類正確率. 發(fā)現(xiàn)7個(gè)偏頭痛數(shù)據(jù),不管是在原始特征作為分類器的輸入數(shù)據(jù)下,還是在精細(xì)特征作為分類器的輸入數(shù)據(jù)下,7個(gè)偏頭痛數(shù)據(jù)都能進(jìn)行正確分類.而7個(gè)健康人數(shù)據(jù),在原始特征作為分類器的輸入數(shù)據(jù)下,出現(xiàn)個(gè)別錯(cuò)誤. 由于偏頭痛數(shù)據(jù)采集困難,數(shù)據(jù)樣本不多,而僅有的7個(gè)測(cè)試數(shù)據(jù)都被各個(gè)分類器正確分類,無法在大樣本下,檢驗(yàn)各個(gè)分類器將偏頭痛分進(jìn)健康對(duì)照組的錯(cuò)誤率. 健康對(duì)照組樣本數(shù)量相對(duì)較多,可以在健康對(duì)照組中,檢驗(yàn)各個(gè)分類器將健康人分進(jìn)偏頭痛的錯(cuò)誤率. 將其余83個(gè)健康人數(shù)據(jù),作為測(cè)試數(shù)據(jù),檢驗(yàn)各個(gè)分類器的分類性能. 實(shí)驗(yàn)結(jié)果如表2、表3和圖3所示,具體討論在第4節(jié)中. 表2 原始特征訓(xùn)練的分類器分類正確率和分類錯(cuò)誤個(gè)數(shù) 表3 精細(xì)特征訓(xùn)練的分類器分類正確率和分類錯(cuò)誤個(gè)數(shù) 圖3 各種分類器,分類健康對(duì)照組的正確率 如表2所示,用83個(gè)健康人數(shù)據(jù),在原始特征下訓(xùn)練的分類器,分類健康人的實(shí)驗(yàn)結(jié)果. RBF-SVM在原始特征作為訓(xùn)練數(shù)據(jù)下,分類效果最差,決策樹效果次之. 線性-SVM分類效果好于RBF-SVM,可能由于原始特征在原始維度空間中,數(shù)據(jù)分布已經(jīng)較好的達(dá)到線性可分程度. 用RBF-SVM將數(shù)據(jù)映射到更高維的空間中,尋找分類超平面,分類效果反而沒有線性-SVM分類效果好,說明在原始空間中的數(shù)據(jù)映射到高維空間中,支持向量機(jī)沒有找到很好的分類超平面分類數(shù)據(jù). 如表3所示,經(jīng)過深度學(xué)習(xí)提取特征之后,RBFSVM分類效果和線性-SVM分類效果都有所提高,并且高于其他分類器分類效果. RBF-SVM將精細(xì)特征映射到高維空間后,能找到更好的分類超平面分類數(shù)據(jù).說明,深度學(xué)習(xí)提取的特征分布,更適合映射到高維空間,尋找到更好的分類超平面. 如圖3所示,分別用精細(xì)特征和原始特征訓(xùn)練各個(gè)分類器,得到的分類正確率. 從圖中可以看出,經(jīng)過深度學(xué)習(xí)提取的精細(xì)特征,在分類正確率上,明顯高于用原始特征訓(xùn)練的各個(gè)分類器. 可以說明,深度學(xué)習(xí)提取的特征,可以提高一些分類器分類效果,在預(yù)測(cè)偏頭痛上,擁有更高預(yù)測(cè)效果. 自動(dòng)解剖標(biāo)簽?zāi)0逄崛〉脑继卣?訓(xùn)練分類器,各個(gè)分類器的平均分類正確率,能達(dá)到88.86%. 說明,偏頭痛病人存在特殊的腦功能網(wǎng)絡(luò),這個(gè)腦功能網(wǎng)絡(luò)與正常人的腦功能網(wǎng)絡(luò),存在一定差異,使得用傳統(tǒng)分類器也能達(dá)到較高的分類正確率. 但是,因?yàn)閾碛卸鄬咏Y(jié)構(gòu)來提取特征,深度學(xué)習(xí)擁有更完美的方式表達(dá)特征. 在我們構(gòu)建的自動(dòng)編碼器中,輸入的大腦區(qū)域相關(guān)性,被表達(dá)為更高層次的描述. 各個(gè)分類器的平均分類正確率,達(dá)到93.07%就是最好的證明. 在深度學(xué)習(xí)中,輸入數(shù)據(jù)經(jīng)過已經(jīng)訓(xùn)練好的自動(dòng)編碼器,提取出擁有更好分類界限的特征,為傳統(tǒng)分類器提高分類效果. 在自動(dòng)編碼器每個(gè)隱藏層中,每個(gè)神經(jīng)元的權(quán)重,能表達(dá)新的物理學(xué)和生理學(xué)意義. 通過分類挑選和校驗(yàn)大量的權(quán)重,能找到某2個(gè)腦區(qū)的相關(guān)系數(shù),對(duì)于預(yù)測(cè)偏頭痛起到更重要的作用. 偏頭痛在臨床診斷中沒有影像學(xué)診斷標(biāo)準(zhǔn),通過我們對(duì)偏頭痛患者靜息態(tài)功能磁共振的研究,提出一種深度學(xué)習(xí)的特征提取方法,在不需要較多先驗(yàn)知識(shí)的前提下,提取出精細(xì)特征,提高各種分類器分類效果.經(jīng)過深度學(xué)習(xí)提取的特征,在各種分類器分類結(jié)果中,都能有效提高分類正確率. 進(jìn)一步研究,可以獲得更多的偏頭痛數(shù)據(jù),用更多的樣本數(shù)據(jù)訓(xùn)練分類器,從而提高分類器分類效果,為臨床診斷偏頭痛提供重要的影像參考. 1 Sloot PMA,Tirado-Ramos A,Altintas I,et al. From molecule to man:Decision support in individualized e-health.Computer,2006,39(11):40-46. [doi:10.1109/MC.2006.380] 2Ronga LS,Jayousi S,Del Re E,et al. TESHEALTH:An integrated satellite/terrestrial system for e-health services.Proceedings of 2012 IEEE International Conference on Communications (ICC). Ottawa,ON,Canada. 2012.3286-2890. 3 Liang J,Sahama T. Online multiple profile manager for eHealth information sharing. Proceedings of 2012 IEEE International Conference on Communications (ICC). Ottawa,ON,Canada. 2012. 3461-3465. 4 Kim JH,Suh SL,Seol HY,et al. Regional grey matter changes in patients with migraine:A voxel-based morphometry study. Cephalalgia An International Journal of Headache,2008,28(6):598-604. [doi:10.1111/j.1468-2982.2008.01550.x] 5 Cutrer FM,Black DF. Imaging findings of migraine.Headache:The Journal of Head and Face Pain,2006,46(7):1095-1107. [doi:10.1111/hed.2006.46.issue-7] 6 Schwedt TJ,Dodick DW. Advanced neuroimaging of migraine. The Lancet Neurology,2009,8(6):560-568. [doi:10.1016/S1474-4422(09)70107-3] 7 Shi YH,Zeng WM,Wang NZ,et al. A novel fMRI group data analysis method based on data-driven reference extracting from group subjects. Computer Methods and Programs in Biomedicine,2015,122(3):362-371. [doi:10.1016/j.cmpb.2015.09.002] 8 Shi YH,Zeng WM,Wang NZ. SCGICAR:Spatial concatenation based group ICA with reference for fMRI data analysis. Computer Methods and Programs in Biomedicine,2017,148:137-151. [doi:10.1016/j.cmpb.2017.07.001] 9 Shi YH,Zeng WM,Wang NZ,et al. A new method for independent component analysis with priori information based on multi-objective optimization. Journal of Neuroscience Methods,2017,283:72-82. [doi:10.1016/j.jneumeth.2017.03.018] 10 Ferri R,Rundo F,Bruni O,et al. Small-world network organization of functional connectivity of EEG slow-wave activity during sleep. Clinical Neurophysiology,2007,118(2):449-456. [doi:10.1016/j.clinph.2006.10.021] 11 Guo ZW,Liu XZ,Jia XZ,et al. Regional coherence changes in alzheimer’s disease patients with depressive symptoms:A resting-state functional MRI study. Journal of Alzheimer’s Disease,2015,48(3):603-611. [doi:10.3233/JAD-150460] 12 Wu T,Long XY,Zang YF,et al. Regional homogeneity changes in patients with Parkinson’s disease. Human Brain Mapping,2009,30(5):1502-1510. [doi:10.1002/hbm.v30:5] 13 Liu SQ,Liu SD,Cai WD,et al. Early diagnosis of Alzheimer’s disease with deep learning. Proceedings of the 11th International Symposium on Biomedical Imaging(ISBI). Beijing,China. 2014. 1015-1018. 14 Suk HI,Shen D. Deep learning-based feature representation for AD/MCI classification. In:Mori K,Sakuma I,Sato Y,et al. eds. Medical Image Computing and Computer-Assisted Intervention-MICCAI 2013. Berlin,Heidelberg:Springer,2013. 583-590. 15 SPM. http://www.fil.ion.ucl.ac.uk/spm. [2018-01-03]. 16 Tzourio-Mazoyer N,Landeau B,Papathanassiou D,et al.Automated anatomical labeling of activations in SPM using a macroscopic anatomical parcellation of the MNI MRI singlesubject brain. Neuroimage,2002,15(1):273-289. [doi:10.1006/nimg.2001.0978] 17 Bengio Y,Lecun Y. Scaling learning algorithms towards AI.In:Bottou L,Chapelle O,DeCoste D,et al. eds. Large-Scale Kernel Machines. Cambridge,MA. MIT Press,2007.321-359.2 深度學(xué)習(xí)模型
2.1 自動(dòng)編碼器
2.2 構(gòu)造深度自動(dòng)編碼器
3 實(shí)驗(yàn)步驟與結(jié)果
3.1 實(shí)驗(yàn)過程與步驟
3.2 實(shí)驗(yàn)結(jié)果
4 討論
5 結(jié)論與展望