蔣嘉蕊,牛振東
北京理工大學計算機學院,北京市100081
人口老齡化已成為世界性的普遍現(xiàn)象。預測到2030年,世界65歲以上老年人將從2000年的4.2億增加到近10 億[1]。阿爾茨海默病(Alzheimer's disease,AD)是一種神經(jīng)退行性疾病[2],在65 歲及以上老年人中越來越普遍,其特征是神經(jīng)元及其連接進行性不可逆損傷,導致認知功能下降和喪失。根據(jù)認知障礙程度,AD分為癥狀前、輕度認知障礙和癡呆階段[3]。
目前,AD尚無法治愈[4],早期診斷和預防尤為重要。過去AD 的確診多取決于患者死亡腦組織檢查[5]。隨著計算機技術的不斷發(fā)展,計算機輔助AD 早期診斷逐漸流行,研究方法主要包括機器學習和深度學習。機器學習已被廣泛應用[6]。深度學習作為機器學習的一個分支,近年來取得很大發(fā)展[7]。深度學習采用端到端的學習方式,省略圖像分割、特征提取和特征選擇的過程[8],分類效果優(yōu)于機器學習,日益受到重視。
本文對近5 年深度學習在AD 診斷中應用研究的熱點和趨勢進行可視化分析。
檢索Web of Science(WoS)核心數(shù)據(jù)庫。時間范圍為2017 年1 月1 日至2021 年12 月31 日。檢索式為deep learning AND Alzheimer disease AND disease diag‐nosis。剔除資訊、會議類論文,采用軟件自帶的去重功能和人工去重,刪除與本主題無關、字段值缺失等文獻。共檢索出文獻306篇。
采用CiteSpace 6.1.R3 軟件[9-11],分別從年發(fā)文量、國家、機構、作者、關鍵詞、共被引文獻等方面進行可視化分析。其中,時間分段選擇“2017-2021”,時間分區(qū)選擇“1”;閾值選擇“TOP N”,N=50;網(wǎng)絡剪裁在“Pathfinder”“Pruning the merged network”和“Pruning the sliced networks”三種算法中選擇。
近5 年來,深度學習在AD 診斷相關領域研究熱度逐年遞增,發(fā)文量呈上升趨勢,見圖1。
圖1 相關文獻年發(fā)文量趨勢圖
節(jié)點設定為Country,得到55 個節(jié)點,105 條線(圖2)。發(fā)文量最多的國家為中國102 篇,其次是美國76 篇,韓國42 篇,英國31 篇,印度28 篇。中心性最高的國家是美國0.56,其次為西班牙0.25,英國0.21,德國0.20,韓國0.19。美國、韓國、英國在發(fā)文量和中心性方面均處于領先,在該領域具有重大影響力。我國發(fā)文量雖排名第1,中心性只有0.05。
圖2 國家/地區(qū)合作網(wǎng)絡
節(jié)點設定為Institution,得到662 個節(jié)點,1 738條線(圖3)。發(fā)文量最多的機構為中國科學院10 篇,其次為高麗大學9 篇,深圳大學8 篇,北卡羅來納大學8 篇,上海交通大學8 篇。中心性最高的是中國科學院0.17 和中國科學院大學0.13,其次為南京航空航天大學0.13、高麗大學0.11、北卡羅來納大學0.11。
圖3 研究機構合作網(wǎng)絡
節(jié)點設定為Author,得到876 個節(jié)點,2 760 條連線。發(fā)文量最高的作者是Liu M (11 篇),他提出一種基于卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)的多模型深度學習框架,用于結構MRI數(shù)據(jù)進行海馬自動分割和AD 分類[12-13]。發(fā)文量排名前5 的還有Zhang Y[14-15](10 篇)、Wang Y[16](9 篇)、Liu Y[17](8 篇)、Kim J S[18](7篇)。
2.5.1 突顯分析
節(jié)點設定為Keyword 進行突顯分析,出現(xiàn)5 個突顯關鍵詞(圖4),分別為AD 疾病診斷、魯棒性、網(wǎng)絡、連接性、人工神經(jīng)網(wǎng)絡。越來越多的模型關注魯棒性,有研究提出一種通用算法來訓練數(shù)據(jù)不完整的LSTM網(wǎng)絡,提高模型的魯棒性[19]。
圖4 關鍵詞突顯分析
2.5.2 共現(xiàn)分析
節(jié)點設定為Keyword,得到259個節(jié)點,959條線(圖5)。除檢索詞外,頻次排名前5的關鍵詞依次是輕度認知功能障礙、分類、磁共振成像、CNN 和癡呆。中心性排名前5 的關鍵詞依次是選擇、靜息態(tài)磁共振成像、遷移學習、特征排序和結構磁共振成像(struc‐tural MRI,sMRI)。見表1。
圖5 關鍵詞共現(xiàn)圖
表1 高頻及高中心性關鍵詞
2.5.3 聚類分析
節(jié)點設定為Keyword,通過LLR 進行聚類,Mo‐dality Q=0.67,Mean Sihouette=0.86,聚類結構顯著,且聚類效果良好[20]。見圖6和表2。
圖6 關鍵詞聚類
表2 主要聚類及其包含關鍵詞
應用的醫(yī)學影像技術主要有sMRI、正電子發(fā)射斷層掃描(positron emission computed tomography,PET)、功能磁共振成像、腦電圖。sMRI 可以無創(chuàng)地捕捉AD 患者腦萎縮的演變[21]。正電子發(fā)射斷層掃描可通過注入放射性示蹤劑捕捉AD 典型的淀粉樣沉積[22]。功能磁共振成像是分析大腦網(wǎng)絡功能連接的主要神經(jīng)影像模式[23]。腦電圖是一種低成本、無創(chuàng)的測量網(wǎng)絡,可以記錄大腦的電活動,腦電圖的異常,如節(jié)律減慢、復雜性喪失和通道之間的同步改變,可能提示腦退化[24]。
常用數(shù)據(jù)集有阿爾茨海默病神經(jīng)影像學倡議(Al‐zheimer's Disease Neuroimaging Initiative,ADNI)、開放獲取系列成像研究數(shù)據(jù)集(Open Access Same Time Information System,OASIS)。ADNI 的主要目標是測試MRI、PET 和其他生物標志物,以及臨床和神經(jīng)心理評估是否可以結合起來測量輕度認知障礙和早期AD 的進展[25-26]。OASIS 由橫斷面和縱向面數(shù)據(jù)集組成,是僅次于ADNI 的核心數(shù)據(jù)資源[27]。針對AD 檢測的心理測試主要包括簡易精神狀態(tài)檢查[28]。AD 早期診斷問題主要可以分為三類:二元分類[29-30]、多元分類[31]和預測[32]。采用的深度學習結構主要有CNN 和深度生成模型(deep generative model,DGM)。CNN 包括2D-CNN[33]和3D-CNN[34-35]兩種。DGM 包括自編碼器[36-37]、深度信念網(wǎng)絡、受限玻爾茲曼機[38-39]。
2.6.1 共被引分析
節(jié)點設定為Reference,被引頻次排名前5 的文獻見表3。其中Liu 等[40]Multimodal neuroimaging feature learning for multiclass diagnosis of Alzheimer's disease被引頻次最高,該研究設計一種基于多層神經(jīng)網(wǎng)絡的新型診斷框架,融合多模式神經(jīng)成像特征以幫助診斷AD,在AD 二元分類和多元分類中都實現(xiàn)了性能提升。Basaia 等[41]Automated classification of Alzheimer'sdisease and mild cognitive impairment using a single MRI and deep neural networks通過比較來自不同中心、神經(jīng)成像協(xié)議和掃描儀的數(shù)據(jù),克服數(shù)據(jù)來源單一的限制,達到結果的可靠性和可重復性。
表3 高頻次被引文獻
2.6.2 突顯分析
節(jié)點設定為Reference 進行突顯分析(圖7)。Suk等[42]Hierarchical feature representation and multimodal fusion with deep learning for AD/MCI diagnosis突顯時間最早,研究使用堆疊自編碼器學習用于AD 分類的MRI和PET腦圖像的多層次和多模態(tài)特征。
圖7 參考文獻突顯分析
本研究采用CiteSpace 對近5 年深度學習在AD 診斷中的應用的相關文獻進行可視化分析,結果顯示,發(fā)文量逐年增加,說明深度學習在AD 診斷領域的可行性。美國、韓國、英國在發(fā)文量和中心性方面均領先。我國發(fā)文量雖排名第1,但中心性只有0.05,未來應注意增加與其他國家的合作,提高國際影響力。
AD 診斷越來越依賴于腦影像技術。通過對關鍵詞和參考文獻的分析發(fā)現(xiàn),該領域使用的醫(yī)學影像技術主要有MRI、PET、腦電圖等。早期研究多采用單一腦影像技術即單模態(tài)神經(jīng)成像方法進行輔助診斷,近年來傾向采用多種醫(yī)學影像技術整合,即多模態(tài)成像方法進行輔助診斷。多模態(tài)成像方法的時間和空間分辨率更好,具有生物信息功能互補等特性,在分類上也更具優(yōu)勢[43]。由上述技術采集的數(shù)據(jù)形成數(shù)據(jù)集,常用有ADNI 和OASIS。進一步研究應將上述數(shù)據(jù)與臨床和神經(jīng)心理評估數(shù)據(jù)及其他生物標志物相結合,以提高分類和預測的準確性。
AD 早期診斷問題主要分為3 類:二元分類[28-29]、多元分類[30]和預測[31]。目前的研究多集中在對AD 早期診斷的二元、多元分類,對于MCI 到AD 轉換預測的研究較少。
CNN 是最多研究者選擇的深度學習模型[44]。深度學習能進行數(shù)據(jù)驅動的自動特征學習,消除了選擇相關特征的主觀性。通過應用非線性的層次結構,深度學習能夠對非常復雜的數(shù)據(jù)模式建模。采用深度學習方法進行AD診斷的準確率不斷提高。
采用深度學習進行AD 診斷也存在一些問題。標記AD 診斷醫(yī)學圖像是一項耗時且昂貴的任務[45];當前數(shù)據(jù)樣本量尚不充分,而依靠數(shù)據(jù)增強和遷移學習緩解數(shù)據(jù)量不足問題的技術仍有局限[46]。進一步研究要不斷降低數(shù)據(jù)采集成本、并盡可能采集互補性更強的多模態(tài)數(shù)據(jù),不斷豐富研究數(shù)據(jù);應優(yōu)化基準測試平臺,探索不同數(shù)據(jù)模式之間的關聯(lián),克服因數(shù)據(jù)集、分類模式和受試者數(shù)量差異造成的研究間無法比較的局限,提高模型預測精度。
本研究選用單一數(shù)據(jù)庫進行分析,對年份、語種、文獻類型進行了限制,導致許多研究未納入統(tǒng)計,有待進一步完善。
利益沖突聲明:所有作者聲明不存在利益沖突。