張夫一 葛曼玲? 郭志彤 謝沖 楊澤坤 宋子博
1) (河北工業(yè)大學, 省部共建電工裝備可靠性與智能化國家重點實驗室, 天津 300130)2) (河北工業(yè)大學, 河北省電磁場與電器可靠性重點實驗室, 天津 300130)(2020年1月8日收到; 2020年3月20日收到修改稿)
當前, 靜息態(tài)功能磁共振成像(rfMRI)為腦功能檢測提供了高效、快捷的先進技術. 熵可以捕捉神經信號動態(tài)特征, 可作為量化評估參數, 但尚存在固定尺度計算缺陷且對認知行為的生物學標記少有研究, 影響檢測精準性. 為此, 本文將多尺度熵模型與機器學習方法聯合, 尋求BOLD 信號復雜度表征健康老年人認知分數的功能影像學標記. 由掃描前認知量表測試分數將98 名健康老年人分為優(yōu)、差兩組, 78 名納入訓練,20 名納入測試. 首先, 構建多尺度熵模型, 計算兩組掃描數據熵, 統(tǒng)計和對比以優(yōu)化模型參數; 然后, 在優(yōu)化參數下由統(tǒng)計顯著性高的腦區(qū)熵值構建特征向量; 最后, 用極限學習機對兩組分類并統(tǒng)計檢驗. 發(fā)現:rfMRI 多尺度熵在評估老年人認知分數時, 在額、顳葉腦區(qū)存在較大顯著性差異, 以此為標記區(qū)分認知分數可達80%準確率. 結論: 額、顳葉等腦區(qū)優(yōu)化的多尺度熵可有效區(qū)分健康老年人認知行為優(yōu)劣. 該研究將為rfMRI 替代主觀繁瑣的傳統(tǒng)認知量表測試提供新的檢測參數和新方法.
隨著全球人口老齡化形勢日益嚴峻, 老年人群體健康狀況越來越受到關注, 尤其是認知水平關乎生命質量而受到格外注意, 盡早了解老年人認知能力狀況, 是采取預防或干預措施以減緩退行性或病理性認知功能減退的重要前提, 特別是對具有日常生活能力, 且精神、軀體和社會層面皆健康的老年人(健康老年人)認知能力的檢測, 是區(qū)分退行性和病理性減退的基礎, 也是評估認知障礙的先決條件, 因而顯得尤為重要.
大腦是復雜的非線性系統(tǒng), 從非線性動力學角度研究生理信號復雜度是腦科學的重要基礎. 生理復雜度通常是通過量化分析檢測信號時間序列的規(guī)律性(有序性)來評估生理活動的動態(tài)變化[1,2],可反映大腦在某些動態(tài)機制中功能狀態(tài)的改變, 對其進行研究可提取大腦的健康(或疾病)狀況以及腦狀態(tài)變化特征, 從而實現精準有效的功能檢測.
熵作為一個經典物理量, 被廣泛應用于非線性序列分析中, 如醫(yī)學、電力、機械等各個領域[3,4].熵模型經歷了近似熵、樣本熵、多尺度熵(multiscale entropy, MSE)等發(fā)展歷史. 近似熵模型由Pincus[5]首次提出, 可從較少數據量中識別時間序列變化復雜度, 其優(yōu)勢之一是將復雜系統(tǒng)分類為確定性和隨機性兩類. 其后, 樣本熵模型由Richman 和Moorman[6]將其改進和發(fā)展, 它可在計算概率時不包括自匹配, 消除了自匹配所產生的計算偏差, 因此, 它比近似熵更簡單, 而且對時間序列長度依賴性更小, 被廣泛應用于生理信號的時間序列計算中, 但固定尺度計算熵值很難捕捉病理變化. 為此, Costa 等[1,7]提出了MSE 概念, 用以表征生理系統(tǒng)在不同狀態(tài)下所表現的復雜特性, 避免了從單一尺度上計算時間序列而導致的誤差. 并且, 通過心率變異性研究發(fā)現: MSE 比單一尺度樣本熵能更好地闡明在健康和疾病狀態(tài)下人體生理信號復雜度的差別, 研究結果支持衰老和疾病的“復雜性損失”理論, 即隨著人體衰老或疾病, 生理信號復雜度會逐漸減小.
在腦科學方面, 熵模型運用在腦電/腦磁[8,9]、功能磁共振成像[10]等信號處理上, 可從復雜度角度揭示大腦生理、病理和功能的變化規(guī)律. 大腦神經細胞在靜息態(tài)(閉眼、清醒、無特定認知任務)下也存在協(xié)同活動, 并保持著在任務態(tài)時才出現的復雜網絡系統(tǒng), 低頻波動的BOLD 信號并不是隨機噪聲, 而是反映了人腦自發(fā)神經活動, 具有一定生理意義[11]. 因無需受試者執(zhí)行特定任務, 卻可以用來研究人腦內在功能架構, 靜息態(tài)下相關性和復雜度等檢測算法受到當今科學研究和臨床檢測的青睞. 除了高空間分辨率和無損優(yōu)勢外, 靜息態(tài)下功能磁共振成像(rfMRI)還比腦電/腦磁、任務態(tài)下功能磁共振成像等先進檢測技術更簡捷、快速(15 min 內), 比一貫使用的量表認知檢測更客觀、方便、快捷和高效, 因此, 這項技術成為替代傳統(tǒng)檢測手段的首選[11?14]. 另外, 從非線性系統(tǒng)角度出發(fā)進行BOLD 信號分析, 有助于深入認識復雜度這一評估參數的物理意義, 有利于提高檢測精準性.
本文試圖將多重物理量優(yōu)化和現代機器學習方法相結合, 探討rfMRI 信號復雜度區(qū)分認知分數的可能性, 為評估健康老年人認知行為(本文采用掃描前認知量表測試分數定義認知行為優(yōu)劣)的先進技術提供新的參數和新方法. 首先, 基于rfMRI 信號優(yōu)化多尺度熵模型的計算參數, 以尋求區(qū)分健康老年人認知行為優(yōu)劣的腦功能影像學標記. 然后, 根據標記, 采用現代機器學習技術—極限學習機(extreme learning machine, ELM)對認知分數進行分類, 以實現客觀、有效地評估健康老年人認知行為的研究目的, 加強rfMRI 技術在認知功能評估上的競爭力, 取代主觀、繁瑣的傳統(tǒng)測試量表方法.
根據rfMRI 掃描前認知量表測試得分, 將98 位健康老年人分成認知分數優(yōu)、差兩組, 共78 人納入訓練集, 其余20 人納入測試集, 在rfMRI預處理基礎上, 本文采用了以下研究思路: 1)構建多尺度熵模型并優(yōu)化算法參數; 2)在優(yōu)化參數下統(tǒng)計顯著性高的腦區(qū)熵值構建特征向量輸入ELM; 3)利用ELM 對認知分數優(yōu)、差兩組進行分類, 并采用N 折交叉驗證測試分類準確率; 4)總結并討論MSE 模型在健康老年人rfMRI 檢測和分類認知行為的研究結果.
本文強調了MSE 模型參數優(yōu)化在探討健康老年人腦BOLD 信號熵值區(qū)分認知分數優(yōu)差中的重要作用, 為rfMRI 檢測腦功能提供了新的評估參數和新方法.
本實驗參與者樣本取自公開數據集(github.com/juanitacabral/LEiDA), 以認知量表測試分數來區(qū)分認知行為優(yōu)劣. 該數據集是從一項隊列研究中挑選出來的, 涉及1051 位年齡在50 歲以上的葡萄牙老人, 他們曾進行過9 項神經心理學測試, 應用主成分分析(PCA)確定與記憶和認知執(zhí)行功能相關兩個主要維度得分, 再由聚類方法將得分由優(yōu)到差排序為C1>C2>C3>C4 四 級, 其中C1和C4 對應最優(yōu)和最差認知分數或優(yōu)、劣認知狀況.分別從上述C1和C4 檔案中隨機選擇受試者掃描rfMRI 并簽署知情同意書, 最終樣本共含有98 名受試者, 其中55 名認知能力優(yōu)秀的受試者(在此命名為認知分數優(yōu)組)和43 名認知能力最差的受試者(在此命名為認知分數差組)[15?18].
在接受掃描時, 參與者被要求保持靜止、安靜、閉眼且清醒的靜息態(tài). 功能磁共振成像在葡萄牙布拉加醫(yī)院采集, 使用臨床認可的1.5 T Siemens MagnetomAvanto 12 通道僅有頭部線圈掃描儀. 采用BOLD 敏感回波平面成像序列, 參數如下: 30個軸向切片, TR/TE = 2000/30 ms, FA =90°, 切片厚度為3.5 mm, 切片間隙為0.48 mm,體素大小為3.5 mm × 3.5 mm, FoV = 1344 mm,180個數據.
rfMRI 數據預處理是使用FMRIB 軟件庫工具進行的[19?21]. 首先, 1)移除采集的前5個數據,以便信號穩(wěn)定; 2)切片計時校正; 3)通過使用MCFLIRT[22]將每個體積的剛體對準采集的平均圖像進行運動校正; 4)使用腦提取工具(BET)進行顱骨剝離[23]; 5)使用FLIRT 通過連續(xù)的剛體配準實現非線性歸一化功能獲取到結構獲取, 非線性配準從結構原生空間到MNI 標準空間, 并使用FNIRT 重新采樣到2 mm 各向同性體素大小[24];6)運動參數、平均CSF 和WM 信號的線性回歸;7)回歸殘差的帶通時間濾波(0.01—0.08 Hz). 然后, 在解剖自動標記AAL 圖譜的90個大腦分區(qū),平均每個腦區(qū)的所有體素上BOLD 信號形成用于多尺度熵計算和分析的時間序列.
MSE 即多尺度樣本熵, 它對生物醫(yī)學信號具有較好的識別能力, 在計算概率時不包括自匹配,熵值較大表明所計算的時間序列具有較高復雜度,反之亦然.
對于長度為N的一維離散時間序列{x1,x2, ···,xN}, 在多個尺度下變換, 得到新的粗粒化時間序列
其中1 ≤j≤N/t,t為尺度因子的長度為L=N/t. 再構造一組m維向量(m即嵌入維數)Ym(i):Ym(i)=yi+k,0km ?1 . 對每個i值, 計算它與其他值j的距離, 即Ym(i)和Ym(j)之間的距離:
設定公差閾值(即相似系數)r(r> 0), 再對每個i值計算的數目Bm(i) , 并計算與距離總數的比值:
相似地, 當維數為m+ 1時, 可得:
當L為有限值時, 可得出序列長度為L的樣本熵估計值, 記為SampEn:
綜上所述, 樣本熵與嵌入維數m和相似系數r的取值有關.
以尺度為變量重復樣本熵計算過程, 得到樣本熵值在多個尺度取值下集合, 即MSE:
其中, 主要有3個參數決定MSE: 尺度因子t、嵌入維數m和相似系數r. MSE 可以通過在不同尺度下熵值變化研究系統(tǒng)復雜度的動態(tài)特性. 在相同參數取值下, 熵值較大表明所計算的時間序列具有較高復雜度, 反之亦然.
MSE 是通過不斷調節(jié)尺度因子大小得到的樣本熵集合, 故MSE 模型會隨著信號復雜度不同而參數取值相異: 如, 用在腦電信號復雜度分析時,通常采用m= 2,r= 0.5[25];m= 2,r= 0.15[26];m= 1,r= 0.25[27]等; 再如, 用在fMRI 信號復雜度分析時, 通常選取m= 2,r= 0.3[10];m= 2,r= 0.46[28];m= 1,r= 0.35[29];m= 2,r=0.6[30]等. 很顯然, 使用MSE 對生物醫(yī)學信號進行處理時, 并不具有統(tǒng)一的參數取值標準或規(guī)范. 因此, 本文提出借助機器學習對認知分數優(yōu)差兩組分類效果進行評估來輔助優(yōu)化熵模型計算參數的研究方案, 以使參數選擇具有客觀性, 并選擇在優(yōu)化參數上有一致性優(yōu)良分類效果的腦區(qū)為區(qū)分認知分數的標志性腦區(qū).
在優(yōu)化MSE模型計算參數時, 有兩點需要同時考慮. 第一點, 采用ROC(receiver operating characteristic)曲線聯合AUC(area under curve)值反映認知分數優(yōu)、差兩組樣本間顯著性差異.ROC 曲線可直觀顯示分類效果, 而ROC 曲線下面積大小, 即AUC 值, 可用來量化評估分類能力高低, 取值范圍一般在0.5—1 之間. 在本文中,AUC 可用數值給出熵模型參數優(yōu)化的效果, 其值越大, 則優(yōu)化效果越好, 反之亦然. 當AUC 取值分別 在0.9—1, 0.8—0.89, 0.7—0.79, 0.6—0.69,0.5—0.59 之間時, 則分別表示分類效果為極好、良好、恰當、較差、很差等5個檔次精度. 本文使用SPSS 軟件(IBM SPSS Statistics 21; USA)進行組間熵值數據差異顯著性統(tǒng)計. 第二點, 考慮MSE 模型參數相互影響的特點, 本文采取在優(yōu)化的每個步驟中3個參數全部參與評估優(yōu)化效果的研究方案. 即當優(yōu)化嵌入維數m和相似系數r時,采用了在3個參數皆參與分析優(yōu)化效果的條件下,先獲得優(yōu)化空間再逐步獲得優(yōu)化值; 進一步優(yōu)化尺度因子t時, 也是統(tǒng)籌3個參數參與下的分類效果來確定t的優(yōu)化值.
在確定對認知分數敏感腦區(qū)時, 本文采用了ROC 曲線和AUC 值聯合參與組間對比的方法,即: 通過組間對比, 觀察熵模型參數對ROC 曲線影響來初步直觀熵模型參數優(yōu)化效果, 再聯合AUC 值來量化評估標志性腦區(qū). 當ROC 曲線總體呈現于參考線以上區(qū)域, 并遠離參考線且AUC 較大時, 則認為總體上分類效果較佳, 可視作該腦區(qū)對認知分數較敏感, 該腦區(qū)可視為認知行為評估的標志性腦區(qū); 反之, 則視作分類效果較差,該腦區(qū)不能作為標志性腦區(qū).
在經過優(yōu)化的參數設定條件下, 將AAL 圖譜中共90個大腦區(qū)域進行熵值計算并通過t檢驗(t-test)對認知分數在優(yōu)與差組間進行差異顯著性統(tǒng)計, 得出在每個大腦區(qū)域下, 認知分數優(yōu)與差兩組樣本差異顯著性統(tǒng)計值(p值), 并按照由小到大順序排列, 優(yōu)先選取p值較小且分類效果較好的腦區(qū), 同時結合ROC 曲線和AUC 值來輔助選取標志性腦區(qū). 在這些腦區(qū)上, 對經過優(yōu)化參數模型計算所得熵值取平均值, 得到每個被試在對應腦區(qū)的平均樣本熵值, 將認知分數優(yōu)的樣本類別標記為“1”, 將認知分數差的樣本類別標記為“0”, 由此組成一個向量, 并與平均樣本熵值組成特征向量, 作為兩組被試認知分數的分類依據.
ELM 是現代機器學習模型, 相對于傳統(tǒng)的人工神經網絡模型, 其優(yōu)勢在于可隨機產生輸入層與隱含層間連接權值及隱含層神經元閾值, 且在訓練過程中無需調整, 只需要設置隱含層神經元個數,便可獲得唯一最優(yōu)解. 為實現優(yōu)、差兩組的準確分類, 需要進行ELM 創(chuàng)建、訓練和仿真測試, 圖1為ELM 分類模型的具體流程圖.
圖1 ELM 分類器操作流程圖Fig. 1. Flowchart of ELM classifier.
ELM 模型主要步驟描述如下:
1)為了使得建立的模型泛化性能良好,ELM 要求具有足夠多的訓練樣本且具有較好的代表性. 同時, 訓練集和測試集格式應符合ELM 訓練和預測函數的要求;
2) 通過elmtrain( )函數創(chuàng)建、訓練ELM, 由于隱含層神經元個數對ELM 性能影響較大, 故需要不斷試湊以選擇適量的隱含神經元;
3) 通過elmpredict( )函數進行ELM 仿真測試, 獲得測試集;
4) 通過測試集分類結果, 可以對模型的分類準確率進行評價.
本文在認知分數為差組的43 名被試中, 隨機抽取33 名熵值數據作為訓練集, 余下10 名數據作為測試集; 在認知分數為優(yōu)組的55 名被試中, 隨機抽取45 名熵值數據作為訓練集, 余下10 名數據作為測試集. 即, 共78 名被試組成訓練集, 20 名組成測試集. 然后, 創(chuàng)建ELM, 將類型參數TYPE 設為1(1 表示解決分類問題, 0 表示解決回歸問題);并設置隱含層神經元個數N= 500; 將激活函數TF 設置為“sig”類型, 在ELM 中對數據進行訓練和仿真. 最后, 通過結果對比, 得出測試集數據的分類準確率.
在ELM 等機器學習模型中, 常用N折交叉驗證(N-fold Cross Validation)來測試算法準確性:在樣本量較少的情況下, 為了充分利用數據集對算法效果進行測試, 將數據集分成N份, 輪流將其中N-1 份作為訓練數據, 1 份作為測試數據, 進行試驗, 每次試驗都會得出相應的正確率(或差錯率).N次結果的正確率(或差錯率)平均值用來估計算法精度. 交叉檢驗優(yōu)勢在于, 保證每個子樣本參與訓練且都被測試, 降低泛化誤差, 常用的有5 折交叉驗證、10 折交叉驗證(即N分別取5, 10)等. 本文使用了10 折交叉驗證獲得分類精度.
本文通過組間對比獲得顯著性差異以及ROC 曲線和AUC 值評估, 共獲得3個MSE 模型的優(yōu)化參數值.
3.1.1 嵌入維數m和相似系數r的優(yōu)化
在計算BOLD時間序列的MSE 過程中, 若時間序列數據長度過短, 會使得樣本熵不可靠, 根據Richman 和Moorman[6]的研究, 由BOLD時間序列計算樣本熵時, 10m—20m的數據長度應足以估計樣本熵. 對于長度較短的BOLD 信號處理中,m= 1時至少需要10—20個時間點,m= 2時至少需要100—400個時間點. 本文數據在經過預處理后得到175個時間點, 所以, 需要m值取1 或2.因此, 考慮前人研究經驗(可參見2.5 節(jié)MSE)和本文數據長度, 初步將在m= 1—2,r= 0.05—0.6 以及t= 1—6 范圍中尋求優(yōu)化參數值.
圖2 改變t, m, r 取值時, 兩組樣本差異較顯著腦區(qū)數量 (a)—(f)在尺度因子t 分別取值1—6時, 且嵌入維數取m = 1(紅色線條)和m = 2 (藍色線條)時, 在相似系數r 取0.05—0.6 上分別計算所得的顯著性腦區(qū)數量(p < 0.05); (g)尺度因子t 從1—6 各個對應的樣本熵做平均, 兩組被試顯著性腦區(qū)數量差異(p < 0.05)Fig. 2. The number of significant brain regions when changing scale factor t, embedding dimension m and similar factor r in the MSE model: (a) t = 1; (b) t = 2; (c) t = 3; (d) t = 4; (e) t = 5; (f) t = 6; (g) average number of significant brain regions over the scale factor t (p < 0.05). Here, the similarity factor r changed from 0.05 to 0.6 with a step of 0.05 and parameter of m = 1 (redline)was fixed and m = 2 (blueline) respectively (p < 0.05).
當尺度因子t= 1—6, 嵌入維數m= 1—2時, 分別設置相似系數r= 0.05—0.6(步長為0.05)可得出老年人樣本組間顯著性差異較大的腦區(qū)數量(p< 0.05), 如圖2所示: 首先, 從尺度因子t= 1—6 下發(fā)現:m=1計算所得差異較顯著腦區(qū)數量比m= 2時多, 這一特點在大部分r取值以及平均數量(圖(g))皆有體現, 這意味著m= 1較m= 2更優(yōu). 進一步, 縱觀圖2(a)—圖2(f)分析t和r優(yōu)化值, 發(fā)現圖2(g)決定了r只有一個非常狹小的取值空間, 即r=0.45—0.55, 在所有尺度上存在顯著性差異.
通過保持嵌入維數m、尺度因子t兩個參數不變(設m= 1,t= 5), 并調節(jié)r的取值(0.05—0.6,步長為0.05)得到區(qū)分程度的分類效果, 如圖3 和表1所示. 發(fā)現: 當r= 0.5時ROC 曲線處于參考線以上而且AUC 值較大(如圖3(a)和圖3(b)所示), 這些腦區(qū)選為對認知分數較敏感腦區(qū); 與此相反, 由圖3(c)和圖3(d)可見, ROC 曲線特征和AUC 值顯示了該腦區(qū)對認知分數不敏感, 也就是說, 在該腦區(qū)并不存在r值使得ROC 都處于參考線以上且AUC 值較大的標志性特征. 綜合圖2、圖3 和表1 對分類效果的分析, 取m= 1 且r=0.5 為最優(yōu)參數.
3.1.2 尺度因子t的優(yōu)化
取優(yōu)化參數m= 1 和r= 0.5, 調節(jié)t=1—6 變化大小得到腦區(qū)的分類效果圖, 如圖4 和表2 所示. 如圖4(a)和圖4(b)所示, 在對認知分數較敏感腦區(qū)中, 當t= 5時AUC 值較大; 在其他對認知分數不敏感的腦區(qū)中, 并不存在t值能使AUC 值取較大值(如圖4(c)和圖4(d)所示).因此, 取t= 5 為最優(yōu)取值.
圖3 相似系數r 對單個腦區(qū)分類效果的影響. 保持m = 1, t = 5 參數值不變, 調節(jié)相似系數r 從0.05 到0.6, 步長為0.05, 單個腦區(qū)ROC 曲線和AUC 值 (a)左后扣帶回; (b)右顳上回; (c)右枕中回; (d)右中央后回. 圖(a)和圖(b)顯示了對認知分數較敏感的單個標志性腦區(qū)的ROC 曲線明顯高于參考線的特征和較大AUC 值, 可以當做本文的功能標記. 相反, 圖(c)和(d)顯示了對認知分數不敏感的單個非標志性腦區(qū)的ROC 曲線繞于參考線周圍的特征和較小AUC 值Fig. 3. Sorting effects of similarity factor rby ROC and AUC value in a single brain region when the similarity factor ris setfrom 0.05 to 0.6 with a step of 0.05 and parameters of m = 1, t = 5 fixed in the MSE model: (a) PCG.L:left posterior cingulate gyrus;(b)STG.R: right superior temporal gyrus; (c) MOG.R: right middle occipital gyrus; (d) PoCG.R: right postcentral gyrus. In above two planes such as (a) and (b), a single sensitive brain area to cognitive testing score could be characted by both ROC beyond the reference line and great AUC value, therefore, be employed as a functional biomarker in this study. In reverse, a single insensitive brain area could be characted by both ROC around the reference line and small AUC value in below two planes such as (c) and (d).
圖4 尺度因子t 對單個腦區(qū)分類效果的影響. 取優(yōu)化參數m = 1 和r = 0.5, 調節(jié)尺度因子t 從1 到6, 步長為1, 單個腦區(qū)ROC 曲線和AUC 值 (a)左后扣帶回; (b)右顳上回; (c)右枕中回; (d)右中央后回. 圖(a)和圖(b)顯示了對認知分數較敏感的單個標志性腦區(qū)ROC 曲線特征和較大AUC 值, 可以當作本文的功能標記; 圖(c)和圖(d)顯示了與圖(a)和圖(b)特征相反的單個非標志性腦區(qū)ROC 曲線特征和較小AUC 值Fig. 4. Sorting effects of scale factor tby ROC and AUC value in a single brain region when the scale factor tis set from 1 to 6 with a step of 1 and the optimization parameters of m = 1 and r =0.5 fixed in the MSE model: (a) PCG.L: left posterior cingulate gyrus;(b) STG.R: right superior temporal gyrus; (c) MOG.R: rightmiddle occipital gyrus; (d) PoCG.R: rightpostcentral gyrus.In above two planes such as (a) and (b), a single sensitive brain area to the cognitive testing score could be characted by both ROC beyond the reference line and great AUC value, therefore, be employed as a functional biomaker in this study. In reverse, a single insensitive brain area to the cognitive testing score could be characted by both ROC around the reference line and small AUC value in below two planes such as (c) and (d).
綜上所述, 根據ROC 曲線特征和AUC 值綜合進行分類效果評估, 本文所取熵模型的優(yōu)化參數為嵌入維數m= 1, 相似系數r= 0.5 以及尺度因子t= 5.
在MSE 型的優(yōu)化參數下, 即m= 1,r=0.5 和t= 5, 進行全腦熵值計算及t 檢驗篩選, 一共獲得9個對認知分數敏感的標志性腦區(qū)(AAL)(p< 0.05), 即: 右距狀裂周圍皮層(CAL.R)、左內側額上回(SFGmed.L)、左后扣帶回(PCG.L)、左顳下回(ITG.L)、右顳上回(STG.R)、右楔葉(CUN.R)、 右豆狀殼核 (PUT.R)、 右海馬(HIP.R)、右顳極: 顳中回(TPOmid.R), 這些腦區(qū)皆 位于默認模式網絡(default mode network,DMN)及周圍區(qū)域. 圖5 給出9個標志性腦區(qū)在優(yōu)化參數下熵值集合, 從圖中可讀出較大分類準確效果存在顳下回等, 如圖5(a)所示. 與此相反, 非標志性腦區(qū)的熵值, 如: 右中央前回(PreCG.R)、左額中回(MFG.L)、左中央溝蓋(ROL.L)、左補充運動區(qū)(SMA.L)、左嗅皮質(OLF.L)、右枕中回(MOG.R)、右中央后回(PoCG.R)、左枕上回(SOG.L)、左頂下緣角回(IPL.L)等, 即便在優(yōu)化參數下也沒有一致性變化規(guī)律, 如圖5(b)所示. 全部9個標志性腦區(qū)構成特征向量的分類效果, 如圖5(c)所示, 其AUC 值可達0.808.
表1 AUC 值表達的相似系數r 對單個腦區(qū)分類效果的影響Table 1. Effect of similarity factor r on sorting rate by the AUC value of each single brain region.
表2 AUC 值表達的尺度因子t 對單個腦區(qū)分類效果的影響Table 2. Effect of scale factor t on sorting rate by the AUC value of each single brain region.
另外發(fā)現: 在優(yōu)化參數取值下, 認知分數優(yōu)組比差組在9個標志性腦區(qū)上的BOLD 信號復雜度要高(p< 0.05), 如圖6 所示, 只有在優(yōu)化參數下(即m= 1,r= 0.5 和t= 5時), 9個標志性腦區(qū)皆存在熵值的顯著性差異(p< 0.05), 總體上, 認知分數優(yōu)組比差組熵值要高.
圖5 在優(yōu)化參數下(即m = 1, r = 0.5 和t = 5)單個標志性腦區(qū)、單個非標志性腦區(qū)以及9個全部標志性腦區(qū)參與的ROC 和AUC值 (a)單個標志性腦區(qū). 共9個; (b)單個非標志性腦區(qū). 隨機選取9個; (c)全部9個標志性腦區(qū)同時參與Fig. 5. Respective ROC and AUC value of a single indicative brain region, a single non-indicative brain regions and a total of 9 indicative brain regions at the optimization parameters of m = 1, r = 0.5 and t = 5 in the MSE model: (a)A single indicative brain region. A total of 9 indicative brain regions. (b)a single of non-indicative brain region. A total of 9 non-indicative brain regions are randomly chosen;(c) a total of 9 indicative brain regions all together.
將所有9個標志性腦區(qū)熵值取平均值后構成特征向量矩陣, 并形成訓練集和測試集數據. 當取優(yōu)化參數值, 即m= 1,r= 0.5 和t= 5時, 特征向量在兩組樣本間具有顯著性差異(p< 0.001).而在r取其他值時, 均沒有顯著性差異出現, 如表3所列; 在t取其他值時, 也沒有顯著性差異出現,如表4 所列. 也就是說, 只要由非優(yōu)化參數計算的熵值所產生的訓練集和測試集進行分類, 無法得到較好的分類效果.
圖6 尺度因子t 取1—5時全部9個標志性腦區(qū)的組間MSE 變化規(guī)律 (a)右距狀裂周圍皮層; (b)左內側額上回; (c)左后扣帶回; (d)左顳下回; (e)右顳上回; (f)右楔葉; (g)右豆狀殼核; (h)右海馬; (i)右顳極: 顳中回. (組間差異顯著性: *表示p < 0.05)Fig. 6. Inter-group MSE values change with the parameter of scale factor t (from 1 to 5 with a step of 1) in a total of 9 indicative brain regions: (a) CAL.R; (b) SFGmed.L; (c) PCG.L; (d) ITG.L; (e) STG.R; (f) CUN.R; (g) PUT.R; (h) HIP.R; (i)TPOmid.R. (*p < 0.05)..
表3 幾種不同相似系數r時所構建特征向量的組間顯著性差異Table 3. Inter-group difference significance of eigenvectors at similarity factors(r).
表4 幾種不同尺度因子t時所構建特征向量的組間顯著性差異Table 4. Inter-group difference significance of eigenvectors at the scale factor(t).
訓練集和測試集數據形成后, 將其輸入ELM 進行分類.
經過ELM 分類, 可將認知分數優(yōu)與差兩組樣本區(qū)分開, 如圖7 所示, 將序號1—20 的樣本分為認知分數優(yōu)(類別1)和差(類別0)兩類, 由圖可見, 經ELM 分類后的分類準確率可達80%.
經極限學習機得出分類準確率之后, 對結果進行N折交叉驗證, 在最常用的10 折交叉驗證(N=10)下, 得到10 折平均分類精度為80.13%, 如表5所列.
本文提出了MSE 模型結合現代機器學習方法, 研究了健康老年人rfMRI 熵值對認知分數分類方法. 結論: 在默認模式網絡(DMN)及其周圍相關區(qū)域(包括海馬皮質、后扣帶回、額上回和顳中回等)等9個標志性腦區(qū)熵值可對認知分數最優(yōu)與最差的健康老年人群體進行認知行為分類, 分類準確率可達到80%, 說明MSE 值與認知行為密切相關, 能較有效地區(qū)分健康老年人的認知行為優(yōu)劣.
圖7 ELM 測試分類準確率. 通過在訓練集和測試集上運行ELM 進行分類, 對認知分數優(yōu)(類別1)與差(類別0)的兩組樣本實現約為80%分類準確率Fig. 7. Classification accuracy tested by ELM. Two groups of samples with excellent cognitive scores (Category 1) and poor cognitive scores (Category 0) could be classified at a sorting rate of about 80%.
表5 經10 折交叉驗證得到的分類精度Table 5. Classification rate (CR) tested by 10-fold cross validation.
由于在以往使用MSE 處理生物醫(yī)學信號時,并不具有統(tǒng)一的參數r,m取值標準或規(guī)范, 需要針對具體信號特征進行優(yōu)化, 這就意味著優(yōu)化參數來計算熵值模型時需要考慮所分析數據特征, 才可能獲得更佳的分類效果. 為改進這一缺陷, 本文除了借鑒以往計算經驗和rfMRI 信號特征來初步篩選參數外, 又提出并實踐了診斷機器學習分類效果的ROC 曲線和AUC 值聯合來確定熵值模型的計算參數, 克服了計算盲目性, 增強了參數選擇的客觀性, 實現了MSE 參數優(yōu)化.
本文在選取計算參數時, 通過組間差異顯著性聯合ROC 分類效果和AUC 值較大參數值來選擇老年人認知分數敏感腦區(qū), 如圖3、圖4,表1、表2所示. 本文選擇9個標志性腦區(qū)的特征向量給出最終分類效果, 如圖7 所示, 該模型的AUC 值可達到0.808, 可見它比表1 和表2 所列單一腦區(qū)分類效果好很多. 由此可預見的是精細分割腦區(qū)將會產生更多敏感腦區(qū), 有望提高分類精度.
對于參數t, Wang 等[31]研究fMRI 信號復雜度(使用了MSE 模型)的神經生理基礎及其與功能連接的關系, 結果表明: MSE 與功能連接之間的關聯取決于BOLD 信號的時間尺度或頻率.Niu 等[32]也有相似研究結果, 即不同大腦區(qū)域在不同頻率上表現出差異, 并認為在不同時間尺度上觀察到的復雜度變化可能代表輕度認知障礙(mild cognitive impairment, MCI)和阿爾茲海默病(Alzheimer’s disease, AD)對大腦區(qū)域或網絡具有依賴性的神經病理學機制. 所以, 本文選取需要分類的尺度因子t時, 經過ROC 曲線和AUC 值聯合比較組間分類效果. 在標志性腦區(qū)上選擇了t=5 能夠將兩組樣本分開, 而不是在所有尺度下選取熵值.
本文首先選取了在AAL 圖譜中對于兩組樣本差異較顯著腦區(qū)定義為標志性腦區(qū), 發(fā)現這些腦區(qū)位于DMN 及其周圍, 以這些腦區(qū)的多尺度熵值為特征實現了對認知能力優(yōu)、劣兩組健康老年人認知分數的有效分類, 拓展了熵值在功能磁共振上的應用.
Yang 等[29]發(fā)現在DMN 上BOLD 信號的MSE 值與主要認知功能(如注意、定向、短期記憶、精神控制和語言等)呈顯著正相關. 同時, 也對年輕人樣本與老年人的進行了對比與分析: 與年輕組相比, 老年組在左嗅皮層、右后扣帶回、右側海馬、右側海馬旁回、左側枕上回、左尾狀核、左丘腦的BOLD 信號熵值顯著降低, 即隨著年齡增長, 大腦的這些區(qū)域的BOLD 信號復雜度顯著減小. 且對于老年組, 沒有發(fā)現比年輕組MSE 值有顯著增加. Niu 等[32]在MCI 和AD 患者自發(fā)BOLD 信號的MSE 分析中, 分別對早期和晚期輕度認知障礙者,阿爾茲海默癥患者和正常對照組等四組被試進行了檢測與分析, 在4 組MSE 的單因素方差統(tǒng)計分析中發(fā)現: 丘腦、腦島、舌回和枕下回、額上回和嗅皮質、邊緣上回、顳上回和顳中回在多個尺度因子上都有顯著性差異. 與正常組相比, MCI 和AD 患者的BOLD 信號復雜度顯著降低, 而AD患者復雜度又低于MCI 患者.
利用熵值評估認知行為優(yōu)劣, 首要問題是尋求熵值對認知行為(本文以rfMRI 掃描前一系列量表測試獲得分數來表征)敏感的標志性腦區(qū), 本文發(fā)現的標志性腦區(qū)與以往利用功能連接選取的具有很大交集.
Raichle 等[33]首次在rfMRI 靜態(tài)功能連接下發(fā)現默認模式網絡(DMN)與認知功能相關; 而后,Greicius 等[34]進一步發(fā)現自發(fā)的BOLD 活動大多表現在DMN 腦區(qū), 這些腦區(qū)表現出更顯著的功能連通性, 從而提供迄今為止最有說服力的證據, 即存在默認模式網絡. Buckner 等[35]在對大腦默認模式網絡的解剖、功能和疾病相關性等方面進行研究時, 更具體地認為DMN 包括后扣帶回、楔前葉、內側前額葉皮質、壓部后區(qū)皮質、內側顳葉、頂下小葉和海馬等區(qū)域. 在對早期MCI 和晚期MCI 研究中, Goryawala 等[36]提出了一個基于MRI 體積和神經心理學評分的統(tǒng)計框架, 以神經心理學參數和顳、頂葉和扣帶回區(qū)的皮質體積為主要分類因素, 對早期MCI 和晚期MCI 進行分類取得了73.6%的分類準確率. 這些研究證據為本文提出的ROC 和AUC 聯合診斷分類效果的方法來優(yōu)化多尺度熵值模型參數, 并以此尋求對認知分數敏感的標志性腦區(qū)提供了支撐.
除此之外, 來自腦結構的研究證據與本文發(fā)現的標志性腦區(qū)也具有很大交集. 例如, Wang 等[37]研究在遺忘性輕度認知障礙者(aMCI)和主觀認知衰退者(subjective cognitive decline, SCD)的腦白質網絡的異常組織分析中, 發(fā)現aMCI 患者的右前扣帶回、距狀裂及周圍皮層、豆狀殼核和左前扣帶回的中介中心性有顯著改變. Smart 等[38]在SCD 老年人與正常同齡人相比的默認模式網絡結構腦變化研究中, 發(fā)現: SCD 組相對于正在左、右尾額中區(qū)、左后中央回、右楔葉、右旁中央小葉、右距狀裂及周圍區(qū)域、右額中區(qū)和右顳極皮質結構變薄.
最后, 由圖6 可觀察出, 認知分數優(yōu)組比差組熵值要高, 這一結果支持“復雜性損失”理論, 即衰老可造成人體生理信號復雜度降低[1,7]. 對rfMRI技術來說, 反映在自發(fā)BOLD 信號熵值減小, 復雜度降低的特性上, 據此推測認知分數降低與老年人認知能力下降有很大關系.
本文盡管給出了基于rfMRI 的MSE 值計算方法, 并結合了容易收斂到最優(yōu)解的現代機器學習方法獲得了較高的認知分數分類準確率, 但尚無法獲知熵值模型參數是否能區(qū)分認知分數處于中段的良和一般的成績, 有待獲取相關數據進行深入研究; 其次, 目前利用熵值降低可識別健康老人認知分數降低, 但熵值模型參數是否能用來區(qū)別病理導致的認知分數降低有待研究; 最后, 本文所有被試大腦結構沒有明顯改變, 將來在老年人大腦結構發(fā)生改變基礎上如何優(yōu)化熵值模型參數是需要深入探索的問題.