李佳 陳亮
摘 要:從神經(jīng)元幾何形態(tài)特征的角度考慮,對神經(jīng)元進行分類。由于神經(jīng)元的幾何形態(tài)復雜多樣,直接用于分類會使得算法運行時間長、分類精度低。采用稀疏主成分分析法提取神經(jīng)元的主要特征,不僅能實現(xiàn)幾何特征的降維,減小分類難度,而且提取出的主成分部分載荷為0,使得主成分更具解釋能力。依據(jù)主要特征,采用極限學習機算法對神經(jīng)元進行分類。實驗結(jié)果表明,該分類模型具有較高的運行效率和分類精度,能夠?qū)ι窠?jīng)元實現(xiàn)有效分類。
關鍵詞:神經(jīng)元;幾何形態(tài)特征;稀疏主成分分析;極限學習機
中圖分類號:TP391 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2017.03.013
神經(jīng)元,又被稱為神經(jīng)原或神經(jīng)細胞,是構(gòu)成神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的基本單位。神經(jīng)元形態(tài)和功能多種多樣,但在結(jié)構(gòu)上大致可以分成細胞體和突起兩部分。突起又分軸突和樹突。神經(jīng)元有接受、整合和傳遞信息的功能。一般就長軸突神經(jīng)元而言,樹突和胞體接受從其他神經(jīng)元傳來的信息,并進行整合,
然后通過軸突將信息傳遞給另一些神經(jīng)元或效應器。大腦是生物體內(nèi)結(jié)構(gòu)和功能最復雜的組織,其中包含上千億個神經(jīng)元,了解人腦對于當前的科學研究來說是一項巨大的挑戰(zhàn)。傳統(tǒng)的細胞生物學相關的實驗室研究對于解決人腦對復雜信息的獲取、處理、加工和高級認知功能的機制非常有限。人類腦計劃(Human Brain Project,HBP)致力于開發(fā)現(xiàn)代化的信息工具,為全世界的神經(jīng)信息學數(shù)據(jù)庫建立共同的標準,加速人類對大腦的認識。
作為大腦構(gòu)造的基本單位,神經(jīng)元的結(jié)構(gòu)和功能包含很多因素,其中,神經(jīng)元的幾何形態(tài)特征和電學物理特性是兩個重要方面。電學特性包含神經(jīng)元不同的電位發(fā)放模式;幾何形態(tài)特征主要包含接受信息的樹突、處理信息的胞體和傳出信息的軸突三部分。鑒于樹突、軸突的生長變化,神經(jīng)元的幾何形態(tài)千變?nèi)f化。電學特性和空間形態(tài)等多個因素一起綜合體現(xiàn)了神經(jīng)元的信息傳遞功能。要想加深對大腦的研究,應先認識神經(jīng)元的特性,實現(xiàn)神經(jīng)元的分類。
神經(jīng)元的分類有多種方法,常以神經(jīng)元突起的數(shù)目、功能和所釋放的遞質(zhì)進行分類。根據(jù)神經(jīng)元突起的數(shù)目可以分為假單極神經(jīng)元、雙極神經(jīng)元和多極神經(jīng)元;根據(jù)神經(jīng)元的功能,
可將其分為感覺神經(jīng)元、運動神經(jīng)元和中間神元;按照釋放的遞質(zhì)的不同,可將其分為膽堿能神經(jīng)元、胺能神經(jīng)元、氨基酸能神經(jīng)元和肽能神經(jīng)元。
本文基于神經(jīng)元的幾何形態(tài),利用神經(jīng)元的空間幾何特征,通過稀疏主成分分析和極限學習機建立神經(jīng)元的分類模型,提出神經(jīng)元的一個空間形態(tài)分類方法,并將神經(jīng)元根據(jù)幾何形態(tài)進行了較為準確的分類。
1 稀疏主成分分析
神經(jīng)元的形態(tài)復雜多變,大量的參數(shù)從不同的角度刻畫了
神經(jīng)元的形態(tài)特征。此外,在實際研究中,對象的特征不會直
觀顯示出來,而需要從中提取。為了全面表示對象,在特征提取的過程中,可能盡量選擇比較多的特征變量,以防對象特征的丟失。這就容易出現(xiàn)2種情況:①為了避免遺漏重要信息而選擇盡可能多的特征;②隨著特征的增多增加了問題的復雜性,同時,造成信息的大量重疊。鑒于此,需要合理處理并提取數(shù)據(jù),在盡可能代替原始變量的所有信息的同時,還要求減少處理后的變量數(shù)。
主成分分析是一種廣泛應用于工程學、生物學和社會科學等領域的數(shù)據(jù)處理與統(tǒng)計降維的方法,它可以將原來變量重新組合成一組新的互相無關的幾個綜合變量。然而,主成分分析存在一些不足之處,由于每一個主成分都是其他原始變量的線性組合,也就是說主成分依賴于所有原始變量,因此,很多時候主成分難以作出解釋。用主成分分析處理某些實際問題時,往往只能給出數(shù)據(jù)的統(tǒng)計、解釋,而很難給出對應的實際意義的解釋。
Zou.H提出了一種新的方法——稀疏主成分分析。該方法將主成分的求解問題轉(zhuǎn)化為LASSO(Least absolute shrinkage and selection operator)回歸問題,因此,稀疏主成分的求解就有效轉(zhuǎn)化為線性模型的變量選擇問題。在此基礎上,引入彈性網(wǎng)(E-lasticNet)懲罰結(jié)構(gòu),提出了稀疏主成分分析方法。其計算步驟如下。
3 實驗與分析
本文使用的神經(jīng)元數(shù)據(jù)來自于Neuronmorpho.Org網(wǎng)站。根據(jù)神經(jīng)元的特征描述,選取神經(jīng)元的胞體表面積、干的數(shù)目、分叉的數(shù)目等20個空間幾何特征量,采用稀疏主成分分析法對數(shù)據(jù)進行降維處理,研究神經(jīng)元的分類。
表1為神經(jīng)元的20個幾何特征參數(shù)的含義及計算方法。
選取7類神經(jīng)元的空間幾何數(shù)據(jù)記為數(shù)據(jù)集D,共選取98個樣本進行實驗。其中,70個樣本為訓練集Dtr,28個樣本為測試集Dte,用于訓練ELM網(wǎng)絡。具體實驗步驟如下:①數(shù)據(jù)預處理,對數(shù)據(jù)集D進行標準化處理;②利用稀疏主成分分析對數(shù)據(jù)進行降維,提取主要特征;③ELM訓練,給定訓練樣本集的特征向量xi和類別標簽ti,設置隱層結(jié)點的個數(shù)N0,ELM隨機產(chǎn)生輸入權值wi和偏值bi,求解輸出權值;④ELM測試,輸入未知樣本的特征向量,利用ELM訓練時求解得到的輸出權值矩陣β構(gòu)建分類模型。
表2給出了稀疏主成分的分析結(jié)果,前4個稀疏主成分的累計貢獻率超過70%,因此,神經(jīng)元的20個形態(tài)特征可以用4個主成分來表示。從幾何形態(tài)的意義上分析,4個主成分表征了神經(jīng)元的4個方面,即:①第一主成分SPC1反映了胞體的表面積、寬度、高度、深度、長度、表面積和體積7個特征,表征了神經(jīng)元的空間形態(tài)的幾何輪廓信息;②第二主成分SPC2反映了分叉數(shù)目、分支數(shù)目、分支級數(shù)、破碎程度、非對稱分化5個特征,表征了神經(jīng)元空間形態(tài)的分支分叉的相關信息;③第三主成分SPC3反映了干的數(shù)目、直徑、羅爾比率、局部分叉角和遠端分叉角5個特征,表征了神經(jīng)元空間形態(tài)的房室和分叉角度的相關信息;④第四主成分SPC4反映了歐式距離、路徑距離、壓縮比3個特征,表征了神經(jīng)元空間形態(tài)的伸縮性。
為了驗證提出的神經(jīng)元形態(tài)分類方法的有效性,對比極限學習機、支持向量機和BP神經(jīng)網(wǎng)絡的性能,結(jié)果如表3所示。其中,支持向量機采用libsvm工具箱,BP神經(jīng)網(wǎng)絡采用MATLAB神經(jīng)網(wǎng)絡工具箱。由表3可知,極限學習機的分類精度與支持向量機有微小的差距,但是,訓練速度遠快于支持向量機和BP神經(jīng)網(wǎng)絡。支持向量機和BP神經(jīng)網(wǎng)絡訓練參數(shù)耗時比較長,如果訓練樣本較大,則二者的訓練會非常緩慢;極限學習機只要給定合適的隱層結(jié)點數(shù)目,就能獲得良好的分類性能,并一次求得全局最優(yōu)解,泛化性能好于BP神經(jīng)網(wǎng)絡。
4 結(jié)論
從神經(jīng)元的空間幾何形態(tài)出發(fā),利用稀疏主成分分析法對神經(jīng)元的幾何特征進行降維,通過原變量的少數(shù)幾個線性組合來解釋原變量的絕大多數(shù)信息,大大減少了分析時變量的維數(shù),增強了主成分的可解釋性,為后續(xù)分類奠定了良好的基礎。在稀疏主成分分析的基礎上,采用ELM算法對神經(jīng)元分類,實驗結(jié)果表明,ELM算法的分類精度比較高,相比于支持向量機和BP神經(jīng)網(wǎng)絡的訓練速度更快,能夠?qū)ι窠?jīng)元進行有效分類。
參考文獻
[1]Shepherd G M,Mirsky J S,Healy M D,et al.The Human Brain Project:neuroinformatics tools for integrating,searching and modeling multidisciplinary neuroscience data.Trends in Neurosciences,1998,21(11):460.
[2]Jiang R,Liu Q,Liu Q,et al.A proposal for the morphological classification and nomenclature of neurons. Neural Regeneration Research,2011,6(25):1925-1930.
[3]Wang T,Liao D.Neuronal morphology classification based on SVM.International Conference on Computer Science and Service System.IEEE,2011:3344-3347.
[4]尚小晶,劉小梅,李成鳳,等.神經(jīng)元的幾何形態(tài)分類[J].吉林大學學報(信息科學版),2011,29(3):237-244.