楊 晨 閆 薇
(1.大連外國語大學(xué)軟件學(xué)院 遼寧 116044;2.遼寧警官高等??茖W(xué)校 遼寧 116036)
腦科學(xué)的研究表明,人類大腦皮層中的細胞群存在著廣泛地自組織現(xiàn)象。處于不同區(qū)域的神經(jīng)元具有不同的功能,它們具有不同特征的輸入信息模式,對不同感官輸入模式的輸入信號具有敏感性,從而形成大腦中各種不同的感知路徑。并且這種神經(jīng)元所具有的特性不是完全來自生物遺傳,而是很大程度上依賴于后天的學(xué)習(xí)和訓(xùn)練。而本文所介紹的自組織特征映射網(wǎng)絡(luò)(SOM)就是根據(jù)這種理論而提出的。
自組織映射(Self-Organizing Feature Maps,SOM)網(wǎng)絡(luò)也稱為 Kohonen網(wǎng)絡(luò),該模型是由芬蘭的赫爾辛基大學(xué)神經(jīng)網(wǎng)絡(luò)專家Teuvo Kohonen于1981年提出,現(xiàn)在已成為應(yīng)用最為廣泛的自組織神經(jīng)網(wǎng)絡(luò)方法。Teuvo Kohonen認為處于空間中不同區(qū)域的神經(jīng)元有不同的分工,當(dāng)一個神經(jīng)網(wǎng)絡(luò)接受外界輸入模式時,將會分為不同的反應(yīng)區(qū)域,各區(qū)域?qū)斎肽J骄哂胁煌捻憫?yīng)特征。這種網(wǎng)絡(luò)模擬大腦神經(jīng)系統(tǒng)自組織特征映射的功能。它是一種競爭型神經(jīng)網(wǎng)絡(luò),采用無監(jiān)督學(xué)習(xí)算法進行網(wǎng)絡(luò)訓(xùn)練,此網(wǎng)絡(luò)廣泛地應(yīng)用于樣本聚類、排序和樣本檢測等方面。
從網(wǎng)絡(luò)結(jié)構(gòu)上來說,SOM網(wǎng)絡(luò)最大的特點是神經(jīng)元被放置在一維、二維或者更高維的網(wǎng)格節(jié)點上。SOM網(wǎng)絡(luò)的具體模型為:
輸入:n dimensions,X=[x1,x2,...,xn]T
輸出:p nodes,Y=[y1,y2,...,yp]T
最普遍的自組織特征映射二維網(wǎng)格模型如圖1所示。
SOM 網(wǎng)絡(luò)的一個典型特性就是可以在一維或二維的處理單元陣列上,形成輸入信號的特征拓撲分布,因此 SOM 網(wǎng)絡(luò)具有抽取輸入信號模式特征的能力。SOM網(wǎng)絡(luò)一般只包含有一維陣列和二維陣列,但也可以推廣到多維處理單元陣列中去。下面只討論應(yīng)用較多的二維陣列。
輸入層是一維的神經(jīng)元,具有N個節(jié)點,競爭層的神經(jīng)元處于二維平面網(wǎng)格節(jié)點上,構(gòu)成一個二維節(jié)點矩陣,共有M個節(jié)點。輸入層與競爭層的神經(jīng)元之間都通過連接權(quán)值進行連接,競爭層臨近的節(jié)點之間也存在著局部的互聯(lián)。SOM網(wǎng)絡(luò)中具有兩種類型的權(quán)值,一種是神經(jīng)元對外部輸入的連接權(quán)值,另一種是神經(jīng)元之間的互連權(quán)值,它的大小控制著神經(jīng)元之間相互作用的強弱。在SOM網(wǎng)絡(luò)中,競爭層又是輸出層。SOM網(wǎng)絡(luò)通過引入網(wǎng)格形成了自組織特征映射的輸出空間,并且在各個神經(jīng)元之間建立了拓撲連接關(guān)系。神經(jīng)元之間的聯(lián)系是由它們在網(wǎng)格上的位置所決定的,這種聯(lián)系模擬了人腦中的神經(jīng)元之間的側(cè)抑制功能,成為網(wǎng)絡(luò)實現(xiàn)競爭的基礎(chǔ)。
圖1 SOM網(wǎng)格模型
SOM 網(wǎng)絡(luò)的主要目的是將任意維數(shù)的輸入轉(zhuǎn)換為一維或二維的離散映射,并且以拓撲有序的方式自適應(yīng)實現(xiàn)這個過程。
生物學(xué)基礎(chǔ)實驗表明,外界信息對于神經(jīng)元的刺激并非是單一的,而是以某一細胞為中心的一個區(qū)域;并且刺激強度有強弱之分,大腦神經(jīng)的刺激趨勢和強度呈墨西哥草帽形狀;神經(jīng)元受刺激的強度以中心最大,隨著區(qū)域半徑的增大逐漸減弱;遠離中心的神經(jīng)元相反會受到抑制作用。根據(jù)這個原理,當(dāng)某類模式輸入時,輸出層某節(jié)點(神經(jīng)元)得到最大刺激而獲勝,獲勝者以及其周圍節(jié)點的權(quán)值會向著輸入模式向量的方向進行修正。隨著輸入模式的變化,相應(yīng)獲勝神經(jīng)元也發(fā)生變化,網(wǎng)絡(luò)即通過自組織的方式在大量樣本數(shù)據(jù)的訓(xùn)練下,使得輸出層特征圖能夠反映出輸入樣本數(shù)據(jù)的分布情況。
SOM網(wǎng)絡(luò)采用的學(xué)習(xí)算法為無監(jiān)督聚類法,它能將任意模式的輸入在輸出層映射成為一維或二維離散圖形,并保持其拓撲結(jié)構(gòu)不變。學(xué)習(xí)過程分為三個主要過程,分別是:
(1)競爭:對每個輸入模式,網(wǎng)絡(luò)中的神經(jīng)元計算它們各自的判別函數(shù)的值。這個判別函數(shù)對神經(jīng)元之間的競爭提供基礎(chǔ)。具有判別函數(shù)最大值的特定神經(jīng)元成為獲勝者。
(2)合作:獲勝神經(jīng)元決定興奮神經(jīng)元的拓撲鄰域的空間位置,從而提供相鄰神經(jīng)元合作的基礎(chǔ)。
(3)權(quán)值調(diào)整:興奮神經(jīng)元通過對它們突觸權(quán)值的適當(dāng)調(diào)節(jié)以增加關(guān)于該輸入模式的判別函數(shù)值,從而使得該神經(jīng)元對以后相似的輸入有一個增強的響應(yīng)。
SOM 網(wǎng)絡(luò)廣泛地應(yīng)用于樣本聚類、排序和樣本檢測等方面。當(dāng)訓(xùn)練過程完成之后,所有的權(quán)值都收斂??梢杂孟旅娴乃惴ㄟM行聚類。
(1)計算輸入矢量x和所有的權(quán)值矢量wj,則有:
(2)尋找所有距離中的最小距離
(3)定義輸出
下面是對SOM網(wǎng)絡(luò)聚類的程序分別運行的結(jié)果,如圖2、圖3、圖4所示。
圖2 程序運行圖
圖3 程序運行圖
圖4 程序運行圖
本文介紹了 SOM 網(wǎng)絡(luò)的起源以及學(xué)習(xí)過程,運用算法進行SOM網(wǎng)絡(luò)進行分類。最后利用一個程序?qū)嵗\行出了SOM網(wǎng)絡(luò)的運行過程。利用圖形化的方式顯示出了利用 SOM 網(wǎng)絡(luò)進行分類的具體過程。
[1]秦立龍,余奇,王振宇.基于泛化理論的集成神經(jīng)網(wǎng)絡(luò)優(yōu)化算法[J].計算機仿真,2013.1
[2]金以明.基于DEA和SOM的數(shù)字圖書館評價研究[J].情報科學(xué),2011.1
[3]李春華,李寧,史陪軍.自組織特征映射神經(jīng)網(wǎng)絡(luò)原理和應(yīng)用研究[J].北京師范大學(xué)學(xué)報(自然科學(xué)版),2006.5