翟龍飛 陳迎春 楊沖 閆心寶
摘 要:人工神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理技術(shù),具有先進(jìn)的建模技術(shù),但網(wǎng)絡(luò)自身存在的不足影響了其進(jìn)一步的發(fā)展和應(yīng)用。本文詳細(xì)研究了標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò),并提出了網(wǎng)絡(luò)性能的改進(jìn)著眼點(diǎn)。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) 網(wǎng)絡(luò)模型 網(wǎng)絡(luò)訓(xùn)練
中圖分類號(hào): TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-9082(2016)03-0004-01
人工神經(jīng)網(wǎng)絡(luò)是一個(gè)由簡(jiǎn)單數(shù)據(jù)處理單元相互連接組成的龐大信息處理計(jì)算模型,該網(wǎng)絡(luò)通過歷史知識(shí)的不斷輸入和人工網(wǎng)絡(luò)對(duì)于運(yùn)算的自適應(yīng)調(diào)整來實(shí)現(xiàn)有用運(yùn)算。
一、神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)具有自主學(xué)習(xí)性質(zhì),對(duì)于特定運(yùn)算具有高效運(yùn)算能力。因此,人們以信息在神經(jīng)系統(tǒng)處理過程為啟發(fā),利用計(jì)算機(jī)系統(tǒng)構(gòu)建了類似的分級(jí)計(jì)算層次結(jié)構(gòu),即人工神經(jīng)網(wǎng)絡(luò)。
神經(jīng)網(wǎng)絡(luò)構(gòu)造可分為神經(jīng)元模型、網(wǎng)絡(luò)模型構(gòu)造兩部分。
1.神經(jīng)元模型
神經(jīng)元(神經(jīng)細(xì)胞)是神經(jīng)網(wǎng)絡(luò)的基本信息處理單元,它是神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)基礎(chǔ)
2.網(wǎng)絡(luò)結(jié)構(gòu)模型
網(wǎng)絡(luò)結(jié)構(gòu)模型由逐個(gè)神經(jīng)元連接構(gòu)成,其能對(duì)信息的多神經(jīng)元融合處理傳輸,因此使得信息處理具有一定的魯棒性。從網(wǎng)絡(luò)結(jié)構(gòu)連接方式上,可將人工神經(jīng)網(wǎng)絡(luò)分為前饋型網(wǎng)絡(luò)和反饋型網(wǎng)絡(luò)。
二、網(wǎng)絡(luò)模型構(gòu)建
1.BP網(wǎng)絡(luò)的結(jié)構(gòu)分析
將BP神經(jīng)元組合就構(gòu)成了多層BP神經(jīng)網(wǎng)絡(luò),圖3給出了一個(gè)單隱層的三層神經(jīng)網(wǎng)絡(luò)模型。
2.BP網(wǎng)絡(luò)的算法分析
2.1神經(jīng)網(wǎng)絡(luò)的性能函數(shù)
神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)性能是以均方誤差MSE作為評(píng)價(jià)標(biāo)準(zhǔn),同時(shí)兼顧網(wǎng)絡(luò)訓(xùn)練時(shí)間。以下為網(wǎng)絡(luò)輸出誤差數(shù)學(xué)表達(dá):
(6)
2.2神經(jīng)網(wǎng)絡(luò)中神經(jīng)元權(quán)值與輸出誤差關(guān)系
由(8)可以看出,網(wǎng)絡(luò)輸出誤差E是各層權(quán)值 、 的函數(shù),因此通過調(diào)整權(quán)值來得到較小E的值,從而實(shí)現(xiàn)數(shù)據(jù)擬合精度提高。
三、影響B(tài)P網(wǎng)絡(luò)性能的關(guān)鍵因素
1.網(wǎng)絡(luò)訓(xùn)練的擬合性能分析
眾多研究表明,網(wǎng)絡(luò)的泛化能力主要與隱層數(shù)以及各隱層神經(jīng)元個(gè)數(shù),樣本大小和訓(xùn)練次數(shù)有關(guān)。本文研究針對(duì)短波數(shù)據(jù)進(jìn)行的擬合預(yù)測(cè)分析,訓(xùn)練目標(biāo)是最好的接近實(shí)際數(shù)據(jù)。因此,本文以訓(xùn)練得到最低均方誤差為目的。
2.數(shù)據(jù)集的選定
訓(xùn)練樣本集的選取以及處理對(duì)于神經(jīng)網(wǎng)絡(luò)的擬合結(jié)果有著重要的影響。在選取輸入樣本變量時(shí),變量應(yīng)具有以下特點(diǎn):
①樣本數(shù)據(jù)大,即擁有較大的置信空間;
②輸入變量之間相關(guān)性要低。
需要對(duì)選定的樣本進(jìn)行預(yù)處理,以便進(jìn)一步優(yōu)化網(wǎng)絡(luò)性能[2]。
3.網(wǎng)絡(luò)初始化
網(wǎng)絡(luò)初始化包括對(duì)于權(quán)值和閾值的初始化,其初始值決定著網(wǎng)絡(luò)訓(xùn)練過程中在誤差曲面上的初始移動(dòng)點(diǎn),由于誤差曲面的不均勻性質(zhì),一個(gè)好的網(wǎng)絡(luò)初始值能夠使得網(wǎng)絡(luò)收斂速度更快,網(wǎng)絡(luò)收斂目標(biāo)更優(yōu),一般BP網(wǎng)絡(luò)初始化是隨機(jī)的,從而導(dǎo)致了網(wǎng)絡(luò)差異化大,網(wǎng)絡(luò)容易陷入局部最優(yōu)不能達(dá)到最終收斂的目的,同時(shí)也造成網(wǎng)絡(luò)訓(xùn)練的不穩(wěn)定。因此在實(shí)際應(yīng)用中,可以多次訓(xùn)練選擇最終誤差性能最小的網(wǎng)絡(luò)初始值,保證了網(wǎng)絡(luò)的訓(xùn)練結(jié)果。
4.網(wǎng)絡(luò)的訓(xùn)練速度
影響網(wǎng)絡(luò)訓(xùn)練速度的主要因素在網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)訓(xùn)練算法以及網(wǎng)絡(luò)參數(shù)。
為了保證較短的訓(xùn)練時(shí)間,選取隱含層和隱層節(jié)點(diǎn)數(shù)盡量少,但若設(shè)計(jì)網(wǎng)絡(luò)是結(jié)構(gòu)過于簡(jiǎn)單會(huì)造成網(wǎng)絡(luò)學(xué)習(xí)樣本的能力不足。然而過大的話,則導(dǎo)致網(wǎng)絡(luò)學(xué)習(xí)的時(shí)間加長(zhǎng),學(xué)習(xí)出現(xiàn)過適配現(xiàn)象[3]。目前可以采取試湊和對(duì)比的方法確定適合于該模型的網(wǎng)絡(luò)結(jié)構(gòu)。
網(wǎng)絡(luò)訓(xùn)練算法體現(xiàn)了訓(xùn)練點(diǎn)在誤差曲面的移動(dòng)路線和方式上,是網(wǎng)絡(luò)擬合性能的關(guān)鍵因素。
5.網(wǎng)絡(luò)性能的檢驗(yàn)
在標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)中,當(dāng)輸出誤差穩(wěn)定到網(wǎng)絡(luò)誤差性能函數(shù)以下時(shí),認(rèn)為是網(wǎng)絡(luò)訓(xùn)練成功。通過對(duì)和訓(xùn)練數(shù)據(jù)同一來源的檢驗(yàn)樣本進(jìn)行仿真預(yù)測(cè),用預(yù)測(cè)值與期望值求得誤差性能函數(shù)MSE來反映性能分析。對(duì)于一個(gè)網(wǎng)絡(luò)的評(píng)價(jià)指標(biāo)主要在網(wǎng)絡(luò)的訓(xùn)練速度和網(wǎng)絡(luò)的擬合精度上。
參考文獻(xiàn)
[1] Simon Haykin著. 神經(jīng)網(wǎng)絡(luò)原理[M]. 葉世偉等譯.第二版.北京:機(jī)械工業(yè)出版社,2004.1: 1~8.
[2] 施顏,韓立群,廉小親編著.神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)方法與實(shí)例分析[M] 北京:北京郵電大學(xué)出版社, 2009,12:23~36.