楊嘉慶 周俊峰
摘要:本文系統(tǒng)地介紹了神經(jīng)網(wǎng)絡模型中徑向基函數(shù)網(wǎng)絡模型的數(shù)學理論,包括他的原理,算法步驟和實證過程。
關(guān)鍵詞:神經(jīng)網(wǎng)絡模型 徑向基函數(shù)網(wǎng)絡
人工神經(jīng)網(wǎng)絡是一種基于腦與神經(jīng)系統(tǒng)的仿真模型,它是模擬人的神經(jīng)結(jié)構(gòu)思維并行計算方式啟發(fā)形成的一種信息描述和信息處理的數(shù)學模型。它具有自我學習能力,從一組輸入數(shù)據(jù)中學習,然后不斷調(diào)整模型參數(shù),以建造更合適的模型。因此,神經(jīng)網(wǎng)絡的工作過程一般來講包含兩個階段:
訓練階段:主要是調(diào)整網(wǎng)絡神經(jīng)元間的連接權(quán)值和連接方法等,因為事實上正是連接方式和連接權(quán)值決定了神經(jīng)網(wǎng)絡的信息處理能力,所以訓練過程至關(guān)重要。同時,神經(jīng)網(wǎng)絡因為具有自學習和自組織的顯著特征,它既可以有導師也可以無導師的自主學習,從而能夠適應外界環(huán)境的復雜變化。
驗證階段:在這個階段網(wǎng)絡的各項已經(jīng)訓練好的參數(shù)都不會發(fā)生變化,此階段的工作過程主要體現(xiàn)在建立輸入數(shù)據(jù),然后根據(jù)已經(jīng)訓練好的最有參數(shù)建立系統(tǒng)模型,然后再得到輸出數(shù)據(jù),最后比較實際數(shù)據(jù)與輸出數(shù)據(jù)的誤差。
人工神經(jīng)網(wǎng)絡在數(shù)學上已經(jīng)得到證明,當條件允許時,它可以無限可能地逼近實際函數(shù),這意味著無論反映實際規(guī)律的函數(shù)有多復雜,形式有多不規(guī)范,神經(jīng)網(wǎng)絡都能逼近那些并不“友好”的函數(shù),這樣得天獨厚的特點對于復雜多變的股票市場無疑具有特別實際的意義,也因此使得神經(jīng)網(wǎng)絡在許多領(lǐng)域都得到了成功應用。
目前學界比較重視同時實際應用中也比較廣泛的神經(jīng)網(wǎng)絡預測方法有前饋式神經(jīng)網(wǎng)絡(BP網(wǎng)絡),徑向基函數(shù)網(wǎng)絡(RBF),反饋式網(wǎng)絡等。目前BP神經(jīng)網(wǎng)絡在各個領(lǐng)域中得到較多的應用,但是BP神經(jīng)網(wǎng)絡也有一個比較致命的弱點,就是網(wǎng)絡收斂過程常常難以超越局部極小范圍而無法最終收斂到全局最小。徑向基函數(shù)網(wǎng)絡是一種三層前饋式神經(jīng)網(wǎng)絡,包括輸入層、隱含層和輸出層,在RBF網(wǎng)絡中,隱含層節(jié)點的作用實際上就是執(zhí)行一種非線性變換,使當有外界輸入后,它會利用基函數(shù)實現(xiàn)線性加權(quán)組合,從而達到從輸入空間到隱層空間的非線性映射。它具有特別出眾的非線性方面的擬合能力,理論上能夠無限度的逼近任意給定的非線性函數(shù)。這樣,徑向基函數(shù)網(wǎng)絡的學習過程可以看作是在高維空間中尋找對于一個已經(jīng)指定訓練數(shù)據(jù)而言的最優(yōu)擬合超平面。
1.首先對原始數(shù)據(jù)進行歸一化處理,然后構(gòu)建訓練集的輸入向量和輸出向量。以每5天的收盤價作為輸入向量,這樣的做的好處是能夠使股票數(shù)據(jù)的趨勢性規(guī)律更明顯的顯現(xiàn)出來,然后以第6天的收盤價作為輸出向量。
2.確定最優(yōu)隱節(jié)點數(shù),通過不斷的嘗試,在1~50的范圍內(nèi),40是最優(yōu)隱節(jié)點數(shù)。
3.在確定好了隱節(jié)點數(shù)后,進行實際值得預測。測試集的輸入向量是后20組的股票收盤價,直接采用MATLAB自帶工具箱進行預測。
4.模型結(jié)果評價。得到預測數(shù)據(jù)之后,對測試結(jié)果進行分析評價,評價的指標即是上文所提到的均方根誤差(RMSE)、平均相對誤差(MAPE)和相關(guān)系數(shù)R,對同一個預測變量,其RMSE與MAPE取值越小,說明預測精度越高。R是對預測值序列和樣本序列線性相關(guān)程度的衡量。相關(guān)系數(shù)有如下性質(zhì):若R的值越大,預測值序列與參考值序列線性關(guān)系越密切,預測精度也就越高。一般而言,線性相關(guān)系數(shù)越大,其均方根誤差和平均相對誤差越小,對各個不同的預測變量RMSE與MAPE相差很大,沒有統(tǒng)一的標準,而R是一個標準的位于[-L1]區(qū)間的數(shù)值,便于分析比較。所以在本例中,使用相關(guān)系數(shù)R作為衡量模型預測精度的標準,RMSE與MAPE僅做輔助參考用。結(jié)果表明,神經(jīng)網(wǎng)絡模型的預測精度在預期范圍內(nèi),不過模型結(jié)果仍需進一步完善。
總體來說,人工神經(jīng)網(wǎng)絡模型的預測效果還是比較可靠的,尤其針對小規(guī)模樣本,而且神經(jīng)網(wǎng)絡的時間和內(nèi)存空間的開銷都極其有限,需要注意的就是如何選取對預測精度其重要作用的隱節(jié)點數(shù)。