劉佳祺 劉德紅 林甜甜
摘 要:本文將BP神經(jīng)網(wǎng)絡(luò)模型與主成分分析法和遺傳算法相結(jié)合,建立了預測股票價格變化的動態(tài)PCA-GA-BP模型。該模型能改善BP神經(jīng)網(wǎng)絡(luò)模型運算速度緩慢和易陷入局部最小值的缺點,彌補傳統(tǒng)股票價格預測方法的不足。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò)模型 主成分分析 遺傳算法 PCA-GA-BP模型
中圖分類號:F832 文獻標識碼:A 文章編號:2096-0298(2018)03(b)-029-02
股票的價格走勢不僅可以從一定程度上體現(xiàn)宏觀經(jīng)濟的發(fā)展狀況,而且與每個投資者的經(jīng)濟利益相關(guān),因此研究我國股票市場的可預測性非常有意義。股票價格的預測方法主要分為兩類:第一類是基于線性模型的傳統(tǒng)統(tǒng)計經(jīng)濟學方法,第二類是采用人工神經(jīng)網(wǎng)絡(luò)模型的非線性方法。然而股票市場是一個復雜的系統(tǒng),它具有非結(jié)構(gòu)性、非線性、高噪聲的特性,使用傳統(tǒng)的方法建立精確、有效的模型比較困難。研究結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)模型能有效地考慮到影響股票價格的各種非線性因素,在股市預測方面效率和精準度相對較高。
1 BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)是由Rumelhart和McClelland為首的科學家提出的概念,是一種按照誤差逆向傳播算法訓練的多層前饋神經(jīng)網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)。
1.1 BP神經(jīng)網(wǎng)絡(luò)模型原理
BP神經(jīng)網(wǎng)絡(luò)模型主要包括三個部分,分別是輸入層、隱含層和輸出層如圖1所示。學習樣本從輸入層經(jīng)各隱含層傳向輸出層,最終在輸出層的各個神經(jīng)元收到來自輸入層的信息。之后,系統(tǒng)以減少輸出值與期望值的誤差為目標,從輸出層開始經(jīng)過各個中間隱含層修正各連接權(quán)值,最后回到輸入層。隨著這種修正傳播的不斷進行,網(wǎng)絡(luò)調(diào)整權(quán)值直至誤差達到理想值。
1.2 BP神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點
首先,BP神經(jīng)網(wǎng)絡(luò)模型具有非線性映射能力強、自適應(yīng)性和自學習能力強、容錯能力強等優(yōu)點,能通過網(wǎng)絡(luò)訓練儲存網(wǎng)絡(luò)權(quán)值中的學習內(nèi)容,較好地處理內(nèi)部作用機制復雜的非線性函數(shù),從而準確地預測數(shù)據(jù)。
但是在實際應(yīng)用中,BP神經(jīng)網(wǎng)絡(luò)模型存在著隱含層節(jié)點難確立、變量選擇困難、運算速度緩慢等缺點。針對這些問題,作者對BP神經(jīng)網(wǎng)絡(luò)進行了改進,使其能準確、高效地預測股票價格。
2 BP神經(jīng)網(wǎng)絡(luò)模型的改進
2.1 BP神經(jīng)網(wǎng)絡(luò)與主成分分析結(jié)合
對股市未來趨勢進行預測的基礎(chǔ)是股市大量的歷史數(shù)據(jù),雖然這些數(shù)據(jù)簡單明了,但直接將這些數(shù)據(jù)作為模型的輸入樣本是錯誤的,因為這組數(shù)據(jù)之間存在相關(guān)性。而主成分分析法能將一組互相影響的輸入因子轉(zhuǎn)換成兩兩不相關(guān)的、變量數(shù)少的綜合指標,盡可能反映原指數(shù)信息的實際需求,揭示影響股價信息的一般因素和特殊信息。所以應(yīng)先對數(shù)據(jù)進行主成分分析,選取足夠的主成分數(shù),從而作為輸入層數(shù)據(jù)代入BP神經(jīng)網(wǎng)絡(luò)模型。
主成分分析對BP神經(jīng)網(wǎng)絡(luò)的改進主要體現(xiàn)在它可以有效地降低輸入變量的維度,提取原指標的主要信息,減少模型的訓練學習時間。但是,主成分分析不能捕捉股價因素之間的非線性關(guān)系,不能直接用于股票價格預測,而BP神經(jīng)網(wǎng)絡(luò)模型能很好地處理內(nèi)部作用機制復雜的非線性關(guān)系。由此可知,主成分分析和BP神經(jīng)網(wǎng)絡(luò)模型的功能可以進行互補,整合各自的數(shù)據(jù)處理優(yōu)勢,從而對股價進行準確預測。
2.2 BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的確定
在BP神經(jīng)網(wǎng)絡(luò)模型中,研究的問題本身已經(jīng)確定了輸入單元數(shù)和輸出單元數(shù)。因此,模型成功的關(guān)鍵在于如何精準確定隱含層的層數(shù)和相應(yīng)的單元數(shù)。因為一個隱含層就可以訓練BP神經(jīng)網(wǎng)絡(luò)無限接近某一目標非線性函數(shù),所以本文將網(wǎng)絡(luò)層數(shù)確定為3,即只有一個隱含層。相反,確定隱含層的單元數(shù)是個十分復雜的問題。一方面,過多的單元數(shù)會影響網(wǎng)絡(luò)的概括推理功能,另一方面,過少的單元數(shù)則會影響模型訓練和預測的精度,降低實證效果。本文采用沈花玉等提出的BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的改進方法,該方法基于3種基本確定單元數(shù)途徑,即:
其中為隱含層單元數(shù),n為輸入單元數(shù),m為輸出單元數(shù)。
筆者提出綜合這三種方法來確定最佳隱含層單元數(shù)的邊界值,然后按照單元數(shù)范圍從小到大依次對數(shù)據(jù)進行訓練,根據(jù)訓練誤差和對應(yīng)的測試誤差,選擇隱含層的最佳數(shù)目。
2.3 BP神經(jīng)網(wǎng)絡(luò)與遺傳算法結(jié)合
遺傳算法是一種自適應(yīng)優(yōu)化搜索算法,其思想來源于生物遺傳學和適者生存的自然規(guī)律。遺傳算法以期望的函數(shù)為目標,評價每個向量的適應(yīng)度,然后根據(jù)該適應(yīng)值實施變異、交換、選擇等操作。在這過程中,適應(yīng)度高的元素被留下來并傳給下一代新的數(shù)據(jù)組,而適應(yīng)度低的元素則被淘汰。
遺傳算法具有較強的全局搜索能力,能彌補BP神經(jīng)網(wǎng)絡(luò)模型具有易陷入局部最小值的缺陷。將BP神經(jīng)網(wǎng)絡(luò)和遺傳算法結(jié)合,可以充分發(fā)揮兩者的優(yōu)點,使新算法既有神經(jīng)網(wǎng)絡(luò)的學習能力和魯棒性,又有遺傳算法的強全局搜索能力。
3 PCA-GA-BP模型的股票預測
采用PCA—GA—BP模型預測股票價格流程如下:首先,選取股票交易的歷史數(shù)據(jù),用主成分分析法對數(shù)據(jù)進行預處理,消除數(shù)據(jù)間的冗余,以達到降維的目的;其次,利用本文2.2節(jié)所述方法選取合適的隱含層單元數(shù),構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型;再次,將輸入變量分為訓練段和預測段兩部分,確保訓練段數(shù)據(jù)盡量擬合,從而確定遺傳算法相關(guān)參數(shù);最后,訓練改進后的BP神經(jīng)網(wǎng)絡(luò),并用其預測股價。具體算法,如圖2所示。
4 結(jié)語
PCA—GA—BP模型改進了BP神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點難確立、變量選擇困難、運算速度緩慢等缺陷,能準確預測具有非線性和隨機性的股票價格,使預測值的誤差達到最小值,實現(xiàn)更好的預測效果。
參考文獻
[1] 齊曉娜,程維剛.基于遺傳LMBP神經(jīng)網(wǎng)絡(luò)模型的股票預測[J].無線互聯(lián)科技,2016(3).
[2] 黃宏運,朱家明,李詩爭.基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)在股指預測中的應(yīng)用研究[J].云南大學學報(自然科學版),2017(3).
[3] 劉永福,李建功.利用BP神經(jīng)網(wǎng)絡(luò)預測上證指數(shù)[J].商務(wù)周刊, 2003(10).
[4] 柏丹,靳鑫,孫方方.BP神經(jīng)網(wǎng)絡(luò)的股票價格預測模型建立[J].科技創(chuàng)業(yè)月刊,2013,26(1).