楊雨霖
摘 要 人工智能技術(shù)已經(jīng)在生產(chǎn)生活中得到了一些應(yīng)用,近些年也逐步滲透到經(jīng)濟(jì)領(lǐng)域。股票作為大眾生活的聚焦點(diǎn),如何借助人工智能技術(shù)對(duì)歷史數(shù)據(jù)和當(dāng)前國(guó)內(nèi)外形勢(shì)、政策等抽象數(shù)據(jù)來(lái)對(duì)股票進(jìn)行準(zhǔn)確預(yù)測(cè),是人工智能技術(shù)的新方向,現(xiàn)實(shí)的股票分析需處理大量數(shù)據(jù),這正是人工智能技術(shù)的優(yōu)勢(shì)。本文結(jié)合了現(xiàn)有的應(yīng)用于股票預(yù)測(cè)的人工神經(jīng)網(wǎng)絡(luò)模型,詳細(xì)介紹了人工智能在股票預(yù)測(cè)方面的應(yīng)用方法與應(yīng)用實(shí)例,并對(duì)未來(lái)的改進(jìn)可能性和應(yīng)用前景進(jìn)行了合理的展望。
關(guān)鍵詞 人工智能;股票;大數(shù)據(jù);價(jià)格預(yù)測(cè)
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)224-0150-02
從股票誕生以來(lái),預(yù)測(cè)未來(lái)股價(jià)走勢(shì)便成為了一個(gè)極富理論意義與實(shí)踐意義的研究命題。但是,由于股票價(jià)格關(guān)于時(shí)間呈現(xiàn)出受多方面因素影響的高度非線性關(guān)系,傳統(tǒng)預(yù)測(cè)方法往往難以把控股價(jià)變動(dòng)的隨機(jī)性與規(guī)律性之間的平衡,存在著或多或少的缺陷[ 1 ]。而隨著人工智能的發(fā)展,其強(qiáng)大的數(shù)據(jù)儲(chǔ)存、處理、分析能力為股票預(yù)測(cè)提供了新的思路。基于人工智能及相關(guān)技術(shù)的股票預(yù)測(cè)手段近些年受到廣泛研究,它們較好地彌補(bǔ)了傳統(tǒng)預(yù)測(cè)方法的不足,提升了股票預(yù)測(cè)的可靠性、準(zhǔn)確性[ 2 ]。
本文正是針對(duì)股票預(yù)測(cè)中的大數(shù)據(jù)分析特點(diǎn),結(jié)合人工智能技術(shù)的優(yōu)勢(shì),有機(jī)地將兩者進(jìn)行交叉分析研究,從應(yīng)用的可行性角度闡述了應(yīng)用的方法與一些應(yīng)用實(shí)例,為人工智能技術(shù)在經(jīng)濟(jì)金融領(lǐng)域的應(yīng)用提供新的思路。
1 基本概念
1.1 人工智能
人工智能第一次是在1956年提出的,當(dāng)時(shí)其主要是作為可體現(xiàn)出智能行為的硬件或軟件形式出現(xiàn)的。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展以及深度學(xué)習(xí)的出現(xiàn),人工智能的應(yīng)用領(lǐng)域正在不斷拓展[1-2],其中典型的人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
人工智能的學(xué)習(xí)方式主要是通過(guò)借助先進(jìn)的處理器建立類似圖1所示的人工神經(jīng)網(wǎng)絡(luò)模型,來(lái)模擬人腦對(duì)數(shù)據(jù)處理的思維,通常都是由多層結(jié)構(gòu)組成,分別為輸入層、隱含層和輸出層,其中最為關(guān)鍵的是隱含層,通過(guò)隱含層中復(fù)雜的算法實(shí)現(xiàn)模擬人腦的工作過(guò)程。其一般工作過(guò)程可描述為:
首先通過(guò)輸入層感知外部環(huán)境數(shù)據(jù)信息,接著進(jìn)入隱含層進(jìn)行數(shù)據(jù)處理,如線性變換、聚類分類等算法實(shí)現(xiàn)數(shù)據(jù)智能處理,特別地,隱含層是根據(jù)實(shí)際應(yīng)用需要進(jìn)行特定設(shè)計(jì),經(jīng)過(guò)處理后得到目標(biāo)結(jié)果傳送到輸出層以供后續(xù)使用。本質(zhì)上,每一層都有其對(duì)應(yīng)的算法,每一層對(duì)應(yīng)的輸出即為下一層對(duì)應(yīng)的輸入,借助這種數(shù)據(jù)處理流程,實(shí)現(xiàn)模擬人腦的神經(jīng)元工作機(jī)制[ 2 ],從而得到對(duì)有關(guān)初始數(shù)據(jù)的學(xué)習(xí)結(jié)果。
1.2 股票分析
常見(jiàn)的股票市場(chǎng)的分析方法主要有基本分析和技術(shù)分析兩種[3-4]。
基本分析(Fundamental?Analysis)研究的是股票內(nèi)在價(jià)值。基本分析通過(guò)對(duì)宏觀經(jīng)濟(jì)狀況、行業(yè)前景和公司發(fā)展?fàn)顩r的研究,得出股票的長(zhǎng)期投資價(jià)值和安全邊際,與股票市場(chǎng)價(jià)進(jìn)行比對(duì),以此得出或買或賣的投資建議?;痉治龅姆椒▽?duì)新投資者而言難于理解,且預(yù)測(cè)精度不高,對(duì)中短期投資缺乏指導(dǎo)作用,多用于長(zhǎng)線投資分析。
技術(shù)分析(Technical?Analysis)研究的是市場(chǎng)行為。技術(shù)分析的理論基礎(chǔ)有3條:市場(chǎng)行為包容一切信息;價(jià)格以趨勢(shì)波動(dòng);歷史往往重演。技術(shù)分析通過(guò)對(duì)股票價(jià)格波動(dòng)方式和波動(dòng)周期的研究,得出短期內(nèi)股價(jià)如何變化的投資指導(dǎo)意見(jiàn)。技術(shù)分析不適用于長(zhǎng)期趨勢(shì)的預(yù)測(cè),并且可靠性和準(zhǔn)確性不足,容易受政策的外界因素的干擾。
2 人工智能在股票預(yù)測(cè)中的應(yīng)用分析
2.1 應(yīng)用領(lǐng)域
2.1.1 大盤(pán)預(yù)測(cè)
對(duì)大盤(pán)數(shù)據(jù)進(jìn)行預(yù)測(cè),是人工智能應(yīng)用于股票分析領(lǐng)域的一個(gè)重要方向。這種分析的實(shí)現(xiàn)大多以技術(shù)分析相關(guān)理論作為理論基礎(chǔ)。根據(jù)“歷史往往重演”的理論,可以將此前證券市場(chǎng)上漲行情(牛市)的數(shù)據(jù)作為樣本,選取牛市行情的典型數(shù)據(jù)特征,以此訓(xùn)練人工智能,使其在市場(chǎng)展露出上漲或下降特征時(shí)做出預(yù)測(cè)。
由此不難看出,特征選取的質(zhì)量決定了預(yù)測(cè)的準(zhǔn)確性。若選取特征過(guò)少或不夠準(zhǔn)確,容易導(dǎo)致人工智能對(duì)市場(chǎng)變化信息不夠敏感。若特征選取過(guò)多,將會(huì)加大運(yùn)算量,并會(huì)使人工智能容易受無(wú)關(guān)噪音干擾。
文獻(xiàn)[4]在基本特征之外選用了相關(guān)狀態(tài)參數(shù)等深層特征,取得了比較好的預(yù)測(cè)效果。
2.1.2 個(gè)股價(jià)格預(yù)測(cè)
上述的方法能夠獲得大盤(pán)走勢(shì)的預(yù)測(cè)信息,但是僅依靠這些信息還不能幫助投資者做出更具體的選擇,如買入或賣出某只特定的股票。因而,對(duì)個(gè)股價(jià)格進(jìn)行預(yù)測(cè)成為了人工智能在股票分析領(lǐng)域的另一個(gè)重要應(yīng)用方向。在個(gè)股價(jià)格預(yù)測(cè)與人工神經(jīng)網(wǎng)絡(luò)技術(shù)相結(jié)合時(shí),常以單只股票的開(kāi)、收盤(pán)價(jià)與最高、最低價(jià)等作為學(xué)習(xí)樣本,使人工神經(jīng)網(wǎng)絡(luò)盡可能模擬出該股票隨時(shí)間變動(dòng)的非線性關(guān)系。
但是這種人工神經(jīng)網(wǎng)絡(luò)方法存在容易陷入局部最小值等問(wèn)題。早先有文獻(xiàn)運(yùn)用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行個(gè)股價(jià)格預(yù)測(cè),其效果不甚理想[ 5 ]。近些年來(lái),又有將Elman神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,并運(yùn)用小波分析過(guò)濾學(xué)習(xí)樣本,獲得了更好的實(shí)驗(yàn)結(jié)果[ 6 ]。
此外,人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)個(gè)股價(jià)格還存在著推廣性差的問(wèn)題,即針對(duì)每一只股票都需要重新訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)。解決這個(gè)問(wèn)題將大大提升人工神經(jīng)網(wǎng)絡(luò)技術(shù)在股票預(yù)測(cè)領(lǐng)域的應(yīng)用價(jià)值,這還需要研究者的進(jìn)一步努力。
2.2 應(yīng)用方法
2.2.1 數(shù)據(jù)采集與處理
由于模型預(yù)測(cè)原理不同,人工智能應(yīng)用于股票分析時(shí)需采集的數(shù)據(jù)種類和先期處理的方式也各有差別。一些模型只選用股票日收盤(pán)價(jià)作為訓(xùn)練數(shù)據(jù)[7],通過(guò)對(duì)數(shù)據(jù)進(jìn)行處理,得到了比較好的預(yù)測(cè)效果。選用數(shù)據(jù)少可以簡(jiǎn)化輸入層結(jié)構(gòu),從而降低了神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的硬件壓力。另一些模型選用了較多的數(shù)據(jù),增加訓(xùn)練數(shù)據(jù)種類使人工神經(jīng)網(wǎng)絡(luò)擁有了分類選股的能力,而不止局限于預(yù)測(cè)股票第二日價(jià)格。
對(duì)數(shù)據(jù)的預(yù)處理方式也是各個(gè)模型區(qū)別于其他模型的一大特征,其中應(yīng)用較廣泛的是歸一法。歸一法是通過(guò)公式(1)所實(shí)現(xiàn):
預(yù)處理后有的模型運(yùn)用小波變換法對(duì)數(shù)據(jù)再次處理,小波變換法是利用一個(gè)原始小波函數(shù)及其伸縮、平移形成的函數(shù)系對(duì)原始數(shù)據(jù)進(jìn)行多尺度分解,以分解信號(hào)代替原始數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),既減少了神經(jīng)網(wǎng)絡(luò)所需的訓(xùn)練次數(shù),也增強(qiáng)了小波函數(shù)逼近函數(shù)的能力。
2.2.2 模型訓(xùn)練
在預(yù)測(cè)模型建立過(guò)程中,模型訓(xùn)練往往放在模型構(gòu)筑之前。這是由人工神經(jīng)網(wǎng)絡(luò)的特性決定的。人工神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、輸出層三層結(jié)構(gòu)組成,其中隱含層是人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的核心,而隱含層的神經(jīng)元個(gè)數(shù)不具有規(guī)律性[ 3 ],需要進(jìn)行預(yù)實(shí)驗(yàn)最終確定。有的基于徑向基函數(shù)(RBF)的人工神經(jīng)網(wǎng)絡(luò)模型將模型訓(xùn)練與模型構(gòu)筑結(jié)合起來(lái)[7],在訓(xùn)練的同時(shí)為基函數(shù)加權(quán),建立神經(jīng)網(wǎng)絡(luò)。
粒子群訓(xùn)練法是一種較為普遍的模型訓(xùn)練方法。粒子群訓(xùn)練法是將每個(gè)數(shù)據(jù)處理為一個(gè)高維空間中只有位置和速度的微粒,通過(guò)迭代不斷追尋最優(yōu)粒子的方式找出最優(yōu)解。粒子群訓(xùn)練法是一種實(shí)用性較強(qiáng)的全局尋優(yōu)算法,與BP算法等局部尋優(yōu)算法不同,不易陷入局部最小值。
2.2.3 模型構(gòu)筑
除上文所述的徑向基函數(shù)法可在模型訓(xùn)練的同時(shí)完成模型構(gòu)筑,大多數(shù)人工神經(jīng)網(wǎng)絡(luò)模型需要依據(jù)輸入層、輸出層結(jié)構(gòu)并根據(jù)經(jīng)驗(yàn)或相應(yīng)公式大致確定隱含層神經(jīng)元個(gè)數(shù)范圍,再通過(guò)先前確定的模型訓(xùn)練方法訓(xùn)練隱含層神經(jīng)元不同的神經(jīng)網(wǎng)絡(luò),選取結(jié)果最優(yōu)的神經(jīng)網(wǎng)絡(luò)作為最終結(jié)構(gòu)。
2.2.4 模型評(píng)估
在人工神經(jīng)網(wǎng)絡(luò)模型完成實(shí)驗(yàn)后,需要評(píng)估其預(yù)測(cè)的準(zhǔn)確性,以此判斷此模型在股票分析中是否實(shí)用。一般用于股票分析的機(jī)器學(xué)習(xí)模式有兩種:模式識(shí)別與函數(shù)逼近。前者強(qiáng)調(diào)將股票按收益高低等指標(biāo)分類,后者強(qiáng)調(diào)對(duì)股價(jià)的直接預(yù)測(cè)。根據(jù)機(jī)器學(xué)習(xí)模式的不同,相應(yīng)的也應(yīng)采用不同的評(píng)估方法。模式識(shí)別類型的神經(jīng)網(wǎng)絡(luò)采用分類正確率來(lái)驗(yàn)證預(yù)測(cè)準(zhǔn)確率,而函數(shù)逼近類型的神經(jīng)網(wǎng)絡(luò)運(yùn)用均方誤差(MSE)、絕對(duì)平均誤差(AAE)、最小二乘誤差(LSE)等統(tǒng)計(jì)量衡量預(yù)測(cè)準(zhǔn)確率。
大多數(shù)模型只以對(duì)測(cè)試集合的預(yù)測(cè)結(jié)果作為評(píng)判標(biāo)準(zhǔn)。也有一些文獻(xiàn)中提出用訓(xùn)練集中的樣本重復(fù)檢驗(yàn)?zāi)P停阅P偷幕貞浤芰ψ鳛檩o助評(píng)判標(biāo)準(zhǔn)。
2.3 未來(lái)展望
目前,應(yīng)用于股票預(yù)測(cè)的人工神經(jīng)網(wǎng)絡(luò)模型層出不窮,而人工神經(jīng)網(wǎng)絡(luò)的硬件實(shí)現(xiàn)成為了新的可取研究方向。人工神經(jīng)網(wǎng)絡(luò)的硬件實(shí)現(xiàn)能提高資源利用率,減少網(wǎng)絡(luò)訓(xùn)練的資源消耗并顯著地改善預(yù)測(cè)速度,有著比較高的研究?jī)r(jià)值。
時(shí)至今日,人工神經(jīng)網(wǎng)絡(luò)仍沒(méi)有在實(shí)踐中得到廣泛的應(yīng)用。隨著研究的進(jìn)一步深入,可以預(yù)見(jiàn)人工神經(jīng)網(wǎng)絡(luò)在股票預(yù)測(cè)領(lǐng)域的應(yīng)用范圍會(huì)進(jìn)一步擴(kuò)大,實(shí)用性也會(huì)進(jìn)一步增強(qiáng),這對(duì)于數(shù)據(jù)密集的股票分析是大有裨益的。
3 結(jié)論
由文獻(xiàn)資料可以看出,早年的人工神經(jīng)網(wǎng)絡(luò)存在著建模復(fù)雜、預(yù)測(cè)準(zhǔn)確率低等各種問(wèn)題。經(jīng)過(guò)十余年的發(fā)展,當(dāng)今應(yīng)用于股票分析領(lǐng)域的人工神經(jīng)網(wǎng)絡(luò)種類眾多,對(duì)提高預(yù)測(cè)性能提出了多種多樣的解決方法,并都取得了不錯(cuò)的效果。未來(lái),人工神經(jīng)網(wǎng)絡(luò)將會(huì)繼續(xù)發(fā)展并逐步實(shí)現(xiàn)硬件化,逐漸在股票預(yù)測(cè)領(lǐng)域擴(kuò)大應(yīng)用,為投資者預(yù)測(cè)股價(jià)變動(dòng)帶來(lái)越來(lái)越多的便利。
參考文獻(xiàn)
[1]Lertyingyod W, Benjamas N. Stock price trend prediction using Artificial Neural Network techniques: Case study: Thailand stock exchange[C]// Computer Science and Engineering Conference. IEEE,2017:1-6.
[2]Srinivasan N, Lakshmi C. Stock prediction and analysis using intermittent training data with artificial neural networks[C]// International Conference on Innovations in Information, Embedded and Communication Systems.2017:1-4.
[3]劉海玥.遺傳算法與神經(jīng)網(wǎng)絡(luò)在股票預(yù)測(cè)中的分析[D].太原:中北大學(xué),2011.
[4]宋恒,張楊.基于模式識(shí)別技術(shù)的股票市場(chǎng)技術(shù)分析研究[J].計(jì)算機(jī)仿真,2004,21(7):142-145.
[5]張健,陳勇,夏罡,等.人工神經(jīng)網(wǎng)絡(luò)之股票預(yù)測(cè)[J].計(jì)算機(jī)工程,1997(2):52-55.
[6]張坤,郁湧,李彤.基于小波和神經(jīng)網(wǎng)絡(luò)相結(jié)合的股票價(jià)格模型[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(23):5496-5498.
[7]龐英智,趙曉丹,郭偉業(yè).一種基于RBF人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法研究[J].情報(bào)科學(xué),2009(11):1707-1709.