[摘 要] 股票系統(tǒng)預(yù)測的研究具有重大的理論意義和誘人的應(yīng)用價(jià)值。本文開發(fā)了基于多元線性回歸和層次分析法的案例推理上證指數(shù)預(yù)測模型,通過相關(guān)性分析,排除與目標(biāo)函數(shù)相關(guān)性低的參數(shù),建立上證指數(shù)預(yù)測參數(shù)集,使用多元線性回歸和層次分析法計(jì)算各個(gè)參數(shù)的權(quán)重,克服了傳統(tǒng)通過定性方法確定權(quán)重不準(zhǔn)確的缺點(diǎn),使用灰色關(guān)聯(lián)度的方法對案例進(jìn)行檢索,通過案例擇優(yōu)對檢索結(jié)果進(jìn)行處理。最終對上證指數(shù)進(jìn)行預(yù)測,并且將本模型的預(yù)測結(jié)果與傳統(tǒng)案例推理、多元線性回歸和人工神經(jīng)網(wǎng)絡(luò)的結(jié)果進(jìn)行比較,結(jié)果發(fā)現(xiàn):與其他方法相比,本模型預(yù)測上證指數(shù)具有較高的精度,誤差區(qū)間在[-5,+5]范圍內(nèi),本模型為45.0%,其他方法都小于或等于30.0%;誤差區(qū)間在[-10,+10]范圍內(nèi),本方法為75.0%,其他方法都小于或等于55.0%;誤差區(qū)間在[-20,+20]范圍內(nèi),本方法為95.0%,其他方法都小于或等于90.0%。另外,案例推理還具有檢索時(shí)間短的優(yōu)點(diǎn)。
[關(guān)鍵詞] 多元線性回歸 層次分析法 案例推理 上證指數(shù)預(yù)測
一、引言
就股市投資而言,辨認(rèn)市場的運(yùn)動規(guī)律,對將來時(shí)刻的股價(jià)指數(shù)進(jìn)行預(yù)測,是股票市場投資決策的關(guān)鍵。股票系統(tǒng)預(yù)測的研究具有重大的理論意義和誘人的應(yīng)用價(jià)值,人們一直探索其內(nèi)在規(guī)律,尋找其有效的預(yù)測方法和工具。由于股票市場的價(jià)格走勢是極為復(fù)雜且難以預(yù)測的,在許多經(jīng)濟(jì)學(xué)家的共同努力下,股票定價(jià)方法向著量化方向發(fā)展。
Tai-Liang Chen等使用基于Fibonacci數(shù)列的模糊時(shí)間序列的方法對股票進(jìn)行預(yù)測;Melike Bildirici等使用人工神經(jīng)網(wǎng)絡(luò)擴(kuò)展的GARCH模型族對伊斯坦布爾從1987到2008年的股票交易進(jìn)行預(yù)測,并且發(fā)現(xiàn)經(jīng)過人工神經(jīng)網(wǎng)絡(luò)的擴(kuò)展會提高GARCH模型族的預(yù)測效果;Ping-Feng Pai等將自回歸移動平均模型和支持向量機(jī)模型雜交成為自回歸移動平均模型和支持向量機(jī)組合模型,并且對股票價(jià)格進(jìn)行預(yù)測,計(jì)算測試發(fā)現(xiàn)效果良好;Henri Nyberg使用動態(tài)二值probit回歸模型對每月的股票超額收益進(jìn)行預(yù)測;馮家誠等提出適用于神經(jīng)網(wǎng)絡(luò)型數(shù)據(jù)挖掘的過程模型,按照選取數(shù)據(jù)樣本、數(shù)據(jù)轉(zhuǎn)換、網(wǎng)絡(luò)建模、網(wǎng)絡(luò)仿真、結(jié)果評價(jià)的數(shù)據(jù)挖掘過程,對上證指數(shù)走勢進(jìn)行預(yù)測,得到了較高的預(yù)測精度。
案例推理技術(shù)是根據(jù)相似性對當(dāng)前案例進(jìn)行檢索,得到與當(dāng)前案例最相似的已發(fā)生案例,把該案例的結(jié)果作為當(dāng)前案例的結(jié)果。本文開發(fā)了基于多元線性回歸和層次分析法的案例推理上證指數(shù)預(yù)測模型。通過相關(guān)性分析,排除與目標(biāo)函數(shù)相關(guān)性低的參數(shù),建立上證指數(shù)預(yù)測參數(shù)集;當(dāng)使用基于案例推理技術(shù)計(jì)算案例的相似度時(shí),需要確定各個(gè)影響因素的權(quán)值,本文采用多元線性回歸和層次分析法計(jì)算各個(gè)影響因素的權(quán)重;采用灰色關(guān)聯(lián)度的方法對案例進(jìn)行檢索,通過案例擇優(yōu)對檢索結(jié)果進(jìn)行處理。最終對上證指數(shù)進(jìn)行預(yù)測,并且將本方法的預(yù)測結(jié)果與傳統(tǒng)案例推理、多元線性回歸和人工神經(jīng)網(wǎng)絡(luò)的結(jié)果進(jìn)行比較,給出了結(jié)論。
二、基于多元線性回歸和層次分析法的案例推理上證指數(shù)預(yù)測模型的開發(fā)及應(yīng)用
基于多元線性回歸和層次分析法的案例推理上證指數(shù)預(yù)測模型包括四部分:影響上證指數(shù)指標(biāo)的選取,多元線性回歸,案例推理和層次分析法,如圖1所示。通過相關(guān)性分析,排除與目標(biāo)函數(shù)明日收盤價(jià)相關(guān)性低的參數(shù),建立上證指數(shù)預(yù)測參數(shù)集;通過多元線性回歸和層次分析法確定各個(gè)參數(shù)對目標(biāo)函數(shù)的影響權(quán)重,建立比較矩陣;最終采用案例推理技術(shù)對目標(biāo)函數(shù)進(jìn)行預(yù)測。
圖1 基于多元線性回歸和層次分析法的案例推理上證指數(shù)預(yù)測模型框架
1.影響上證指數(shù)指標(biāo)的選取
影響股票價(jià)格的各個(gè)因素如宏觀經(jīng)濟(jì)、政策、心理等都反映在其價(jià)格變化中,可以將研究影響上證指數(shù)運(yùn)行的各個(gè)因素轉(zhuǎn)化為研究上證指數(shù)歷史價(jià)格的變動上,應(yīng)用技術(shù)指標(biāo)分析方法,對股票的原始數(shù)據(jù)進(jìn)行處理,得出指標(biāo)值,這些指標(biāo)反應(yīng)了股票的規(guī)律或內(nèi)涵,根據(jù)這些指標(biāo)對上證指數(shù)進(jìn)行分析。由于這些指標(biāo)值可能具有一定相關(guān)性,通過相關(guān)性分析,排除與目標(biāo)函數(shù)相關(guān)性低的指標(biāo),剩下的指標(biāo)構(gòu)成了上證指數(shù)預(yù)測參數(shù)集,如表1所示。
2.多元線性回歸和層次分析法的應(yīng)用
當(dāng)使用基于案例推理技術(shù)時(shí),必須計(jì)算案例的相似度,而計(jì)算相似度時(shí)需要確定各個(gè)影響因素的權(quán)值。
采用多元線性回歸,確定各個(gè)指標(biāo)的權(quán)重。其基本原理是:目標(biāo)函數(shù)明日收盤價(jià)y受x1,x2…的影響,利用選取的數(shù)據(jù)樣本進(jìn)行回歸分析,建立模型:
根據(jù)最小二乘法,計(jì)算出模型中的參數(shù)
…的值,從而確定各個(gè)指標(biāo)對目標(biāo)函數(shù)影響的權(quán)重。
層次分析法(Analytic Hierarchy Process, AHP)是一種定性和定量相結(jié)合的、系統(tǒng)的、層次化的分析方法[8-10]。假設(shè)比較的 個(gè)指標(biāo) 對目標(biāo) 的影響,如今日收盤價(jià)、昨日收盤價(jià)、DEA等對明日收盤價(jià)的影響。 每次取兩個(gè)指標(biāo) 和 ,用 表示 和 對
的影響之比,全部比較結(jié)果可用以下成對比較矩陣來表示:
。
對矩陣的一致性采用如下一致性比率公式來判定:
。
其中, 為一致性比率, 為一致性指標(biāo)( 為矩陣 的特征向值), 為隨機(jī)一致性指標(biāo),取表2的值。
3.案例描述
從2.1的分析可以得出,影響上證指數(shù)的指標(biāo)包括:今日收盤價(jià)、昨日收盤價(jià)、DEA等,這些指標(biāo)既可能是狀態(tài)向量,也可能是特征向量,所謂狀態(tài)向量,指的是該指標(biāo)取值形式為離散值,如今日收盤價(jià)={正常、偏高、偏低};所謂特征向量,指的是該指標(biāo)取值形式為連續(xù)值,如今日收盤價(jià)={t|t>0,t∈R}。本文將所有因素同時(shí)考慮為狀態(tài)向量和特征向量。如圖2所示。
4.案例檢索
本文基于灰色關(guān)聯(lián)度的方法計(jì)算案例的相似度。設(shè)待分析案例為 ,候選案例為 ,案例的特征向量維數(shù)為 則案例
和 在 緯空間上的灰色相似度為:
。
其中,
為案例 和在特征向量的第 個(gè)屬性上的灰色距離。
為 案例和在特征向量的第 個(gè)屬性上的關(guān)聯(lián)系數(shù), 為分辨系數(shù),一般取 , 為特征向量的第
個(gè)屬性的權(quán)值,該權(quán)值由多元線性回歸和層次分析法計(jì)算確定。
5.案例擇優(yōu)
基于案例推理搜索出的結(jié)果是一個(gè)根據(jù)相似度進(jìn)行降序排列的案例集,本文的案例擇優(yōu)不是選擇相似度最大的案例,而是考慮大于相似度閾值的案例集合。因此,上證指數(shù)預(yù)測的計(jì)算公式如下:
。
其中, 是匹配案例的相似度, 是匹配案例的實(shí)際上證指數(shù), 是相似度閾值,本文取0.75。
三、預(yù)測結(jié)果
上證指數(shù)從2011年2月1日到2011年7月28日一共120個(gè)交易日,經(jīng)歷上漲下跌再上漲下跌的行情,本文采用該時(shí)段的數(shù)據(jù)作為原始數(shù)據(jù),生成前100個(gè)案例(從2011年2月1日到2011年6月30日)為已有案例集,后20個(gè)案例(從2011年7月1日到2011年7月8日)為預(yù)測案例。采用多元線性回歸,計(jì)算各個(gè)指標(biāo)的權(quán)重系數(shù),如表3所示。根據(jù)指標(biāo)的權(quán)重系數(shù)計(jì)算各個(gè)指標(biāo)的相對權(quán)重,如表4所示。根據(jù)指標(biāo)的相對權(quán)重計(jì)算出比較矩陣,如表5所示。
模型使用Java編程,預(yù)測結(jié)果如圖3所示。為了驗(yàn)證本方法預(yù)測股票價(jià)格的效果,分別采用傳統(tǒng)的案例推理(未采用多元線性回歸計(jì)算參數(shù)權(quán)重和案例擇優(yōu)算法)、多元線性回歸和人工神經(jīng)網(wǎng)絡(luò)預(yù)測股票價(jià)格,預(yù)測結(jié)果如圖6,表6所示。由表6可知,本模型預(yù)測股票價(jià)格具有較高的精度,誤差區(qū)間在[-5,+5]范圍內(nèi),本方法為45.0%,其他方法都小于或等于30.0%;誤差區(qū)間在[-10,+10]范圍內(nèi),本方法為75.0%,其他方法都小于或等于55.0%;誤差區(qū)間在[-20,+20]范圍內(nèi),本方法為95.0%,其他方法都小于或等于90.0%。如果對每天的上證指數(shù)波動的預(yù)測在±10個(gè)點(diǎn)內(nèi)被定義為預(yù)測準(zhǔn)確的,那么基于多元線性回歸和層次分析法的案例推理的預(yù)測模型的準(zhǔn)確率達(dá)到75%,而上證指數(shù)±20個(gè)點(diǎn)的預(yù)測準(zhǔn)確率為95%。
另外,案例推理具有檢索時(shí)間短的特點(diǎn),案例推理每個(gè)案例檢索時(shí)間大約1秒,20個(gè)案例檢索只需要20秒左右,而人工神經(jīng)網(wǎng)絡(luò)進(jìn)行上證指數(shù)預(yù)測,需要進(jìn)行長時(shí)間訓(xùn)練,大約需要217秒。下一步的研究將引入宏觀經(jīng)濟(jì)指標(biāo)和政策因素到模型中,利用案例推理進(jìn)行上證指數(shù)和個(gè)股股價(jià)的預(yù)測。本模型以天為單位進(jìn)行預(yù)測,改進(jìn)后還可以進(jìn)一步以5分鐘或10分鐘為一個(gè)時(shí)段對下一個(gè)或二個(gè)時(shí)段進(jìn)行預(yù)測。
四、結(jié)論
本文開發(fā)了基于多元線性回歸和層次分析法的案例推理的上證指數(shù)預(yù)測模型;通過相關(guān)性分析對上證指數(shù)預(yù)測指標(biāo)進(jìn)行篩選,排除了與目標(biāo)函數(shù)相關(guān)性低的參數(shù);通過多元線性回歸和層次分析法確定各個(gè)參數(shù)對目標(biāo)函數(shù)的影響權(quán)重,克服了傳統(tǒng)定性分析方法不準(zhǔn)確的缺點(diǎn);通過案例推理對案例進(jìn)行檢索,并且使用案例擇優(yōu)處理檢索結(jié)果。最后基于同樣的數(shù)據(jù),與傳統(tǒng)的案例推理、多元線性回歸和人工神經(jīng)網(wǎng)絡(luò)進(jìn)行比較。
(1)本模型預(yù)測股票價(jià)格具有較高的精度,誤差區(qū)間在[-5,+5]范圍內(nèi),本方法為45.0%,其他方法都小于或等于30.0%;誤差區(qū)間在[-10,+10]范圍內(nèi),本方法為75.0%,其他方法都小于或等于55.0%;誤差區(qū)間在[-20,+20]范圍內(nèi),本方法為95.0%,其他方法都小于或等于90.0%。
(2)案例推理具有檢索時(shí)間短的特點(diǎn),案例推理每個(gè)案例檢索時(shí)間大約1秒,20個(gè)案例檢索只需要20秒左右,而人工神經(jīng)網(wǎng)絡(luò)進(jìn)行上證指數(shù)預(yù)測,需要進(jìn)行長時(shí)間訓(xùn)練,大約需要217秒。
參考文獻(xiàn):
[1]馮家誠,馬銳.基于神經(jīng)網(wǎng)絡(luò)型數(shù)據(jù)挖掘技術(shù)的股價(jià)預(yù)測[J].計(jì)算機(jī)應(yīng)用,2009,29:155-156.(Feng Jia-cheng, Ma Rui. Stock price forecast based on data mining of neural networks[J].Journal of Computer Application,2009,29:155-156.)
[2]李響.基于BP神經(jīng)網(wǎng)絡(luò)的股價(jià)預(yù)測[J].大連海事大學(xué)學(xué)報(bào),2008,34(增刊):114-116.(Li Xiang. Prediction of the price of stock based on the BP neutral network[J]. Journal of Dalian Maritime University, 2008,34(Suppl):114-116.)
[3]儲小俊,劉思峰.基于新陳代謝GM-Markov模型的股價(jià)預(yù)測[J].山東財(cái)政學(xué)院學(xué)報(bào),2007,3:43-45.( Chu Xiaojun, Liu Sifeng. Forecasting of Stock Prices Based on Metabolic GM-Markov Model[J].Journal of Shandong University of Finance and Economics, 2007,3:43-45.)
[4]Tai-Liang Chena, Ching-Hsue Cheng, Hia Jong Teoha. Fuzzy time-series based on Fibonacci sequence for stock price forecasting[J]. Physica A, 2007,380:377–390.
[5]Melike Bildirici. Improving forecasts of GARCH family models with the artificial neural networks:An application to the daily returns in Istanbul Stock Exchange[J]. Expert Systems with Applications, 2009,36: 7355–7362.
[6]Ping-Feng Pai, Chih-Sheng Lin. A hybrid ARIMA and support vector machines model in stock price forecasting[J]. Omega, 2005,33:497–505.
[7]Henri Nyberg. Forecasting the direction of the US stock market with dynamic binary probit models[J].International Journal of Forecasting, 2011,27:561–578.
[8]Saaty TL. The analytical hierarchy process[M]. New York: McGraw Hill. 1980.
[9]馮偉.基于層次分析法的稅收征管質(zhì)量評價(jià)指標(biāo)體系研究[J].廣西師范學(xué)院學(xué)報(bào)自然科學(xué)版,2011,28(2):87-92.(Feng Wei. Evaluation Index System of Quality of Tax Collection and Administration Based on AHP Method[J]. Journal of Guangxi Teachers Education University: Natural Science Edition, 2011,28(2):87-92.)
[10]林麗,關(guān)德君.基于層次分析法的空間信息網(wǎng)管理域劃分算法[J].計(jì)算機(jī)應(yīng)用,2011,31(8):2279-2285.(Lin li, Guang De-jun. Management domain division algorithm based on analytic hierarchy process in space information network[J]. Journal of Computer Applications, 2011,31(8):2279-2285.)
[11]許樹柏.層次分析法原理[M].天津:天津大學(xué)出版社,1988.
[12]路楊,何欣,杜娟娟.基于灰色理論的故障案例檢索算法[J].計(jì)算機(jī)工程,2008,34(9):28-32.(Lu Yang,He Xin,Du Juanjuan. Fault case retrieval algorithm based on grey theory[J]. Computer Engineering,2008,34(9):28-32.)