[摘要] 近年來,時(shí)態(tài)數(shù)據(jù)挖掘的研究對商業(yè)、金融、醫(yī)療診斷、科學(xué)與工程等領(lǐng)域的數(shù)據(jù)分析具有重要意義,因此時(shí)態(tài)數(shù)據(jù)的挖掘方法已經(jīng)成為數(shù)據(jù)挖掘的一個(gè)研究熱點(diǎn)。本文主要討論時(shí)態(tài)關(guān)聯(lián)規(guī)則在股市走勢中的應(yīng)用。選取相對強(qiáng)弱指標(biāo)RSI,收集交易數(shù)據(jù)進(jìn)行實(shí)證分析,得出了若干條有用的關(guān)聯(lián)規(guī)則。
[關(guān)鍵詞] 時(shí)態(tài)關(guān)聯(lián)規(guī)則 技術(shù)分析 股價(jià)走勢
一、引言
近年來對關(guān)聯(lián)規(guī)則的探討一直是數(shù)據(jù)挖掘中的熱門研究課題。關(guān)聯(lián)規(guī)則的挖掘?qū)ο笠话闶鞘聞?wù)型數(shù)據(jù)庫,其中的一個(gè)主要應(yīng)用是在零售或交易數(shù)據(jù)庫中關(guān)聯(lián)規(guī)則的采掘。由于大部分的關(guān)聯(lián)規(guī)則挖掘都沒有考慮數(shù)據(jù)庫中所包含的時(shí)態(tài)語義,因而可稱之為傳統(tǒng)的或靜態(tài)的關(guān)聯(lián)規(guī)則。事實(shí)上,由于數(shù)據(jù)的獲得都隨時(shí)間變化,時(shí)間是數(shù)據(jù)本身固有的因素,許多數(shù)據(jù)庫中的記錄都帶有時(shí)間標(biāo)記,如交易記錄中的交易時(shí)間,病歷信息庫中的診斷時(shí)間等。時(shí)態(tài)數(shù)據(jù)庫的出現(xiàn)必然要求在知識發(fā)現(xiàn)過程中考慮時(shí)間因素。
二、技術(shù)分析理論
技術(shù)分析法(Technical Analysis)是通過對證券的歷史數(shù)據(jù),如過去交易所發(fā)生的價(jià)格、時(shí)間、成交量的思考來推算未來行情,從而建立起買賣證券的規(guī)則,以優(yōu)化收益、規(guī)避風(fēng)險(xiǎn)的一種投資理論。技術(shù)分析中涉及預(yù)測股價(jià)走勢的部分都類似于關(guān)聯(lián)規(guī)則中的前件后件關(guān)系。而交易數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)多是連續(xù)型的數(shù)據(jù),因此在應(yīng)用數(shù)值型關(guān)聯(lián)規(guī)則分析時(shí)需要先將其離散化,將數(shù)據(jù)轉(zhuǎn)化為二值型,再利用二值型規(guī)則的挖掘方法來實(shí)現(xiàn)。
本文以RSI(相對強(qiáng)弱指標(biāo))為例。RSI(Relative Strength Index)指標(biāo)以一特定時(shí)期內(nèi)股價(jià)的變動(dòng)情況推測價(jià)格未來的變動(dòng)方向,并根據(jù)股價(jià)漲跌幅度顯示市場的強(qiáng)弱。
三、數(shù)據(jù)預(yù)處理
根據(jù)技術(shù)分析理論,我們采用從國泰君安大智慧行情系統(tǒng)下載的價(jià)格數(shù)據(jù)和技術(shù)指標(biāo)數(shù)據(jù)來挖掘有時(shí)態(tài)約束的數(shù)值型關(guān)聯(lián)規(guī)則。我們選擇的個(gè)股是工商銀行(601398)從2006年10月27日上市起至2008年2月29日的318個(gè)交易數(shù)據(jù)。本文驗(yàn)證的是RSI(6)的預(yù)測力。首先對價(jià)格中的收盤價(jià)數(shù)據(jù)計(jì)算每日漲跌幅,并將連續(xù)的屬性值進(jìn)行離散化分類后得下表1:
相對強(qiáng)弱指標(biāo)RSI的數(shù)據(jù)可以直接從行情系統(tǒng)的技術(shù)分析版塊下載得到。系統(tǒng)中可以得到RSI(6)、RSI(12)、RSI(24),這里我們選擇變化靈敏的RSI(6),并從2006年11月2日開始記錄。RSI的連續(xù)屬性值劃分為4種布爾型的數(shù)據(jù),利用SPSS做變量計(jì)算得到表2所示的數(shù)據(jù):
為了挖掘數(shù)值型關(guān)聯(lián)規(guī)則,將兩表合并,并把RSI屬性作為前件,漲跌幅屬性作為后件,得下表3:
四、當(dāng)日RSI和當(dāng)日漲跌幅間的規(guī)則挖掘
使用表3的數(shù)據(jù),我們可以分析和計(jì)算當(dāng)日RSI數(shù)值和當(dāng)日漲跌幅之間的關(guān)聯(lián)關(guān)系。上文中已指出技術(shù)指標(biāo)RSI數(shù)值處于不同的階段對應(yīng)不同的操作,這些操作是基于對股價(jià)走勢的預(yù)測。表4是當(dāng)日RSI與當(dāng)日漲跌幅之間不同屬性取值的支持度和置信度。
①當(dāng)RSI屬性值為“極強(qiáng)”時(shí):
由于RSI為“極強(qiáng)”本身出現(xiàn)的次數(shù)有限(為41次),所以相對應(yīng)的漲跌幅支持度都較小。但是在技術(shù)指標(biāo)取極端值的情況下,我們更關(guān)心它的預(yù)測力,即相對應(yīng)規(guī)則的置信度。由表4可見,當(dāng)日RSI處于“極強(qiáng)”區(qū)域中時(shí),當(dāng)日股價(jià)下跌的概率很?。?.44%),大跌幾乎不可能出現(xiàn);而震蕩即小幅波動(dòng)的概率為24.39%;上漲(包括小漲和大漲)的概率很高,總和為73.18%,說明當(dāng)日股價(jià)走勢較好的概率較大??傊?,當(dāng)RSI為“極強(qiáng)”時(shí),我們可以得出結(jié)論:當(dāng)日股價(jià)將震蕩或上升,而且上升的概率更大。
②當(dāng)RSI屬性值為“極弱”時(shí):
與RSI為“極強(qiáng)”相反的極端情況為RSI“極弱”的情形。與“極強(qiáng)”相比,“極弱”出現(xiàn)次數(shù)更少(4次),導(dǎo)致其在研究期間各規(guī)則的支持度極低,但確有不容忽視的高置信度。由表5可見,當(dāng)RSI為“極弱”時(shí),當(dāng)日股價(jià)有50%的可能是大跌,50%的可能是小跌,而震蕩、小漲、大漲的情形在本例中未曾出現(xiàn)。因此我們可以得出結(jié)論:當(dāng)RSI為“極弱”時(shí),當(dāng)日股價(jià)有非常大的可能下跌。
③當(dāng)RSI屬性值為“強(qiáng)”時(shí):
RSI為“強(qiáng)”的屬性共出現(xiàn)142次,相對應(yīng)的漲跌狀況中,震蕩的概率較高為40.85%,其次為小漲24.65%,接下來為小跌和大漲,最后是大跌。由表6可知各種情況沒有明顯區(qū)別,相對來說震蕩上升的可能性更大些,說明這是一個(gè)多頭的市場,可以進(jìn)行買入操作。
④當(dāng)RSI屬性值為“弱”時(shí):
RSI為“弱”的屬性共出現(xiàn)131次,相對應(yīng)的漲跌狀況中,小跌的概率較高為34.35%,其次為震蕩32.06%,接下來為大跌和小漲,最后是大漲。由表7可見各種情況沒有明顯區(qū)別,相對來說震蕩下跌的可能性更大些,說明這是一個(gè)空頭的市場,應(yīng)進(jìn)行賣出操作。
五、關(guān)聯(lián)規(guī)則分析
綜上所述,如果不考慮支持度,并設(shè)定40%的置信度閥值,在漲跌幅被劃分為5個(gè)屬性區(qū)間的基礎(chǔ)上,我們只能挖掘出3條有效的數(shù)值型關(guān)聯(lián)規(guī)則:
(1)RSI=“極弱”=>當(dāng)日股價(jià)“大跌”(confidence=50%)
(2)RSI=“極弱”=>當(dāng)日股價(jià)“小跌”(confidence=50%)
(3)RSI=“強(qiáng)”=>當(dāng)日股價(jià)“震蕩”(confidence=40.85%)
如果將“大跌”、“小跌”和“”大漲、“小漲”分別合并為“下跌”和“上漲”,那么在置信度閥值為40%的情況下,我們可以得到更抽象的5條規(guī)則:
(1)RSI=“極強(qiáng)”=>當(dāng)日股價(jià)“上漲”(confidence=73.18%)
(2)RSI=“極弱”=>當(dāng)日股價(jià)“下跌”(confidence=100%)
(3)RSI=“強(qiáng)”=>當(dāng)日股價(jià)“震蕩”(confidence=40.85%)
(4)RSI=“強(qiáng)”=>當(dāng)日股價(jià)“上漲”(confidence=40.14%)
(5)RSI=“弱”=>當(dāng)日股價(jià)“下跌”(confidence=51.14%)
六、結(jié)論
本文在引入股市技術(shù)分析理論的基礎(chǔ)上,選取相對強(qiáng)弱指標(biāo)RSI,把時(shí)態(tài)關(guān)聯(lián)規(guī)則挖掘引入到股市走勢分析中,通過收集交易數(shù)據(jù)進(jìn)行了實(shí)證分析,驗(yàn)證了技術(shù)指標(biāo)的預(yù)測力,給投資者提供重要的參考意義。
參考文獻(xiàn):
[1]J.M.Ale,G.H.Rossi.An Approach to Discovering Temporal Association Rules[C].In:Proc.of the 2000 ACM Symposium on Applied Computing,2000:294~300
[2]歐陽為民,蔡慶生.在數(shù)據(jù)庫中發(fā)現(xiàn)具有時(shí)態(tài)約束的關(guān)聯(lián)規(guī)則[J].軟件學(xué)報(bào),1999,10(5):527~532
[3]李少年孟志青:雙事件時(shí)態(tài)關(guān)聯(lián)規(guī)則的知識發(fā)現(xiàn)問題[J].計(jì)算機(jī)科學(xué), 2001,29( 8):71~73
[4]陳成王永縣:股市技術(shù)分析理論研究發(fā)展綜述[J].經(jīng)濟(jì)師,2005年第5期:13~15
[5]韓楊:對技術(shù)分析在中國股市的有效性研究[J].經(jīng)濟(jì)科學(xué),2001年第3期:49~57