摘 要:股市作為一個特殊的交易市場,具有變化多端的特點,在整體上很難進行把控。所以,股市上的盈利人員畢竟是少數(shù)的。為了可以在股市技術(shù)上進行深入的分析和了解,可應(yīng)用數(shù)據(jù)挖掘算法來完成相關(guān)的操作,同時在多方面來觀察股市的具體走向以及客觀上的動態(tài)情況,避免錯誤的操作所引起的不必要的損失。文章針對數(shù)據(jù)挖掘算法及其在股市技術(shù)分析中的應(yīng)用展開討論,并提出合理化建議。
關(guān)鍵詞:數(shù)據(jù)挖掘算法;股市;分析;技術(shù)
隨著經(jīng)濟的發(fā)展和社會生活水平的提升,股市表現(xiàn)為一定的繁榮狀態(tài)。但從股票的角度來分析,其作為一種虛擬的有價證券,本身并不是特別的穩(wěn)定,很容易受到外界因素的影響,同時受到操控者的影響較大,波動性較強。有相當(dāng)數(shù)量的股民,由于在股市技術(shù)分析上沒有從客觀情況出發(fā),單純憑借主觀上的經(jīng)驗來完成,致使最終的損失較為嚴重。
一、概述
近年來,計算機網(wǎng)絡(luò)發(fā)展較快,相關(guān)的內(nèi)容及研究領(lǐng)域也在不斷的拓寬。從客觀的角度來分析,數(shù)據(jù)挖掘算法在目前是非常高度關(guān)注的算法技術(shù),同時在很多方面都與股市技術(shù)具有密切的關(guān)系。數(shù)據(jù)挖掘算法在應(yīng)用過程中,主要是根據(jù)數(shù)據(jù)所創(chuàng)建數(shù)據(jù)挖掘模型的一組試探法和計算。為了能夠更好的創(chuàng)建模型,該算法可以首先分析固有的數(shù)據(jù)內(nèi)容,同時查找特定的類型模式、相關(guān)趨勢等等。由此可見,我們在股市技術(shù)分析過程中,有效的應(yīng)用數(shù)據(jù)挖掘算法后,能夠?qū)崿F(xiàn)以下目的:第一,股市技術(shù)分析所提供的數(shù)據(jù)較多,涵蓋了各個方面的數(shù)據(jù),為算法的應(yīng)用提供了較強的基礎(chǔ)。第二,經(jīng)過數(shù)據(jù)挖掘算法分析后,股市技術(shù)的趨向以及可能出現(xiàn)的情況,都會被人一目了然,避免了操作失誤的現(xiàn)象,保護了股民的權(quán)益,減少了外部的影響和內(nèi)部的操作水平。
二、數(shù)據(jù)挖掘算法在股市技術(shù)分析中的應(yīng)用
針對股市技術(shù)的分析工作,必須要從客觀實際出發(fā),理論上給出的數(shù)據(jù)和信息,與現(xiàn)實其概況存在一定的差異,因此即便獲得了正確的分析結(jié)果,依然不能將其應(yīng)用到實踐的股市操作當(dāng)中。
1.實驗數(shù)據(jù)
在本次實驗分析當(dāng)中,選擇的股市技術(shù)數(shù)據(jù),主要是從2000年1月--3月的某股市指數(shù)。在選擇的時間段方面,選定周期為60分鐘的股市指數(shù)走勢圖進行分析。在每一個交易日當(dāng)中,選擇了開市時間(9:30)、10:30、13:30、14:00以及收市時間(15:00)作為具體的指標進行分析。實驗過程中,倘若具體的交易日數(shù)量設(shè)定為M,那么數(shù)據(jù)的總數(shù)則為5*M。分析認為,針對每一個型態(tài)的模版而言,可以應(yīng)用一個一維的數(shù)據(jù)組進行相應(yīng)的表示,這樣就避免了數(shù)據(jù)的雜亂和信息的錯誤。建議在分析工作中,為了進一步發(fā)揮出數(shù)據(jù)挖掘算法的優(yōu)勢和功能,首先要將模版進行有效的劃分,可以嘗試將其劃分為時間差異相等的10段,每段提取出1個具體的數(shù)字,也就是數(shù)軸上的具體高度。通過上述的操作方法,可以使用10個數(shù)字來表示每一個模版,得到的效果比較突出,操作簡便。
2.算法的應(yīng)用
數(shù)據(jù)挖掘算法在股市分析中的應(yīng)用時,必須要做出一些假設(shè),由此來配合股市的多變特點。在算法的處理、應(yīng)用過程中,想要更加簡單的處理數(shù)據(jù)的擬合問題,可通過“對稱形式”的方法來進行解決,同時不建議做傾斜約束的限制。在本文當(dāng)中,初始化的條件設(shè)定為:g(1,1)=2d(1,1)。通過分析和歸納,得到的動態(tài)規(guī)劃方程如下:
經(jīng)過相關(guān)的分析和處理后,窗口的調(diào)整條件確定為:j-r≤i≤j+r。時間規(guī)范化的距離設(shè)計和分析中,對整體的算法應(yīng)用具有很大的影響。為此,將具體的距離控制為:D(A,B)=g(I,J)/N,在距離的條件當(dāng)中,N=I+J。
實驗中,給定的型態(tài)模板作為模式A,同時一段給定的走勢曲線作為模式B。由于股市走勢是市場各方力量的綜合體現(xiàn),股票在單個或連續(xù)若干個交易日的某個時間段更富規(guī)律性(如在1999年的519行情中,和1999年末2000年初網(wǎng)絡(luò)股帶動股市進入牛市中的行情中,某個交易日中指數(shù)下滑并不體現(xiàn)指數(shù)整體在攀升的情況)。故認為形態(tài)模板與走勢的擬合應(yīng)以形態(tài)模板縮放到N個交易日為準(N為正整數(shù)),才符合現(xiàn)實世界的規(guī)律(當(dāng)然,N也不能很大)。把模板分成10段,同時用10個指數(shù)為一段的走勢曲線與模板比較,與股市中一、兩天就形成一種形態(tài)走勢的客觀事實相符。
3.實驗結(jié)果及分析
數(shù)據(jù)挖掘算法在股市技術(shù)分析當(dāng)中應(yīng)用時,通過對固有的數(shù)據(jù)進行搜集和分析,從而能在很大程度上充分的掌握好股市發(fā)展趨勢及具體的表現(xiàn)。在本次實驗當(dāng)中,選擇了多個類型的模版進行系統(tǒng)的分析,包括潛伏頂、箱形整理等等。在最終的結(jié)果方面,每一個階段的時間規(guī)范化距離,經(jīng)過大量的比較發(fā)現(xiàn),陰跌形態(tài)當(dāng)中,其時間規(guī)范化的距離對比當(dāng)中,基本上是最大的。除此之外,潛伏頂排列在第二位,證明陰跌、潛伏頂?shù)臅r間規(guī)范化距離表現(xiàn)為較大的狀態(tài)。分析原因為,該股市指數(shù)在1月份--3月份,主要表現(xiàn)出了牛市的狀態(tài),而陰跌和潛伏頂隸屬于熊市的兩種模塊。綜上所述,數(shù)據(jù)挖掘算法本身的優(yōu)異性比較突出,能夠在很多方面對股市技術(shù)進行分析,從而獲得正確的走向及趨勢。另外,將數(shù)據(jù)挖掘算法充分的應(yīng)用后,減少了股民的損失,對于國家的宏觀調(diào)控而言,也可以提供較多的數(shù)據(jù)與參考,實現(xiàn)了經(jīng)濟上的平穩(wěn)運行。日后,可以深入分析數(shù)據(jù)挖掘算法的相關(guān)內(nèi)容,加強對股市技術(shù)分析的掌控,在客觀上和主觀上,穩(wěn)定國內(nèi)的股市情況。
三、結(jié)語
本文對數(shù)據(jù)挖掘算法及其在股市技術(shù)分析中的應(yīng)用展開討論,從得到的結(jié)果來看,數(shù)據(jù)挖掘算法的分析結(jié)果及可行性,都比較符合客觀上的需求,整體上獲得了較高的保障,未出現(xiàn)惡性循環(huán)。另一方面,由于股市技術(shù)分析受到的影響較多,因此在應(yīng)用數(shù)據(jù)挖掘算法時,還必須融入到其他的因素及相關(guān)的算法內(nèi)容,避免造成分析技術(shù)的單一性。
參考文獻:
[1]楊琬琪,高陽,周新民,楊育彬,商琳. 多模態(tài)張量數(shù)據(jù)挖掘算法及應(yīng)用[J]. 計算機科學(xué),2012,01:9-13.
[2]王權(quán),王軍,史子新. 數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法及其應(yīng)用[J]. 計算機光盤軟件與應(yīng)用,2014,19:126-127.
[3]付海辰. 基于數(shù)據(jù)挖掘技術(shù)的聚類分析算法在異常入侵檢測中的應(yīng)用[J]. 軟件導(dǎo)刊,2011,05:73-74.
[4]張銘. 數(shù)據(jù)挖掘技術(shù)及其在中藥分析中的應(yīng)用[J]. 中醫(yī)雜志,2011,13:1105-1107.
[5]楊秀萍. 數(shù)據(jù)挖掘技術(shù)及其在收視行為分析中的應(yīng)用[J]. 福建電腦,2013,04:124-126+59.
作者簡介:陳格(1992-),男,廣東省吳川市人,民族:漢,廣東金融學(xué)院應(yīng)用數(shù)學(xué)系,學(xué)生, 學(xué)歷:本科,研究方向:數(shù)學(xué)與應(yīng)用數(shù)學(xué)(金融數(shù)學(xué)與金融工程)。