亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社會媒體環(huán)境下基于EMD-DSVR的股票市場預(yù)測方法研究

        2016-11-29 05:11:42張理政
        安徽建筑大學(xué)學(xué)報 2016年5期
        關(guān)鍵詞:模態(tài)

        梁 坤,張理政

        (1.合肥工業(yè)大學(xué) 管理學(xué)院,合肥 230009,2.安徽建筑大學(xué) 管理學(xué)院,合肥 230022)

        社會媒體環(huán)境下基于EMD-DSVR的股票市場預(yù)測方法研究

        梁 坤1,張理政2

        (1.合肥工業(yè)大學(xué) 管理學(xué)院,合肥 230009,2.安徽建筑大學(xué) 管理學(xué)院,合肥 230022)

        現(xiàn)有的利用社會媒體預(yù)測股票市場的研究未能考慮股指時間序列所具有的多尺度特征。為了解決這一問題,運用EMD分解法、混沌分析理論和支持向量回歸機(jī),提出一種EMD-DSVR股票市場預(yù)測方法。首先分析股指時間序列多尺度與社會媒體變量序列多尺度間的內(nèi)在聯(lián)系,運用EMD分解法將社會媒體變量序列分解成不同尺度的基本模態(tài)分量;然后運用混沌分析理論和支持向量回歸機(jī)對各模態(tài)分量進(jìn)行建模和預(yù)測;最后利用社會媒體變量序列的各模態(tài)分量對股票市場進(jìn)行預(yù)測。運用所提出的EMD-DSVR模型,對上證指數(shù)和深成指數(shù)的日收盤值進(jìn)行預(yù)測,實驗結(jié)果表明,所提出的方法能有效提高對股指時間序列的預(yù)測精度。

        經(jīng)驗?zāi)B(tài)分解;股票收益;混沌理論;支持向量回歸

        0 引言

        股票市場是金融市場的重要組成部分,也是國家經(jīng)濟(jì)運行狀況的晴雨表。合理分析并預(yù)測股票市場不僅能夠引導(dǎo)股民進(jìn)行正確投資,還可以為政府提供股票市場宏觀調(diào)控的理論依據(jù),進(jìn)而保障經(jīng)濟(jì)平穩(wěn)健康發(fā)展。

        傳統(tǒng)的股票市場分析與預(yù)測主要有基本面法和技術(shù)分析法[1]。隨著論壇、博客和內(nèi)容社區(qū)等社會媒體的快速發(fā)展與廣泛應(yīng)用,基于社會媒體的股票市場預(yù)測逐漸成為新的研究熱點[2]。已有研究表明,社會媒體中的用戶生成內(nèi)容能夠顯著影響投資者的投資決策行為,進(jìn)而造成股票價格、交易量和收益率等的變化[3-6]。Frank的研究指出,社會媒體的信息數(shù)量與股票價格波動成正比,與股票收益率成反比[3]。Bollen利用文本處理技術(shù)分析Twitter上的公眾情緒,并指出公眾情緒的變化能顯著影響道瓊斯工業(yè)平均指數(shù)[4]。Hsinchun Chen的研究表明,通過分析投資者論壇上的討論話題和干系人組成,能夠更加細(xì)粒度的反映股票的市場行為[5]。 Jiang研究了突發(fā)事件不同階段雅虎金融論壇上的發(fā)帖數(shù)量和情感傾向與股票收益率間的關(guān)系,研究結(jié)論表明,社會媒體變量與股票收益率間的關(guān)系在突發(fā)事件不同階段是不同的[6]。上述研究主要從社會媒體內(nèi)容方面對股票市場預(yù)測展開研究,也有學(xué)者從社會網(wǎng)絡(luò)分析視角研究社會媒體對股票市場的影響。例如,Zhang指出,Twitter上有關(guān)股票主題的被轉(zhuǎn)發(fā)次數(shù)與標(biāo)準(zhǔn)普爾500指數(shù)呈顯著的正相關(guān)關(guān)系[7]。

        然而,現(xiàn)有的關(guān)于利用社會媒體預(yù)測股票市場的研究很少考慮股指時間序列所具有的多尺度特征[8]。不同時間尺度的交易者對股票市場和社會媒體關(guān)注的時間尺度是不同的:短期投資者一般關(guān)注短時間內(nèi)的社會媒體股票信息;而長期投資者一般綜合分析較長時間內(nèi)的社會媒體股票信息,更關(guān)注股票收益的長期走勢[9]。為了綜合考慮不同類型交易者對股票市場產(chǎn)生的整體影響,并提高社會媒體對股票市場的預(yù)測性能,需要相應(yīng)的對社會媒體變量序列進(jìn)行多尺度分析。

        小波分析在時域和頻域均具有良好的分析能力,因此,基于小波分析的股指時間序列預(yù)測逐漸受到學(xué)者們的青睞[10-15]。然而,小波分析具有以下兩點不足[16]:第一,小波分解不能根據(jù)信號本身特性進(jìn)行自適應(yīng)分析,通常會產(chǎn)生很多虛假的諧波;第二,小波分解需預(yù)先人為設(shè)定時間尺度,導(dǎo)致小波分解不能客觀反映信號中所包含的各尺度上的信息。經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition, EMD)能夠基于信號局部特征,將原始序列中不同尺度的波動或趨勢逐級分解開來,產(chǎn)生一系列模態(tài)函數(shù)(Intrinsic mode function, IMF),其中每個模態(tài)函數(shù)均可以反映原始序列在不同尺度上的波動特征。由于EMD方法可以更準(zhǔn)確的反映原始序列的物理特性,因此在處理非線性、非平穩(wěn)時間序列時,EMD較之小波分解更加有效[17]。

        本文將EMD方法與支持向量回歸(Support vector regression, SVR)相結(jié)合,對中國股票市場進(jìn)行預(yù)測。首先利用EMD方法將社會媒體變量序列分解成若干個IMF;然后針對每個IMF進(jìn)行混沌序列的支持向量回歸建模;最后,利用社會媒體變量序列的各IMF和股指時間序列的前期值對股票市場進(jìn)行預(yù)測。由于EMD方法能將復(fù)雜的社會媒體變量序列分解成若干個彼此間影響甚微的基本模態(tài)分量,從而使得支持向量回歸機(jī)能更加準(zhǔn)確的把握社會媒體變量序列的多尺度特征,而且還能綜合考慮不同類型交易者對股票市場產(chǎn)生的整體影響,從而最終提高模型的預(yù)測精度。

        1 基于EMD的雙重支持向量回歸預(yù)測模型

        為了提高社會媒體對股票市場的預(yù)測性能,考察社會媒體變量序列的各尺度模態(tài)分量對交易者產(chǎn)生的綜合影響,提出一個基于EMD的雙重支持向量回歸預(yù)測模型(Empirical mode decomposition and double support vector regression, EMD-DSVR),該模型的預(yù)測流程分為三個階段,如圖1所示。首先利用EMD分解法將社會媒體變量序列SM(t)分解成不同時間尺度的模態(tài)分量和長期趨勢項;然后通過計算各模態(tài)分量的嵌入維數(shù)和延遲時間,建立各模態(tài)分量的混沌模型CMi,并利用前層支持向量回歸機(jī)對各模態(tài)分量進(jìn)行預(yù)測,對于長期趨勢項的預(yù)測則采用擬合函數(shù)法;最后將股指時間序列的前期值和上一階段中各序列的預(yù)測值Pi一同輸入后層支持向量回歸機(jī)中,預(yù)測股指時間序列的下一個數(shù)據(jù)點。

        圖1 EMD-SVR預(yù)測模型整體框架

        設(shè)SM(t)和S(t)分別為t時刻的社會媒體變量序列和股指時間序列,sm(t)和s(t)分別為SM(t)和S(t)在t時刻的取值,則EMD-DSVR預(yù)測方法的數(shù)學(xué)模型和具體實現(xiàn)步驟如下:

        步驟1:利用EMD方法將社會媒體變量序列SM(t)分解為有限個基本模態(tài)分量SMimf(i)(t) (i=1,…,n)和長期趨勢項SMr(t)。

        步驟2:根據(jù)混沌分析理論,對SMimf(i)(t),(i=1,…,n)進(jìn)行相空間重構(gòu),通過計算社會媒體變量序列各模態(tài)分量的延遲時間和嵌入維數(shù)來對各模態(tài)分量進(jìn)行插值,并確定前層支持向量機(jī)的結(jié)構(gòu)參數(shù)。其中延遲時間可由互信息法來確定,將imf(i)的互信息函數(shù)第一次達(dá)到局部極小值時的t作為最佳延遲時間T[18];嵌入維數(shù)的選擇使用假近鄰法,即累積假近鄰點占總點數(shù)的比例小于一定閾值所對應(yīng)的維數(shù)m為嵌入維數(shù)M[19]。

        步驟3:將插值后的SMimf(i)(t),(i=1,…,n)輸入前層支持向量回歸機(jī),其中輸入變量即為步驟2中按照延遲時間和嵌入維數(shù)確定的各項插值,輸入節(jié)點數(shù)即為嵌入維數(shù)M,得出SMimf(i)(t)在t+1時刻的預(yù)測值P(smimf(i)(t+1))。對長期趨勢項SMr(t)采用線性擬合的方法進(jìn)行預(yù)測,得到SMr(t)在t+1時刻的預(yù)測值P(smr(t+1))。

        步驟4:對社會媒體變量序列的各模態(tài)分量和長期趨勢項預(yù)測完成后,將得到的預(yù)測結(jié)果輸入后層支持向量回歸機(jī)。此外,由于金融時間序列具有自相關(guān)性[20],將股指時間序列的前期值作為控制變量一同納入預(yù)測模型,并輸入后層支持向量回歸機(jī)。

        2 實驗研究

        為了驗證本文提出的EMD-DSVR預(yù)測方法的有效性,利用社會媒體數(shù)據(jù)對上證指數(shù)和深成指數(shù)從2013年4月1日到2014年3月31日共240天的收盤值進(jìn)行預(yù)測。

        本文采用百度搜索指數(shù)功能獲取社會媒體變量數(shù)據(jù)。百度搜索指數(shù)是百度網(wǎng)站提供的海量數(shù)據(jù)分析服務(wù),用以反映網(wǎng)民在過去一段時間內(nèi)利用百度搜索引擎對特定關(guān)鍵詞的累計搜索頻次。此外,將股指收盤值序列的前期值作為控制變量加入預(yù)測模型中。由于具有初值敏感性,混沌時間序列只適合做短期預(yù)測,因此將股票收益序列的前200個數(shù)據(jù)點為訓(xùn)練集,后40個點為測試集,僅做一步預(yù)測,用均方根誤差衡量模型的預(yù)測性能。

        圖2 社會媒體變量序列EMD分解結(jié)果

        將上證指數(shù)作為,獲取其百度搜索指數(shù)的時間序列Data1。圖2是對Data1進(jìn)行EMD分解的結(jié)果,共產(chǎn)生7個基本模態(tài)分量imf(i),i=1,2, ... ,7。根據(jù)對各個imf的混沌相空間重構(gòu),設(shè)計前層支持向量回歸機(jī)的結(jié)構(gòu)。在此需要計算Data1各模態(tài)分量的最佳延遲時間和嵌入維數(shù)。通過計算互信息值,得出Data1各模態(tài)分量的延遲時間;將求得的延遲時間代入FNN算法,經(jīng)計算可得各模態(tài)分量的假近鄰率,由此得出各序列的嵌入維數(shù)。表1展示了Data1各模態(tài)分量的最佳延遲時間、嵌入維數(shù)和最大Lyapunov指數(shù)。通過Lyapunov分析,各模態(tài)分量的最大Lyapunov指數(shù)均大于0,這表明各模態(tài)分量均具有不同程度的混沌性[21],適用于混沌分析的應(yīng)用場景。

        表1 社會媒體變量序列各模態(tài)分量的混沌參數(shù)

        根據(jù)得出的混沌參數(shù),對Data1的各模態(tài)分量進(jìn)行混沌序列的支持向量回歸建模,前層支持向量回歸機(jī)的核函數(shù)選用Puk核函數(shù)。由于本文只進(jìn)行一步預(yù)測,因此對于各模態(tài)分量,每預(yù)測一個值以后,需要在百度搜索指數(shù)序列中加入與預(yù)測分量對應(yīng)的百度指數(shù)實際值,并重新進(jìn)行EMD分解,產(chǎn)生各模態(tài)分量的實際值,然后根據(jù)構(gòu)建的混沌支持向量回歸模型繼續(xù)預(yù)測各模態(tài)分量的下一個數(shù)據(jù)點。對于長期趨勢項,由于其形態(tài)接近線性函數(shù),根據(jù)線性擬合法對其進(jìn)行預(yù)測。此外,根據(jù)相關(guān)系數(shù)檢驗,上證指數(shù)收盤值序列具有一階自相關(guān)性,因此將前一期的收盤值作為控制變量,與各模態(tài)分量和長期趨勢的預(yù)測值一同輸入后層支持向量回歸機(jī)中,得到最終的預(yù)測結(jié)果。后層支持向量回歸機(jī)采用多項式核函數(shù)。對深成指數(shù)做同樣的分析預(yù)測。圖3顯示了本文提出的EMD-DSVR模型的預(yù)測效果。

        圖3 兩市日收盤值預(yù)測結(jié)果

        從圖3可以看出,在對上證指數(shù)收盤值的預(yù)測中,前21個點的預(yù)測效果較好,從第22個點開始預(yù)測精度逐漸降低,預(yù)測值的變化較之實際值的變化出現(xiàn)滯后。深成指數(shù)的預(yù)測也出現(xiàn)了類似的情況,從第19個點開始,預(yù)測誤差逐漸變大并出現(xiàn)預(yù)測滯后。造成這種現(xiàn)象的原因可能與混沌序列建模有關(guān)。雖然本文對兩市收盤值采用了一步預(yù)測的策略,即所有解釋變量均為實測數(shù)據(jù)。然而,在訓(xùn)練集上對社會媒體變量序列各模態(tài)分量的混沌支持向量建模是一次性的,隨著時間的推移,適用于訓(xùn)練集上的混沌參數(shù)(延遲時間和嵌入維數(shù))不一定再適合于新的測試數(shù)據(jù),此時社會媒體變量對股指收盤值的解釋能力開始減弱,EMD-DSVR模型的預(yù)測能力逐漸依賴于控制變量,即收盤值的自相關(guān)前期值。所以,在對后面點的預(yù)測中,精度逐漸降低并出現(xiàn)了滯后現(xiàn)象。

        為了驗證本文提出的EMD-DSVR方法的預(yù)測性能,對所選實驗數(shù)據(jù),再分別運用經(jīng)典的人工神經(jīng)網(wǎng)絡(luò)模型(ANN)和支持向量回歸模型(SVR)進(jìn)行預(yù)測,并比較我們提出的方法與ANN和SVR模型各自的均方誤差,結(jié)果如表2所示。在運用ANN和SVR模型時,直接對社會媒體變量序列本身進(jìn)行混沌序列的建模預(yù)測。由表2可知,無論是對上證指數(shù)還是深成指數(shù),本文方法的預(yù)測誤差均小于其他兩類模型,預(yù)測性能最優(yōu)。

        表2 不同模型的均方根誤差比較

        3  結(jié)論與展望

        本文通過對社會媒體變量序列進(jìn)行EMD分解和混沌支持向量回歸建模,提出一個基于EMDDSVR的股指時間序列預(yù)測方法。應(yīng)用該方法對上證綜合指數(shù)和深證成份指數(shù)的收盤值進(jìn)行預(yù)測,發(fā)現(xiàn)將社會媒體變量序列進(jìn)行多尺度分解能有效地提高其對股票市場的預(yù)測性能,證明了所提出方法的有效性。然而,社會媒體具有多種類型,如論壇、博客和社交網(wǎng)絡(luò),同一社會媒體平臺中又可以提取多種社會媒體變量,如情感傾向、主題評論數(shù)和轉(zhuǎn)發(fā)次數(shù)等。如何運用EMD-DSVR方法驗證不同社會媒體對股票市場的預(yù)測性能,以及多種社會媒體對股票市場產(chǎn)生的交互影響將成為我們未來的研究工作。

        [1]李愛忠,任若恩,董紀(jì)昌. 基于集成預(yù)測的均值-方差-熵的模糊投資組合選擇[J]. 系統(tǒng)工程理論與實踐,2013(05):1116-1125.

        [2]Das S R, Chen M Y. Yahoo! for Amazon: sentiment extraction from small talk on the web[J]. Management Science, 2007(53): 1375–1388.

        [3]Antweiler W, Frank M Z. Is all that talk just noise? The information content of internet stock message boards[J]. Journal of Finance, 2004(59): 1259–1294.

        [4]Bollen J., Mao H., Zeng X. Twitter mood predicts the stock market[J]. Journal of Computational Science, 2011,2 (1) :1-8.

        [5]Chen Hsinchun. AI and Opinion Mining[J]. IEEE Intelligent Systems, 2010, 25(3):74-76.

        [6]CQ Jiang, et al. Analyzing market performance via social media: a case study of a banking industry crisis[J]. Science China Information Sciences, 2014, 57(5):1-18.

        [7]X Zhang, H Fuehres, P Gloor. Predicting Asset Value Through Twitter Buzz[J]. Advances in Intelligent and Soft Computing, 2012(113):23-34.

        [8]王文波, 費浦生, 羿旭明. 基于EMD與神經(jīng)網(wǎng)絡(luò)的中國股票市場預(yù)測[J]. 系統(tǒng)工程理論與實踐,2010(06):1027-1033.

        [9]Peter E E. Fractal Market Analysis: Applying Chaos Theory Investment and Economics[M]. New York: John Wiley and Son,1996.

        [10]S R Mudakkar, K Zaman. A wavelet analysis of oil prices and stock market: Evidence from Pakistan and India[J]. Energy Policy. Article in Press.

        [11]Vuorenmaa, Tommi A. A wavelet analysis of scaling laws and long-memory in stock market volatility[C]. Proc. SPIE 5848, Noise and Fluctuations in Econophysics and Finance, doi:10.1117/12.626343.

        [12]Jammazi, Rania. Wavelet decomposition and regime shifts: Assessing the effects of crude oil shocks on stock market returns[J]. Energy Policy, 2010, 38(3): 1415-1435.

        [13]Fernández-Macho, Javier. Wavelet multiple correlation and cross-correlation: A multiscale analysis of Eurozone stock markets[J]. Physica A: Statistical Mechanics and its Applications. 2012, 391(4): 1097-1104.

        [14]Langi, A. Z R, Pitara, S.W., Kuspriyanto. Stock prices trends analysis using wavelet transform[C]. 2012 International Conference on Cloud Computing and Social Networking, doi: 10.1109/ICCCSN.2012.6215753.

        [15]Gallegati, Marco. A wavelet-based approach to test for financial market contagion[J]. Computational Statistics and Data Analysis, 2012, 56(11): 3491-3497.

        [16]Tewfiki A H. On the optimal choice of a wavelet for signal representation[J].IEEE Trans Information Theory, 1992,38(2):747-765.

        [17]N E Huang,Z Shen,S R Long. A new view of nonlinear water waves—The Hilbert spectrum[J]. Annu.Rev.Fluid Mech.1999.31:417-457.

        [18]呂小青. 確定延遲時間互信息法的一種算法[J].計算物理,2006,23(2):184-188.

        [19]Karatasou, S. Santamouris, M. Detection of low-dimensional chaos in buildings energy consumption time series[J]. Communications in Nonlinear Science and Numerical Simulation, 2010, 15(6):1603-1612.

        [20]苑瑩, 莊新田. 金融時間序列的標(biāo)度特性實證研究[J]. 管理工程學(xué)報, 2008(2): 85-89.

        [21]盛昭瀚, 馬軍海. 管理科學(xué):面對復(fù)雜性—混沌時序經(jīng)濟(jì)動力系統(tǒng)重構(gòu)技術(shù)[J]. 管理科學(xué)學(xué)報. 1998 (01): 31-42.

        Prediction Method of Stock Market Based on EMD-DSVR under Social Media Environment

        LIANG Kun1, ZHANG Lizheng2
        (1.School of Management, Hefei University of Technology, Hefei,230009, China, 2.School of Management,AnHui Jianzhu University,HeFei,230022,China)

        The existing relevant research of social media-based market performance analysis fails to consider the multi-scale of stock time series. To solve this problem, by employing the empirical mode decomposition (EMD), chaos theory and support vector regression, this paper presents an EMD-DSVR method to predict stock market. First, the intrinsic link between stock time series multi-scale and social media time series multi-scale has been analyzed; and by using EMD method, this paper decomposes the social media time series into many intrinsic modal function (IMF) which can significantly represent potential information of original time serial. Then, by using chaos theory and support vector regression, this paper predicts and sets models for each IMF. Finally, market performance is predicted by using the IMF of social media time series. In order to verify the effectiveness of EMDDSVR model, the close value of Shanghai Composite Index and Shenzhen component index are predicted by using this model. The results show that our approach can effectively improve the prediction accuracy of stock time series.

        empirical mode decomposition; stock time series; chaos theory; support vector regression

        TP391

        A

        2095-8382(2016)05-106-05

        10.11921/j.issn.2095-8382.20160519

        2015-10-12

        國家自然科學(xué)基金重點項目(71331002),教育部博士學(xué)科點專項科研基金(20120111110027),安徽省軟科學(xué)重大項目(1302053009)

        梁坤(1985-),男,博士生,主要研究方向為社會媒體分析與預(yù)測.

        猜你喜歡
        模態(tài)
        基于BERT-VGG16的多模態(tài)情感分析模型
        跨模態(tài)通信理論及關(guān)鍵技術(shù)初探
        一種新的基于模態(tài)信息的梁結(jié)構(gòu)損傷識別方法
        多跨彈性支撐Timoshenko梁的模態(tài)分析
        車輛CAE分析中自由模態(tài)和約束模態(tài)的應(yīng)用與對比
        國內(nèi)多模態(tài)教學(xué)研究回顧與展望
        基于HHT和Prony算法的電力系統(tǒng)低頻振蕩模態(tài)識別
        由單個模態(tài)構(gòu)造對稱簡支梁的抗彎剛度
        計算物理(2014年2期)2014-03-11 17:01:39
        利用源強(qiáng)聲輻射模態(tài)識別噪聲源
        日版《午夜兇鈴》多模態(tài)隱喻的認(rèn)知研究
        電影新作(2014年1期)2014-02-27 09:07:36
        亚洲欧美一区二区三区在线| 99精品国产av一区二区| 在线观看极品裸体淫片av| 人妻系列少妇极品熟妇| 成人久久精品人妻一区二区三区| 男女啪啪视频高清视频| 99视频在线精品免费观看6| 精品一区二区三区免费视频| 天天燥日日燥| 亚洲手机国产精品| 亚洲综合久久久中文字幕| 国产av麻豆精品第一页| 亚洲天堂亚洲天堂亚洲色图 | 台湾佬自拍偷区亚洲综合| 中文在线а√天堂官网| 青青国产成人久久91| 一区二区三区婷婷在线| 和少妇人妻邻居做爰完整版| 人妻少妇偷人精品一区二区| 国产一区高清在线观看| 国产日韩精品欧美一区喷水| 无码av免费一区二区三区试看| 亚洲精品永久在线观看| 欧美色资源| 亚洲性av少妇中文字幕| 少妇被黑人整得嗷嗷叫视频| 欧美国产综合欧美视频| 国产呦系列呦交| 在线av野外国语对白| 国产99视频一区二区三区 | 国产精品久久国产精品久久| 青青草原综合久久大伊人精品 | 亚洲无av码一区二区三区| 日韩一区二区av极品| 欧洲美女黑人粗性暴交视频| 国产aⅴ无码专区亚洲av麻豆| 亚洲av无码男人的天堂在线| 欧美日本免费一区二| 亚洲午夜精品国产一区二区三区| 久久人妻中文字幕精品一区二区| 一个人看的www片免费高清视频|