吳俊傳 唐振鵬 杜曉旭 陳凱杰
(福州大學(xué)經(jīng)濟(jì)與管理學(xué)院,福州 350108)
基于金融物理學(xué)中著名的對(duì)數(shù)周期冪律模型(log-periodic power law model,LPPL)來(lái)預(yù)警2015年6月份中國(guó)上證綜合指數(shù)、創(chuàng)業(yè)板指數(shù)的崩盤.鑒于已有采用LPPL模型預(yù)警市場(chǎng)崩盤的研究均只考慮市場(chǎng)歷史交易數(shù)據(jù).本文將投資者情緒因素納入到LPPL模型建模過(guò)程,以改進(jìn)LPPL模型的預(yù)警效果.采用文本挖掘技術(shù)結(jié)合語(yǔ)義分析方法對(duì)抓取的財(cái)經(jīng)媒體的股評(píng)報(bào)道進(jìn)行詞頻統(tǒng)計(jì),以構(gòu)建媒體情緒指數(shù).進(jìn)一步修改LPPL模型中的崩潰概率函數(shù)表達(dá)式,將其表示為關(guān)于歷史交易數(shù)據(jù)及媒體情緒的函數(shù),構(gòu)建LPPL-MS組合模型預(yù)警股市崩盤.實(shí)證結(jié)果表明,本文所構(gòu)建的LPPL-MS組合模型相比LPPL模型具有更高的預(yù)警精度,其預(yù)測(cè)的大盤見(jiàn)頂?shù)呐R界時(shí)點(diǎn)與上證指數(shù)、創(chuàng)業(yè)板指數(shù)真實(shí)的見(jiàn)頂時(shí)點(diǎn)更為接近,并且其擬合結(jié)果通過(guò)了相關(guān)檢驗(yàn).
資本市場(chǎng)中投資者之間的擁擠交易行為極易促成資產(chǎn)價(jià)格泡沫的形成,并且其泡沫迅速膨脹過(guò)程當(dāng)中呈現(xiàn)出高度的非線性、自組織等復(fù)雜特性.Sornette等[1]物理學(xué)家提出對(duì)數(shù)周期冪律模型(log-periodic power law model,LPPL)來(lái)刻畫資本市場(chǎng)處于泡沫階段的運(yùn)行規(guī)律,將地震預(yù)測(cè)模型成功地運(yùn)用到資本市場(chǎng)泡沫崩潰的預(yù)測(cè).股市崩盤使市場(chǎng)參與者蒙受巨額損失,將風(fēng)險(xiǎn)輸出到相應(yīng)上市公司.此外,股市崩潰往往伴隨著系統(tǒng)性風(fēng)險(xiǎn),股市系統(tǒng)性風(fēng)險(xiǎn)的頻繁爆發(fā)極大地危害資本市場(chǎng)的平穩(wěn)運(yùn)行,弱化資本市場(chǎng)的吸引力及競(jìng)爭(zhēng)力,降低各類投資主體,尤其是境外投資者的入市積極性,嚴(yán)重削弱資本市場(chǎng)的融資及資源優(yōu)化配置等功能的進(jìn)一步發(fā)揮,并最終擾亂市場(chǎng)經(jīng)濟(jì)秩序,對(duì)中國(guó)經(jīng)濟(jì)發(fā)展的危害不言而喻.股票市場(chǎng)作為資本市場(chǎng)最重要的組成部分之一,對(duì)一國(guó)經(jīng)濟(jì)發(fā)展的重要性十分明顯,提前預(yù)警并及時(shí)管控其系統(tǒng)性風(fēng)險(xiǎn),對(duì)維護(hù)中國(guó)經(jīng)濟(jì)、金融穩(wěn)定發(fā)展大局具有十分重要的意義.
長(zhǎng)期以來(lái),諸如隨機(jī)漫步 (random walk)[2]、有效市場(chǎng)假說(shuō)(efficient markets hypothesis,EMH)[3]等理論均認(rèn)為股票價(jià)格序列之間不存在長(zhǎng)記憶效應(yīng),未來(lái)的股價(jià)無(wú)法提前預(yù)測(cè).然而,大量研究表明股票價(jià)格序列并非滿足隨機(jī)游走的假設(shè),股票價(jià)格劇烈波動(dòng)的背后存在可預(yù)測(cè)成分[4].股市瘋狂暴漲、形成泡沫,并伴隨泡沫破裂的現(xiàn)象時(shí)有發(fā)生[5].自 Sornette等[1]學(xué)者以來(lái),越來(lái)越多的研究借鑒統(tǒng)計(jì)物理學(xué)的方法,利用對(duì)數(shù)周期修正的臨界點(diǎn)來(lái)識(shí)別股市泡沫.該方法后來(lái)被稱為JLS(Johansen-Ledoit-Sornette)模型或?qū)?shù)周期冪律奇異性模型(LPPL).該模型認(rèn)為泡沫可以從市場(chǎng)的自然運(yùn)作中本質(zhì)上產(chǎn)生,類似于其他統(tǒng)計(jì)物理復(fù)雜系統(tǒng),金融資產(chǎn)也具備自組織臨界特性,自組織即指復(fù)雜系統(tǒng)[6]某一狀態(tài)的形成主要由系統(tǒng)內(nèi)部不同組成部分互相作用所驅(qū)使,而并非由其他外界因素主導(dǎo);臨界性是指復(fù)雜系統(tǒng)當(dāng)前處于極其敏感的特殊狀態(tài),某一微小的局部變化即可引致整個(gè)系統(tǒng)的突變.自組織臨界性可以解釋諸如日輝耀斑、地震、泥石流、山體滑坡、雪崩、物種滅絕及金融市場(chǎng)中的資產(chǎn)價(jià)格崩潰現(xiàn)象[7,8].LPPL模型認(rèn)為由于市場(chǎng)上交易者同一時(shí)間段互相模仿,并通過(guò)正反饋機(jī)制不斷強(qiáng)化,致使資產(chǎn)價(jià)格在市場(chǎng)的自然運(yùn)作過(guò)程當(dāng)中逐漸產(chǎn)生泡沫,并最終崩潰.潘娜等[9]和周煒星[10]認(rèn)為L(zhǎng)PPL模型具備兩個(gè)顯著特征:一是對(duì)數(shù)周期性振蕩,在線性尺度下,越接近臨界點(diǎn),振蕩頻率越快,而在對(duì)數(shù)尺度下,振蕩頻率為常數(shù);二是冪律增長(zhǎng),即價(jià)格的增長(zhǎng)率并非常數(shù),而是單調(diào)遞增.
金融資產(chǎn)價(jià)格泡沫在趨近崩潰邊緣時(shí),呈現(xiàn)出對(duì)數(shù)周期冪律振蕩特性.因此,采用LPPL模型可有效識(shí)別金融市場(chǎng)是否處于泡沫狀態(tài),并對(duì)大盤見(jiàn)頂,泡沫崩潰時(shí)點(diǎn)進(jìn)行提前預(yù)警.Sornette和Johansen[11]使用了20世紀(jì)兩次最大的歷史崩潰,即1929年10月和1987年10月的崩潰,并表明該方法通過(guò)分析泡沫發(fā)生前8年間隔內(nèi)的股指走勢(shì)可有效識(shí)別這兩次崩潰.Sornette和Johansen[12]提出了一個(gè)簡(jiǎn)單的股票市場(chǎng)交易員等級(jí)模型,其研究結(jié)果表明,不管是模型中處于最高等級(jí)的國(guó)家層面,還是處于次高級(jí)的國(guó)家內(nèi)部的銀行等金融機(jī)構(gòu),其交易行為均表現(xiàn)出明顯的羊群效應(yīng),這種不同層級(jí)的相互模仿足以使股票價(jià)格產(chǎn)生對(duì)數(shù)周期冪律振蕩,并最終引發(fā)市場(chǎng)的崩潰.Sornette和Zhou[13]提出了一個(gè)系統(tǒng)的算法預(yù)先檢測(cè)到道瓊斯工業(yè)平均指數(shù)(DJIA)和香港恒生綜合指數(shù)(HSI)泡沫的崩潰.Sornette等[14]利用LPPL方法分析了 2006—2008 年石油價(jià)格的上漲情況,并證明了石油價(jià)格的演變過(guò)程也呈現(xiàn)出類似泡沫的狀態(tài).Kyriazis等[15]采用LPPL方法成功的預(yù)測(cè)到比特幣、以太坊等加密貨幣2013年、2017年的泡沫崩潰.Omer[16]詳細(xì)梳理了LPPL模型用于預(yù)警金融市場(chǎng)崩潰的成功案例.Sirca和Omladic[17]成功地運(yùn)用LPPL模型用于預(yù)測(cè)全球33個(gè)主流股票市場(chǎng)泡沫的崩潰.Filimonov和Sornette[18]提出了一種改進(jìn)的 LPPL公式,將其從 3 個(gè)線性參數(shù)和 4 個(gè)非線性參數(shù)的函數(shù)轉(zhuǎn)化為 4 個(gè)線性參數(shù)和 3 個(gè)非線性參數(shù),實(shí)證結(jié)果表明,這種轉(zhuǎn)換顯著降低了擬合過(guò)程的復(fù)雜性,并提高了其穩(wěn)定性.國(guó)內(nèi)學(xué)者在這方面亦展開了廣泛的研究.Jiang等[19]利用LPPL模型檢測(cè)了2005年5月至2009年7月期間中國(guó)股市2個(gè)重要指數(shù)—上證綜合指數(shù)和深證成分指數(shù)的2個(gè)泡沫和隨后的市場(chǎng)崩潰,并成功地預(yù)測(cè)了2個(gè)指數(shù)的崩潰.Yan等[20]利用 LPPL模型,開發(fā)了一種基于先進(jìn)模式識(shí)別方法的預(yù)警指數(shù)用于探測(cè)市場(chǎng)泡沫,并對(duì)市場(chǎng)崩潰和反彈進(jìn)行預(yù)測(cè).在 10 個(gè)主要的全球股票市場(chǎng)上取得了較好的效果.李東[21]針對(duì)LPPL模型提出了基于網(wǎng)格的Nelder-Mead Simplex預(yù)搜索方法優(yōu)化LPPL模型的估計(jì)參數(shù),并對(duì)恒生指數(shù)的泡沫崩潰進(jìn)行提前預(yù)警,取得了較好的效果.周偉和何建敏[22]采用LPPL模型成功識(shí)別到后金融危機(jī)時(shí)代不同類型的金屬期貨價(jià)格的集體泡沫,做出了歸因分析,并驗(yàn)證了其結(jié)論.李斯嘉等[23]借鑒金融物理學(xué)方法,分析上證綜指和深證成指的崩盤前后動(dòng)力學(xué)特征,采用LPPL模型分別預(yù)測(cè)2007年、2015年上證綜指、深證成指的崩盤,發(fā)現(xiàn)股市崩盤的特征符合G-R規(guī)律與Omori定律.李倫一和張翔[24]使用LPPL模型對(duì)中國(guó)房地產(chǎn)市場(chǎng)交易價(jià)格泡沫進(jìn)行測(cè)度.文章基于2010年6月至2017年11月中國(guó)100個(gè)主要城市的房地產(chǎn)交易數(shù)據(jù)對(duì)各城市房地產(chǎn)價(jià)格泡沫進(jìn)行識(shí)別.研究結(jié)果表明,LPPL模型能夠有效甄別各城市房地產(chǎn)價(jià)格正向泡沫、反向泡沫.陳衛(wèi)華和蔡文靖[25]運(yùn)用改進(jìn)的LPPL參數(shù)估計(jì)方法預(yù)測(cè)2015年上證和創(chuàng)業(yè)板指數(shù)的崩盤,并對(duì)其進(jìn)行Lomb譜分析和O-U過(guò)程檢驗(yàn),取得了穩(wěn)健的效果.趙磊和劉慶[26]采用LPPL模型擬合比特幣價(jià)格,結(jié)果發(fā)現(xiàn),比特幣價(jià)格呈現(xiàn)出LPPL模型中所隱含的超指數(shù)膨脹、對(duì)數(shù)周期冪律振蕩特性,并預(yù)測(cè)比特幣價(jià)格可能在2020年下半年出現(xiàn)泡沫.
縱觀已有文獻(xiàn),LPPL模型在預(yù)警金融資產(chǎn)泡沫方面已經(jīng)取得了豐碩的研究成果,然而,該模型并未將金融資產(chǎn)交易價(jià)格以外的因素,諸如金融資產(chǎn)價(jià)格基本面、政策層面及市場(chǎng)情緒等因素納入建模過(guò)程.為此,本文嘗試將市場(chǎng)情緒層面的因素納入LPPL模型建模過(guò)程,對(duì)改進(jìn)LPPL模型的泡沫預(yù)警效果.
隨著20世紀(jì)八九十年代金融市場(chǎng)上一系列金融異象,如股票溢價(jià)之謎、股價(jià)過(guò)度波動(dòng)之謎、股價(jià)長(zhǎng)期反轉(zhuǎn)效應(yīng)等,被逐漸揭示.行為金融理論(behavioral finance)借助行為科學(xué)、心理學(xué)的研究成果,能有效解釋這類金融異象.行為金融理論認(rèn)為市場(chǎng)上交易者并非完全理性,其交易決策會(huì)受到各類心里因素,如投資者情緒等非市場(chǎng)因素影響[27].國(guó)內(nèi)外大量實(shí)證研究表明,投資者情緒在股票價(jià)格的決定中起著重要的作用.Baker和Wurgler[28,29]將投資者情緒定義為對(duì)未來(lái)現(xiàn)金流和投資風(fēng)險(xiǎn)的信念,而這些信念并不是由基本面決定的.他們的研究結(jié)果表明,投資者情緒會(huì)影響股票市場(chǎng)的回報(bào),即積極情緒對(duì)股價(jià)具有正面影響,消極情緒對(duì)股價(jià)具有負(fù)面影響,并且隨著投資者意識(shí)到情緒與基本面的偏離時(shí),這種影響在接下來(lái)的交易日會(huì)發(fā)生逆轉(zhuǎn).García[30]的研究表明,投資者情緒對(duì)道瓊斯工業(yè)平均指數(shù)的短期走勢(shì)的影響符合上述發(fā)現(xiàn).新聞媒體作為投資者獲取重要信息的窗口,其對(duì)股票市場(chǎng)信息的報(bào)道對(duì)投資者指定交易決策具有重要影響.媒體報(bào)道通過(guò)對(duì)股票市場(chǎng)的表現(xiàn)狀況做出評(píng)判及預(yù)測(cè),會(huì)直接誘導(dǎo)投資者未來(lái)預(yù)期,影響投資者情緒,進(jìn)而影響市場(chǎng)未來(lái)走勢(shì)[31,32].Solomon[33]的研究發(fā)現(xiàn),比起負(fù)面報(bào)道,媒體更熱衷于正面報(bào)道,即新聞媒體的報(bào)道內(nèi)容往往摻雜著媒體商主觀意見(jiàn),并非完全基于市場(chǎng)上已有的客觀事實(shí).Nardo等[34]通過(guò)綜合采用文本挖掘、情感分析及機(jī)器學(xué)習(xí)技術(shù)基于大量互聯(lián)網(wǎng)新聞報(bào)道預(yù)測(cè)未來(lái)股票市場(chǎng)走勢(shì),發(fā)現(xiàn)互聯(lián)網(wǎng)新聞報(bào)道有助于預(yù)測(cè)市場(chǎng)未來(lái)走勢(shì),然而其實(shí)際回報(bào)很少超過(guò)5%.Fisher和Statman[35]的研究顯示個(gè)人投資者的情緒受新聞媒體撰稿人的情緒影響較為顯著,二者相關(guān)性較強(qiáng),并且投資者的情緒與未來(lái)股市收益率負(fù)相關(guān).國(guó)內(nèi)學(xué)者方面,武佳薇等[36]基于前景理論框架,考慮投資者非理行預(yù)期因素,構(gòu)建投資組合決策模型,其采用某券商2007年至2009年近177萬(wàn)個(gè)人股票賬戶交易數(shù)據(jù)進(jìn)行實(shí)證分析,實(shí)證結(jié)果表明,投資者情緒與處置效用具有負(fù)相關(guān)關(guān)系.李合龍和馮春娥[37]采用EEMD分解技術(shù)提取投資者情緒及股指價(jià)格在不同時(shí)間尺度下的波動(dòng)特征,研究結(jié)果發(fā)現(xiàn),投資者情緒與股指價(jià)格序列在不同時(shí)間尺度下呈現(xiàn)出不同的波動(dòng)關(guān)系.由于中國(guó)股票市場(chǎng)中,散戶投資者占據(jù)了絕大部分比例,其活躍程度遠(yuǎn)超機(jī)構(gòu)投資者,截止2020年8月底,中國(guó)股市中,自然人投資者數(shù)目達(dá)到1.72億,而非自然人投資者數(shù)目?jī)H為40.28萬(wàn)(數(shù)據(jù)來(lái)源于中國(guó)證券登記結(jié)算有限責(zé)任公司).相比機(jī)構(gòu)等專業(yè)投資者,廣大散戶,尤其是剛?cè)胧械男鹿擅?其專業(yè)知識(shí)及實(shí)操經(jīng)驗(yàn)較為缺乏,其對(duì)市場(chǎng)運(yùn)行狀況的評(píng)價(jià)較依賴于各類新聞媒體的股評(píng)觀點(diǎn).隨著近些年,互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)步入 Web 3.0 時(shí)代,諸如微博、論壇等各種新興媒體的崛起,投資者可輕而易舉地從互聯(lián)網(wǎng)上獲取各類海量并充斥著強(qiáng)烈情感色彩的股評(píng)文本信息.游家興和吳靜[38]通過(guò)選取2004年至2010年間國(guó)內(nèi)8家財(cái)經(jīng)報(bào)紙新聞,運(yùn)用文本分析方法綜合報(bào)道基調(diào)、曝光程度及關(guān)注水平三個(gè)維度信息構(gòu)建媒體情緒指數(shù),發(fā)現(xiàn)新聞媒體情緒能夠顯著引致股價(jià)波動(dòng).Wu等[39]從新浪財(cái)經(jīng)網(wǎng)站抓取股評(píng)短文,采用SVM訓(xùn)練媒體情緒,實(shí)證結(jié)果表明,媒體股評(píng)情緒與股價(jià)未來(lái)走勢(shì)具有顯著相關(guān)關(guān)系,并且其在成長(zhǎng)股中表現(xiàn)尤為明顯.戴德寶等[40]通過(guò)抓取東方財(cái)富網(wǎng)絡(luò)論壇文本結(jié)合情感詞典分析方法生成投資者情緒序列數(shù)據(jù),并采用SVM學(xué)習(xí)機(jī)將生成的情緒指數(shù)納入訓(xùn)練過(guò)程,其實(shí)證結(jié)果表明,相比基準(zhǔn)模型,考慮情緒指數(shù)的SVM學(xué)習(xí)器具有更高的預(yù)測(cè)精度.由于每日均有海量的新聞報(bào)道產(chǎn)生,投資者受限個(gè)人有限的注意力,無(wú)法逐一對(duì)每日新聞報(bào)道內(nèi)容進(jìn)行細(xì)致閱讀[41],作為新聞報(bào)道內(nèi)容的凝練與總結(jié),新聞標(biāo)題可迅速吸引讀者的注意力,甚至有媒體為了博取投資者的關(guān)注,故意為媒體報(bào)道冠上夸張的標(biāo)題[42].Huang等[43]研究發(fā)現(xiàn)企業(yè)管理層可以充分利用投資者的有限注意力,在新聞標(biāo)題中嵌入更多積極信息,以煽動(dòng)投資者的樂(lè)觀情緒.由上可得,采用文本挖掘技術(shù)剖析新聞媒體評(píng)論稿標(biāo)題可提取媒體情緒,進(jìn)而為下文分析媒體情緒對(duì)股市未來(lái)走勢(shì)的影響作鋪墊.
綜上,關(guān)于LPPL模型用于預(yù)警股市崩盤方面已經(jīng)取得了豐碩成果,然而已有研究未將交易歷史數(shù)據(jù)以外的因素納入建模過(guò)程.此外,現(xiàn)有研究均表明投資者情緒可在一定程度上解釋未來(lái)股價(jià)走勢(shì)的變動(dòng).本文嘗試將投資者情緒納入LPPL建模過(guò)程.以改進(jìn)LPPL模型股市崩潰預(yù)警效果.本文將從以下幾個(gè)方面開展研究工作:首先,采用文本挖掘技術(shù)結(jié)合情感詞典構(gòu)建媒體情緒指數(shù);其次,對(duì)現(xiàn)有LPPL模型進(jìn)行改進(jìn),將媒體情緒指數(shù)納入建模過(guò)程;最后,通過(guò)實(shí)證數(shù)據(jù)檢驗(yàn)改進(jìn)模型與 基準(zhǔn)模型的預(yù)測(cè)效果.
2.1.1 中文金融情感詞典介紹
本文主要基于Sentiment等[44]構(gòu)建的中文金融詞典對(duì)獲取的媒體評(píng)論文本進(jìn)行情感標(biāo)注:首先,采用知網(wǎng)HOWNET、大連理工大學(xué)DLUTSD及臺(tái)灣大學(xué)NTUSD作為基礎(chǔ)詞典;然后,使用在線路演紀(jì)要,業(yè)績(jī)說(shuō)明電話會(huì)議紀(jì)要,IPO招股說(shuō)明書及公司年報(bào)構(gòu)建基礎(chǔ)語(yǔ)料庫(kù);最后,基于算法和人工刪選,使用多階段剔除法來(lái)構(gòu)建中文金融情感詞典CFSD.具體步驟如下.
步驟1 通過(guò)合并HOWNET,DLUTSD和NTUSD中的肯定和否定術(shù)語(yǔ)并刪除重復(fù)項(xiàng),創(chuàng)建基礎(chǔ)情感詞典.
步驟2 收集1411個(gè)在線路演紀(jì)要,7138個(gè)電話會(huì)議紀(jì)要,2043個(gè)IPO招股說(shuō)明書和29737份年度財(cái)務(wù)報(bào)告.運(yùn)用 jieba分詞包(Python分詞工具)用于分割這些文檔以創(chuàng)建基本語(yǔ)料庫(kù).
步驟3 根據(jù)步驟1中創(chuàng)建的基礎(chǔ)情感詞典,計(jì)算基本語(yǔ)料庫(kù)中每個(gè)積極詞和消極詞的詞頻.排除頻率為零的詞.在創(chuàng)建基本的中國(guó)金融情感詞典(CFSD0.0)之前,將與財(cái)務(wù)文檔無(wú)關(guān)的術(shù)語(yǔ)手動(dòng)排除.
步驟4 CFSD 0.0中的所有術(shù)語(yǔ)均來(lái)自HOWNET,DLUTSD和NTUSD.由于這3個(gè)詞典在財(cái)務(wù)中不包括一些常用的否定詞和肯定詞,因此手動(dòng)添加了100個(gè)常用的財(cái)務(wù)否定詞和100個(gè)肯定詞以生成字典CFSD 0.1.
步驟5 Gensim(Python軟件包)用于將基本語(yǔ)料庫(kù)轉(zhuǎn)換為單詞向量模型.單詞向量模型用于找出CFSD 0.1中每個(gè)術(shù)語(yǔ)的前50個(gè)同義詞.在手動(dòng)刪除與財(cái)務(wù)、金融無(wú)關(guān)的所有同義詞之后,創(chuàng)建CFSD 0.2.
步驟6 將CFSD 0.0,CFSD 0.1和CFSD 0.2合并以刪除重復(fù)項(xiàng)以獲得CFSD.CFSD中有1488個(gè)否定詞和1107個(gè)肯定詞.
2.1.2 媒體情緒指數(shù)構(gòu)建
利用前述構(gòu)建的CFSD詞典對(duì)媒體評(píng)論進(jìn)行情感標(biāo)注,在情感標(biāo)注過(guò)程中,對(duì)詞匯所表達(dá)的情感強(qiáng)度不作進(jìn)一步區(qū)分,僅通過(guò)統(tǒng)計(jì)詞匯出現(xiàn)的次數(shù)的高低來(lái)描述情感得分.每一自然日出現(xiàn)積極、消極情緒得分的表達(dá)式如(1)式所示:
式中,kPos,Neg分別表示積極、負(fù)面情緒,Sentit,k為第t個(gè)自然日的媒體股評(píng)文章標(biāo)題中情緒類型k的得分,mk為隸屬于情緒類型k的詞匯出現(xiàn)的次數(shù),nt,j為第t個(gè)自然日股評(píng)文章標(biāo)題中第j個(gè)詞匯出現(xiàn)的次數(shù).
由于每一天的股評(píng)標(biāo)題里可能同時(shí)包含積極詞匯、消極詞匯,為了綜合評(píng)價(jià)某一天的情緒值,本文參考王曉丹等[45]的處理方法,得到綜合的媒體情緒指數(shù),其表達(dá)式為
式中,post表示第t天的積極情感得分,negt表示第t天的消極情感得分.當(dāng)積極情感得分大于消極情感得分時(shí),判定相互抵消后的綜合情緒值大于0,表明情緒偏樂(lè)觀;反之,當(dāng)積極情感得分小于消極情感得分時(shí),綜合情緒值小于0,表明情緒偏悲觀.
2.2.1 LPPL模型介紹
Sornette等[1]認(rèn)為金融市場(chǎng)具有典型的復(fù)雜系統(tǒng)的特性.發(fā)生在復(fù)雜系統(tǒng)中的極端事件往往是由于系統(tǒng)內(nèi)部相互作用、自組織等自然演化的結(jié)果,并非由外部沖擊驅(qū)使.Johansen 和Sornette[2]認(rèn)為金融市場(chǎng)上由于投資者之間的羊群效應(yīng)及正反饋機(jī)制造成的資產(chǎn)價(jià)格泡沫的膨脹與破裂可由LPPL模型進(jìn)行刻畫.LPPL模型具有如下特性:
1)投資者之間相互模仿,呈現(xiàn)集體追漲的交易局面,造成對(duì)數(shù)資產(chǎn)價(jià)格呈超指數(shù)暴漲;
2)隨著資產(chǎn)價(jià)格泡沫破裂的風(fēng)險(xiǎn)逐漸擴(kuò)大,市場(chǎng)需要更高的回報(bào)作為補(bǔ)償;
3)資產(chǎn)價(jià)格泡沫在臨界點(diǎn)tc具有最大的崩盤概率;
4)越接近臨界點(diǎn)tc,資產(chǎn)價(jià)格對(duì)數(shù)周期性振蕩頻率越高.
在LPPL模型中,股票價(jià)格在泡沫階段的演化過(guò)程如(3)式所示:
式中p是股票價(jià)格;μ(t) 為趨勢(shì)項(xiàng);W為滿足均值為0,方差為1的維納過(guò)程;dj為非連續(xù)的跳躍,泡沫崩潰以前,dj0,崩潰之后 dj1 .與發(fā)生崩潰對(duì)應(yīng)的價(jià)格損失幅度由參數(shù)κ確定.假定h(t) 為崩潰發(fā)生的概率,則有:Et[dj]1×h(t)dt+0×(1?h(t))dth(t)dt.
在LPPL模型中,假設(shè)股價(jià)崩盤的概率h(t)如(4)式所示[2]:
式中B′,C′均大于0;tc為金融資產(chǎn)價(jià)格見(jiàn)頂?shù)臅r(shí)刻,也稱為崩潰臨界點(diǎn);m為冪增長(zhǎng)指數(shù),代表股價(jià)增長(zhǎng)的加速度,m越小,股價(jià)增長(zhǎng)的加速度越快,其臨近泡沫的可能性也越大.ω為振蕩的角頻率,φ為振蕩的初始相位.
由Et[dj]h(t)dt,Et[dW]0 及滿足市場(chǎng)不存在無(wú)風(fēng)險(xiǎn)套利條件,即Et[dp]0,對(duì)(3)式兩端取期望,可得μ(t)κh(t),進(jìn)一步,假定股價(jià)崩盤已經(jīng)產(chǎn)生,(3)式簡(jiǎn)化為
進(jìn)一步,對(duì)(5)式兩端取期望,得
傳統(tǒng)上,中國(guó)人的確并沒(méi)有意識(shí)到“老糊涂”是一種病。近年來(lái),“老年癡呆癥”這個(gè)病名被人們?cè)絹?lái)越熟悉,它比阿爾茨海默病聽(tīng)起來(lái)更“通俗”。事實(shí)上,無(wú)論是在中國(guó)內(nèi)地還是香港地區(qū),調(diào)查數(shù)據(jù)顯示,阿爾茨海默病的患病率并不比其他地區(qū)低——內(nèi)地的發(fā)病率與世界平均水平持平,為6%左右;而香港的發(fā)病率則接近10%。
(6)式取積分結(jié)合(4)式即得LPPL方程[2]:
式中A>0,為股票在臨界點(diǎn)的價(jià)格,也即股票見(jiàn)頂時(shí)的價(jià)格;并且,B(tc?t)m反映了股價(jià)由正反饋機(jī)制驅(qū)使而出現(xiàn)的冪律增長(zhǎng)特性,C(tc?t)mcos(ωln(tc?t)?φ)刻畫了股價(jià)在臨近見(jiàn)頂并崩盤時(shí)呈對(duì)數(shù)周期性振蕩,是對(duì)股價(jià)冪律增長(zhǎng)行為的修正.圖1以中國(guó)上證指數(shù)2015年泡沫期間走勢(shì)為例,展示了LPPL模型中呈現(xiàn)的對(duì)數(shù)周期冪律振蕩現(xiàn)象.
如圖1所示,在線性尺度下,越接近崩盤的臨界點(diǎn),其振蕩的頻率越快,其表現(xiàn)為圖中指數(shù)振蕩的間隔周期越來(lái)越短,如圖1中振蕩的周期依次為116(由余弦函數(shù)的波峰或波谷數(shù)值相減可得,如第一個(gè)周期為200減去84為116個(gè)交易日,以此類推),67,38,22,13個(gè)交易日.而在對(duì)數(shù)尺度下,其振蕩頻率為常數(shù),如圖1中所示,分別對(duì)線性尺度下的振蕩周期取對(duì)數(shù),則其周期為ln(116)–ln(67)=ln(67)–ln(38)=ln(38)–ln(22)=ln(22)–ln(13)=0.54.并且股價(jià)越是接近臨界點(diǎn),股價(jià)增長(zhǎng)速度越快,即股價(jià)增長(zhǎng)率呈現(xiàn)單調(diào)遞增的特點(diǎn).
圖1 上證指數(shù)2015年泡沫期間LPPL擬合圖Fig.1.LPPL fitting diagram of the Shanghai stock exchange (SSE) index during the 2015 bubble.
2.2.2 LPPL-MS模型的構(gòu)建
基礎(chǔ)的LPPL模型未將投資者情緒因素納入到建模過(guò)程當(dāng)中,本文創(chuàng)新性地對(duì)LPPL模型中的崩潰概率公式h(t) 進(jìn)行修改,以刻畫媒體情緒因素對(duì)崩潰風(fēng)險(xiǎn)的影響.如前文所述,已有研究均已表明,投資者情緒對(duì)股價(jià)具有顯著的影響,因此,本文假定在股市泡沫階段,媒體積極評(píng)論將進(jìn)一步助推市場(chǎng)情緒的高漲,加速羊群效應(yīng),放大市場(chǎng)正反饋機(jī)制,驅(qū)使股價(jià)加速膨脹,導(dǎo)致其崩盤概率增大.反之,媒體負(fù)面評(píng)論則可能平抑過(guò)熱的市場(chǎng)情緒,延緩羊群效應(yīng),抑制市場(chǎng)正反饋機(jī)制,延緩崩盤時(shí)刻的到來(lái).考慮媒體情緒(mediasentiment,MS)影響后的股價(jià)崩潰函數(shù)h(t) 如(8)式表示:
式中 sentimentt?1為t?1時(shí)刻媒體情緒值;λ>0,則表明積極情緒會(huì)放大正反饋效應(yīng),消極情緒會(huì)抑制正反饋效應(yīng),否則不成立.同上,與2.2.1節(jié)中情形類似,可得到考慮媒體情緒后的LPPL方程的表達(dá)式:
Johansen等[46]提到,LPPL模型刻畫的股市崩盤具有典型的3個(gè)特征:1)股價(jià)達(dá)到明顯的峰值;2)股價(jià)至少在6個(gè)月內(nèi)維持上漲的態(tài)勢(shì);3)股價(jià)達(dá)到峰值后在短期內(nèi)便迅速下降.由于自2014年1月1日起,新聞來(lái)源眾多,而2013年及之前的網(wǎng)站來(lái)源少、新聞數(shù)據(jù)量少,結(jié)合LPPL模型所滿足的3個(gè)特征,本文選擇上證指數(shù)2014年1月2日至2015年5月29日、創(chuàng)業(yè)板指數(shù)2014年1月2日至2015年5月20日收盤價(jià)數(shù)據(jù)及對(duì)應(yīng)新聞媒體評(píng)論數(shù)據(jù)作為樣本進(jìn)行擬合.所有樣本數(shù)據(jù)均來(lái)源于東方財(cái)富旗下Choice金融終端,通過(guò)在Choice金融終端抓取關(guān)鍵詞“A股”、“大盤”相關(guān)的各類媒體評(píng)論,匯總每一自然日新聞財(cái)經(jīng)媒體對(duì)當(dāng)下股票市場(chǎng)整體運(yùn)行狀況的評(píng)價(jià)及未來(lái)走勢(shì)預(yù)判.其數(shù)據(jù)覆蓋面較為全面,其數(shù)據(jù)均來(lái)源于諸如,滬深交易所、中國(guó)基金報(bào)、券商中國(guó)、澎湃新聞、21世紀(jì)經(jīng)濟(jì)報(bào)道、中證網(wǎng)、中金網(wǎng)等國(guó)內(nèi)主流媒體.部分媒體評(píng)論稿標(biāo)題信息如圖2所示.
圖2 部分財(cái)經(jīng)媒體評(píng)論稿標(biāo)題信息樣本Fig.2.Some financial media commentary title information samples.
采用2.1節(jié)中構(gòu)建的情感詞典掃描每一條評(píng)論的標(biāo)題,統(tǒng)計(jì)每條評(píng)論對(duì)應(yīng)的積極詞匯、消極詞匯出現(xiàn)的次數(shù),再結(jié)合(2)式,便得到每一天的情緒值.本文所參照的CFSD金融情感詞典部分內(nèi)容如表1所示.
表1 CFSD詞典部分積極、消極詞匯Table 1.Some positive and negative words in CFSD dictionary.
媒體情緒指數(shù)描述性統(tǒng)計(jì)分析如表2所示.從表2中可看出,本文所選取的媒體情緒樣本中積極情緒指數(shù)明顯高于消極情緒指數(shù),表明各類財(cái)經(jīng)媒體的評(píng)論具有明顯的傾向性,其傾向于對(duì)市場(chǎng)做出積極正面的評(píng)論.受央行多次降準(zhǔn)降息,市場(chǎng)無(wú)風(fēng)險(xiǎn)利率不斷下探,疊加國(guó)家實(shí)施積極財(cái)政政策及國(guó)企改革等一系列“利好”因素的推動(dòng)下,2015年上半年A股市場(chǎng)節(jié)節(jié)攀升,上證指數(shù)在2015年6月12日最高上漲到5178.19點(diǎn),創(chuàng)業(yè)板指數(shù)在2015年6月5日最高上漲到4037.96點(diǎn),隨后隨著市場(chǎng)泡沫的破裂,僅兩個(gè)月時(shí)間,上證指數(shù)從高位滑落至2850.71點(diǎn),創(chuàng)業(yè)板則滑落至1779.18點(diǎn).上證指數(shù)、創(chuàng)業(yè)板指數(shù)泡沫前后的走勢(shì)如圖3所示.
圖3 上證指數(shù)、創(chuàng)業(yè)板指數(shù)泡沫前后走勢(shì)Fig.3.Trend of SSE index and growth enterprise market(GEM) index before and after bubble.
表2(MS)序列描述性統(tǒng)計(jì)分析Table 2.Descriptive statistical analysis of media sentiment(MS) sequence.
為了得到模型的參數(shù)估計(jì)結(jié)果,本文采用遺傳算法(genetic algorithm,GA)來(lái)獲取LPPL、LPPLMS參數(shù)估計(jì)值.其中,上證指數(shù)的擬合樣本區(qū)間為2014年1月2日至2015年5月29日;創(chuàng)業(yè)板指數(shù)的擬合樣本區(qū)間為2014年1月2日至2015年5月20日.GA算法的適應(yīng)度函數(shù)為擬合值與實(shí)際值的均方誤差,其種群規(guī)模設(shè)為20,交叉概率設(shè)為0.5,變異率設(shè)為0.05,迭代次數(shù)設(shè)為100次,為了使預(yù)測(cè)結(jié)果更加穩(wěn)健,選取適應(yīng)度最佳的3組擬合結(jié)果進(jìn)行分析.LPPL及LPPL-MS模型的GA算法估計(jì)結(jié)果如表3、表4所示.
表3、表4中MSE指標(biāo)為L(zhǎng)PPL,LPPL-MS模型擬合值與實(shí)際值的均方誤差,其余各參數(shù)的意義同2.2節(jié)中的介紹.所有模型擬合得到的冪增長(zhǎng)指數(shù)m介于0到1之間,表明市場(chǎng)崩潰的概率h(t)具有不斷加速的特征,滿足產(chǎn)生崩盤的條件.此外,LPPL-MS模型中,λ均大于0,表明媒體情緒對(duì)正反饋效應(yīng)具有顯著影響,即積極情緒會(huì)放大正反饋效應(yīng),消極情緒會(huì)抑制正反饋效應(yīng).若N≤tc 表3 上證指數(shù)LPPL,LPPL-MS參數(shù)估計(jì)結(jié)果Table 3.Parameter estimation results of SSE index LPPL and LPPL-MS. 表4 創(chuàng)業(yè)板指數(shù)LPPL、LPPL-MS參數(shù)估計(jì)結(jié)果Table 4.Estimation results of LPPL and LPPL-MS parameters of gem index. 從表5中可看出,LPPL-MS無(wú)論是在上證指數(shù)還是創(chuàng)業(yè)板指數(shù)情形下,其預(yù)測(cè)的見(jiàn)頂時(shí)點(diǎn)均更接近真實(shí)值,其預(yù)測(cè)的崩潰臨界時(shí)點(diǎn)與真實(shí)見(jiàn)頂時(shí)點(diǎn)的最低絕對(duì)誤差、最高絕對(duì)誤差、平均絕對(duì)誤差均小于LPPL模型.圖4直觀展示了不同模型的預(yù)測(cè)表現(xiàn). 表5 上證指數(shù)、創(chuàng)業(yè)板指數(shù)預(yù)警誤差比較分析Table 5.Comparative analysis of early warning errors between SSE index and GEM index. 圖4中,不同顏色的線條分別對(duì)應(yīng)不同的擬合情形,所有圖中上證指數(shù)、創(chuàng)業(yè)板指數(shù)實(shí)際的見(jiàn)頂時(shí)點(diǎn)所在的時(shí)刻均用“^”符號(hào)標(biāo)出.“*,+,<”分別對(duì)應(yīng)情形1,2,3下預(yù)測(cè)得到的見(jiàn)頂時(shí)點(diǎn).其中,上證指數(shù)對(duì)應(yīng)的大盤見(jiàn)頂時(shí)點(diǎn)為353,對(duì)應(yīng)的交易日期為2015年6月12日,創(chuàng)業(yè)板指數(shù)對(duì)應(yīng)的大盤見(jiàn)頂時(shí)點(diǎn)為346,對(duì)應(yīng)的交易日期為2015年6月3日.上證指數(shù)LPPL三種擬合情形預(yù)測(cè)的大盤見(jiàn)頂時(shí)點(diǎn)分別370,380,362,即分別比實(shí)際的見(jiàn)頂時(shí)點(diǎn)晚17,27,9個(gè)交易日.上證指數(shù)LPPL-MS模型三種擬合情形預(yù)測(cè)的大盤見(jiàn)頂時(shí)點(diǎn)分別為363,366,361,即分別比實(shí)際的見(jiàn)頂時(shí)點(diǎn)晚10,13,8個(gè)交易日.從圖中也可看出,上證指數(shù)LPPL-MS模型預(yù)測(cè)的大盤見(jiàn)頂時(shí)點(diǎn)相比較LPPL模型更為接近真實(shí)值.同理,創(chuàng)業(yè)板指數(shù)LPPL三種擬合情形預(yù)測(cè)的大盤見(jiàn)頂時(shí)點(diǎn)分別為336,342,341,其分別比實(shí)際的見(jiàn)頂時(shí)點(diǎn)提前10,4,5個(gè)交易日.創(chuàng)業(yè)板指數(shù)LPPL-MS三種擬合情形預(yù)測(cè)的大盤見(jiàn)頂時(shí)點(diǎn)分別為345,353,354,其分別比實(shí)際見(jiàn)頂時(shí)點(diǎn)提前1個(gè)交易日、遲延7個(gè)交易日、延遲8個(gè)交易日,其相比LPPL模型預(yù)測(cè)的見(jiàn)頂時(shí)點(diǎn)更為接近真實(shí)值.圖4的直觀展示結(jié)果亦表明LPPL-MS組合模型預(yù)警效果優(yōu)于LPPL模型. 圖4 上證指數(shù)、創(chuàng)業(yè)板指數(shù)不同模型預(yù)測(cè)表現(xiàn)比較分析Fig.4.Comparative analysis of forecasting performance of different models of Shanghai Stock Exchange Index and Growth Enterprise Market Index. 為了進(jìn)一步驗(yàn)證LPPL,LPPL-MS擬合結(jié)果的穩(wěn)健性,對(duì)其擬合殘差進(jìn)行Ornstein-Uhlenbeck(O-U)過(guò)程檢驗(yàn).Lin等[48]指出,如果股票市場(chǎng)在泡沫期間的對(duì)數(shù)收盤價(jià)可以用LPPL模型進(jìn)行有效解釋,則其擬合的殘差應(yīng)該滿足 O-U過(guò)程.其擬合的殘差若滿足平穩(wěn)性,則表明其符合O-U過(guò)程.表6列出了上述模型不同擬合情形下殘差的單位根檢驗(yàn)結(jié)果. 表6 上證指數(shù)、創(chuàng)業(yè)板指數(shù)不同擬合情形下殘差平穩(wěn)性檢驗(yàn)Table 6.Residual stationarity test of SSE index and GEM index under different fitting conditions. 表6中的數(shù)值為L(zhǎng)PPL,LPPL-MS不同擬合情形下殘差Dickey-Fuller檢驗(yàn)的P值.從表6可看出,上述LPPL,LPPL-MS模型不同擬合情形下殘差均通過(guò)了平穩(wěn)性檢驗(yàn),表明其擬合殘差滿足O-U過(guò)程,且LPPL-MS模型相比LPPL模型具有更小的P值,其擬合結(jié)果更為穩(wěn)健.本文所采用的LPPL、LPPL-MS模型可有效解釋2015年上證指數(shù)、創(chuàng)業(yè)板指數(shù)泡沫期間的運(yùn)行情況. 本文采用文本挖掘技術(shù)生成財(cái)經(jīng)媒體情緒指數(shù)MS,通過(guò)將MS指數(shù)納入傳統(tǒng)的LPPL模型,構(gòu)建LPPL-MS組合模型對(duì)中國(guó)上證指數(shù)、創(chuàng)業(yè)板指數(shù)2015年6月份的崩盤進(jìn)行預(yù)警.實(shí)證分析得出以下結(jié)論. 1)通過(guò)文本挖掘技術(shù)結(jié)合大數(shù)據(jù)分析,抓取財(cái)經(jīng)媒體對(duì)A股的評(píng)論信息,通過(guò)分析其評(píng)論措辭的情感傾向可有效衡量媒體情緒.并且,財(cái)經(jīng)媒體傾向于對(duì)市場(chǎng)做出樂(lè)觀的評(píng)價(jià),以煽動(dòng)其他投資者的情緒.由于中國(guó)股市中個(gè)人投資者基數(shù)龐大,尤其是其中的新進(jìn)投資者,其缺乏交易經(jīng)驗(yàn),往往容易受財(cái)經(jīng)媒體具有煽動(dòng)性報(bào)道內(nèi)容的影響.以致于媒體情緒一定程度上能影響股票市場(chǎng)的表現(xiàn). 2)中國(guó)A股市場(chǎng)在2015年上半年開啟單邊暴漲模式,并出現(xiàn)嚴(yán)重的泡沫,其泡沫階段的運(yùn)行情況符合LPPL模型中描述的超指數(shù)膨脹及對(duì)數(shù)周期冪律加速振蕩特征.采用LPPL模型可有效預(yù)警2015年6月份上證指數(shù)、創(chuàng)業(yè)板指數(shù)的崩潰. 3)在股票市場(chǎng)泡沫期間,媒體頻繁的帶有煽動(dòng)性正向情感傾向的股評(píng)報(bào)道可引起市場(chǎng)的極度亢奮情緒,使市場(chǎng)的崩盤概率進(jìn)一步加速.通過(guò)在傳統(tǒng)的LPPL模型中納入媒體情緒指標(biāo)MS,構(gòu)建LPPL-MS組合模型預(yù)警上證指數(shù)、創(chuàng)業(yè)板指數(shù)2015年6月份的崩盤,具有更高的預(yù)測(cè)精度,其預(yù)測(cè)大盤見(jiàn)頂?shù)呐R界點(diǎn)相比LPPL模型更接近真實(shí)值.并且其擬合殘差單位根檢驗(yàn)的P值小于LPPL模型,其模型擬合結(jié)果更為穩(wěn)健. 本文的研究結(jié)果有助于政府相關(guān)監(jiān)管當(dāng)局提前預(yù)警股市系統(tǒng)性風(fēng)險(xiǎn),為其提前制定風(fēng)險(xiǎn)管控政策做鋪墊.同時(shí),投資者也借助該模型提前優(yōu)化交易策略,及時(shí)規(guī)避系統(tǒng)性風(fēng)險(xiǎn),減少投資損失.本文將投資者情緒因素納入到LPPL模型,以改進(jìn)LPPL模型預(yù)警效果,然而,股票市場(chǎng)本身作為一個(gè)復(fù)雜系統(tǒng),其市場(chǎng)運(yùn)行規(guī)律受內(nèi)外部多維復(fù)雜因素影響,其不僅僅受市場(chǎng)情緒影響,還受到諸如市場(chǎng)基本面因素、市場(chǎng)技術(shù)面特征、外圍市場(chǎng)沖擊等因素影響,未來(lái)的研究可將上述因素納入到模型當(dāng)中,以進(jìn)一步優(yōu)化模型預(yù)警效果.3.3 LPPL,LPPL-MS擬合結(jié)果O-U過(guò)程檢驗(yàn)
4 結(jié)論