亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Bi-LSTM模型挖掘的股吧投資者情緒對(duì)股價(jià)泡沫的影響

        2023-01-03 06:38:24尹海員楊慶松
        管理學(xué)報(bào) 2022年12期
        關(guān)鍵詞:股價(jià)泡沫投資者

        尹海員 楊慶松

        (陜西師范大學(xué)國(guó)際商學(xué)院)

        1 研究背景

        我國(guó)證券市場(chǎng)發(fā)展速度快,但存在歷史短、投資者成熟度低、個(gè)人投資者占據(jù)主體、市場(chǎng)機(jī)制不健全等問(wèn)題。股票市場(chǎng)充斥著非理性行為,股票價(jià)格暴漲暴跌。研究發(fā)現(xiàn),2000~2017年間我國(guó)股票市場(chǎng)出現(xiàn)了多次泡沫,其中最長(zhǎng)泡沫周期長(zhǎng)達(dá)17個(gè)月,隱藏著巨大的市場(chǎng)風(fēng)險(xiǎn)[1]。

        股價(jià)泡沫是股價(jià)脫離實(shí)際價(jià)值的暴漲暴跌。有效市場(chǎng)理論認(rèn)為,如果金融市場(chǎng)是有效的,股票價(jià)格將及時(shí)反映所有基本面信息,非理性投資者造成的股價(jià)偏離會(huì)被套利者及時(shí)糾正。噪聲交易者理論則認(rèn)為,噪音交易者的預(yù)期往往受到無(wú)意義的市場(chǎng)信號(hào)和情緒的影響,從而造成股票價(jià)格的偏差?,F(xiàn)有文獻(xiàn)也表明,投資者的非理性行為會(huì)降低股價(jià)的信息含量和市場(chǎng)定價(jià)效率[2]。噪音交易者理論成立的前提是:情緒波動(dòng)在噪音交易者之間具有系統(tǒng)相關(guān)性,這往往被理性主義者所駁斥。如果此前提理論上成立,那么投資者群體的過(guò)度樂(lè)觀和悲觀在套利限制存在的市場(chǎng)上,都會(huì)體現(xiàn)在股價(jià)的形成中。情緒通過(guò)羊群效應(yīng)和正反饋效應(yīng)最終促成股價(jià)泡沫的形成。投資者情緒在噪音交易者之間是否具有系統(tǒng)相關(guān)性,是否及如何對(duì)股價(jià)泡沫產(chǎn)生影響?這是本研究需要探討的主要問(wèn)題。

        本研究以滬深300指數(shù)成分股為研究對(duì)象,抓取東方財(cái)富股吧上的個(gè)股評(píng)論文本,通過(guò)搭建雙向長(zhǎng)短時(shí)記憶(Bi-LSTM)模型對(duì)文本進(jìn)行情感分類,構(gòu)建日度投資者情緒指標(biāo);同時(shí),使用PHILLIPS等[3]提出的GSADF法檢驗(yàn)樣本股價(jià)泡沫,利用BSADF法獲得個(gè)股泡沫持續(xù)期及泡沫強(qiáng)度;并在此基礎(chǔ)上建立面板數(shù)據(jù)模型,分析投資者情緒與股價(jià)泡沫之間的內(nèi)在關(guān)系。

        2 文獻(xiàn)綜述

        2.1 投資者情緒挖掘技術(shù)

        金融領(lǐng)域中,傳統(tǒng)的文本情感分析法(如情感詞典匹配法和有監(jiān)督的機(jī)器學(xué)習(xí)法)往往泛化性較弱且會(huì)忽視上下文的語(yǔ)義關(guān)系[4,5]。近年來(lái),深度學(xué)習(xí)模型(如卷積神經(jīng)網(wǎng)絡(luò)CNN和循環(huán)神經(jīng)網(wǎng)絡(luò)RNN等)在文本情感分析領(lǐng)域被廣泛應(yīng)用。其優(yōu)點(diǎn)在于,模型可以考慮到詞語(yǔ)位置并善于處理不規(guī)范和大規(guī)模文本[6]。

        CNN的特點(diǎn)在于,可以提取文本的細(xì)粒度局部特征,其準(zhǔn)確率和召回率等指標(biāo)往往優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)模型,現(xiàn)已被廣泛用于網(wǎng)絡(luò)大數(shù)據(jù)分析中[7]。RNN模型的特征識(shí)別兼顧當(dāng)期輸入和歷史信息,有利于具有時(shí)間依賴關(guān)系的文本序列的情感分類任務(wù)[8]。RNN模型在訓(xùn)練過(guò)程中常出現(xiàn)梯度消失和梯度爆炸問(wèn)題。學(xué)界基于RNN模型進(jìn)行改進(jìn),出現(xiàn)了長(zhǎng)短時(shí)記憶(LSTM)模型、門控循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)模型等。這些模型克服了RNN模型的缺點(diǎn),同時(shí)保留了其可以結(jié)合上下文語(yǔ)義提取文本特征的優(yōu)勢(shì)。LSTM模型目前已被用于金融領(lǐng)域執(zhí)行文本情感分析任務(wù)[9]。Bi-LSTM模型可結(jié)合前后兩個(gè)方向的文本特征進(jìn)行文本情感分類,其分類效果常優(yōu)于LSTM模型[10]。

        2.2 股價(jià)泡沫的檢驗(yàn)

        國(guó)內(nèi)外學(xué)者檢測(cè)股價(jià)泡沫的方法可分為3類:代理變量法、線性檢驗(yàn)?zāi)P秃头蔷€性檢驗(yàn)?zāi)P汀4碜兞糠ㄊ侵甘褂门c股價(jià)泡沫高度相關(guān)的其他金融變量來(lái)量化股價(jià)泡沫,該方法具有間接性,衡量的精準(zhǔn)度存在問(wèn)題。線性檢驗(yàn)?zāi)P褪腔趥鹘y(tǒng)的單位根和協(xié)整檢驗(yàn)的泡沫檢驗(yàn)方法[11]。該類模型不能檢測(cè)出坍塌性泡沫。非線性檢驗(yàn)?zāi)P椭?,基于馬爾可夫區(qū)制轉(zhuǎn)換的檢驗(yàn)方法可檢測(cè)坍塌性泡沫但會(huì)過(guò)度接受泡沫存在的假設(shè)[12],而右尾遞歸單位根(SADF)檢驗(yàn)法不適用于多重和異方差泡沫的檢驗(yàn)[13]。

        2015年,PHILLIPS等[3]提出了GSADF檢驗(yàn)法以及對(duì)應(yīng)的BSADF泡沫持續(xù)期標(biāo)記法。2017年,CASPI[14]在EViews軟件中發(fā)布了GSADF檢驗(yàn)的標(biāo)準(zhǔn)執(zhí)行程序。MONSCHANG等[15]對(duì)比了GSADF檢驗(yàn)法與兩種異方差調(diào)整的GSADF檢驗(yàn)法,發(fā)現(xiàn)BSADF檢驗(yàn)在標(biāo)記泡沫持續(xù)期時(shí),對(duì)數(shù)據(jù)頻率的敏感度更低且檢驗(yàn)精度更高。目前,GSADF檢驗(yàn)被廣泛應(yīng)用于期貨[16]、股票[17]和房地產(chǎn)[18]等各類資產(chǎn)的泡沫檢驗(yàn)中。

        2.3 投資者情緒與股價(jià)泡沫

        股價(jià)泡沫的影響因素可分為宏觀和微觀兩個(gè)視角。宏觀因素主要包括制度因素[19]、信用違約互換利差和波動(dòng)率[20]等。微觀因素主要包括投資者過(guò)度自信及投資者情緒[21]等。

        投資者情緒與股市泡沫關(guān)系的研究大多著眼于市場(chǎng)整體泡沫。如羅衎等[22]以中證800指數(shù)為研究對(duì)象,發(fā)現(xiàn)社會(huì)互動(dòng)會(huì)加劇投資者情緒傳染進(jìn)而加劇市場(chǎng)泡沫。YAO等[23]用主成分分析法構(gòu)建投資者情緒指數(shù),用剩余收益模型提取了股市泡沫,發(fā)現(xiàn)投資者情緒與股市泡沫成正相關(guān)關(guān)系。PAN[24]以標(biāo)準(zhǔn)普爾500指數(shù)為研究對(duì)象,發(fā)現(xiàn)投資者情緒對(duì)股市泡沫的產(chǎn)生概率及泡沫大小有顯著影響。總之,股市泡沫的研究目前以市場(chǎng)整體泡沫的檢驗(yàn)和成因?yàn)橹鳎狈膫€(gè)股視角剖析投資者情緒對(duì)泡沫影響機(jī)理的探討。

        3 研究設(shè)計(jì)

        3.1 數(shù)據(jù)來(lái)源

        本研究以滬深300指數(shù)成分股為研究對(duì)象,研究期為2018年4月3日~2021年5月31日,觀測(cè)頻率為日度數(shù)據(jù)。為保證數(shù)據(jù)的有效性和連續(xù)性,本研究按照以下標(biāo)準(zhǔn)對(duì)樣本進(jìn)行篩選:①剔除金融類上市公司;②剔除在研究期間調(diào)入或調(diào)出滬深300指數(shù)的樣本,以保證研究時(shí)段的連續(xù)性;③剔除在個(gè)股股吧上平均日度發(fā)貼數(shù)量少于10條的樣本,以保證文本挖掘有足夠的容量;④剔除研究期間出現(xiàn)停牌超過(guò)一個(gè)月的樣本。最終獲得142只樣本股作為研究對(duì)象。

        本研究所使用的投資者發(fā)帖文本來(lái)自東方財(cái)富股吧。股吧上的投資者多為散戶投資者。來(lái)源于股吧的投資者情緒更能直接地反映散戶投資者情緒。研究中,散戶投資者由于缺乏有效的市場(chǎng)信息和信息處理能力往往被當(dāng)作噪音交易者。研究噪音交易者的情緒是否對(duì)股價(jià)泡沫產(chǎn)生系統(tǒng)影響具有重要意義。相較于國(guó)內(nèi)其他股票交流論壇,東方財(cái)富網(wǎng)股吧論壇提供了股票行情、公司財(cái)務(wù)數(shù)據(jù)、交易明細(xì)等多維度資料,具有高發(fā)帖頻率和高內(nèi)容質(zhì)量等優(yōu)勢(shì)。本研究使用網(wǎng)絡(luò)爬蟲,抓取了東方財(cái)富股吧上滬深300指數(shù)成分股在研究期內(nèi)的日度發(fā)帖文本、閱讀量和發(fā)帖時(shí)間等內(nèi)容。在剔除“問(wèn)董秘”、投票以及重復(fù)發(fā)帖等無(wú)效發(fā)帖后,共得到8 259 295條文本。其中,樣本個(gè)股日均發(fā)帖量76條,個(gè)股最高日均發(fā)帖量343條,個(gè)股最低日平均發(fā)帖量15條。其余市場(chǎng)變量數(shù)據(jù)來(lái)自于Wind數(shù)據(jù)庫(kù)和RESSET數(shù)據(jù)庫(kù)。為了保證數(shù)據(jù)的準(zhǔn)確性,使用兩個(gè)數(shù)據(jù)庫(kù)對(duì)變量數(shù)據(jù)進(jìn)行了交叉驗(yàn)證。同時(shí),為了緩解極端異常值的影響,對(duì)樣本期間所有連續(xù)變量在1%上下端進(jìn)行Winsorize處理。

        3.2 投資者情緒的度量

        3.2.1Bi-LSTM模型

        神經(jīng)網(wǎng)絡(luò)模型進(jìn)行文本情感分類的基本步驟如下:①文本預(yù)處理:使用正則表達(dá)式及jieba分詞工具,對(duì)文本進(jìn)行噪音字符的過(guò)濾和分詞。②詞典構(gòu)建及詞向量的獲?。簩⑺形谋窘?jīng)文本預(yù)處理后獲得詞語(yǔ)庫(kù);根據(jù)詞庫(kù)中每個(gè)詞語(yǔ)出現(xiàn)的頻率對(duì)其進(jìn)行編號(hào),構(gòu)建詞典;接著利用構(gòu)建好的詞典,將文本轉(zhuǎn)化為數(shù)字序列;再調(diào)用embedding層,將數(shù)字序列化后的文本轉(zhuǎn)化為詞向量矩陣。③數(shù)據(jù)輸入和特征提?。簩⒃~向量矩陣輸入Bi-LSTM模型,根據(jù)訓(xùn)練后的模型參數(shù)提取文本特征。④結(jié)果輸出:將Bi-LSTM模型的輸出結(jié)果輸入到logsoftmax層。softmax函數(shù)的表達(dá)式見(jiàn)式(1),其中y代表Bi-LSTM模型輸出結(jié)果。softmax函數(shù)的計(jì)算結(jié)果為該文本屬于積極或消極某一類別的概率值。logsoftmax函數(shù)是對(duì)softmax函數(shù)計(jì)算結(jié)果的對(duì)數(shù)化處理,可以解決softmax函數(shù)固有的數(shù)值計(jì)算問(wèn)題。根據(jù)logsoftmax輸出值的大小可判斷該文本的具體類別。

        softmax(y)=exp(y)/∑exp(y)。

        (1)

        LSTM模型神經(jīng)元的內(nèi)部結(jié)構(gòu)見(jiàn)圖1。

        圖1 LSTM模型神經(jīng)元內(nèi)部結(jié)構(gòu)

        一個(gè)神經(jīng)元的信息傳播過(guò)程見(jiàn)式(2)~式(8):

        ft=logistic(Wfxt+Ufht-1+bf);

        (2)

        it=logistic(Wixt+Uiht-1+bi);

        (3)

        (4)

        (5)

        ot=logistic(Woxt+Uoht-1+bo);

        (6)

        ht=ot×tanh(Ct);

        (7)

        (8)

        3.2.2Bi-LSTM模型訓(xùn)練、測(cè)試與投資者情緒量化

        本研究使用分層抽樣法,在各樣本股的發(fā)帖中隨機(jī)抽取了8 000條文本作為模型訓(xùn)練集、2 000條文本作為模型測(cè)試集。邀請(qǐng)了10位金融學(xué)碩士分別對(duì)這10 000條訓(xùn)練集和測(cè)試集文本做人工標(biāo)注,將每條文本分為“樂(lè)觀”或“悲觀”兩類。針對(duì)標(biāo)注結(jié)果不一致的文本,10位標(biāo)注者進(jìn)行了集中討論,最終給出一致意見(jiàn),形成最終訓(xùn)練(測(cè)試)集。接著,利用訓(xùn)練集進(jìn)行模型訓(xùn)練,利用測(cè)試集進(jìn)行模型測(cè)試。為提升模型訓(xùn)練速度,在支持GPU的主機(jī)上進(jìn)行模型訓(xùn)練和測(cè)試,主機(jī)型號(hào)為NVIDIA GeForce RTX 3090。訓(xùn)練和測(cè)試結(jié)果表明,模型樣本外準(zhǔn)確率為73%,可以滿足研究精度要求。最后,使用訓(xùn)練后的模型,將8 259 295條文本進(jìn)行情感分類,共得到悲觀發(fā)帖量5 210 227條,樂(lè)觀發(fā)帖量3 049 068條。

        利用式(9)對(duì)樣本進(jìn)行投資者情緒(Se)量化:

        Se=ln((1+Mpos)/(1+Mneg)) ,

        (9)

        式中,Mpos表示某股票在某日的加權(quán)積極情緒帖子總數(shù);Mneg表示某股票在某日的加權(quán)消極情緒帖子總數(shù),權(quán)重為該帖子的閱讀總量。統(tǒng)計(jì)區(qū)間為第t-1日15∶00到第t日15∶00。之所以以閱讀量為權(quán)重,是因?yàn)樘颖旧碇荒艽戆l(fā)帖人的個(gè)人情緒,難以反映股吧上投資者的整體情緒。此外,股吧上存在大量網(wǎng)絡(luò)水軍,他們的發(fā)帖并不能代表其真正情緒和決策。然而,股吧上的發(fā)帖人所表達(dá)的情緒具有傳染性,瀏覽帖子的投資者易受到這些情緒的影響,進(jìn)而在市場(chǎng)上形成強(qiáng)勢(shì)的意見(jiàn)環(huán)境。加權(quán)之后的投資者情緒可以更全面科學(xué)地反映股吧投資者的整體情緒。投資者情緒變量Se會(huì)隨著積極情緒帖子的數(shù)量和閱讀量的增加而提高,反之則降低。當(dāng)Mpos等于Mneg時(shí),該指數(shù)為0。經(jīng)統(tǒng)計(jì),變量Se的均值為-0.145,標(biāo)準(zhǔn)差為0.397,極小值為-5.227,極大值為5.264,偏度-1.764,峰度為42.921。說(shuō)明研究期間內(nèi)投資者情緒偏向悲觀,投資者情緒指數(shù)具有一定的左偏和尖峰性質(zhì)。

        3.3 股價(jià)泡沫的度量

        考慮到市盈率比股票價(jià)格更能反映公司的內(nèi)在價(jià)值,本研究選擇個(gè)股市盈率日度數(shù)據(jù),檢驗(yàn)了樣本股的泡沫存在性,并利用BSADF檢驗(yàn)得到泡沫持續(xù)期。SADF、GSADF以及BSADF檢驗(yàn)三者均是以右尾單位根檢驗(yàn)法為基礎(chǔ),并做進(jìn)一步拓展的檢驗(yàn)方法。一般性右尾單位根檢驗(yàn)的拒絕域在臨界值的左邊,當(dāng)檢驗(yàn)統(tǒng)計(jì)量落入拒絕域,則拒絕序列是平穩(wěn)或單位根過(guò)程的原假設(shè),接受序列變量存在泡沫特征的備擇假設(shè)。SADF、GSADF及BSADF檢驗(yàn)則是在右尾單位根檢驗(yàn)基礎(chǔ)上引入了遞歸思想,具體遞歸過(guò)程如下:

        (10)

        式(10)是SADF檢驗(yàn)統(tǒng)計(jì)量的定義式,其中r0、r1和r2均代表全樣本的部分比例;r0表示最小有效樣本窗口;具體檢驗(yàn)中r1恒等于0并作為樣本窗口起點(diǎn);r2為窗口終點(diǎn),取值范圍為[r0,1]。r2從r0的位置向前遞歸,每次遞歸增加一個(gè)樣本并進(jìn)行一次右尾單位根檢驗(yàn),直到r2取值為1。SADF檢驗(yàn)統(tǒng)計(jì)量等于所有右尾單位根檢驗(yàn)統(tǒng)計(jì)值的上界值。

        (11)

        式(11)是GSADF檢驗(yàn)統(tǒng)計(jì)量的定義式。與SADF檢驗(yàn)不同的是,GSADF檢驗(yàn)起點(diǎn)r1不再恒等于0。r1的取值范圍為[0,r2-r0]。GSADF統(tǒng)計(jì)量被定義為r1和r2所有可行范圍內(nèi)右尾單位根檢驗(yàn)統(tǒng)計(jì)值的最大值。其中,GSADF統(tǒng)計(jì)量的極限分布為

        (12)

        式中,W表示標(biāo)準(zhǔn)維納過(guò)程;rw=(r2-r1),當(dāng)r1=0,r2=1時(shí),該式為ADF統(tǒng)計(jì)量的極限分布;當(dāng)r1=0,r2從[r0,1]之間取值時(shí),該式為SADF統(tǒng)計(jì)量的極限分布。顯然,SADF檢驗(yàn)是GSADF檢驗(yàn)的一種特殊情況,用GSADF法檢驗(yàn)全樣本的泡沫存在性問(wèn)題會(huì)更準(zhǔn)確。BSADF檢驗(yàn)統(tǒng)計(jì)量的定義式為

        (13)

        簡(jiǎn)而言之,BSADF檢驗(yàn)是針對(duì)特定r2進(jìn)行的后向SADF檢驗(yàn)。與正常SADF檢驗(yàn)的區(qū)別在于,BSADF檢驗(yàn)的r2固定,而r1在區(qū)間[0,r2-r1]之間取值。GSADF統(tǒng)計(jì)量與BSADF統(tǒng)計(jì)量的聯(lián)系為

        (14)

        綜上,SADF檢驗(yàn)本質(zhì)上是起點(diǎn)固定,終點(diǎn)向前遞歸的并不斷擴(kuò)充樣本容量的一系列右尾單位根檢驗(yàn)。SADF統(tǒng)計(jì)量則是一系列右尾單位根檢驗(yàn)統(tǒng)計(jì)值的最大值,可以判斷全樣本泡沫的存在性。GSADF檢驗(yàn)是起點(diǎn)和終點(diǎn)均向前遞歸的一系列單位根檢驗(yàn),GSADF統(tǒng)計(jì)量可以對(duì)全樣本進(jìn)行泡沫存在性的檢驗(yàn)。BSADF檢驗(yàn)是終點(diǎn)固定而起點(diǎn)向后遞歸的檢驗(yàn),BSADF統(tǒng)計(jì)量針對(duì)的是部分樣本泡沫存在性的檢驗(yàn)統(tǒng)計(jì)量。因此,針對(duì)每個(gè)可行范圍的r2進(jìn)行BSADF檢驗(yàn),得到BSADF的統(tǒng)計(jì)值序列,該序列與臨界值序列進(jìn)行比較,大于臨界值的位置就是處于泡沫持續(xù)期。

        表1 部分樣本GSADF檢驗(yàn)結(jié)果

        圖2 部分樣本與滬深300指數(shù)的BSADF檢驗(yàn)結(jié)果

        基于上述基礎(chǔ)研究,本研究設(shè)定了劃分泡沫階段的虛擬變量Be,若某股票在某一日處于泡沫持續(xù)期,則Be=1,否則為0。此外,更大的BSADF統(tǒng)計(jì)值意味著更高的泡沫強(qiáng)度,因此本研究設(shè)定衡量泡沫強(qiáng)度指標(biāo)Bs,其值等于某股票在某一日的BSADF檢驗(yàn)統(tǒng)計(jì)值。

        3.4 控制變量

        參考趙汝為等[25]的研究,本研究選取以下變量作為控制變量:①市凈率、市銷率及公司規(guī)模等來(lái)控制公司價(jià)值因素;②凈資產(chǎn)收益率和資產(chǎn)負(fù)債率變化量等來(lái)控制公司財(cái)務(wù)特征因素;③流通股比例變化、股權(quán)集中度變化以及機(jī)構(gòu)持股比例變化等來(lái)控制股權(quán)特征因素;④為了排除市場(chǎng)層面和宏觀經(jīng)濟(jì)周期的影響,選取市場(chǎng)泡沫整體強(qiáng)度及國(guó)內(nèi)生產(chǎn)總值增長(zhǎng)率(G)作為控制變量;⑤為區(qū)分投資者情緒與投資者關(guān)注度的不同,以某股票在某一日所有發(fā)帖的閱讀量之和作為投資者關(guān)注度控制變量;⑥引入解釋變量滯后一期和滯后二期,以考察投資者情緒對(duì)股價(jià)泡沫影響的延續(xù)性。

        本研究主要變量的釋義見(jiàn)表2。

        3.5 基礎(chǔ)回歸模型

        本研究的被解釋變量包括泡沫存在性(Be)和泡沫強(qiáng)度(Bs),分別建立面板Logit回歸模型和面板回歸模型進(jìn)行主回歸檢驗(yàn)。經(jīng)過(guò)初步檢驗(yàn),兩模型中均具有顯著的個(gè)體效應(yīng),拒絕使用混合回歸模型的原假設(shè)。進(jìn)一步經(jīng)過(guò)Hausman檢驗(yàn)后發(fā)現(xiàn),兩模型均拒絕了隨機(jī)效應(yīng)模型的原假設(shè)。最終構(gòu)建兩個(gè)個(gè)體固定效應(yīng)基礎(chǔ)回歸模型,即泡沫存在性的面板Logit模型和泡沫強(qiáng)度的面板回歸模型:

        (15)

        Bs=α0+β1Se+∑βkC+γ。

        (16)

        式中,Be=1則代表泡沫存在;α0為截距項(xiàng);β1、βk為系數(shù);C為系列控制變量;γ為擾動(dòng)項(xiàng)。

        4 實(shí)證分析

        4.1 描述性統(tǒng)計(jì)與相關(guān)性分析

        主要變量的描述性統(tǒng)計(jì)結(jié)果見(jiàn)表3。表3中,變量PB和PS因個(gè)別股票停牌存在少量數(shù)據(jù)缺失;變量Dc、Di、Do、Dr和Dl因經(jīng)過(guò)差分處理,樣本總量均減少142。本研究后續(xù)所有回歸模型中,因各控制變量樣本量存在差異、各回歸模型自身要求以及分組回歸要求等原因,樣本量各有不同。由表3可知:①因變量Be的均值為0.051。結(jié)合前文GSADF檢驗(yàn)結(jié)果:142只樣本股中的61.7%顯著存在泡沫,綜合說(shuō)明在橫截面方向個(gè)股泡沫出現(xiàn)的頻率較高,但是在時(shí)間序列上個(gè)股泡沫出現(xiàn)的頻率并不高,與現(xiàn)實(shí)情況較為吻合。經(jīng)統(tǒng)計(jì),所有泡沫的平均持續(xù)天數(shù)為5.21天;②因變量Bs整體上呈現(xiàn)右偏、尖峰分布且其正向極端值較大;③第9列展示了所有變量的平穩(wěn)性檢驗(yàn)結(jié)果,可以發(fā)現(xiàn)所有變量均為平穩(wěn)序列;④第10列是按照某股票在某一日是否存在泡沫將樣本觀測(cè)值分為兩組后,針對(duì)其余變量所做的均值T檢驗(yàn),結(jié)果顯示解釋變量Se以及大部分控制變量在兩組之間均顯著存在差異。通過(guò)變量之間的相關(guān)性檢驗(yàn)結(jié)果(1)限于篇幅,變量之間的相關(guān)系數(shù)矩陣表格未展示,留存?zhèn)渌?。發(fā)現(xiàn),因變量Be、Bs與當(dāng)期投資者情緒Se顯著正相關(guān),與其余控制變量也顯著相關(guān)。

        4.2 投資者情緒對(duì)泡沫存在性的影響

        投資者情緒對(duì)泡沫存在性和泡沫強(qiáng)度的影響見(jiàn)表4。表4 中列(2)和列(3)分別為依次加入自變量滯后一期、滯后二期與其余控制變量的回歸結(jié)果??梢钥闯觯谒谢貧w結(jié)果中,投資者情緒Se均在1%的水平上顯著正向影響泡沫存在性Be??刂谱兞糠矫妫瑴笠黄诤蜏蠖谕顿Y者情緒Se-1和Se-2系數(shù)均小于當(dāng)期投資者情緒系數(shù);投資者情緒對(duì)泡沫存在概率的正向影響具有一定的延續(xù)性;投資者關(guān)注度A對(duì)泡沫存在的概率也具有顯著正向影響,但其系數(shù)小于Se、Se-1和Se-2的系數(shù);市凈率PB、市銷率PS和公司規(guī)模Si均顯著正向影響股價(jià)泡沫的存在概率。列(3)中,Dr和Dl對(duì)泡沫存在概率的影響不顯著,說(shuō)明泡沫存在概率對(duì)公司收益和公司債務(wù)的變化并不敏感;Di、Do和Dc對(duì)泡沫存在概率的影響不顯著;G和Bm顯著正向影響泡沫的存在概率,即個(gè)股泡沫存在概率隨國(guó)內(nèi)宏觀經(jīng)濟(jì)水平和市場(chǎng)泡沫強(qiáng)度的提高而提高。

        4.3 投資者情緒對(duì)泡沫強(qiáng)度的影響

        由表4的列(4)~列(6)可知,在所有回歸結(jié)果中,投資者情緒至少在10%的水平上對(duì)泡沫強(qiáng)度具有顯著正向影響??刂谱兞糠矫妫琒e-1和Se-2對(duì)泡沫強(qiáng)度的影響在加入所有控制變量后不再顯著,投資者情緒對(duì)泡沫強(qiáng)度的正向影響延續(xù)性不強(qiáng);投資者關(guān)注度A對(duì)泡沫強(qiáng)度具有顯著正向影響,但其系數(shù)小于Se的系數(shù);市凈率PB和市銷率PS顯著正向影響股價(jià)泡沫強(qiáng)度;公司規(guī)模Si對(duì)泡沫強(qiáng)度的影響不顯著;Dr和Dl對(duì)股價(jià)泡沫強(qiáng)度的影響不顯著,說(shuō)明股價(jià)泡沫強(qiáng)度對(duì)公司收益和公司債務(wù)變化的敏感度不高。同理,股價(jià)泡沫強(qiáng)度對(duì)機(jī)構(gòu)持股比例變化Di、流通股比例變化Do和股權(quán)集中度變化Dc也不敏感。最后,市場(chǎng)泡沫強(qiáng)度Bm顯著正向影響個(gè)股泡沫強(qiáng)度,而G對(duì)個(gè)股泡沫強(qiáng)度的影響不顯著。

        表4 投資者情緒對(duì)泡沫存在性和泡沫強(qiáng)度的影響

        5 進(jìn)一步研究:異質(zhì)性和中介路徑

        5.1 投資者情緒對(duì)股價(jià)泡沫影響的異質(zhì)性分析

        根據(jù)已有研究[26],投資者情緒對(duì)股票收益率的影響受股權(quán)集中度和產(chǎn)權(quán)性質(zhì)等因素的影響顯著。投資者情緒對(duì)股價(jià)泡沫的影響是否因公司規(guī)模、股權(quán)集中度等截面特征的不同而存在異質(zhì)性,需進(jìn)一步討論?;诠疽?guī)模的子樣本異質(zhì)性分析結(jié)果見(jiàn)表5。本研究按照公司市值是否小于中位數(shù)的標(biāo)準(zhǔn),將全部樣本分為小規(guī)模和大規(guī)模兩組子樣本。由表5可知,無(wú)論因變量是Be還是Bs,無(wú)論是否加入Se-1和Se-2,小規(guī)模樣本組Se的系數(shù)絕對(duì)值均大于大規(guī)模樣本組Se的系數(shù)絕對(duì)值,顯著性水平也是如此,說(shuō)明當(dāng)期投資者情緒對(duì)股價(jià)泡沫存在概率以及泡沫強(qiáng)度的影響,隨公司規(guī)模的擴(kuò)大而減弱?;诠蓹?quán)集中度差異和產(chǎn)權(quán)性質(zhì)的分組回歸結(jié)果(2)限于篇幅,基于股權(quán)集中度差異和產(chǎn)權(quán)性質(zhì)的分組回歸結(jié)果未展示,留存?zhèn)渌?。可知,無(wú)論是否加入Se-1和Se-2,Se對(duì)Be和Bs的正向影響隨股權(quán)集中度的提高而降低??赡艿脑蛟谟?,股權(quán)集中度是衡量公司股權(quán)分布狀態(tài)和公司穩(wěn)定性的指標(biāo),股權(quán)集中度越高,公司決策效率以及穩(wěn)定性也越高,應(yīng)對(duì)突發(fā)事件的能力也越強(qiáng),泡沫出現(xiàn)的概率和強(qiáng)度也越低。此外,非國(guó)有企業(yè)當(dāng)期投資者情緒對(duì)泡沫存在概率以及泡沫強(qiáng)度的正向影響相比國(guó)有企業(yè)更強(qiáng),國(guó)有企業(yè)的股價(jià)相對(duì)更穩(wěn)定。

        表5 基于公司規(guī)模的異質(zhì)性分析回歸結(jié)果

        5.2 中介效應(yīng)檢驗(yàn)

        已有研究發(fā)現(xiàn),投資者情緒通過(guò)影響市場(chǎng)交易量進(jìn)而影響股票收益率[27]。趙宣凱等[28]也發(fā)現(xiàn),市場(chǎng)情緒越高,盈余公告前的股票交易量越大,投資者的投機(jī)行為也越瘋狂。王高義[29]的研究也表明,超額交易量與未來(lái)股價(jià)泡沫破滅概率顯著正相關(guān)。理論上,投資者情緒直接影響的是投資者決策行為,具有積極情緒的投資者傾向于買入股票;反之,傾向于賣出股票。隨著市場(chǎng)上積極情緒的積累,看漲買入股票的投資者逐漸增多,交易量增大,股價(jià)提高,加之股市羊群效應(yīng)、正反饋效應(yīng)以及套利限制的存在,股價(jià)泡沫快速出現(xiàn);隨著市場(chǎng)上消極情緒的醞釀,看跌賣出股票的投資者增多,交易量同樣增大,而股價(jià)下跌,泡沫破裂。泡沫的產(chǎn)生和破滅過(guò)程雖然均伴隨交易量的激增,但由于股價(jià)的表現(xiàn)不同,最終體現(xiàn)為總交易金額的不同。因此可以認(rèn)為,投資者情緒以個(gè)股交易金額為中介對(duì)股價(jià)泡沫產(chǎn)生影響。為了驗(yàn)證上述猜想,本研究使用個(gè)股日度交易金額作為中介變量,進(jìn)行中介效應(yīng)檢驗(yàn),符號(hào)表示為Vo。參考溫忠麟等[30]的做法,建立如下面板數(shù)據(jù)中介效應(yīng)模型:

        D=α0+β1Se+∑βkC+γ;

        (17)

        M=α0+β1Se+∑βkC+γ;

        (18)

        D=α0+β1Se+β2M+∑βkC+γ,

        (19)

        式中,D代表因變量Be或Bs;M代表中介變量Vo;β2為M的系數(shù)。

        中介效應(yīng)的檢驗(yàn)結(jié)果見(jiàn)表6。由表6可知,當(dāng)期投資者情緒Se顯著正向影響個(gè)股日度交易總金額Vo;在沒(méi)有加入中介變量之前,Se顯著正向影響B(tài)e和Bs;在加入中介變量之后,Vo在1%的水平上顯著正向影響B(tài)e和Bs;Se對(duì)泡沫存在概率、泡沫強(qiáng)度的影響系數(shù)和顯著性水平相對(duì)加入中介變量前有所下降。上述結(jié)果表明,投資者情緒以個(gè)股當(dāng)期交易總金額為中介,正向影響泡沫出現(xiàn)的概率及泡沫強(qiáng)度。該結(jié)論由Sobel檢驗(yàn)也可得到證實(shí):Sobel、good1及good2統(tǒng)計(jì)值均顯著拒絕不存在中介效應(yīng)的原假設(shè)。此外,Sobel檢驗(yàn)結(jié)果表明,投資者情緒通過(guò)個(gè)股當(dāng)期交易總金額對(duì)泡沫存在概率具有22.2%的中介效應(yīng),對(duì)泡沫強(qiáng)度具有56.4%的中介效應(yīng)。

        6 內(nèi)生性討論與穩(wěn)健性檢驗(yàn)

        6.1 內(nèi)生性討論:工具變量檢驗(yàn)

        為盡量消除內(nèi)生性問(wèn)題,在實(shí)證中使用固定效應(yīng)模型,并盡可能多地選擇了可能影響股價(jià)泡沫的控制變量,但仍存在由雙向因果造成的內(nèi)生性問(wèn)題。本研究選擇同行業(yè)同期的其他公司投資者情緒均值(符號(hào)表示為Seo)作為工具變量進(jìn)行檢驗(yàn)。檢驗(yàn)結(jié)果見(jiàn)表7。表7中列(1)的F值為16.456,大于10,不存在弱工具變量問(wèn)題。由列(2)和列(3)的工具變量回歸結(jié)果可知,當(dāng)期投資者情緒仍至少在10%的水平上顯著正向影響股價(jià)泡沫強(qiáng)度和泡沫存在概率,這證明了前文實(shí)證結(jié)果的可靠性。

        表6 交易金額的中介效應(yīng)檢驗(yàn)

        表7 工具變量及DID模型檢驗(yàn)

        6.2 內(nèi)生性討論:DID檢驗(yàn)

        變量遺漏問(wèn)題可能是造成本研究?jī)?nèi)生性問(wèn)題的來(lái)源之一。雙重差分模型(DID)可以通過(guò)組內(nèi)差分和組間差分,將隨時(shí)間變化和不變的擾動(dòng)項(xiàng)剔除掉,進(jìn)而更有效地排除潛在的內(nèi)生性問(wèn)題。DID模型需要將樣本在橫截面維度和時(shí)間序列維度各分為兩類。橫截面維度上,本研究將樣本股票分為國(guó)有和非國(guó)有兩類,設(shè)置虛擬變量OW,OW=1代表上市公司為國(guó)有企業(yè);否則為非國(guó)有企業(yè)。時(shí)間序列維度上,本研究的研究期橫跨國(guó)內(nèi)新冠疫情爆發(fā)時(shí)間點(diǎn) 2019年12月8日,因此以新冠疫情爆發(fā)時(shí)間為節(jié)點(diǎn)劃分研究期,設(shè)置虛擬變量CV,CV=1代表時(shí)間處于2019年12月8日之后,新冠疫情爆發(fā);否則處于2019年12月8日之前。設(shè)置變量Did代表OW和CV的交乘項(xiàng),建立DID模型,觀察DID模型下內(nèi)生性問(wèn)題是否存在,并進(jìn)一步觀察疫情爆發(fā)對(duì)不同產(chǎn)權(quán)性質(zhì)樣本股價(jià)泡沫的影響是否存在顯著差異。

        本研究截取了2019年12月8日前后各兩個(gè)月時(shí)間的數(shù)據(jù)做平衡趨勢(shì)檢驗(yàn),結(jié)果見(jiàn)圖3。圖3(a)被解釋變量為Be,圖3(b)被解釋變量為Bs。由圖3可知,疫情爆發(fā)前,國(guó)有企業(yè)的平均泡沫存在概率和平均泡沫強(qiáng)度均低于非國(guó)有企業(yè),但二者趨勢(shì)類似;平衡趨勢(shì)檢驗(yàn)通過(guò)疫情爆發(fā)后,二者趨勢(shì)出現(xiàn)明顯不同。

        圖3 平衡趨勢(shì)檢驗(yàn)結(jié)果

        圖4 安慰劑檢驗(yàn)結(jié)果

        表7的列(4)~列(7)為DID模型的檢驗(yàn)結(jié)果。首先,無(wú)論是否加入Se-1和Se-2,Se對(duì)Be及Bs的正向影響依然顯著,本研究主要結(jié)論依然成立;其次,變量CV對(duì)Be具有顯著負(fù)向影響,對(duì)Bs的負(fù)向影響不顯著,說(shuō)明新冠疫情的爆發(fā)對(duì)非國(guó)有企業(yè)股價(jià)泡沫存在概率的抑制作用顯著,而對(duì)泡沫強(qiáng)度的抑制作用不明顯;同時(shí),變量Did對(duì)Be具有顯著正向影響,對(duì)Bs的正向影響不顯著,說(shuō)明國(guó)有企業(yè)與非國(guó)有企業(yè)之間泡沫存在概率的差因疫情爆發(fā)出現(xiàn)顯著變化。結(jié)合圖3可以看出,這種變化呈縮小的趨勢(shì)。其原因可能在于,疫情爆發(fā)后,投資者為了規(guī)避市場(chǎng)風(fēng)險(xiǎn)更多地選擇國(guó)有企業(yè)股票投資,使得國(guó)有企業(yè)股價(jià)泡沫出現(xiàn)的概率提高。

        6.3 內(nèi)生性討論:PSM檢驗(yàn)

        為排除樣本選擇問(wèn)題帶來(lái)的內(nèi)生性問(wèn)題,繼續(xù)利用傾向評(píng)分匹配法(PSM)檢驗(yàn)。按照投資者情緒Se高低,將大于80%分位數(shù)的樣本作為實(shí)驗(yàn)組,將小于40%分位數(shù)的樣本作為對(duì)照組,利用除Se以外的所有控制變量作為計(jì)算傾向匹配得分的特征變量,進(jìn)行一對(duì)一最近鄰匹配,結(jié)果見(jiàn)表8。由表8可知,高投資者情緒組對(duì)泡沫存在概率及泡沫強(qiáng)度的平均處理效應(yīng)(ATT)均在10%的水平上顯著為正,說(shuō)明投資者情緒越高,泡沫存在的概率和泡沫強(qiáng)度越大,這與前文結(jié)論一致。

        表8 PSM檢驗(yàn)結(jié)果

        6.4 穩(wěn)健性檢驗(yàn):安慰劑檢驗(yàn)

        為排除偶然因素的影響,進(jìn)行如下安慰劑檢驗(yàn):①將所有投資者情緒隨機(jī)打亂,生成虛擬投資者情緒;②利用虛擬投資者情緒、原被解釋變量及原控制變量重新回歸;③提取回歸結(jié)果中當(dāng)期虛擬投資者情緒系數(shù)以及對(duì)應(yīng)顯著性水平。重復(fù)上述步驟500次,所得系數(shù)及對(duì)應(yīng)顯著性水平的p值結(jié)果見(jiàn)圖4。由圖4可知,無(wú)論被解釋變量是Be還是Bs,500次模擬所得虛擬投資者情緒的估計(jì)系數(shù)絕對(duì)值均遠(yuǎn)小于對(duì)應(yīng)基準(zhǔn)回歸結(jié)果的系數(shù),并以0為中心呈對(duì)稱分布;大部分虛擬情緒所得系數(shù)的對(duì)應(yīng)p值大于0.1,即不顯著,可以認(rèn)為基準(zhǔn)回歸結(jié)果并非偶然因素引起。

        6.5 穩(wěn)健性檢驗(yàn):變量替換

        參考陳浪南等[17]的方法,本研究利用Hp濾波法剔除收盤價(jià)中的趨勢(shì)性成分,并定義價(jià)格偏離趨勢(shì)性成分的部分為泡沫強(qiáng)度,用Hps表示用該指標(biāo)替換原泡沫強(qiáng)度Bs作為因變量,驗(yàn)證結(jié)果的穩(wěn)健性,檢驗(yàn)結(jié)果見(jiàn)表9。由表9可知,首先,列(1)和列(3)中投資者情緒對(duì)泡沫強(qiáng)度的影響均在至少10%的水平上顯著為正;其次,逐步回歸和Sobel檢驗(yàn)證明,投資者情緒確以日度交易金額為中介對(duì)泡沫強(qiáng)度產(chǎn)生正向影響。檢驗(yàn)結(jié)果再次證明了本研究結(jié)論的穩(wěn)健性。

        表9 投資者情緒影響個(gè)股泡沫強(qiáng)度的穩(wěn)健性檢驗(yàn)

        7 結(jié)語(yǔ)

        本研究在抓取東方財(cái)富股吧個(gè)股日內(nèi)實(shí)時(shí)發(fā)帖的基礎(chǔ)上,利用Bi-LSTM模型進(jìn)行文本情感分類,并構(gòu)建了投資者情緒指標(biāo);同時(shí),基于GSADF法檢驗(yàn)了個(gè)股泡沫情況,并利用BSADF檢驗(yàn)法得到個(gè)股泡沫持續(xù)期和泡沫強(qiáng)度。進(jìn)一步地,通過(guò)構(gòu)建面板數(shù)據(jù)模型,分析了投資者情緒與股價(jià)泡沫的內(nèi)在關(guān)系。實(shí)證結(jié)果表明:①投資者情緒對(duì)個(gè)股泡沫存在概率以及泡沫強(qiáng)度的影響顯著。投資者情緒越高,股價(jià)泡沫存在概率和泡沫強(qiáng)度也越大。②本研究從股權(quán)集中度、公司規(guī)模和產(chǎn)權(quán)性質(zhì)3個(gè)方面進(jìn)行了異質(zhì)性分析,發(fā)現(xiàn)投資者情緒對(duì)股價(jià)泡沫的影響存在截面異質(zhì)性。在小規(guī)模、低股權(quán)集中度和非國(guó)有屬性公司中,投資者情緒對(duì)股價(jià)泡沫的正向影響更強(qiáng)。③中介效應(yīng)檢驗(yàn)結(jié)果發(fā)現(xiàn),投資者情緒以當(dāng)期交易總金額為中介對(duì)股價(jià)泡沫產(chǎn)生正向影響。利用工具變量回歸、DID模型和PSM法探討內(nèi)生性問(wèn)題,并通過(guò)安慰劑檢驗(yàn)和變量替換等方法進(jìn)行了穩(wěn)健性檢驗(yàn),發(fā)現(xiàn)上述研究結(jié)論依然成立。

        本研究理論上豐富了關(guān)于股價(jià)泡沫成因的相關(guān)文獻(xiàn)。實(shí)踐上,本研究結(jié)論表明:在移動(dòng)互聯(lián)時(shí)代,來(lái)自社交媒體的投資者情緒在一定程度上可以有效預(yù)測(cè)股價(jià)泡沫。這給監(jiān)管者、投資者和上市公司均提供了一定的建議:①監(jiān)管者一方面要靈活運(yùn)用互聯(lián)網(wǎng)信息進(jìn)行風(fēng)險(xiǎn)預(yù)警,注意利用互聯(lián)網(wǎng)投資者情緒識(shí)別股價(jià)泡沫過(guò)程中因公司規(guī)模等因素產(chǎn)生的異質(zhì)性問(wèn)題;另一方面又要加強(qiáng)網(wǎng)絡(luò)信息的監(jiān)管力度,擴(kuò)大監(jiān)管范圍,杜絕網(wǎng)絡(luò)謠言快速傳播造成的泡沫現(xiàn)象。②對(duì)于投資者來(lái)說(shuō),既要善于甄別網(wǎng)絡(luò)謠言,避免盲目跟風(fēng)、追漲殺跌;又要善于運(yùn)用投資者情緒和交易金額等常見(jiàn)指標(biāo)識(shí)別股價(jià)泡沫,提高自身的專業(yè)素養(yǎng)和決策能力。③上市公司要及時(shí)關(guān)注投資者情緒,及時(shí)披露高質(zhì)量信息、澄清市場(chǎng)謠言,在提升公司自身盈利能力和內(nèi)在價(jià)值等硬實(shí)力的基礎(chǔ)上,防止由于社交網(wǎng)絡(luò)媒體情緒偏離導(dǎo)致的股票價(jià)格泡沫。

        本研究還存在一定不足,由于股吧上投資者的發(fā)帖往往不具有規(guī)范性,Bi-LSTM模型的文本情感分類效果雖然可以滿足研究需求,但分類精度仍然有限,未來(lái)需要繼續(xù)完善模型,提高文本分類的準(zhǔn)確率。

        猜你喜歡
        股價(jià)泡沫投資者
        ?十不該(股市)
        毒泡沫
        投資者
        廢棄的泡沫盒
        聊聊“普通投資者”與“專業(yè)投資者”
        “搞死”國(guó)家的泡沫
        盤中股價(jià)升跌引起持股者情緒變化
        新興市場(chǎng)對(duì)投資者的吸引力不斷增強(qiáng)
        股價(jià)創(chuàng)股災(zāi)以來(lái)新低的股票
        好泡沫與壞泡沫
        精品无码一区在线观看| 中文字幕亚洲一区视频| 日本一区二区视频高清| 噜噜综合亚洲av中文无码| 私人毛片免费高清影视院| 欧美性大战久久久久久久| 亚洲色www无码| 抽搐一进一出试看60秒体验区| 99久久精品一区二区三区蜜臀 | 久久久久亚洲av无码专区喷水 | 破了亲妺妺的处免费视频国产| 国产亚洲精品国看不卡| 日本女u久久精品视频| 99re66在线观看精品免费| 免费1级做爰片1000部视频| 少妇久久久久久被弄到高潮 | 丰满女人猛烈进入视频免费网站| 把女邻居弄到潮喷的性经历| 俺来也俺去啦久久综合网| 91免费国产高清在线| 成人水蜜桃视频在线观看| 亚洲av成人片色在线观看 | 麻豆国产在线精品国偷产拍| 这里有精品可以观看| 国产精品亚洲精品日产久久久| 国产av普通话对白国语| 成年网站在线91九色| 亚洲熟妇色自偷自拍另类| 国产99久久久国产精品免费看| 在线播放国产一区二区三区| 精品国产性色av网站| 亚洲中文字幕免费精品| 91精品亚洲成人一区二区三区| 扒开腿狂躁女人爽出白浆| 亚洲一区av无码少妇电影| 亚洲a∨好看av高清在线观看 | 亚洲精品国精品久久99热一| 在线观看av片永久免费| 91l视频免费在线观看| 丰满少妇被粗大猛烈进人高清| 最好看的最新高清中文视频|