李 巖,金德環(huán),2
(1.上海財經(jīng)大學 金融學院;2.上海市金融信息技術研究重點實驗室,上海 200433)
經(jīng)典金融學理論往往忽視對投資者情緒的研究,他們認為理性投資者間的競爭將導致市場的有效性,少數(shù)非理性投資者對市場的影響也會被套利者的交易所矯正。然而,近年來國內外學者發(fā)現(xiàn)的眾多金融異象無法被傳統(tǒng)理論解釋,有關投資者情緒的研究正是當前學術研究的熱點問題。本文通過構建理論模型證明投資者情緒是影響股票收益的一個重要因素,同時這種影響與情緒交易者的多寡有關。
本文參考Anteiler和Frank的方法,以社交媒體——東方財富網(wǎng)股吧論壇為研究對象,利用計算機爬蟲技術抓取了東方財富股吧數(shù)據(jù),并借助機器學習輔加文本分析的方法對發(fā)帖人的情感進行分類處理,以過去一個月內數(shù)據(jù)為基礎構造投資者情緒指標。本文的指標具有連續(xù)性,其覆蓋了個股的各個時間段,這有助于進行深入研究。
相比以往研究,本文的貢獻主要體現(xiàn)在:(1)出于數(shù)據(jù)可得性原因,現(xiàn)有文獻較少從個股層面出發(fā)研究投資者情緒,本文對其做了補充。同時,不同于傳統(tǒng)的實證研究,本文的網(wǎng)絡數(shù)據(jù)是一大亮點,網(wǎng)絡非標數(shù)據(jù)的合理使用必將擴寬現(xiàn)有研究的邊界,本文有助于推動網(wǎng)絡數(shù)據(jù)在金融經(jīng)濟學研究中的廣泛應用。(2)本文的結論為上市公司利用社交媒體營造透明的信息環(huán)境具有啟發(fā)意義,對監(jiān)管部門制定相應的監(jiān)管標準也具有一定的參考價值。
本文考慮包含一個無風險資產(chǎn)和一個風險資產(chǎn)的單期模型,其中無風險資產(chǎn)的價格恒定為1,風險資產(chǎn)的期初價格為p,期末價格為v。假設v服從期望為,精度(方差的倒數(shù))為τv的正態(tài)分布。模型中有兩大類投資者:(1)理性投資者,占比為1-μ。為簡化起見,本文假設理性投資者對于v的信息認知不包含其他噪音,服從Nˉ,1/τv);(2)情緒交易者,占比為 μ 。他們對于v的信息認知為這里ei為投資者情緒對信息的影響,ˉ衡量了投資者情緒的大小。除此之外,假定風險資產(chǎn)的供給恒定為1,兩類投資者均按照風險厭惡系數(shù)為γ的CARA效用函數(shù)進行投資,即在期初最大化效用函數(shù)U(W)=-exp(-γW)。
基于已有信息,投資者通過最大化期末預期資產(chǎn)的效用來決定最優(yōu)投資決策,CARA效用函數(shù)的假定將問題歸結為最大化是投資者的信息集。若投資者期初的財富為W0,對風險資產(chǎn)的需求為d,則期末財富 W=W0+d*(v-p)。故 E(W|F)=W0+d(E(v|F)-p),Var(W|F)=d2Var(v|F),求解最優(yōu)函數(shù) ,得到
證明:理性投資者的信息集為 F={p},則 E(v|F)=vˉ,
命題:本文的模型存在如下均衡解。情緒交易者的信息集為F=
風險資產(chǎn)的均衡價格滿足市場出清的條件:
將dr和de帶入式(2)有:
整理得:
易知命題成立。
假設1:在其他條件相同的情況下,投資者情緒與股票收益間存在正相關關系。
假設2:情緒交易者越多,投資者情緒對股票收益的正向影響越大。
受限于投資者情緒指標的構造,本文樣本選擇滬深兩市A股2010—2016年的數(shù)據(jù),數(shù)據(jù)頻率為月度的。對初始數(shù)據(jù)進行了適當處理:首先,剔除數(shù)據(jù)缺失的樣本,其次,剔除樣本期間被ST、*ST的樣本和金融保險類上市公司;最后,為降低極端值的影響,所有指標都在1%和99%分位上做了縮尾處理。本文除了網(wǎng)絡數(shù)據(jù)來自東方財富網(wǎng)以外,其他數(shù)據(jù)均來自CSMAR數(shù)據(jù)庫。
(1)月收益率(Ret)
股票的月收益率是本文的主要被解釋變量。
(2)投資者情緒變量(Senti)
為構造投資者情緒指標,首先利用樸素貝葉斯方法對近一億條原始數(shù)據(jù)進行“正面”“中立”和“負面”分類處理。分類的具體步驟包括:第一,從全部樣本中隨機選取20000條帖子進行人工分類處理,然后從分類好的樣本中隨機選擇15000條帖子作為可用數(shù)據(jù)集,其中“正面”“中立”和“負面”各5000條;第二,隨機取13500條帖子作為訓練數(shù)據(jù)集,使用樸素貝葉斯方法對訓練數(shù)據(jù)集進行訓練并建立分類模型,這里“正面”“中立”和“負面”各4500個樣本。接著用分類模型對剩下的1500條樣本進行分類處理,結果詳如表1所示。一方面,模型對“正面”“中立”和“負面”正確分類的概率分別為64.4%、67.6%和68.2%。另一方面,從整個樣本的角度看,模型判斷為“正面”的數(shù)目是原“正面”數(shù)目的87.4%,等價于模型將12.6%的“正面”樣本判斷錯了。同理,“中立”和“負面”的錯誤判斷率為16.6%和4%,模型具有較高的準確度;第三,使用訓練出來的模型對原始數(shù)據(jù)進行分類。
表1 機器學習分類結果
參考Antweiler和Frank(2004)的方法,投資者情緒指標構造如下:
其中,Positive為股票當月論壇討論中正面情緒的帖子數(shù)量,Negative為負面情緒帖子的數(shù)量。Senti表示個股當月論壇討論中正負面情緒的差額占所有正負面情緒的比例,數(shù)值越大,則投資者情緒越高漲,數(shù)值越小投資者情緒越低落。
(3)情緒交易者數(shù)量(SenNum)
用當月發(fā)帖數(shù)的對數(shù)來衡量,論壇發(fā)帖越多,中小投資者的關注度越大,情緒交易者也就越多。
(4)其他控制變量
除此之外,還控制了機構投資者持股比例(Hold)、分析師覆蓋(Lanalyst)、非流動性(Ill)、市值(Size)、貝塔(Beta)、賬面市值比(Bm)、動量(Mom)等變量,具體變量說明如表2所示。
表2 變量定義與度量
首先,本文運用如下模型來檢驗投資者情緒對股票收益的影響,進而驗證假設1:
其中,Ret為月收益率,Senti是利用文本分析和機器學習方法得到了投資者情緒指標,Senti越大說明投資者情緒越高漲,情緒交易者越容易受到影響,Control為本文所選控制變量。若假設1成立,β1系數(shù)應顯著為正。特別地,本文借鑒Fama-MacBeth的方法對以上模型進行相關估計,具體分為兩步:第一步,在不同時間點上對以上方程做橫截面回歸,得到方程系數(shù)的時間序列;第二步,對系數(shù)的時間序列數(shù)據(jù)做T檢驗。
其次,為進一步證實投資者情緒對股票收益的影響主要是由于情緒交易者的原因,本文還估計了以下方程:
這里,SenNum是指示情緒交易者多少的變量,如果假設2成立,則β2的系數(shù)應顯著為正。
表3前兩列集中了投資者情緒對股票收益的影響分析。在第一列中,Senti的系數(shù)在時間序列上的均值為2.464,T值為6.66,在1%的統(tǒng)計水平下顯著。投資者情緒與股票收益間存在正相關關系,投資者情緒高漲時,投資者一致看多。受情緒的影響,情緒交易者更容易做出買入決策,交易的不對稱性驅動股價的持續(xù)上漲。其他控制變量方面:Ill顯著為正,流動性差的股票收益較高;Size顯著為負與小公司效應相一致;Beta不顯著,高Beta股票在市場上漲時漲的多,在市場下跌時跌的多,整體看與股票收益間的關系并不明確;Bm的系數(shù)不顯著,我國股票市場起步較晚,投資者的投資理念還不夠成熟,市場中投機炒作現(xiàn)象明顯,公司價值不能充分反映在股價中;Mom顯著為負表明我國市場中存在著短期一月內的收益反轉效應。在第二列中,還加入了Hold和Lanalyst,Senti的系數(shù)依然顯著為正。表3前兩列的結果表明投資者情緒越高股票收益越大,與假設1的預期一致。
表3后兩列給出了模型(4)的實證檢驗結果。在第三列中,投資者情緒和情緒交易者數(shù)量交叉項的系數(shù)為1.444,在1%的水平下顯著為正,表明市場中情緒交易者越多,股票收益受到投資者情緒的影響也就越大,投資者情緒主要通過情緒交易者的交易融入股價中。第四列中,在額外控制機構投資者和分析師的因素外,結論未變。表3后兩列的研究結果支持假設2。
為保證研究結論的穩(wěn)健性,本文還構建了如下投資者情緒指標:
SentiNew的數(shù)值越大,投資者情緒越高。本文假設的檢驗結果如表4所示,假設1和假設2的結論依然成立,說明本文的研究具有較強的穩(wěn)健性。
作為傳統(tǒng)金融學理論的重要補充,投資者情緒的研究備受國內外學者的關注,針對情緒交易者行為的研究極具重要的理論意義與實踐價值。在此背景下,本文建立了投資者情緒與股票收益間的理論模型來揭示兩者間的內在聯(lián)系,并用數(shù)據(jù)對相關結論進行了實證檢驗。具體而言,本文使用網(wǎng)絡爬蟲技術從東方財富股吧論壇中抓取了股票的歷史討論數(shù)據(jù),借助文本分析和機器學習的方法對論壇中帖子所持情感進行分類處理,構造投資者情緒指標。相比傳統(tǒng)指標,本文的指標更直觀,同時可以有效反映個股投資者情緒的變化。本文的研究結論表明短期內投資者情緒會影響情緒交易者對股價的判斷,并經(jīng)情緒交易者的交易融入股價,致使其與股票收益間呈正相關關系?;诖耍S著網(wǎng)絡社交媒體在公眾生活中重要性的不斷提升,建議監(jiān)管部門有必要規(guī)范個人投資者的行為,防止虛假信息及負面謠言的傳播。
表3 實證結果
表4 穩(wěn)健性檢驗