王佳歡
【摘 要】行為金融學(xué)認(rèn)為投資者心理活動會影響資產(chǎn)價格,投資者由于精力和注意力有限,無法注意并吸收市場上全部的信息,從而導(dǎo)致對資產(chǎn)價格認(rèn)知的偏差。通過對投資者關(guān)注度變化的研究,有助于我們理解與預(yù)測市場的波動性。本文基于淘股吧論壇,運用爬蟲程序爬取用戶12年1月至18年8月的留言數(shù)據(jù),以含有“銀行”關(guān)鍵字的留言數(shù)在當(dāng)日總留言數(shù)中的占比為投資者關(guān)注度代理指標(biāo),研究關(guān)注度變化對銀行股票下一交易日漲跌幅的影響。結(jié)果表明,銀行股出現(xiàn)大幅度波動的概率與關(guān)注度與水平成正相關(guān),且高關(guān)注度水平在一周的交易日內(nèi)的分布具有不均勻性。
【關(guān)鍵詞】投資者關(guān)注度;銀行股票;數(shù)據(jù)挖掘
一、研究背景
由于投資者的精力和注意力有限,金融市場上的投資者無法注意并理解市場上的所有信息(Barberis & Thaler,2003)從而導(dǎo)致對信息理解的不全面和對資產(chǎn)價值預(yù)測的偏差。投資者對于市場信息的認(rèn)識和理解會直接影響到他們的投資決策和交易行為,從而對金融市場產(chǎn)生影響。
通過對投資者關(guān)注度變化的研究,有助于我們理解與預(yù)測市場的波動性。
二、意義及創(chuàng)新點
股吧是投資者交流意見和獲取信息的重要途徑,投資者在股吧中瀏覽他人的觀點,并留下自己的判斷,在交流的過程留下的瀏覽記錄以及發(fā)言記錄無疑都是投資者個體內(nèi)心的寫照,通過分析其留言中是否含有‘銀行關(guān)鍵字,可以判斷該投資者是否關(guān)注到了銀行股,因此本文使用涉及關(guān)鍵字‘銀行的留言在總留言數(shù)中的占比作為投資者對銀行股的關(guān)注度代理指標(biāo)。將下一交易日,標(biāo)的漲跌幅度作為因變量,研究關(guān)注度的變化對下一交易日的影響。
根據(jù)數(shù)據(jù)來源的不同,傳統(tǒng)的投資者關(guān)注的度量方式可以分為以下兩種:第一種方式是利用金融資產(chǎn)的交易特點度量投資者關(guān)注度。通常的做法是使用交易量、換手率、成交量等變量測度股票是否受到了投資者關(guān)注(Chemmanur & Yan, 2009; Hou et al, 2009; Loh, 2010)。第二種方式是基于財務(wù)報表和公告數(shù)據(jù)測度投資者關(guān)注。
傳統(tǒng)數(shù)據(jù)(交易數(shù)據(jù)及公司報表、公告等)能在一定程度上度量投資者關(guān)注和投資者情緒,但這些數(shù)據(jù)仍存在以下弊端:第一,傳統(tǒng)數(shù)據(jù)缺乏對投資者關(guān)注和情緒的直接度量。第二,傳統(tǒng)數(shù)據(jù)種類單一,缺乏以投資者為對象的數(shù)據(jù),為深入研究投資者行為和心理帶來了阻礙。第三,大多傳統(tǒng)數(shù)據(jù)數(shù)量較少,計量誤差較大。
相較傳統(tǒng)交易數(shù)據(jù)或財務(wù)報表數(shù)據(jù),股吧數(shù)據(jù)具有規(guī)模性、多樣性、高速性的特點。
本文以淘股吧作為數(shù)據(jù)來源,新增了一個分析投資者關(guān)注度及其情緒的數(shù)據(jù)來源,并以涉及關(guān)鍵字的留言占比作為投資者關(guān)注度的代理指標(biāo),新增了一種投資者關(guān)注度的代理指標(biāo)。
三、數(shù)據(jù)來源
(1)淘股吧介紹
淘股吧論壇成立于09年,發(fā)展至12年后論壇基本成熟,用戶活躍度及數(shù)量都保持在一個較高水平,根據(jù)淘股吧內(nèi)的帖子來看,淘股吧用戶股票操作風(fēng)格大多激進(jìn),其用戶層面比之東方財富較窄,少有中長線價值投資者,多為快進(jìn)快出的短線投機客,本文正是基于對短線投機客對于銀行股關(guān)注度的變化來研究其對后一交易日銀行股整體情況的影響。
(2)樣本選取
本文選取的是12年1月1日至18年8月31日的共2435日近150萬帖子數(shù)據(jù)。通過python軟件爬取了淘股吧論壇的所有帖子,將帖子的標(biāo)題、內(nèi)容、發(fā)帖人、發(fā)帖時間,以及所有跟帖的內(nèi)容、跟帖時間、跟帖人保存在mongodb數(shù)據(jù)庫中。共得到426761條有關(guān)銀行的留言。
(3)對應(yīng)標(biāo)的選取
因為是以‘銀行為關(guān)鍵字進(jìn)行檢索,所以選取銀行板塊指數(shù)作為對應(yīng)標(biāo)的進(jìn)行對銀行板塊整體情況的研究,該指數(shù)包含了A股所有的銀行股,能較好的反應(yīng)銀行股的整體情況。
四、數(shù)據(jù)處理
在數(shù)據(jù)庫中以日為單位對當(dāng)日數(shù)據(jù)進(jìn)行統(tǒng)計,記錄下當(dāng)日留言的總條數(shù)以及包含‘銀行關(guān)鍵字的留言條數(shù),生成當(dāng)日談及銀行的留言在總留言數(shù)中的占比。
以日為單位,在excel中生成日期、星期、關(guān)鍵字留言數(shù)、總留言數(shù)、占比、下一交易日漲跌幅項目。
五、數(shù)據(jù)分析
刪除一些無效數(shù)據(jù)后得到共2399日數(shù)據(jù),將數(shù)據(jù)按照關(guān)注度水平進(jìn)行降序排列,取前2.5%數(shù)據(jù)(60個)作為高關(guān)注度組,取后2.5%數(shù)據(jù)(60個)作為低關(guān)注度組,對比研究與總體的差異。
分別對總體、高關(guān)注度組以及低關(guān)注度的下一交易日漲跌幅進(jìn)行描述統(tǒng)計。(表2、表3、表4)
研究發(fā)現(xiàn):
(一)下一交易日出現(xiàn)大幅波動的概率與關(guān)注度水平成正相關(guān)
與總體相比,高關(guān)注度水平下,方差顯著變大(從2.48增大至5.40),表示下一個交易日出現(xiàn)大幅度波動的可能性顯著增大。
與總體相比,低關(guān)注度水平下,方差顯著減?。◤?.48減小至1.19),表示下一個交易日出現(xiàn)大幅度波動的可能性顯著減小。
以漲跌幅超過3%作為大幅度波動,從歷史數(shù)據(jù)來看,我們也可以驗證這一點。以本文選用的2012年1月1日至2018年8月31日之間的1622個交易日數(shù)據(jù)來看,共有92個交易日漲跌幅超過3%,出現(xiàn)大幅度波動的概率為5.67%。
在高關(guān)注度組,60個樣本中共有7次下一日漲跌幅超過3%(且指向的下一交易日非重復(fù)),出現(xiàn)大幅度波動的概率為11.67%。
在低關(guān)注度組,60個樣本中共有2次下一日漲跌幅超過3%,由于這兩次指向的下一交易日正好重疊,所以記為一次,所以出現(xiàn)大幅度波動的概率為1.67%。
可見,關(guān)注度水平確實影響出現(xiàn)大幅波動的概率。
(二)高關(guān)注度出現(xiàn)在一周內(nèi)頻率并不相同,交易日間的風(fēng)險不同
高關(guān)注度出現(xiàn)在周六周日周一的頻率顯著最大(周日頻率最高),意味著周一、周二出現(xiàn)大幅度波動的可能性最大。
可見,周一的風(fēng)險明顯大于其他4個交易日,周二其次。
六、結(jié)論
本文通過對淘股吧內(nèi)投資者對銀行股的關(guān)注度水平建立代理指標(biāo),研究銀行股關(guān)注度水平與其對應(yīng)標(biāo)的(板塊指數(shù))之間的關(guān)系,研究發(fā)現(xiàn):
(一)關(guān)注度水平與下一交易日的出現(xiàn)較大的漲跌幅的概率成正相關(guān)。
(二)高關(guān)注度水平在每周交易日的不平均分布(周六、周日、周一顯著較高)可能是導(dǎo)致周一出現(xiàn)大幅波動的原因。
七、不足與展望
一、本文只從關(guān)注度角度出發(fā),得出了高關(guān)注度導(dǎo)致銀行股出現(xiàn)大幅度波動的概率增大,但是無法從關(guān)注度角度得出變化的方向,下一步將希望通過語義分析分類等方法分析投資者的情緒,研究關(guān)注度與情緒結(jié)合起來對資產(chǎn)價格的影響。
二、對于結(jié)論二,只是發(fā)現(xiàn)銀行股高關(guān)注度分布的不均勻性(在周六、周日及周一顯著高于其他),以及從歷史數(shù)據(jù)得出的出現(xiàn)大幅波動的概率在周一最高、周二其次的現(xiàn)象,而并沒有準(zhǔn)確地分析這兩個現(xiàn)象之間的因果關(guān)系,下一步將尋找一些模型和方法來準(zhǔn)確論證其中的因果關(guān)系。
【參考文獻(xiàn)】
[1]Barberis, Nicholas. & Richard Thaler (2003) A Survey of Behavioral Finance. In: George M. Constantinides, Milton Harris, and RenéM. Stulz, eds. Handbook of the Economics of Finance: Volume 1B, Financial Markets and Asset Pricing. Elsevier North Holland, Chapter 18:1053~1128.
[2]Chemmanur, T. & A. Yan (2009). Product market advertising and new equity issues. Journal of Financial Economics, 92(1):40-65.
[3]Hou, K.et al. (2009). A tale of two anomalies: The implication of investor attention for price and earnings momentum. Social Science Electronic Publishing, 45:416-418.
[4]Loh, R.K. (2010). Investor inattention and the underreaction to stock recommendations. Financial Management, 39(3):1223-1252.
[5]Grullon, G.et al. (2004). Advertising, breadth of ownership, and liquidity. Review of Financial Studies, 17(2):439-461.
[6]Solomon, D. H.et al. (2014). Winners in the spotlight: Media coverage of fund holdings as a driver of flows. Journal of Financial Economics, 113(1):53-72.
[7]Kaniel, R. & R. Parham. (2017). WSJ Category Kings: The impact of media attention on consumer and mutual fund investment decisions. Journal of Financial Economics, 123(2):337-356.
[8]許柳英, 陳啟歡. 公眾注意力影響買入行為嗎?——基于投資者行為的分析[J].上海管理科學(xué),2005.27(4):39-41.
[9]譚偉強, 我國股市盈余公告的“周歷效應(yīng)”與“集中公告效應(yīng)”研究[J].金融研究,2008.2:39-41.
[10]楊曉蘭我國股票市場的網(wǎng)絡(luò)關(guān)注度效應(yīng)——一個基于和訊關(guān)注度的實證檢驗[R].工作論文,2010.
[11]饒育蕾, 彭疊峰, 周相宜. 基于有限注意的排行榜效應(yīng)研究[C].第六屆中國金融學(xué)年會論文,2009.
[12]饒育蕾, 王攀. 媒體關(guān)注度對新股表現(xiàn)的影響——來自中國股票市場的證據(jù)[J].財務(wù)與金融,2010.3:1-7.
[13]于李勝, 王艷艷. 信息競爭性披露、投資者注意力與信息傳播效率[J].金融研究,2010.8:112-135.
[14]周嘉南, 黃登仕. 投資者有限注意力與上市公司年報公布時間選擇[J].證券市場導(dǎo)報,2011.5:53-60.
[15]張雅慧, 萬迪防, 付雷鳴. 股票收益的媒體效應(yīng):風(fēng)險補償還是過度關(guān)注弱勢[J].金融研究, 2011.8:143-156.
[16]李冬昕, 李心丹, 張兵. 分析師的盈利預(yù)測偏差與本地優(yōu)勢[J].財經(jīng)科學(xué), 2011.3:26-33.
[17]董大勇, 肖作平. 交易市場與網(wǎng)絡(luò)論壇間存在信息傳遞嗎[J].管理評論, 2011,11:3-11.
[18]張永杰, 張維, 金曦等. 互聯(lián)網(wǎng)知道的更多么?——網(wǎng)絡(luò)開源信息對資產(chǎn)定價影響[J].系統(tǒng)工程理論與實踐, 2011.4:577-586.
[19]俞慶進(jìn), 張兵. 投資者有限關(guān)注與股票收益——以百度指數(shù)作為關(guān)注度的一項實證研究[J],金融研究, 2012.8:152-165.
[20]謝世宏. 基于互聯(lián)網(wǎng)搜索的有限注意與我國股票市場的關(guān)系研究[D].南京大學(xué),2012.