尹海員 王曉曉
[摘 要]股票定價(jià)效率是衡量股票市場有效性的重要指標(biāo),更高的定價(jià)效率有利于促進(jìn)資本市場資源的合理配置,更好地服務(wù)實(shí)體經(jīng)濟(jì)高質(zhì)量發(fā)展。本文挖掘東方財(cái)富的投資者社區(qū)的文本發(fā)帖信息,利用機(jī)器學(xué)習(xí)方法分析文本情緒狀態(tài),構(gòu)建投資者情緒指標(biāo)并分析其對股票定價(jià)效率的影響。研究表明,投資者情緒與股票定價(jià)效率之間存在顯著正相關(guān)關(guān)系,也即樂觀的投資者情緒會(huì)帶動(dòng)股票定價(jià)效率的提升。這種影響效應(yīng)是通過樂觀情緒降低了信息不對稱程度,進(jìn)而提升了股價(jià)信息含量,并與定價(jià)效率的機(jī)制路徑產(chǎn)生作用。進(jìn)一步看,隨著賣空限制的降低,股票定價(jià)效率對情緒的敏感程度會(huì)增大;良好的信息環(huán)境會(huì)降低情緒對股票定價(jià)效率的影響。研究結(jié)論為從個(gè)體投資者情緒視角透視我國股票市場運(yùn)行效率以及網(wǎng)絡(luò)媒體信息監(jiān)管的必要性提供了證據(jù)。
[關(guān)鍵詞] 投資者情緒;股票定價(jià)效率;數(shù)據(jù)挖掘;機(jī)器學(xué)習(xí)
[中圖分類號(hào)] F832.51;TP181[文獻(xiàn)標(biāo)志碼] A[文章編號(hào)] 1672-4917(2024)03-0096-16
一、引言
我國資本市場經(jīng)過30多年的大力發(fā)展,取得了非凡的成績。但不可否認(rèn)的是,目前我國資本市場仍然不夠健全和成熟,存在著體系不完善、投資者決策行為跟風(fēng)等問題。從市場現(xiàn)實(shí)看,個(gè)體投資者作為參與者占據(jù)了絕對多數(shù),多數(shù)情況下處于信息劣勢方,其獲取信息渠道有限加之自身缺乏專業(yè)知識(shí),決策行為更易受自身心理、情緒等因素影響,導(dǎo)致股票市場異常波動(dòng)甚至股價(jià)崩盤風(fēng)險(xiǎn)。在中國經(jīng)濟(jì)高質(zhì)量發(fā)展的背景下,提升股票市場的定價(jià)效率,完善證券價(jià)格的信號(hào)機(jī)制,對于優(yōu)化資本市場的資源配置功能以更好服務(wù)實(shí)體經(jīng)濟(jì)具有重要意義。
在移動(dòng)互聯(lián)時(shí)代,網(wǎng)絡(luò)社區(qū)為投資者提供了互相交流、互相學(xué)習(xí)、互相分享信息的重要平臺(tái),為資本市場的參與者提供了新的交流方式。越來越多的投資者愿意通過網(wǎng)絡(luò)表達(dá)自己的觀點(diǎn)并與其他投資者交流信息。隨著網(wǎng)絡(luò)挖掘技術(shù)的發(fā)展,從網(wǎng)絡(luò)平臺(tái)上獲取研究所需的內(nèi)容成為可能。探究網(wǎng)絡(luò)平臺(tái)上的情緒與信息含量成為學(xué)界近些年關(guān)注的重點(diǎn),已有學(xué)者關(guān)注投資者情緒,特別是個(gè)體投資者情緒或者行為對股價(jià)信息含量的影響效應(yīng)。比如楊菁菁等(2023年)發(fā)現(xiàn),投資者情緒越趨于樂觀則股價(jià)的信息含量越高,降低了股價(jià)同步性水平,而且隨著投資者關(guān)注度的增加、境外投資者持股比例的上升,這一影響效應(yīng)會(huì)減弱[1]。鄭建東等(2022年)則關(guān)注社交媒體的投資者互動(dòng)行為對資本市場定價(jià)效率的影響,他們利用股吧發(fā)帖數(shù)量來度量投資者交互行為程度,發(fā)現(xiàn)投資者在網(wǎng)絡(luò)股吧中的發(fā)帖數(shù)量增加有助于公司特質(zhì)信息融入股價(jià),降低了股價(jià)同步性[2]。
但這一領(lǐng)域的研究尚有改進(jìn)的空間,主要體現(xiàn)在投資者情緒度量方法的改進(jìn)、情緒對股票定價(jià)效率的影響效應(yīng)等方面。從前者來看,早期研究者主要利用客觀指標(biāo)構(gòu)建主成分因子衡量情緒狀態(tài),隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,基于網(wǎng)絡(luò)數(shù)據(jù)的挖掘和文本分析成為主流方法,但采用不同的文本分析模型可能導(dǎo)致結(jié)果的各異[3]。從后者看,學(xué)者們很早就注意到投資者情緒對市場定價(jià)的影響,比如噪聲交易模型(DSSW)認(rèn)為,投資者有限理性行為會(huì)相互影響,成為影響金融資產(chǎn)均衡價(jià)格的系統(tǒng)性風(fēng)險(xiǎn)。也有學(xué)者研究投資者情緒對資本市場效率的影響規(guī)律,但如何采用更為有效的投資者情緒指標(biāo)值得進(jìn)一步探討。
本文挖掘了東方財(cái)富網(wǎng)股吧的2019年1月至2022年2月的實(shí)時(shí)發(fā)帖文本信息,利用樸素貝葉斯模型將文本進(jìn)行情感傾向識(shí)別分類并構(gòu)建了樣本股票的投資者情緒指標(biāo)。然后基于股價(jià)同步性和相關(guān)系數(shù)兩個(gè)指標(biāo),構(gòu)造了定價(jià)效率指標(biāo),利用面板模型探討了投資者情緒和股票定價(jià)效率的關(guān)系、情緒影響股票定價(jià)效率的中介機(jī)制和市場制度、信息環(huán)境在其中起到的作用。我們發(fā)現(xiàn),投資者情緒對股票定價(jià)效率有顯著的正向影響,即投資者情緒越樂觀,股票定價(jià)效率越高。進(jìn)一步看,隨著賣空限制的降低,股票定價(jià)效率對情緒的敏感程度會(huì)增大,而良好的信息環(huán)境會(huì)降低情緒對股票定價(jià)效率的影響。這些研究發(fā)現(xiàn)為透視我國股票市場投資者情緒如何影響市場運(yùn)行,以及加強(qiáng)網(wǎng)絡(luò)媒體信息傳播監(jiān)管的必要性提供了實(shí)證證據(jù)。
本文的邊際貢獻(xiàn)主要體現(xiàn)在如下兩點(diǎn):首先,拓展了股票定價(jià)效率、股價(jià)信息含量驅(qū)動(dòng)因素的研究范疇和資本市場效率研究的視角。股票定價(jià)效率作為衡量市場健康發(fā)展的重要指標(biāo),學(xué)術(shù)界大多從宏觀經(jīng)濟(jì)政策、公司角度去探究對其的影響。即使現(xiàn)有從投資者行為角度出發(fā)的研究,也多從投資者網(wǎng)絡(luò)中心性、關(guān)注度、本地偏好和持股行為等變量出發(fā)進(jìn)行研究。而本文從投資者情緒視角分析其對股票定價(jià)效率的影響,拓寬了股票定價(jià)效率、股價(jià)信息含量驅(qū)動(dòng)因素的研究邊界。其次,豐富了投資者情緒影響效應(yīng)及其后果的研究內(nèi)容。盡管投資者情緒成為了學(xué)術(shù)界關(guān)注的重點(diǎn),但大多研究將其聚焦于對股票收益率、波動(dòng)性和流動(dòng)性的影響,少有文獻(xiàn)從行為金融視角出發(fā)研究投資者情緒對股票定價(jià)效率的影響。區(qū)別于傳統(tǒng)投資者情緒指標(biāo),我們抓取了股吧論壇的文本信息,使用樸素貝葉斯算法分類分析投資者情緒傾向,構(gòu)建了基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的情緒指標(biāo),在此基礎(chǔ)上探究其對股票定價(jià)效率影響規(guī)律,以及在不同的賣空限制程度和信息環(huán)境下的表現(xiàn)和中介機(jī)制,豐富了投資者情緒影響效應(yīng)的研究內(nèi)容。
二、文獻(xiàn)綜述與研究假設(shè)
(一)基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的投資者情緒
近年來,基于網(wǎng)絡(luò)數(shù)據(jù)對投資者情緒進(jìn)行挖掘分析已逐漸成為該領(lǐng)域的研究熱點(diǎn)。早期研究者主要使用網(wǎng)絡(luò)數(shù)據(jù)的數(shù)量指標(biāo),具體來說,即基于網(wǎng)絡(luò)搜索信息來構(gòu)造投資者情緒指數(shù),包括谷歌、百度等搜索引擎的搜索數(shù)據(jù)等。比如Da(2015年)將谷歌搜索指數(shù)(SVI)作為投資者關(guān)注度指標(biāo),發(fā)現(xiàn)該指數(shù)可以預(yù)測股票市場回報(bào)率[4]。Gao(2020年)同樣利用該指數(shù)構(gòu)建了2004—2014年期間全球40個(gè)國家的周度搜索指數(shù)作為股票市場情緒指數(shù),發(fā)現(xiàn)該指數(shù)是市場回報(bào)的反向預(yù)測因子[5]。國內(nèi)學(xué)者大部分通過百度搜索指數(shù)構(gòu)建投資者情緒指標(biāo),發(fā)現(xiàn)上市公司的日度百度指數(shù)顯著解釋其下一交易日股票集合競價(jià)時(shí)的價(jià)格跳躍現(xiàn)象[6]。近年來,文本分析技術(shù)的發(fā)展推動(dòng)研究重心從網(wǎng)絡(luò)數(shù)據(jù)的數(shù)量指標(biāo)轉(zhuǎn)向了內(nèi)容指標(biāo)。構(gòu)造投資者情緒指數(shù)的信息內(nèi)容來源包括推特、財(cái)經(jīng)網(wǎng)站、微博、微信、股吧論壇[7-8]。研究者們利用文本分析方法構(gòu)建情緒指標(biāo),發(fā)現(xiàn)基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的投資者情緒可以傳遞到股票市場,影響成交量并能夠預(yù)測股市收益。
從技術(shù)方法上看,機(jī)器學(xué)習(xí)模型可以在一定程度上消除研究者的主觀性,近年來學(xué)術(shù)界逐漸運(yùn)用機(jī)器學(xué)習(xí)模型來提取情緒狀態(tài)。目前支持向量機(jī)、樸素貝葉斯、K鄰近三種模型的使用最為普遍。楊曉蘭等(2016年)以東方財(cái)富網(wǎng)股吧發(fā)帖為研究對象,通過IP地址識(shí)別構(gòu)建本地關(guān)注指標(biāo),使用K鄰近方法構(gòu)建了投資者情緒指標(biāo)[9]。Li等(2019年)使用支持向量機(jī)方法對中文網(wǎng)絡(luò)論壇發(fā)帖進(jìn)行情感分類,并使用情感指標(biāo)對股票收益進(jìn)行預(yù)測[10]。支持向量機(jī)、樸素貝葉斯、K鄰近模型三種方法各有優(yōu)勢,其中樸素貝葉斯分類算法能更好地處理稀疏、高維、短文本的分類問題,最早Antweiler和Frank(2004年)利用樸素貝葉斯文本分類算法對雅虎財(cái)經(jīng)上投資者發(fā)帖進(jìn)行識(shí)別并構(gòu)建了投資者情緒指標(biāo)[11]。也有國內(nèi)學(xué)者采用樸素貝葉斯算法識(shí)別了東方財(cái)富股吧發(fā)帖文本的情緒傾向,對投資者發(fā)帖情緒如何影響股票特質(zhì)風(fēng)險(xiǎn)進(jìn)行了探討[12]。
(二)股票定價(jià)效率及其影響因素
股票市場定價(jià)效率是股價(jià)對企業(yè)特質(zhì)信息吸收的快慢與準(zhǔn)確程度,是衡量市場有效性的一個(gè)關(guān)鍵指標(biāo)。有效識(shí)別那些能夠影響股票定價(jià)效率的因素,可以更好地進(jìn)行股票市場交易設(shè)計(jì)來提升市場有效性。眾多文獻(xiàn)已經(jīng)從不同視角探索股票定價(jià)效率的影響因素,包括制度因素、公司內(nèi)部因素、利益相關(guān)者行為因素,等等。
制度因素方面,包括賣空機(jī)制、市場開放、稅收等變量對于股票定價(jià)效率的影響。比如孟慶斌和黃清華(2018年)[13]證明了融資融券制度有效改善了價(jià)格發(fā)現(xiàn)機(jī)制,兩融標(biāo)的股票的定價(jià)效率得到了顯著提高。也有學(xué)者發(fā)現(xiàn)滬港通、深港通的推出提高了我國大陸上市公司股票定價(jià)效率[14]。公司內(nèi)部因素方面,學(xué)者們發(fā)現(xiàn)公司治理水平、信用等級(jí)、會(huì)計(jì)信息透明度等水平的改善,會(huì)降低股價(jià)同步性,提升股票定價(jià)效率。另外公司信息管理能力越高則股票定價(jià)效率也越高,比如田高良等(2018年)發(fā)現(xiàn)上市公司對網(wǎng)絡(luò)輿情的管理能夠向市場傳遞特質(zhì)信息,提升信息效率[15]。隨著新媒體手段的廣泛應(yīng)用,有學(xué)者開始關(guān)注上市公司新媒體手段的應(yīng)用對公司股價(jià)信息效率的影響,Zhou等(2019年)發(fā)現(xiàn),上市公司開通官方微博在一定程度上可以增加公司股價(jià)中的信息含量,提高股票的定價(jià)效率,官方微博推文的數(shù)量與股價(jià)同步性呈負(fù)相關(guān)[16]。利益相關(guān)者行為方面,學(xué)者們研究了監(jiān)管部門、證券分析師、審計(jì)師、新聞媒體等股票市場參與主體行為如何影響股票定價(jià)效率。He和Fang(2019年)發(fā)現(xiàn)市場監(jiān)管部門針對上市公司的違規(guī)行為實(shí)施處罰時(shí),被處罰公司的股票定價(jià)效率呈現(xiàn)先上升后下降的規(guī)律[17]。張大永等(2021年)從分析師羊群行為出發(fā),證明了“非信息驅(qū)動(dòng)”的真羊群行為增加了公司的股價(jià)同步性[18]。Steven(2021年)發(fā)現(xiàn)審計(jì)公司規(guī)模、審計(jì)事務(wù)所任期與股價(jià)同步性正相關(guān),更好的會(huì)計(jì)審計(jì)專家的專業(yè)技能有助于向市場提供可靠的公司信息,進(jìn)而提升股票定價(jià)效率[19]。還有學(xué)者發(fā)現(xiàn),政府行為、媒體報(bào)道可以幫助更多企業(yè)特質(zhì)信息融入股價(jià),在一定條件下降低企業(yè)股價(jià)同步性,提高股價(jià)中公司特質(zhì)信息的含量[20]。
(三)研究假設(shè)的提出
股票市場定價(jià)效率是衡量股市有效的重要指標(biāo),到底有哪些因素影響了定價(jià)效率值得深入研究。近年來,學(xué)者將投資者情緒因子加入到資產(chǎn)定價(jià)模型中,發(fā)現(xiàn)情緒是股票收益率的有效解釋因子。除收益率之外,學(xué)者們后續(xù)開始探討情緒是否與股票市場運(yùn)行的其他變量存在相關(guān)性,這些變量包括股票交易量、波動(dòng)性、公司盈利預(yù)測等。比如Das和Chen(2007年)衡量了24家在納斯達(dá)克上市的科技類公司的董事會(huì)會(huì)議信息中透露出的情緒信息,發(fā)現(xiàn)這些情緒信息與股票交易量和波動(dòng)率等具有高度的相關(guān)性[21]。Price等(2012年)利用上市公司的電話會(huì)議進(jìn)行文本分析,提取文本中所包含的情緒信息,發(fā)現(xiàn)它是股票收益和交易量的重要預(yù)測指標(biāo)[22]。Jiang(2018年)基于公司財(cái)務(wù)報(bào)表和電話會(huì)議的文本基調(diào)構(gòu)建情緒指標(biāo),發(fā)現(xiàn)經(jīng)理情緒越樂觀則股票市場收益越低[23]。
學(xué)者們進(jìn)一步研究投資者行為是否可以向市場注入有效信息,發(fā)現(xiàn)投資者之間的交流活動(dòng)會(huì)為其理解信息提供參考,促進(jìn)信息被更多投資者吸收消化,并提高市場效率[24]。還有文獻(xiàn)證明了活躍的投資者情緒可以改善信息不對稱程度,促進(jìn)信息更好地融入股價(jià)[25]。投資者情緒是對未來股價(jià)走勢的主觀預(yù)期,如果投資者對股價(jià)未來走勢預(yù)期越樂觀,會(huì)更愿意通過網(wǎng)絡(luò)社交媒體的互動(dòng)進(jìn)行交流,抱著積極的態(tài)度進(jìn)行投資決策。其更多的交流互動(dòng)行為會(huì)促進(jìn)信息被更多投資者理解,加快了市場信息與公司特質(zhì)信息融入股價(jià)的速度并提升股票定價(jià)效率。所以,活躍的投資者情緒會(huì)減少知情交易及信息不透明程度,從而降低了公司的信息不對稱程度。反之,投資者的悲觀情緒會(huì)產(chǎn)生心理壓力和謹(jǐn)慎情緒,出于風(fēng)險(xiǎn)厭惡心理,投資者會(huì)弱化其在社交網(wǎng)絡(luò)的交互行為,信息擴(kuò)散受到阻礙,降低股價(jià)定價(jià)效率?;谝陨戏治觯覀兲岢霰疚难芯考僭O(shè)H1和假設(shè)H2:
假設(shè)H1:投資者情緒會(huì)影響股票定價(jià)效率,越樂觀的投資者情緒會(huì)增加股票價(jià)格的特質(zhì)信息含量,進(jìn)而提升定價(jià)效率。
假設(shè)H2:投資者的樂觀情緒通過降低公司信息不對稱程度進(jìn)而提升股票定價(jià)效率。
股價(jià)波動(dòng)的根源在于信息的變化。投資者社交網(wǎng)絡(luò)的交互行為以及由此集聚形成的情緒狀態(tài)有可能包含有價(jià)值的公司特定信息,有助于提升股票定價(jià)效率,但外部制度變量可能會(huì)影響這一效應(yīng)。市場賣空機(jī)制能夠允許投資者通過買空和賣空行為操作,這樣會(huì)促使更多的信息融入股價(jià)。如果缺乏賣空制度,投資者即使在看空股票時(shí)也無法通過賣空操作來獲利。因此,在缺乏賣空機(jī)制的情況下,悲觀情緒無法得到充分的表達(dá)和釋放,進(jìn)而影響股價(jià)的信息含量。另外,在不同信息環(huán)境中,信息傳遞效率不同,如果公司所處市場信息環(huán)境越透明,信息融入股價(jià)的時(shí)間越短,股票定價(jià)效率就越高。上市公司所處信息環(huán)境會(huì)影響投資者獲取以及處理信息的質(zhì)量,進(jìn)而影響股價(jià)對信息的反應(yīng)程度。良好的公司信息環(huán)境可以降低信息不對稱程度,促進(jìn)投資者的態(tài)度看法得到更多個(gè)體投資者的獲取和理解,從而提升股票定價(jià)效率。基于以上分析,提出本文研究假設(shè)H3和假設(shè)H4:
假設(shè)H3:賣空限制程度越低的樣本公司股票,投資者情緒對股票定價(jià)效率的影響效應(yīng)越顯著。
假設(shè)H4:信息環(huán)境越差的樣本公司股票,投資者情緒對股票定價(jià)效率的影響效應(yīng)越顯著。
三、研究設(shè)計(jì)
(一)樣本選擇與數(shù)據(jù)說明
本文選擇滬深300指數(shù)成分股作為研究對象,并剔除以下幾類樣本:(1)為滿足數(shù)據(jù)處理需求,確保數(shù)據(jù)容量,剔除論壇中日平均發(fā)帖量少于10條的樣本;(2)剔除金融類上市公司、ST和*ST的公司樣本;(3)為避免“指數(shù)效應(yīng)”偏差以及保證樣本期內(nèi)數(shù)據(jù)連續(xù)性,剔除在研究期間被調(diào)入或調(diào)出滬深300指數(shù)的樣本,最終樣本股票為166只,時(shí)間區(qū)間選取為2019年1月1日—2022年2月28日。
本文利用東方財(cái)富網(wǎng)股吧獲取投資者情緒狀態(tài)。作為中國最活躍的股票論壇之一,東方財(cái)富網(wǎng)股吧具有得天獨(dú)厚的數(shù)據(jù)挖掘優(yōu)勢:從數(shù)據(jù)容量來說,用戶數(shù)和瀏覽量大、論壇資訊內(nèi)容豐富;從數(shù)據(jù)質(zhì)量來說,論壇開設(shè)時(shí)間久、發(fā)帖頻率高。這些優(yōu)勢有助于分樣本獲取個(gè)股文本信息。首先,本文利用Python編寫爬蟲程序,獲取東方財(cái)富網(wǎng)股吧實(shí)時(shí)發(fā)帖,其中每條發(fā)帖包括標(biāo)題內(nèi)容、閱讀量、評論量、發(fā)帖人及發(fā)帖時(shí)間,初步獲取原始發(fā)帖18 381 202條。其次,對原始文本進(jìn)行數(shù)據(jù)清洗,包括剔除完全重復(fù)、純數(shù)字、純標(biāo)點(diǎn)符號(hào)、圖片和表情以及無關(guān)外部鏈接的發(fā)帖。隨后,將發(fā)帖日期與股市行情的交易日期進(jìn)行匹配,剔除非交易日發(fā)帖,最終獲得17 243 512條發(fā)帖。
本文實(shí)證所用樣本股票財(cái)務(wù)數(shù)據(jù)、交易數(shù)據(jù)來自銳思(RESSET)金融數(shù)據(jù)庫、國泰安(CSMAR)經(jīng)濟(jì)金融數(shù)據(jù)庫。為保證數(shù)據(jù)的準(zhǔn)確性,我們使用兩個(gè)數(shù)據(jù)庫的變量數(shù)據(jù)進(jìn)行了交叉驗(yàn)證。同時(shí)為避免極端值的影響,對所有連續(xù)變量進(jìn)行上下1%的Winsorize縮尾處理。
(二)文本情緒分析
本文運(yùn)用Python中的Jieba分詞工具對文本發(fā)帖進(jìn)行分詞,獲得單個(gè)詞語;然后,參考哈工大停用詞庫中的停用詞,篩選出與股票無關(guān)的詞,保留與股市相關(guān)的詞匯,剔除停用詞;最后,使用TF-IDF和卡方統(tǒng)計(jì)(Chi-square)篩選出前K個(gè)特征詞,用特征向量來表示待分類文本,供計(jì)算機(jī)識(shí)別其語言。
為更好地量化投資者情緒,我們使用樸素貝葉斯模型進(jìn)行情緒分類,共分為四個(gè)步驟:首先,通過人工標(biāo)注“樂觀”“中性”和“悲觀”標(biāo)簽將發(fā)帖分為三類,準(zhǔn)備訓(xùn)練數(shù)據(jù)集。其次,隨機(jī)選出12 000條發(fā)帖,請30名金融學(xué)專業(yè)研究生人工標(biāo)注發(fā)帖文本,每3人為一組,每人標(biāo)注1200條,每條帖子的最終標(biāo)簽以3次結(jié)果中占比大的為最終的情緒狀態(tài),最終得到悲觀發(fā)帖5564條,樂觀發(fā)帖3368條,中性發(fā)帖3068條。再次,利用Python編寫樸素貝葉斯情感分類模型的程序,通過Sklearn庫中自帶的Nave.bayes模塊,選擇不同Testsize和隨機(jī)數(shù)種子,篩選不同的訓(xùn)練集比例與特征詞數(shù)來訓(xùn)練模型,最終模型準(zhǔn)確率為73%。最后,利用訓(xùn)練好的樸素貝葉斯文本分類模型預(yù)測所有發(fā)帖的情緒傾向,在此基礎(chǔ)上構(gòu)建投資者情緒變量。
(三)變量設(shè)計(jì)
1.投資者情緒
借鑒Antweiler和Frank(2004年)思路[26],基于當(dāng)月得到的樂觀/悲觀發(fā)帖數(shù)來構(gòu)建月度投資者情緒:
Sentimenti,t=ln[(1+posi,t)/(1+negi,t)](1)
公式(1)中,posi,t 和negi,t分別是股票i在第t月的樂觀發(fā)帖數(shù)量和悲觀發(fā)帖數(shù)量。很顯然,當(dāng)月度樂觀發(fā)帖數(shù)大于悲觀發(fā)帖數(shù)時(shí),Sentimenti,t大于0,反之小于0。
為了檢驗(yàn)該投資者情緒指標(biāo)的有效性,我們選取CSMAR數(shù)據(jù)庫的社交媒體數(shù)據(jù)庫中的情緒指標(biāo)proxy作為代理變量進(jìn)行相關(guān)性驗(yàn)證。由于CSMAR數(shù)據(jù)庫的社交媒體數(shù)據(jù)庫中的情緒指數(shù)從2020年1月開始發(fā)布,我們選取對應(yīng)樣本時(shí)間段的數(shù)據(jù),利用公式(2)進(jìn)行月度數(shù)據(jù)擬合回歸。表1結(jié)果表明,proxyi,t與基于公式(1)的Sentimenti,t在 1%的顯著性水平上正相關(guān)。
Sentimenti,t=α0+α1proxyi,t+εi,t(2)
2.股票定價(jià)效率
現(xiàn)有文獻(xiàn)主要從以下兩個(gè)思路來衡量股票定價(jià)效率。一是從股價(jià)的信息含量角度,判定股票價(jià)格是否真實(shí)而充分地反映了市場信息,以股價(jià)同步性指標(biāo)為代表;二是從股價(jià)對信息的反應(yīng)速度角度,判定價(jià)格是否能及時(shí)而準(zhǔn)確地吸收新的市場信息,以相關(guān)系數(shù)指標(biāo)為代表。本文選擇股價(jià)同步性(SYNi,t)和相關(guān)系數(shù)(ρi,t)來度量樣本股的定價(jià)效率。
股價(jià)同步性指標(biāo)主要反映股價(jià)隨市場、行業(yè)股票組合變動(dòng)而同向變動(dòng)的程度。股價(jià)隨市場、行業(yè)同漲同跌程度越強(qiáng),股價(jià)中特質(zhì)信息越少,股票定價(jià)效率越低。為計(jì)算股價(jià)同步性,首先需要計(jì)算市場和行業(yè)收益率水平如下:
Indretj,t=(k∈jWk,t×Rk,t-Wi,t×Ri,t)/(Ij,t-1)(3)
公式(3)中,Indretj,t是待計(jì)算的樣本股i所處的行業(yè)j的收益率水平,Wk,t是樣本股i在行業(yè)j中第t日市值權(quán)重,Ij,t是樣本股i所在行業(yè)j在第t日的公司數(shù)量,對于樣本股i自身,需要在計(jì)算行業(yè)收益率時(shí)將其自身收益率排除在外。按照同樣的方法可以定義市場收益率Mktrett如下:
Mktrett=(Wk,t×Rk,t-Wj,t×Rj,t)/(It-1)(4)
公式(4)中,Mktrett是待計(jì)算的市場收益率,Wj,t是樣本股i所處行業(yè)j在第t日市值權(quán)重,It是市場中在第t日的行業(yè)數(shù)量,也就是說,我們同樣將樣本股i自身所處行業(yè)排除在外。
參考Morck等(2000年)的做法[27],在上述計(jì)算的基礎(chǔ)上,對于樣本股i進(jìn)行如下回歸:
Reti,t=αi,t+β1Mktrett+β2Mktrett-1+β3Indretj,t+β4Indretj,t-1+εi,t(5)
公式(5)中,Reti,t表示樣本股i在第t日的收益率,Mktrett和Indretj,t分別表示第t日的市場收益率和樣本股所處行業(yè)j的收益率。我們加入了滯后一期的市場與行業(yè)收益率,用以控制可能存在的非同步交易偏差。按照公式(5)對樣本進(jìn)行回歸,得到每個(gè)回歸所產(chǎn)生的擬合優(yōu)度值R2i,t。再通過公式(6)進(jìn)行Logistic變換,得到股價(jià)同步性水平:
SYNi,t=ln(R2i,t/1-R2i,t)(6)
公式(6)中的R2i,t表示回歸得到的擬合優(yōu)度值,SYNi,t表示Logistic變換后的股價(jià)同步性指標(biāo),SYNi,t值越大,股價(jià)同步性水平越高。進(jìn)一步看,通過公式(5)回歸得到的擬合優(yōu)度值中包含了行業(yè)收益率的影響,股票價(jià)格中可能包含了樣本股票所處行業(yè)的信息,SYNi,t值較大不一定必然代表股價(jià)中缺乏信息。我們繼續(xù)采用以下方法優(yōu)化股價(jià)同步性指標(biāo):
Reti,t=α+β1Mktrett+β2Mktrett-1+εi,t(7)
R2i,t_DIFF=R2i,t-R*2i,t(8)
SYNdiffi,t=ln[R2i,t_DIFF/(1-R2i,t_DIFF)](9)
通過對公式(7)回歸可以得到擬合優(yōu)度R*2i,t,R2i,t-DIFF是公式(5)的擬合優(yōu)度與公式(7)擬合優(yōu)度之差,再通過公式(9)變換得到股價(jià)同步性指標(biāo)SYNdiffi,t,其值越小意味著股價(jià)同漲跌程度越低,即定價(jià)效率越高。
相關(guān)系數(shù)指標(biāo)用來表示個(gè)股股價(jià)對市場波動(dòng)的延遲程度,通過當(dāng)期股票收益率和滯后一期的市場收益率來計(jì)算,最早由Bris等(2007年)提出[28],計(jì)算如下:
ρi,t=|Corr(ri,t,rm,t-1)|(10)
公式(10)中,ri,t表示樣本股 i在第t月的月度收益率,rm,t-1 是用來指代滯后一期的流通市值加權(quán)的市場收益率,用滬深300指數(shù)收益率來指代。作為股票定價(jià)效率的衡量指標(biāo),ρi,t越小,則當(dāng)期個(gè)股收益率與滯后一期市場收益率之間關(guān)聯(lián)程度越薄弱,個(gè)股能更及時(shí)地吸收新的市場信息,定價(jià)效率越高。
3.控制變量
參照郭照蕊和張?zhí)焓妫?021年)相似主題的研究[29],我們選取以下11個(gè)控制變量: ①公司規(guī)模(Size)。公司規(guī)模越大,則企業(yè)信息披露機(jī)制越健全,受到外界的關(guān)注度越高,在一定程度上加快了信息融入股價(jià)的速度,進(jìn)而提升定價(jià)效率。 ②資產(chǎn)負(fù)債率(Lev)。資產(chǎn)負(fù)債率反映了財(cái)務(wù)風(fēng)險(xiǎn)狀況,債務(wù)因素會(huì)影響股票定價(jià)。③資產(chǎn)報(bào)酬率(Roa)。資產(chǎn)報(bào)酬率反映了盈利能力,其越強(qiáng)則會(huì)向市場傳遞正面信息。 ④賬面市值比(Bm)。賬面市值比越高,公司越具有投資價(jià)值,其受到外界的關(guān)注度越高,進(jìn)而影響市場效率。 ⑤換手率(Turnover)。換手率越高,股票的流動(dòng)性越強(qiáng),越能促進(jìn)公司層面的特質(zhì)信息融入股價(jià),進(jìn)而提高股價(jià)信息含量。⑥上市年限(Age)。上市時(shí)間越久的公司,其信息含量會(huì)越多,信息反應(yīng)速度會(huì)下降進(jìn)而影響股票定價(jià)效率。⑦第一大股東持股比例(Top1)。第一大股東持股比例越高,意味著基于私有信息的交易越多。⑧機(jī)構(gòu)投資者持股比例(Institution)。機(jī)構(gòu)投資者是理性和知情交易的代表,其持股比例越多,股價(jià)越符合隨機(jī)游走模式。⑨收益率波動(dòng)(Volatility)。收益率的波動(dòng)性越強(qiáng),意味著股價(jià)包含的異質(zhì)性信息越強(qiáng)。⑩企業(yè)性質(zhì)(Type)。最終控制人的資本產(chǎn)權(quán)屬性不同,可能會(huì)影響信息披露程度和股價(jià)信息含量。B11是否使用四大審計(jì)(Big4)。若上市公司由普華永道、德勤、畢馬威、安永四大會(huì)計(jì)師事務(wù)所審計(jì),意味著其信息披露的質(zhì)量更高。
表2匯總了本文所用主要變量名稱、符號(hào)和釋義。
(四)基礎(chǔ)模型
我們構(gòu)建面板回歸模型來分析基于網(wǎng)絡(luò)社區(qū)股吧提取的投資者情緒是否會(huì)影響股票的定價(jià)效率:
Efficiencyi,t=α0+α1Sentimenti,t+γControli,t+year+industry+εi,t(11)
模型(11)中,被解釋變量Efficiency表示股票定價(jià)效率,分別用股價(jià)同步性(SYNdiff)、相關(guān)系數(shù)(ρ)來衡量;Sentimenti,t為樣本股i在第t月的投資者情緒;Controli,t為系列控制變量;模型中加入了行業(yè)和年度虛擬變量以控制行業(yè)和年度固定效應(yīng)。接著對模型和數(shù)據(jù)的匹配問題處理如下:首先,選擇合適的面板數(shù)據(jù)處理模型,經(jīng)Hausman檢驗(yàn)發(fā)現(xiàn)應(yīng)該選擇固定效應(yīng)模型(p<0.01)。其次,為了避免面板數(shù)據(jù)異方差與序列相關(guān)的問題,以公司為聚類變量對所有回歸模型標(biāo)準(zhǔn)誤進(jìn)行了聚類調(diào)整。
四、實(shí)證分析與結(jié)果討論
(一)描述性統(tǒng)計(jì)與相關(guān)性分析
表3報(bào)告了各主要研究變量的描述性統(tǒng)計(jì)結(jié)果,投資者情緒(Sentiment)均值為-1.003,表明基于股吧文本信息提取的投資者情緒總體上比較悲觀;最小值為-1.550,最大值為1.739,標(biāo)準(zhǔn)差為0.234,說明投資者情緒的波動(dòng)也比較大。定價(jià)效率的兩個(gè)度量指標(biāo)中,股價(jià)同步性(SYNdiff) 和相關(guān)系數(shù)(ρ)均值分別為-1.802和-0.011,說明樣本股票的定價(jià)效率較高;標(biāo)準(zhǔn)差分別為1.610和0.223,說明定價(jià)效率的波動(dòng)性較高。樣本期內(nèi)換手率(Turnover)較高,均值為20.9%;股價(jià)收益率波動(dòng)水平(Volatility)均值為0.023,標(biāo)準(zhǔn)差為0.010,說明樣本期內(nèi)收益率較為穩(wěn)定。
表4報(bào)告了主要研究變量和部分控制變量的相關(guān)性分析結(jié)果。可以看出,投資者情緒(Sentiment)與股價(jià)同步性(SYNdiff)之間的相關(guān)系數(shù)為-0.090和-0.085,且在1%的顯著性水平上顯著負(fù)相關(guān),說明了投資者情緒越高漲,越能提升股價(jià)信息含量,進(jìn)而使股價(jià)同步性降低。投資者情緒(Sentiment)與相關(guān)系數(shù)指標(biāo)(ρ)之間的相關(guān)系數(shù)為-0.027和-0.026,且在1%的水平上顯著,說明情緒越高漲則股價(jià)反應(yīng)的滯后程度越低。這些結(jié)果初步表明,投資者情緒與股票定價(jià)效率存在正相關(guān)關(guān)系。造成這一現(xiàn)象的原因可能在于,一方面,股吧論壇中上市公司對于市場信息的披露促進(jìn)了信息在投資者之間的流動(dòng),并且投資者之間的相互交流也加快了市場信息的傳播,有利于市場信息融入股價(jià);另一方面,由于我國股票市場賣空限制的存在,投資者情緒更偏向樂觀,進(jìn)而吸引更多的投資者進(jìn)入市場交易,提升了流動(dòng)性水平并提高了股票定價(jià)效率。后續(xù)我們通過面板數(shù)據(jù)回歸分析做進(jìn)一步探討。
(二)基礎(chǔ)回歸結(jié)果
表5報(bào)告了投資者情緒(Sentiment)對股票定價(jià)效率影響效應(yīng)的回歸結(jié)果,其中,列(1)和列(3)是考慮投資者情緒并加入控制變量后的回歸結(jié)果??梢园l(fā)現(xiàn)投資者情緒對股價(jià)同步性和相關(guān)系數(shù)的回歸系數(shù)為-0.579和-0.075,且都在1%的顯著水平下顯著。列(2)和列(4)是進(jìn)一步加入滯后一期投資者情緒(Sentimentt-1)后的回歸結(jié)果,對股價(jià)同步性和相關(guān)系數(shù)的回歸系數(shù)為-0.110和-0.039,分別在10%和1%的水平上顯著。同時(shí),當(dāng)期投資者情緒的系數(shù)稍微有些下降,但仍顯著負(fù)相關(guān)。表5結(jié)果進(jìn)一步驗(yàn)證了前述相關(guān)性分析結(jié)果,也即當(dāng)期情緒、滯后一期情緒的高漲會(huì)提高股票定價(jià)效率,假設(shè)H1得到驗(yàn)證。
控制變量方面,公司規(guī)模(Size)、賬面市值比(Bm)與股價(jià)同步性、相關(guān)系數(shù)成反比,說明規(guī)模越大、賬面市值比越高,股票定價(jià)效率越高;是否由四大會(huì)計(jì)師事務(wù)所審計(jì)(Big4)在各個(gè)回歸中均與股價(jià)同步性、相關(guān)系數(shù)成反比,說明審計(jì)水平的提升會(huì)有助于信息融入股價(jià),提升定價(jià)效率;資產(chǎn)報(bào)酬率(Roa)與股價(jià)同步性、相關(guān)系數(shù)成反比,越高的資產(chǎn)回報(bào)率其定價(jià)效率越高;此外換手率(Turnover)、收益波動(dòng)性(Volatility)都與定價(jià)效率變量呈現(xiàn)顯著的反比關(guān)系,說明高換手率、高收益波動(dòng)性的股票,其流動(dòng)性和收益變化對信息的反應(yīng)更為敏感,股票定價(jià)效率更高。這些結(jié)論大部分與張延良等(2022年)的發(fā)現(xiàn)一致[30]。一個(gè)有意思的現(xiàn)象是,企業(yè)產(chǎn)權(quán)性質(zhì)(Type)變量系數(shù)在回歸中均呈現(xiàn)顯著負(fù)向關(guān)系,說明國有控股上市公司其股票定價(jià)效率更高。這一現(xiàn)象背后的原因可能在于國有控股上市公司的治理結(jié)構(gòu)更為完善,信息披露機(jī)制和渠道更為暢通,從而提升了信息傳遞效率和股價(jià)的信息含量。其他控制變量如機(jī)構(gòu)投資者持股比例(Institution)、公司上市年限(Age)、資產(chǎn)負(fù)債率(Lev)、第一大股東持股比例(Top1)等,對股票定價(jià)效率沒有顯著影響。
(三)穩(wěn)健性檢驗(yàn)—替換變量
本部分對解釋變量和被解釋變量進(jìn)行替換以驗(yàn)證回歸結(jié)果的穩(wěn)健性。使用公式(6)計(jì)算的股價(jià)同步性指標(biāo)SYN代替SYNdiff,并利用CSMAR數(shù)據(jù)庫中社交媒體情緒指標(biāo)(Sentiment2),計(jì)算如下:
Sentiment2i,t=ln[(1+post)/(1+negt)](12)
公式(12)中,post是當(dāng)月積極的文本條數(shù),negt是當(dāng)月消極的文本條數(shù),Sentiment2是我們構(gòu)建的投資者情緒替代指標(biāo)。表6報(bào)告了對解釋變量和被解釋變量進(jìn)行重新替換后的穩(wěn)健性檢驗(yàn)結(jié)果,列(1)是替換被解釋變量后投資者情緒對股價(jià)同步(SYN)的回歸結(jié)果。可以看出,情緒對股價(jià)同步(SYN)的回歸系數(shù)為-0.297且在1%的顯著性水平下顯著,和前文實(shí)證結(jié)果一致。列(2)和列(3)是替換解釋變量后,投資者情緒(Sentiment2)對定價(jià)效率的回歸結(jié)果??梢钥闯鐾顿Y者情緒回歸系數(shù)為-0.217,對相關(guān)系數(shù)(ρ)的回歸系數(shù)為-0.06,均在1%的顯著性水平下顯著??刂谱兞糠矫?,除系數(shù)絕對值有大小變化差異外,在影響方向上和顯著性方面,與前文實(shí)證結(jié)果一致,證實(shí)了本文基礎(chǔ)結(jié)論的穩(wěn)健性。
(四)內(nèi)生性探討—傾向得分匹配
為排除樣本選擇偏誤可能帶來的內(nèi)生性問題,我們利用傾向得分匹配法(PSM),進(jìn)一步來檢驗(yàn)投資者情緒與股票定價(jià)效率間的關(guān)系。首先,按照投資者情緒值的大小排序,選取前50%作為實(shí)驗(yàn)組、后50%作為對照組。在兩組樣本中按照選取的控制變量運(yùn)用Logit回歸模型計(jì)算投資者情緒,控制變量包括賬面市值比(Bm)、資產(chǎn)收益率(Roa)、資產(chǎn)負(fù)債率(Lev)、公司規(guī)模(Size)。其次,基于Logit回歸模型估計(jì)系數(shù),計(jì)算樣本公司的傾向得分。最后,采用最鄰近匹配法以得分高低作為匹配標(biāo)準(zhǔn)進(jìn)行1∶1匹配,再計(jì)算實(shí)驗(yàn)組和控制組在Sentiment上的平均處理效應(yīng)(ATT),其中Caliper設(shè)置為0.01且使用放回抽樣法進(jìn)行分析。結(jié)果如表7所示,可以看出平均處理效應(yīng)(ATT)均在1%的顯著性水平上為負(fù),說明投資者情緒越樂觀則股票定價(jià)效率越高,PSM檢驗(yàn)結(jié)果和前文基礎(chǔ)回歸結(jié)果一致。
(五)內(nèi)生性探討—DID檢驗(yàn)
盡管我們盡可能多地選擇了可能影響股價(jià)泡沫的控制變量,同時(shí)加入了自變量滯后項(xiàng),但變量遺漏問題仍可能是造成內(nèi)生性問題的主要來源,比如隨時(shí)間變化的影響因素仍然沒有被充分考慮到。進(jìn)一步地,我們利用雙重差分模型(DID)通過組內(nèi)差分和組間差分將隨時(shí)間變化和不變的擾動(dòng)項(xiàng)剔除掉,更有效地排除潛在的內(nèi)生性問題。我們的研究期恰好橫跨國內(nèi)新冠疫情暴發(fā)時(shí)間點(diǎn),將樣本股票分為低情緒組和高情緒組,以新冠疫情暴發(fā)時(shí)間為節(jié)點(diǎn)建立DID模型,觀察疫情暴發(fā)這一外生沖擊事件對兩組子樣本的股票定價(jià)效率是否存在顯著差異。我們設(shè)置虛擬變量sen和COVID-19,將投資者情緒按照樣本個(gè)股生成50%的分位數(shù),大于50%的分位數(shù)的取1為高情緒組,即sen=1;小于50%的分位數(shù)的取0為低情緒組,sen=0。虛擬變量COVID-19=1代表時(shí)間處于2019年12月8日及之后,新冠疫情暴發(fā);COVID-19=0表示處于2019年12月8日之前,沒有新冠疫情。
我們以2019年12月疫情暴發(fā)為節(jié)點(diǎn)做平衡趨勢檢驗(yàn),圖1中被解釋變量為股價(jià)同步性(SYNdiff),縱軸表示平均股價(jià)同步性;圖2被解釋變量為相關(guān)系數(shù)(ρ),縱軸表示平均相關(guān)系數(shù)。兩圖中垂直于橫軸的直線所對應(yīng)時(shí)間為新冠疫情暴發(fā)時(shí)間點(diǎn)2019年12月8日,藍(lán)色虛線對應(yīng)高情緒組,紅色實(shí)線對應(yīng)低情緒組??梢园l(fā)現(xiàn),盡管疫情暴發(fā)前高情緒組平均股價(jià)同步性和平均相關(guān)系數(shù)均小于低情緒組,但二組有相同趨勢,而疫情暴發(fā)之后二者趨勢出現(xiàn)不同。
為了進(jìn)一步檢驗(yàn)平行趨勢,我們生成月份虛擬變量Month與情緒虛擬變量sen的交互項(xiàng)加入模型(13)進(jìn)行回歸:
模型(13)中,m和n分別表示新冠疫情暴發(fā)前和后的期數(shù),其余變量與模型11相同。我們將疫情暴發(fā)當(dāng)月作為基準(zhǔn)組,比較疫情暴發(fā)前各月的交叉項(xiàng)系數(shù)δj,發(fā)現(xiàn)其顯著為0,進(jìn)一步表明疫情暴發(fā)之前高、低情緒組之間的定價(jià)效率不存在顯著差異,這一結(jié)果與圖1和圖2可以相互印證。
我們用did表示sen和COVID-19交乘項(xiàng),將COVID-19、did引入基準(zhǔn)回歸模型中,表8報(bào)告了DID模型的檢驗(yàn)結(jié)果??梢园l(fā)現(xiàn),引入這些變量后,投資者情緒對于股價(jià)同步性和相關(guān)系數(shù)的影響依然顯著為負(fù)。另外,COVID-19對股價(jià)同步性具有顯著的負(fù)向作用,新冠疫情的暴發(fā)反而抑制了股價(jià)同步性,提高了股票定價(jià)效率。
(六)安慰劑檢驗(yàn)
我們繼續(xù)選擇安慰劑檢驗(yàn)(Placebo-Test)來甄別股票定價(jià)效率是否受其他隨機(jī)變量的影響。具體方法為:首先,打亂樣本個(gè)股投資者情緒數(shù)據(jù),將投資者情緒數(shù)據(jù)隨機(jī)賦給樣本股票;其次,將隨機(jī)賦給樣本個(gè)股的投資者情緒(random_s2)分別對股票定價(jià)效率(股價(jià)同步性、相關(guān)系數(shù))進(jìn)行回歸;最后,將上述步驟重復(fù)500次,統(tǒng)計(jì)結(jié)果中投資者情緒(random_s2)系數(shù)的p值并與基準(zhǔn)回歸結(jié)果進(jìn)行對比。
圖3和圖4分別報(bào)告了相應(yīng)被解釋變量下投資者情緒(random_s2)回歸系數(shù)p值的核密度分布圖,其中圖3對應(yīng)的被解釋變量為股價(jià)同步性,圖4的對應(yīng)被解釋變量為相關(guān)系數(shù),橫軸表示當(dāng)期虛擬投資者情緒的系數(shù),縱軸為對應(yīng)系數(shù)的p值,水平虛線對應(yīng)p值為0.1,垂直虛線為原基準(zhǔn)回歸結(jié)果的系數(shù),左側(cè)系數(shù)為-0.579,右側(cè)系數(shù)為-0.075??梢钥闯?,無論被解釋變量是股價(jià)同步性還是相關(guān)系數(shù),500次模擬所得虛擬投資者情緒的估計(jì)系數(shù)絕對值均遠(yuǎn)小于對應(yīng)基準(zhǔn)回歸結(jié)果的系數(shù),并以0為中心呈對稱分布。大部分模擬情緒所得系數(shù)的對應(yīng)p值大于0.1,并不顯著??梢哉J(rèn)為,基準(zhǔn)回歸結(jié)果并非偶然因素引起,投資者情緒對股票定價(jià)效率的影響作用比較穩(wěn)健。
五、進(jìn)一步研究:中介機(jī)制與調(diào)節(jié)效應(yīng)
(一)信息效應(yīng)中介機(jī)制檢驗(yàn)
為了檢驗(yàn)創(chuàng)業(yè)板上市企業(yè)良好的ESG表現(xiàn)是否發(fā)揮“信息效應(yīng)”,降低了公司的信息不對稱程度進(jìn)而提高了股票定價(jià)效率,借鑒武鵬等(2023年)的研究方法[31],選取流動(dòng)性比率(LR)、非流動(dòng)性比率(IRR)和收益率反轉(zhuǎn)指標(biāo)(GAM)的第一主成分作為“信息不對稱”(Asy)的代理變量。信息不對稱(Asy)數(shù)值越大,說明公司向市場傳遞的特質(zhì)信息越少,信息不對稱程度越嚴(yán)重。我們進(jìn)行了信息中介機(jī)制的檢驗(yàn),表9報(bào)告了檢驗(yàn)結(jié)果。
列(1)—列(2)是以信息不對稱(Asy)為被解釋變量,投資者情緒及其滯后一期作為解釋變量,逐步納入回歸的結(jié)果??梢园l(fā)現(xiàn),投資者情緒變量及其滯后一期變量的回歸系數(shù)均在5%的顯著性水平下顯著為負(fù),說明投資者情緒的樂觀有助于緩解信息不對稱程度。將解釋變量和中介變量Asy同時(shí)納入回歸模型,列(3)—列(4)、列(5)—列(6)分別是以SYNdiff和ρ為被解釋變量的回歸結(jié)果??梢园l(fā)現(xiàn),情緒及其滯后一期、信息不對稱指標(biāo)分別顯著為負(fù)和正,表明樂觀的投資者情緒能夠通過降低信息不對稱程度,進(jìn)而提高股票市場定價(jià)效率,假設(shè)H2得到驗(yàn)證。
(二)調(diào)節(jié)效應(yīng):賣空限制的影響
市場賣空機(jī)制通過允許投資者的買空和賣空行為,促使更多的信息融入股價(jià)。如果賣空受限,投資者即使在看空股票時(shí)也無法通過賣空操作來獲利,悲觀情緒無法得到充分的表達(dá)和釋放,進(jìn)而影響股價(jià)的信息含量。借鑒Liu 等(2015年)的觀點(diǎn)[32],利用機(jī)構(gòu)持股比例來衡量賣空限制程度。因?yàn)槭袌隹纯照咭獙?shí)施賣空操作,首先要從券商手中借入股票。機(jī)構(gòu)投資者通常作為出借股票的一方,其持有股票的數(shù)量或者比例就決定了市場上賣空限制程度的強(qiáng)弱。這樣可供借出的股票數(shù)量就可以間接衡量賣空限制的程度,如果機(jī)構(gòu)持股數(shù)量越少,則表示賣空限制程度越強(qiáng)。首先,我們對個(gè)股每季末的機(jī)構(gòu)持股數(shù)量取均值,再進(jìn)行排序,之后按照50%分位數(shù)將樣本股票分為機(jī)構(gòu)持股數(shù)量高、低兩組。機(jī)構(gòu)持股數(shù)量最低組作為對照組,對投資者情緒對股票定價(jià)效率的影響效應(yīng)進(jìn)行分組回歸。
表10報(bào)告了回歸結(jié)果,其中列(1)和列(2)是投資者情緒對股價(jià)同步性的回歸結(jié)果,列(1)是機(jī)構(gòu)持股數(shù)量低的組,也即賣空限制高的組。投資者情緒的回歸系數(shù)是-0.379,且在1%的顯著性水平下顯著。列(2)是機(jī)構(gòu)持股數(shù)量高的組,也即賣空限制低的組。投資者情緒的回歸系數(shù)是-0.705,且在1%的顯著性水平下顯著。列(3)和列(4)是投資者情緒對相關(guān)系數(shù)的回歸結(jié)果,列(3)是機(jī)構(gòu)持股數(shù)量低的組。投資者情緒對相關(guān)系數(shù)的回歸系數(shù)是-0.067,且在1%的顯著性水平下顯著。列(4)是機(jī)構(gòu)持股數(shù)量高的組,投資者情緒的回歸系數(shù)是-0.097,且在1%的顯著性水平下顯著。很明顯,無論對于股價(jià)同步性(SYNdiff)還是相關(guān)系數(shù)(ρ)來說,隨著賣空限制程度的降低,Sentiment的系數(shù)絕對值都呈現(xiàn)逐漸增大的規(guī)律且始終保持顯著。這意味著賣空限制越低,投資者情緒對股票定價(jià)效率的影響越明顯,假設(shè)H3得到驗(yàn)證。
(三)調(diào)節(jié)效應(yīng):信息環(huán)境的影響
上市公司所處信息環(huán)境會(huì)影響投資者獲取以及處理信息的質(zhì)量,進(jìn)而影響股價(jià)對信息的反應(yīng)程度。參考孟慶斌和黃清華(2018年)的度量方法[33],以分析師關(guān)注度(Analyst),即在t年度分析師跟蹤樣本股票i的總數(shù)量的自然對數(shù)作為信息環(huán)境的度量指標(biāo),對樣本進(jìn)行分組回歸。表11中列(1)和列(2)是投資者情緒對股價(jià)同步性影響效應(yīng)的回歸結(jié)果??梢园l(fā)現(xiàn),低分析師關(guān)注度組中,投資者情緒對股價(jià)同步性的回歸系數(shù)是-0.752,在1%顯著性水平下顯著;高分析師關(guān)注度組中,投資者情緒對股價(jià)同步性的回歸系數(shù)是-0.344,在5%顯著性水平下顯著。列(3)和列(4)是投資者情緒對相關(guān)系數(shù)的回歸結(jié)果。低分析師關(guān)注度組中,投資者情緒對相關(guān)系數(shù)的回歸系數(shù)是-0.074;高分析師關(guān)注度組中,投資者情緒對相關(guān)系數(shù)的回歸系數(shù)是-0.073,兩者均在1%顯著性水平下顯著。無論對于同步性還是相關(guān)系數(shù)來說,隨著上市公司分析師關(guān)注度的提升,解釋變量Sentiment的系數(shù)絕對值都逐漸減小且始終保持顯著。這意味著分析師跟蹤人數(shù)越少,投資者情緒對股票定價(jià)效率的影響越明顯,也即公司信息環(huán)境的改善可以緩解情緒對股票定價(jià)效率的影響效應(yīng),假設(shè)H4得到驗(yàn)證。
六、結(jié)論與啟示
本文以滬深300指數(shù)成分股作為研究樣本,利用Python文本挖掘技術(shù)抓取東方財(cái)富網(wǎng)樣本股股吧中2019年1月—2022年2月實(shí)時(shí)發(fā)帖文本,使用樸素貝葉斯方法對文本中隱含的情緒傾向進(jìn)行分析并構(gòu)建了投資者情緒指標(biāo),利用固定效應(yīng)模型分析了投資者情緒對于股票定價(jià)效率的影響。進(jìn)一步地,分析了這一影響效應(yīng)在不同賣空限制程度和信息環(huán)境條件下的異質(zhì)性表現(xiàn)。實(shí)證發(fā)現(xiàn),首先,基于股吧論壇發(fā)帖構(gòu)建的投資者情緒與股票定價(jià)效率之間存在顯著正相關(guān)關(guān)系,也即越樂觀的投資者情緒越能帶動(dòng)股票定價(jià)效率的提升。其次,中介機(jī)制分析表明,這種影響效應(yīng)是通過樂觀情緒降低信息不對稱程度,進(jìn)而提升股價(jià)信息含量和定價(jià)效率這一路徑產(chǎn)生作用。在一定程度上說明,投資者情緒的高漲提高了股價(jià)信息含量,加快了市場信息融入股價(jià)的速度。再次,隨著賣空限制的降低,投資者情緒對股票定價(jià)效率的影響會(huì)越明顯,也即股票定價(jià)效率對投資者情緒的敏感度會(huì)隨著賣空限制的降低而增強(qiáng),而公司信息環(huán)境的改善可以降低投資者情緒對股票定價(jià)效率的影響效應(yīng)。在經(jīng)過一系列穩(wěn)健性檢驗(yàn)后,上述結(jié)論仍然成立。這些結(jié)論為透視股票市場中的投資者情緒如何影響市場信息效率和市場運(yùn)行,以及加強(qiáng)網(wǎng)絡(luò)媒體信息傳播監(jiān)管的必要性提供了實(shí)證證據(jù)。
在移動(dòng)互聯(lián)時(shí)代,越來越多的個(gè)體投資者會(huì)選擇通過網(wǎng)絡(luò)渠道獲取信息、交流觀點(diǎn)。這種情勢的變化也為通過網(wǎng)絡(luò)信息監(jiān)督管理來提高股票市場運(yùn)行效率提供了新思路?;诒疚慕Y(jié)論,對于上市公司來說,要充分重視對網(wǎng)絡(luò)信息渠道的檢測,同時(shí)切實(shí)履行信息披露責(zé)任,利于更多公司特質(zhì)信息融入股價(jià),提高股價(jià)的信息效率。對于監(jiān)管部門來說,要加強(qiáng)對互聯(lián)網(wǎng)平臺(tái)的監(jiān)管,保證信息的真實(shí)性以及可靠性。同時(shí),應(yīng)充分健全市場管理制度框架,比如由于賣空限制程度會(huì)影響股票定價(jià)效率對于投資者情緒的敏感程度,監(jiān)管部門應(yīng)結(jié)合我國實(shí)際情況逐步完善融資融券制度。對于網(wǎng)絡(luò)平臺(tái)來說,其高質(zhì)量發(fā)展不僅需要監(jiān)管部門的監(jiān)督和制約,還要實(shí)現(xiàn)自我監(jiān)督和管理,切實(shí)履行自己的責(zé)任,做高質(zhì)量信息傳遞的渠道。網(wǎng)絡(luò)平臺(tái)可以對信息進(jìn)行過濾甄別,對發(fā)布人身份與言論進(jìn)行分析,為投資者提供技術(shù)支持,禁止互聯(lián)網(wǎng)上不合理的信息散布與擴(kuò)散。
[參考文獻(xiàn)]
[1] 楊菁菁、胡錦、張朕東:《投資者情緒與資本市場信息效率——基于股價(jià)信息含量的視角》,《河北工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)》2023年第3期,第1—13+49頁。
[2] 鄭建東、呂曉亮、呂斌等:《社交媒體平臺(tái)信息交互與資本市場定價(jià)效率——基于股吧論壇億級(jí)大數(shù)據(jù)的證據(jù)》,《數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究》2022年第11期,第91—112頁。
[3] Behrendt S, Schmidt A: “The Twitter Myth Revisited: Intraday Investor Sentiment, Twitter Activity, and Individual-Level Stock Return Volatility”, Journal of Banking and Finance, Vol.96, No.8,2018, pp.355-367.
[4] Da Z, Joseph E, Gao P: “The Sum of All FEARS Investor Sentiment and Asset Prices”,The Review of Financial Studies, Vol.28, No.1,2015, pp.1-32.
[5] Gao Z, Ren H, Zhang B: “Googling Investor Sentiment around the World”, Journal of Financial and Quantitative Analysis, Vol.55, No.2,2020, pp. 549-580.
[6] 俞慶進(jìn)、張兵:《投資者有限關(guān)注與股票收益——以百度指數(shù)作為關(guān)注度的一項(xiàng)實(shí)證研究》,《金融研究》 2012年第8期,第152—165頁。
[7] Tsukioka Y, Yanagi J, Takada T: “Investor Sentiment Extracted from Internet Stock Message Boards and IPO Puzzles”, International Review of Economics and Finance, Vol.56, No.3, 2018, pp.205-217.
[8] 黃創(chuàng)霞、溫石剛、楊鑫等:《個(gè)體投資者情緒與股票價(jià)格行為的互動(dòng)關(guān)系研究》,《中國管理科學(xué)》 2020年第3期,第191—200頁。
[9] 楊曉蘭、沈翰彬、祝宇:《本地偏好、投資者情緒與股票收益率:來自網(wǎng)絡(luò)論壇的經(jīng)驗(yàn)證據(jù)》,《金融研究》2016年第12期,第143—158頁。
[10] Li X, Qiao P, Zhao L: “CEO Mmedia Exposure, Political Connection and Chinese Firms Stock Price Synchronicity”, International Review of Economics and Finance, Vol.63, No.C,2019, pp.61-75.
[11][26] Antweiler W, Frank M Z: “Is All That Talk Just Noise? The Information Content of Internet Stock Message Boards”, The Journal of Finance, Vol.59, No.3,2004, pp.1259-1294.
[12] 尹海員、寇文娟:《基于樸素貝葉斯法的投資者情緒度量及其對股票特質(zhì)風(fēng)險(xiǎn)的影響 》,《中國管理科學(xué)》2021年,DOI:10.16381/j.cnki.issn1003-207x.2021.0028。
[13][33] 孟慶斌、黃清華:《賣空機(jī)制是否降低了股價(jià)高估?——基于投資者異質(zhì)信念的視角》,《管理科學(xué)學(xué)報(bào)》 2018年第4期,第43—66頁。
[14] 連立帥、朱松、陳關(guān)亭:《資本市場開放、非財(cái)務(wù)信息定價(jià)與企業(yè)投資——基于滬深港通交易制度的經(jīng)驗(yàn)證據(jù)》,《管理世界》 2019年第8期,第136—154頁。
[15] 田高良、司毅、秦嶺等:《網(wǎng)絡(luò)輿情及其應(yīng)對與上市公司的信息效率》,《系統(tǒng)工程理論與實(shí)踐》2018年第1期,第46—66頁。
[16] Zhou D, Zhao Y, Lin P, Li B: “Can Microblogging Information Disclosure Reduce Stock Price Synchronicity? Evidence from China”, Australian Journal of Management, Vol.44, No.2,2019, pp.282-305.
[17] He Q, Fang C: “Regulatory Sanctions and Stock Pricing Efficiency: Evidence from the Chinese Stock Market”,Pacific-Basin Finance Journal, Vol.58, No.8,2015, pp.101241-101241.
[18] 張大永、劉倩、姬強(qiáng):《股票分析師的羊群行為對公司股價(jià)同步性的影響分析》,《中國管理科學(xué)》2021年第5期,第55—64頁。
[19] Steven C, Lam B M, Li L Z, Jahidur R M: “Information Environment and Stock Price Synchronicity: Evidence from Aauditor Characteristics”, International Journal of Auditing, Vol.25, No.2,2021, pp.332-350.
[20] Dang T L, Dang M, Hoang L, Nguyen L: “Media Coverage and Stock Price Synchronicity”,International Review of Financial Analysis, Vol.67, No.C,2019, pp.1014-1030.
[21] Das S R, Chen M Y: “Yahoo! for Amazon: Sentiment Extraction from Small Talk on the Web”,Management Science, Vol.53, No.9,2007, pp.1375-1388.
[22] Price S M, Doran J S,Peterson D R, Bliss B A:“Earnings Conference Calls and Stock Returns: The Incremental Informativeness of Textual Tone”, Journal of Banking and Finance, Vol.36, No.4,2012, pp.992-1011.
[23] Jiang X, Xu N, Yuan Q: “Mutual-Fund-Affiliated Analysts and Stock Price Synchronicity: Evidence from China”,Journal of Accounting, Auditing & Finance, Vol.33, No.3,2018, pp.435-460.
[24] 潛力、龔之晨:《網(wǎng)絡(luò)溝通對股票市場的影響——基于投資者有限關(guān)注視角的研究》,《金融論壇》2021年第2期,第47—58頁。
[25] 孫鯤鵬、肖星:《互聯(lián)網(wǎng)社交媒體、投資者之間交流與資本市場定價(jià)效率》,《投資研究》2018年第4期,第140—160頁。
[27] Morck R, Yeung B, Yu W: “The Information Content of Stock Markets: Why Do Emerging Markets Have Synchronous Stock Price Movements?”, Journal of Financial Economics, Vol.58, No.1,2000, pp.215-260.
[28] Bris A, Goetzmann W N, Zhu N: “Efficiency and the Bear: Short Sales and Markets around the World”, The Journal of Finance, Vol.62, No.3,2007, pp.1029-1079.
[29] 郭照蕊、張?zhí)焓妫骸陡哞F開通對資本市場定價(jià)效率的影響研究》,《管理學(xué)報(bào)》2021年第4期,第614—623頁。
[30] 張延良、崔海濤,李琪等:《媒體關(guān)注對股票定價(jià)效率影響研究》,《投資研究》2022年第9期,第143—158頁。
[31] 武鵬、楊科、蔣峻松等:《企業(yè)ESG表現(xiàn)會(huì)影響盈余價(jià)值相關(guān)性嗎?》,《財(cái)經(jīng)研究》2023年第6期,第137—152+169頁。
[32] Liu S: “Investor Sentiment and Stock Market Liquidity”, Journal of Behavioral Finance, Vol.16, No.1,2015, pp.51-67.
Does Investor Sentiment Affect the Efficiency of Stock Pricing?
——Textual Evidence from the Stock Community
Abstract: The efficiency of stock pricing is a crucial indicator for measuring the effectiveness of the stock market. Higher pricing efficiency facilitates the rational allocation of capital market resources and better serves the high-quality development of the real economy. This study explores the text postings within the investor community of Dongfang Fortune, analyzes the sentiment of the text using machine learning methods, constructs investor sentiment indicators, and examines their impact on the efficiency of stock pricing. The findings indicate a significant positive correlation between investor sentiment and stock pricing efficiency, suggesting that more optimistic investor sentiment drives an increase in stock pricing efficiency. This influence operates through a mechanism in which optimism reduces the degree of information asymmetry, thereby enhancing the information content of stock prices and improving pricing efficiency. Furthermore, with the loosening of short-selling restrictions, the sensitivity of stock pricing efficiency to sentiment will increase, and a conducive information environment will reduce the impact of sentiment on stock pricing efficiency. The research conclusion provides evidence for observing the operational efficiency of Chinas stock market from an individual investor sentiment perspective and the necessity of information regulation on online media.
Key words:investor sentiment; stock pricing efficiency; data mining; machine learning