扈文秀 蘇振興 楊櫟
摘 要:概念炒作一直是股票價(jià)格波動(dòng)的重要驅(qū)動(dòng)因素之一,本文基于投資者關(guān)注視角探究投資者概念關(guān)注對(duì)概念指數(shù)波動(dòng)的預(yù)測(cè)作用。使用百度搜索指數(shù)的非結(jié)構(gòu)化數(shù)據(jù)測(cè)度投資者概念關(guān)注,利用隨機(jī)森林方法構(gòu)建預(yù)測(cè)模型,驗(yàn)證市場(chǎng)交易指標(biāo)和投資者概念關(guān)注對(duì)概念指數(shù)收益和超額收益漲跌的預(yù)測(cè)作用,并根據(jù)預(yù)測(cè)結(jié)果設(shè)計(jì)交易策略。結(jié)果發(fā)現(xiàn)市場(chǎng)交易指標(biāo)對(duì)概念指數(shù)收益漲跌有較好的預(yù)測(cè)作用,投資者概念關(guān)注則對(duì)概念指數(shù)超額收益漲跌有較好的預(yù)測(cè)作用,根據(jù)預(yù)測(cè)結(jié)果設(shè)計(jì)的交易策略可以獲得正向的超額收益。本文彌補(bǔ)了前人關(guān)于投資者概念關(guān)注預(yù)測(cè)作用研究的空白,也為投資者制定交易策略提供一定的理論參考。
關(guān)鍵詞:投資者概念關(guān)注;概念指數(shù)收益;隨機(jī)森林;交易策略
中圖分類號(hào):F832.5文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-5192(2021)01-0060-07doi:10.11847/fj.40.1.60
Abstract:The concept speculation has always been one of the main reasons of stock price fluctuation. From the perspective of investor attention, this paper explores the prediction effect of investor attention to the concept index on the fluctuation of concept index. The unstructured data of BSI (Baidu Search Index) is used to measure the investor attention to the concept index, and the Random Forest Algorithm is used to build a prediction model, to verify the prediction effect of market trading indicators and the investor attention to the concept index on the return and abnormal return of concept index. Then, design investment strategies according to the prediction results. The results show that the market trading indicators have a good prediction effect on the return of concept index, and the investor attention to the concept index has a good prediction effect on the abnormal return of concept index, and the investment strategies can get positive abnormal returns. This paper fills in the gap of the existed research on the prediction effect of investor attention to the concept index and provides some academic reference for investors to making investment strategies.
Key words:investor attention to the concept index; return of concept index; random forest algorithm; investment strategy
1 引言
在中國(guó)證券市場(chǎng),“概念”板塊炒作已經(jīng)成為股票價(jià)格波動(dòng)的重要推手之一。近年來“科創(chuàng)板”、“5G”、“一帶一路”、“互聯(lián)網(wǎng)+”等概念層出不窮,吸引了大量投資者關(guān)注,助推股票價(jià)格大幅上漲。投資者關(guān)注是投資者為降低投資不確定性從而主動(dòng)獲取投資信息的認(rèn)知行為,在一定程度上反應(yīng)了投資者的預(yù)期[1],所以利用投資者關(guān)注預(yù)測(cè)股票價(jià)格波動(dòng)在理論上具有一定的可行性[2]。Da等[3]首次將股票簡(jiǎn)稱在Google搜索引擎的搜索量作為投資者關(guān)注的代理變量,解決了投資者關(guān)注不可觀測(cè)性、不可獲得性和時(shí)效性等問題,使得利用投資關(guān)注預(yù)測(cè)證券市場(chǎng)成為可能,為投資者識(shí)別證券市場(chǎng)盈利機(jī)會(huì)、獲取超額收益提供新的思路。
隨著大數(shù)據(jù)在金融領(lǐng)域的廣泛應(yīng)用,大量實(shí)證研究以搜索引擎的非結(jié)構(gòu)化數(shù)據(jù)作為投資者關(guān)注的代理變量,對(duì)證券市場(chǎng)進(jìn)行了有效的預(yù)測(cè)。這些研究主要從兩個(gè)層面展開,其一是利用投資者對(duì)宏觀證券市場(chǎng)中特定關(guān)鍵詞的關(guān)注來構(gòu)建和測(cè)量市場(chǎng)領(lǐng)先指標(biāo)[4]、投資者情緒[5,6]以及市場(chǎng)風(fēng)險(xiǎn)[7]等變量,進(jìn)而對(duì)證券市場(chǎng)指數(shù)以及市場(chǎng)風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè);其二是利用微觀層面的投資者個(gè)股關(guān)注對(duì)股票價(jià)格、收益率以及波動(dòng)率等因素進(jìn)行預(yù)測(cè)[3,8]。但是中觀層面的投資者概念關(guān)注卻鮮有人研究,王宇哲和趙靜[9]將PM2.5和霧霾的百度搜索量作為投資者對(duì)“霧霾”關(guān)注度的代理變量引入研究,研究發(fā)現(xiàn)投資者對(duì)PM2.5和霧霾的關(guān)注度越高,污染治理類股票收益越高,滯后一期的公眾霧霾關(guān)注度對(duì)霧霾治理概念股收益率有顯著的正向影響。楊濤和郭萌萌[10]也以PM2.5概念為例進(jìn)行研究,發(fā)現(xiàn)投資者對(duì)PM2.5和霧霾的關(guān)注會(huì)正向影響PM2.5概念股的收益率。這些文獻(xiàn)為研究投資者概念關(guān)注提供了有益的探索,但是也存在一些局限性。一方面僅以PM2.5概念板塊的股票為樣本進(jìn)行研究,存在樣本選取誤差,研究結(jié)果可能不具有普適性;另一方面也未有研究考慮投資者概念關(guān)注是否對(duì)概念指數(shù)收益以及超額收益漲跌具有預(yù)測(cè)作用?,F(xiàn)有文獻(xiàn)在研究投資者關(guān)注對(duì)股票收益預(yù)測(cè)作用時(shí),大多采用Granger因果關(guān)系檢驗(yàn)[1]、VAR模型[9]、GARCH模型[11]以及線性回歸分析方法[1,3,6~10,12]等傳統(tǒng)計(jì)量模型進(jìn)行實(shí)證研究,也有學(xué)者使用機(jī)器學(xué)習(xí)方法中的SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)股票市場(chǎng)收益[13]。由于投資者關(guān)注的劇烈變化會(huì)導(dǎo)致其分布呈現(xiàn)出尖峰厚尾、波動(dòng)集群的統(tǒng)計(jì)特征,所以投資者關(guān)注與市場(chǎng)表現(xiàn)之間存在非線性復(fù)雜關(guān)系,使用傳統(tǒng)回歸分析難以構(gòu)建有效的金融預(yù)測(cè)模型[14]。而機(jī)器學(xué)習(xí)方法不需要嚴(yán)格假設(shè)和充足先驗(yàn)條件為前提假定的,可以有效規(guī)避這一統(tǒng)計(jì)分布缺陷,刻畫變量間的非線性關(guān)系,所以本研究選擇機(jī)器學(xué)習(xí)方法中的隨機(jī)森林方法(Random Forests Algorithm,RFA)作為預(yù)測(cè)模型。該方法是一種包含多個(gè)決策樹的分類和預(yù)測(cè)模型,適用于存在大量未知特征的數(shù)據(jù),可以有效解決數(shù)據(jù)不符合正態(tài)分布的問題,當(dāng)數(shù)據(jù)存在大量噪音時(shí),也可以取得很好的預(yù)測(cè)性能,且不必?fù)?dān)心過度擬合問題[15,16]。
基于此,本文將中觀層面的投資者概念關(guān)注引入預(yù)測(cè)模型,采用隨機(jī)森林方法對(duì)概念指數(shù)收益和超額收益漲跌進(jìn)行預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果構(gòu)建交易策略。與以往文獻(xiàn)相比,本文的貢獻(xiàn)在于:(1)補(bǔ)充了中觀層面的投資者概念關(guān)注對(duì)概念指數(shù)收益和超額收益預(yù)測(cè)研究的空白,豐富了投資者關(guān)注的理論研究和實(shí)證研究。(2)隨機(jī)森林方法作為非參數(shù)分類預(yù)測(cè)方法,可以有效克服投資者概念關(guān)注的統(tǒng)計(jì)分布缺陷,提高投資者概念關(guān)注極端變化以及股票收益極端變化情況下的預(yù)測(cè)準(zhǔn)確性。(3)依據(jù)投資者概念關(guān)注的預(yù)測(cè)結(jié)果構(gòu)建交易策略,為投資者的投資決策提供理論參考。
2 理論分析
目前學(xué)術(shù)界尚未對(duì)股票市場(chǎng)中的“概念”進(jìn)行統(tǒng)一的定義,本文引用股票市場(chǎng)板塊的定義對(duì)“概念”進(jìn)行闡述?!案拍睢笔侵笇?duì)驅(qū)動(dòng)某一類股票價(jià)格波動(dòng)要素的概括,也是投資者基于該要素形成的一種更為積極、含義更為肯定、具有持續(xù)性的投資共識(shí)。投資者概念關(guān)注是指投資者對(duì)該要素及其相關(guān)信息的關(guān)注行為,本質(zhì)是投資者對(duì)信息的關(guān)注。本文以信息搜尋理論[17](search theory)、分類思考[18](ctegory-learning/thinking)以及投資者有限關(guān)注[19]為理論基礎(chǔ)論述投資者概念關(guān)注對(duì)概念指數(shù)波動(dòng)的影響作用。
信息搜尋理論認(rèn)為,信息搜尋可以降低投資決策的不確定性,從而獲得超額收益,但是信息搜尋具有成本,其中投資者注意力的有限性是搜索成本的重要因素之一[17,20]。因此為了使注意力這一稀缺資源獲得最大收益,會(huì)促使投資者采用分類思考的方式處理信息,即較少關(guān)注股票的特質(zhì)信息,而是將更多注意力分配給市場(chǎng)信息、行業(yè)信息或者板塊信息,利用市場(chǎng)、行業(yè)或板塊的信息來指導(dǎo)其投資決策[18]。Huang[21]利用個(gè)人投資者的交易數(shù)據(jù)實(shí)證研究發(fā)現(xiàn),投資者在某一特定行業(yè)的成功投資經(jīng)歷會(huì)增加隨后購(gòu)買同一行業(yè)股票的可能性,即投資者會(huì)采用分類思考的方式作出投資決策。Barberis和Shleifer[22]研究也發(fā)現(xiàn)投資者存在按行業(yè)等類別對(duì)股票進(jìn)行分類從而簡(jiǎn)化投資決策的行為特征。故說明投資者對(duì)分類要素信息的關(guān)注會(huì)影響投資決策,即投資者概念關(guān)注會(huì)影響該概念板塊股票價(jià)格的波動(dòng)。
投資者概念關(guān)注作為一種認(rèn)知行為,必然會(huì)受到投資者注意力有限性的約束[23],只能有選擇地關(guān)注某些信息,而忽略其它事物的信息,即有限關(guān)注[19]。所以當(dāng)投資者準(zhǔn)備買入股票時(shí),需要在數(shù)以千計(jì)股票中進(jìn)行選擇,只能關(guān)注引起自己注意的部分股票,并將這些股票視作潛在的投資目標(biāo)。但是當(dāng)投資者準(zhǔn)備賣出股票時(shí),由于賣空限制,投資者僅可以賣出自己所持有的股票,所以注意力不受約束。這種注意力約束對(duì)買賣決策的非對(duì)稱影響勢(shì)必導(dǎo)致投資者成為其關(guān)注股票的凈買入者,從而在短期內(nèi)帶來凈買入資金,對(duì)股票價(jià)格形成上漲壓力,所以投資者的關(guān)注行為表達(dá)了一定程度的買入預(yù)期[24]。投資者信念的偏差性會(huì)導(dǎo)致投資者選擇關(guān)注與自己觀念相一致的信息,拒絕接受與自己觀念相沖突的信息,所以投資者概念關(guān)注也是其投資偏好和預(yù)期的體現(xiàn)[25]?!案拍睢笔峭顿Y者形成的一種積極投資共識(shí)[10],所以當(dāng)投資者概念關(guān)注增加,表示這種積極投資共識(shí)的擴(kuò)大,從而導(dǎo)致買入資金的增加,推動(dòng)股票價(jià)格上漲。因此本文認(rèn)為投資者概念關(guān)注可以有效地預(yù)測(cè)概念指數(shù)的波動(dòng)。
3 變量設(shè)計(jì)與研究方法
3.1 研究變量與數(shù)據(jù)來源
本文選擇三個(gè)概念板塊的概念指數(shù)進(jìn)行實(shí)證研究,分別是基于產(chǎn)業(yè)技術(shù)發(fā)展驅(qū)動(dòng)的5G板塊,基于公眾關(guān)注驅(qū)動(dòng)的PM2.5板塊以及基于國(guó)家政策驅(qū)動(dòng)的一帶一路板塊,這三個(gè)板塊具有典型的中國(guó)證券市場(chǎng)概念板塊特征,且是目前證券市場(chǎng)投資者較為認(rèn)可和追捧的熱點(diǎn)板塊。三個(gè)概念板塊的時(shí)間跨度分別以該概念板塊指數(shù)首次收入WIND數(shù)據(jù)庫(kù)為基準(zhǔn)日期,故5G概念的基準(zhǔn)日期為2016年1月4日,PM2.5概念的基準(zhǔn)日期為2013年5月2日,一帶一路概念的基準(zhǔn)日期為2014年10月9日,期末日期均為2018年11月29日。
本研究假設(shè)以每個(gè)概念板塊中的所有股票建立投資組合,每只股票投資金額的權(quán)重為構(gòu)建概念指數(shù)的權(quán)重,以概念指數(shù)作為投資組合的價(jià)格。采用前置一期的概念指數(shù)收益和超額收益漲跌為被預(yù)測(cè)變量。借鑒王宇哲和趙靜[9]的量化方法測(cè)量投資者概念關(guān)注(ICA),將“5G”、“PM2.5+霧霾”和“一帶一路”為關(guān)鍵詞的百度搜索量分別作為投資者5G概念關(guān)注、PM2.5概念關(guān)注和一帶一路概念關(guān)注的代理變量。借鑒俞慶進(jìn)和張兵[26]測(cè)度滬深300指數(shù)投資者關(guān)注度的方法,將個(gè)股證券簡(jiǎn)稱作為關(guān)鍵詞的百度搜索量作為投資者個(gè)股關(guān)注,按照股票所屬的概念板塊進(jìn)行等權(quán)求和,從而得到投資者概念板塊關(guān)注(ISA)。
市場(chǎng)交易變量的設(shè)計(jì)參照戴德寶等[13]的研究,在構(gòu)建預(yù)測(cè)模型時(shí),考慮到指數(shù)收益和超額收益均具有自相關(guān)性,所以將當(dāng)期的概念指數(shù)收益和超額收益加入預(yù)測(cè)模型。將概念指數(shù)市場(chǎng)交易指標(biāo)開盤點(diǎn)位、最高點(diǎn)位、最低點(diǎn)位、振幅、成交額和成交量也納入研究,還引入滬深300指數(shù)的收盤點(diǎn)位作為市場(chǎng)影響因素加入預(yù)測(cè)模型。投資者關(guān)注的數(shù)據(jù)來自于百度搜索指數(shù),利用Python 3.7構(gòu)建的網(wǎng)絡(luò)爬蟲代碼抓取這些數(shù)據(jù),股票市場(chǎng)的交易數(shù)據(jù)均來自于WIND數(shù)據(jù)庫(kù)。
概念指數(shù)收益和超額收益的計(jì)算方法借鑒Burrowes和Jones[27]的方法。
3.2 隨機(jī)森林方法
隨機(jī)森林方法[15]是一種基于統(tǒng)計(jì)抽樣理論(Bootstrap)的數(shù)據(jù)挖掘分類算法,有隨機(jī)森林回歸和隨機(jī)森林分類兩種方法,本研究使用隨機(jī)森林分類。隨機(jī)森林分類建模的基本思想是利用Bootstrap方法從原始樣本中有放回地隨機(jī)抽取N個(gè)子樣本,對(duì)每一個(gè)子樣本進(jìn)行決策樹建模,最后根據(jù)N個(gè)決策樹模型的預(yù)測(cè)結(jié)果,使用多數(shù)投票法決定隨機(jī)森林的分類結(jié)果,即
其中H(x)表示最終分類結(jié)果,hi(x)表示每個(gè)子樣本i的決策樹分類結(jié)果,Y表示被預(yù)測(cè)變量,I(·)表示示性函數(shù),若hi(x)=Y,則I(·)=1,否則I(·)=0。(5)式表示隨機(jī)森林方法使用多數(shù)投票決策的方式來確定最終的分類[28]。
隨機(jī)森林方法的核心是決策樹模型,該模型是一種非參數(shù)分類方法,也是一種有監(jiān)督的分類方法。決策樹模型會(huì)根據(jù)每個(gè)樣本確定的分類屬性訓(xùn)練出一個(gè)分類器,其中節(jié)點(diǎn)分裂是該模型的核心步驟,通過節(jié)點(diǎn)分裂才能產(chǎn)生一棵完整的決策樹。每棵樹分支的生成,都是按照某種分裂規(guī)則選擇屬性,這些規(guī)則主要包括信息增益最大、信息增益率最大和Gini系數(shù)最小等,不同的規(guī)則對(duì)應(yīng)不同的分裂算法。在節(jié)點(diǎn)分裂時(shí),將每個(gè)屬性的所有劃分按照規(guī)則指標(biāo)進(jìn)行排序,然后按照規(guī)則選擇某個(gè)屬性作為分裂屬性,并按照其劃分實(shí)現(xiàn)決策樹的分支生長(zhǎng)。通過理論和實(shí)證研究都證明了隨機(jī)森林具有很高的預(yù)測(cè)準(zhǔn)確率,對(duì)異常值和噪聲具有很好的容忍度。
4 實(shí)證研究
本研究的實(shí)證分析主要由三部分構(gòu)成,首先是對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,由于變量概念指數(shù)收益率(RIT)、超額收益率(AIR)、開盤點(diǎn)位變動(dòng)率(DOpen)、最高點(diǎn)位變動(dòng)率(DHigh)、最低點(diǎn)位變動(dòng)率(DLow)、振幅變動(dòng)率(DTa)、成交額變動(dòng)率(DVol)、成交量變動(dòng)率(DVot)和滬深300指數(shù)收盤點(diǎn)位變動(dòng)率(DMR)之間具有相關(guān)性,為了避免“維數(shù)災(zāi)難”,所以對(duì)變量進(jìn)行主成分分析(Principal Component Analysis)。其次是將預(yù)測(cè)變量進(jìn)行組合,構(gòu)建不同的預(yù)測(cè)模型,設(shè)置隨機(jī)森林預(yù)測(cè)模型的相關(guān)參數(shù)并訓(xùn)練預(yù)測(cè)模型,根據(jù)預(yù)測(cè)模型對(duì)預(yù)測(cè)集數(shù)據(jù)進(jìn)行預(yù)測(cè)并計(jì)算準(zhǔn)確率。最后根據(jù)預(yù)測(cè)結(jié)果構(gòu)建交易策略,驗(yàn)證預(yù)測(cè)模型的實(shí)踐效果。
利用SPSS 21對(duì)RIT、AIR、DOpen、DHigh、DLow、DTa、DVol、DVot和DMR 9個(gè)變量進(jìn)行主成分分析。結(jié)果顯示5G概念、PM2.5概念和一帶一路概念的KMO值均大于0.6,Bartlett’s球狀檢驗(yàn)在1%的顯著水平下顯著,說明適合做主成分分析。最終每個(gè)概念均提取了三個(gè)因子,提取的累計(jì)方差5G概念為85.57%、PM2.5概念為83.33%、一帶一路概念為85.72%,說明提取的三個(gè)因子可以保留9個(gè)初始變量大部分信息,最終根據(jù)每個(gè)因子的方差權(quán)重計(jì)算市場(chǎng)交易變量(MTV)。
4.1 隨機(jī)森林模型參數(shù)設(shè)置與預(yù)測(cè)結(jié)果
為了驗(yàn)證三個(gè)預(yù)測(cè)變量市場(chǎng)交易變量(MTV)、投資者概念板塊關(guān)注變動(dòng)率(DISA)和投資者概念關(guān)注變動(dòng)率(DICA)及其組合對(duì)DRIT和DAIR預(yù)測(cè)的準(zhǔn)確率,本研究共設(shè)計(jì)了7個(gè)預(yù)測(cè)模型,不同模型的預(yù)測(cè)變量如表2。使用Python 3.7中的隨機(jī)森林算法對(duì)模型進(jìn)行預(yù)測(cè),所以需要對(duì)預(yù)測(cè)模型的相關(guān)參數(shù)進(jìn)行設(shè)置。根據(jù)一般預(yù)測(cè)模型的要求,將樣本劃分為訓(xùn)練數(shù)據(jù)集與預(yù)測(cè)數(shù)據(jù)集,比例為7∶3,訓(xùn)練數(shù)據(jù)集為概念指數(shù)交易周期內(nèi)的前70%的數(shù)據(jù),預(yù)測(cè)數(shù)據(jù)集為概念指數(shù)交易周期內(nèi)后30%的數(shù)據(jù)。隨機(jī)森林方法需要設(shè)置:兩個(gè)重要參數(shù)決策樹的數(shù)量ntree和內(nèi)部節(jié)點(diǎn)輸入變量mtry的個(gè)數(shù),根據(jù)前人研究和實(shí)驗(yàn)經(jīng)驗(yàn),設(shè)置決策樹ntree為500,內(nèi)部節(jié)點(diǎn)輸入變量mtry為3[16,28],預(yù)測(cè)結(jié)果如表2。
根據(jù)表2,模型1對(duì)三個(gè)概念指數(shù)的DRIT預(yù)測(cè)準(zhǔn)確率分別為52.05%,53.12%,50.66%,均高于其他模型的準(zhǔn)確率,說明MTV可以較好地預(yù)測(cè)DRIT。模型3對(duì)三個(gè)概念指數(shù)的DAIR預(yù)測(cè)準(zhǔn)確率分別為53.88%,50.03%,52.67%,高于其他模型,說明DICA對(duì)DAIR有較好的預(yù)測(cè)能力。模型2對(duì)DAIR和DRIT的預(yù)測(cè)能力均較弱,說明DISA對(duì)概念指數(shù)的DAIR和DRIT預(yù)測(cè)作用不佳。為了進(jìn)一步探究預(yù)測(cè)模型的預(yù)測(cè)作用,根據(jù)預(yù)測(cè)模型1和模型3的結(jié)果分別構(gòu)建交易策略。
4.2 交易策略構(gòu)建
交易策略設(shè)計(jì)的核心是根據(jù)預(yù)測(cè)的收益率漲跌設(shè)計(jì)交易機(jī)制,并計(jì)算累計(jì)收益和累計(jì)超額收益,從而驗(yàn)證預(yù)測(cè)模型的有效性。根據(jù)隨機(jī)森林算法的預(yù)測(cè)結(jié)果,模型1的市場(chǎng)交易指標(biāo)可以較好地預(yù)測(cè)概念指數(shù)收益,模型3的投資者概念關(guān)注可以更好地預(yù)測(cè)概念指數(shù)的超額收益,故根據(jù)前文的模型1和模型3預(yù)測(cè)結(jié)果設(shè)計(jì)買入和賣出信號(hào)。若預(yù)測(cè)結(jié)果DRITi,t+1=1,則買入投資組合;若DRITi,t+1=0,則賣出投資組合。同理,若預(yù)測(cè)結(jié)果DAIRi,t+1=1,則買入投資組合;若DAIRi,t+1=0,則賣出投資組合。
為簡(jiǎn)化起見,在計(jì)算該交易策略的累計(jì)收益和累計(jì)超額收益時(shí),做出如下假設(shè)和約束:交易成本為ETF指數(shù)的交易費(fèi)用,單邊費(fèi)用為0.025%;假設(shè)交易存在賣空限制;設(shè)定交易價(jià)格為概念指數(shù)的收盤點(diǎn)位;設(shè)定每次每個(gè)概念板塊的投資金額均為100萬(wàn)元。最終交易機(jī)制是:以基期開始計(jì)算,投資者在概念板塊i第一次出現(xiàn)買入信號(hào)之前一直空倉(cāng),當(dāng)出現(xiàn)買入信號(hào)后買入概念板塊i構(gòu)建的投資組合,并持有至賣出信號(hào)出現(xiàn)的交易日,在該交易日清倉(cāng)概念板塊i的投資組合,期間如果出現(xiàn)買入信號(hào)不追加倉(cāng)位。同理,清倉(cāng)概念板塊i的投資組合后,在第一個(gè)出現(xiàn)的買入信號(hào)時(shí),買入概念板塊i的投資組合,期間如果出現(xiàn)賣出信號(hào)則不進(jìn)行任何操作。如此循環(huán)往復(fù)進(jìn)行投資,根據(jù)交易策略獲取每日收益,計(jì)算概念板塊i投資組合的累計(jì)收益和累計(jì)超額收益。為了比較交易策略的有效性,同時(shí)構(gòu)建長(zhǎng)期持有交易策略,該策略的交易機(jī)制是:以期初的價(jià)格買入概念板塊i構(gòu)建的投資組合,持有至期末清倉(cāng)概念板塊i構(gòu)建的投資組合,持有期不進(jìn)行交易,故沒有交易費(fèi)用。
根據(jù)表3,在三個(gè)概念中,PM 2.5的交易周期最長(zhǎng),獲取的收益也最多,利用預(yù)測(cè)模型構(gòu)建的交易策略的期末累計(jì)RIT相較于長(zhǎng)期持有交易策略會(huì)多獲取48.6萬(wàn)元的收益,年化收益為25.61%,多獲取40.08萬(wàn)元的AIR,年化收益為21.12%。使用5G概念樣本進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)模型構(gòu)建的交易策略的期末累計(jì)RIT相較于長(zhǎng)期持有交易策略會(huì)多獲取17.42萬(wàn)元的收益,年化收益為19.82%,多獲取4.73萬(wàn)元的AIR,年化收益為5.29%。使用一帶一路概念樣本進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)模型構(gòu)建的交易策略會(huì)多獲取11.24萬(wàn)元的RIT和4.79萬(wàn)元的AIR,年化收益分別為9.11%和3.89%。說明預(yù)測(cè)模型交易策略的期末累計(jì)RIT和AIR均高于長(zhǎng)期持有交易策略期末累計(jì)的RIT和AIR,所以根據(jù)預(yù)測(cè)模型構(gòu)建的交易策略可以獲取超額的收益,進(jìn)一步說明了預(yù)測(cè)模型的有效性。且在三個(gè)概念樣本中均成立,說明預(yù)測(cè)模型具有較好的魯棒性。
根據(jù)圖1,在交易周期內(nèi),5G概念和PM 2.5概念預(yù)測(cè)模型交易策略的累計(jì)RIT基本均在0軸之上,說明相較于長(zhǎng)期持有策略,預(yù)測(cè)模型構(gòu)建的交易策略更有效。但是在一帶一路概念樣本中,預(yù)測(cè)模型交易策略的累計(jì)RIT卻在部分交易日期內(nèi)低于長(zhǎng)期持有交易策略的累計(jì)RIT,說明交易指標(biāo)對(duì)DRIT有一定的預(yù)測(cè)作用,但是在不同的概念板塊中卻存在差異。根據(jù)圖2,發(fā)現(xiàn)投資者概念關(guān)注變動(dòng)率對(duì)DAIR具有預(yù)測(cè)作用,但是在不同的概念板塊中同樣存在差異。
根據(jù)對(duì)概念板塊的分析發(fā)現(xiàn),一方面是由于5G概念和PM 2.5概念板塊的股票多以低市值、高市盈率的為主,這些股票價(jià)格的波動(dòng)幅度較大,容易受到市場(chǎng)消息的驅(qū)動(dòng)。但是一帶一路概念板塊的股票大多以高市值、低市盈率的股票居多,股票價(jià)格的波動(dòng)幅度較低,股票價(jià)格主要受公司盈利能力的影響較多,因此通過市場(chǎng)交易指標(biāo)或投資者概念關(guān)注來預(yù)測(cè)一帶一路概念指數(shù)波動(dòng)的效果較差。另一方面PM 2.5概念是基于公眾關(guān)注驅(qū)動(dòng)的板塊,空氣污染的變化會(huì)影響公眾對(duì)PM 2.5關(guān)注度的變化,而空氣污染具有一定的漸變性和周期性,投資者對(duì)PM 2.5概念的關(guān)注也具有一定的漸變性和周期性,所以概念指數(shù)的波動(dòng)也具有一定的漸變性,導(dǎo)致投資者概念關(guān)注預(yù)測(cè)作用增強(qiáng);而5G概念和一帶一路概念是基于信息沖擊驅(qū)動(dòng)的板塊,具有一定的突發(fā)性,所以信息會(huì)迅速被股票價(jià)格吸收,導(dǎo)致預(yù)測(cè)作用下降。故相對(duì)于PM 2.5概念,投資概念關(guān)注對(duì)5G概念和一帶一路概念指數(shù)超額收益的預(yù)測(cè)作用較弱。
5 結(jié)論與啟示
5.1 研究結(jié)論
本文以信息搜尋理論、分類思考以及投資者有限關(guān)注為理論基礎(chǔ),論述投資者概念關(guān)注對(duì)股票價(jià)格波動(dòng)的影響作用?;诎俣人阉髦笖?shù)的非結(jié)構(gòu)化數(shù)據(jù)測(cè)度投資者概念關(guān)注,并利用隨機(jī)森林算法驗(yàn)證了7個(gè)預(yù)測(cè)模型對(duì)概念指數(shù)收益和超額收益漲跌的預(yù)測(cè)作用,根據(jù)預(yù)測(cè)結(jié)果設(shè)計(jì)交易策略。研究發(fā)現(xiàn):市場(chǎng)交易指標(biāo)對(duì)概念指數(shù)收益的漲跌有較好的預(yù)測(cè)能力,投資者概念關(guān)注則對(duì)概念指數(shù)超額收益的漲跌有較好的預(yù)測(cè)能力,而基于投資者個(gè)股關(guān)注計(jì)算得到的投資者概念板塊關(guān)注對(duì)概念指數(shù)的收益和超額收益漲跌的預(yù)測(cè)結(jié)果均不理想。根據(jù)隨機(jī)森林方法預(yù)測(cè)結(jié)果設(shè)計(jì)的交易策略會(huì)獲得高于長(zhǎng)期持有交易策略的超額收益,其中PM 2.5概念超額收益的年化回報(bào)率達(dá)到了21.12%,5G概念的年化超額收益為5.29%,一帶一路概念的年化超額收益為3.89%,可以看出概念板塊之間的年化超額收益有較大的差異性,本文根據(jù)概念板塊股票的構(gòu)成和概念指數(shù)的驅(qū)動(dòng)因素探究了該差異的原因。
5.2 理論貢獻(xiàn)與實(shí)踐啟示
通過系統(tǒng)的文獻(xiàn)評(píng)述、理論分析和實(shí)證研究,本研究的主要理論貢獻(xiàn)有:(1)利用信息搜尋理論、分類思考以及投資者有限關(guān)注論述中觀層面的投資者概念關(guān)注對(duì)概念指數(shù)收益和超額收益的預(yù)測(cè)作用,彌補(bǔ)了前人研究的空白。(2)以百度搜索指數(shù)的非結(jié)構(gòu)化數(shù)據(jù)為數(shù)據(jù)源,采用大數(shù)據(jù)分析方法中的隨機(jī)森林方法展開實(shí)證研究,拓展了隨機(jī)森林方法在金融領(lǐng)域的應(yīng)用。(3)依據(jù)預(yù)測(cè)模型結(jié)果構(gòu)建的交易策略可以獲得正向的超額回報(bào),為投資者制定交易策略提供新的路徑。
本研究得到如下實(shí)踐啟示和建議。對(duì)于監(jiān)管部門而言:(1)應(yīng)深入挖掘、捕捉和監(jiān)測(cè)投資者網(wǎng)絡(luò)搜索數(shù)據(jù),改進(jìn)股票市場(chǎng)監(jiān)管的技術(shù)手段,抑制股票市場(chǎng)的概念炒作現(xiàn)象,也可以利用大數(shù)據(jù)技術(shù)提高金融市場(chǎng)系統(tǒng)性風(fēng)險(xiǎn)預(yù)警的先導(dǎo)性和準(zhǔn)確性,促進(jìn)金融市場(chǎng)健康發(fā)展。(2)成立大數(shù)據(jù)分析部門,積極收集投資者的聲音和挖掘投資者的需求,助力上市公司研判市場(chǎng)趨勢(shì),實(shí)現(xiàn)精準(zhǔn)投融資決策。(3)完善數(shù)據(jù)保護(hù)、監(jiān)管與共享機(jī)制,制定相關(guān)法律法規(guī),防止大數(shù)據(jù)平臺(tái)利用數(shù)據(jù)優(yōu)勢(shì)攫取超額收益,同時(shí)應(yīng)該鼓勵(lì)互聯(lián)網(wǎng)的共享思維,提高數(shù)據(jù)共享水平,促進(jìn)金融領(lǐng)域的大數(shù)據(jù)技術(shù)快速發(fā)展。對(duì)于投資者而言:(1)可以利用投資者概念關(guān)注數(shù)據(jù)預(yù)測(cè)股票收益并制定相應(yīng)的投資策略。(2)應(yīng)該提升自身的投資知識(shí)水平,學(xué)習(xí)大數(shù)據(jù)技術(shù),通過大數(shù)據(jù)技術(shù)來汲取經(jīng)驗(yàn),預(yù)判未來,理性決策。(3)應(yīng)該樹立價(jià)值投資理念,擯棄概念炒作的思維。
5.3 研究局限與展望
首先,由于本研究側(cè)重于研究投資者概念關(guān)注對(duì)概念指數(shù)收益和超額收益的預(yù)測(cè)作用,所以缺乏對(duì)其作用機(jī)理的實(shí)證研究。其次,本研究選擇了三個(gè)具有代表性的概念板塊進(jìn)行預(yù)測(cè)研究,但是股票市場(chǎng)存在較多的概念板塊,可能存在一定的樣本選取誤差,未來的研究可以對(duì)概念指數(shù)進(jìn)行全樣本研究,提高預(yù)測(cè)模型的普適性。最后,在構(gòu)建概念指數(shù)收益和超額收益預(yù)測(cè)模型時(shí),未將投資者情緒加入模型,未來研究可以將投資者情緒納入預(yù)測(cè)模型,提高預(yù)測(cè)模型的精準(zhǔn)度。
參 考 文 獻(xiàn):
[1]張誼浩,李元,蘇中鋒,等.網(wǎng)絡(luò)搜索能預(yù)測(cè)股票市場(chǎng)嗎[J].金融研究,2014,(2):193-206.
[2]李倩,吳昊.大數(shù)據(jù)背景下投資者行為研究的趨勢(shì)分析:基于“內(nèi)涵-思路-方法”的三重視角[J].中央財(cái)經(jīng)大學(xué)學(xué)報(bào),2017,(2):52-62.
[3]Da Z, Engelberg J, Gao P. In search of attention[J]. Journal of Finance, 2011, 66(5): 1461-1499.
[4]Vozlyublennaia Nadia. Investor attention, index performance, and return predictability[J]. Journal of Banking & Finance, 2014, 41: 17-35.
[5]Takeda F, Wakao T. Google search intensity and its relationship with returns and trading volume of Japanese stocks[J]. Pacific-Basin Finance Journal, 2014, 27: 1-18.
[6]胡昌生,陶鑄.個(gè)體投資者情緒、網(wǎng)絡(luò)自媒體效應(yīng)與股票收益[J].預(yù)測(cè),2017,36(3):50-55.
[7]曾建光.網(wǎng)絡(luò)安全風(fēng)險(xiǎn)感知與互聯(lián)網(wǎng)金融的資產(chǎn)定價(jià)[J].經(jīng)濟(jì)研究,2015,(7):131-145.
[8]趙龍凱,陸子昱,王致遠(yuǎn).眾里尋“股”千百度——股票收益率與百度搜索量關(guān)系的實(shí)證探究[J].金融研究,2013,(4):183-195.
[9]王宇哲,趙靜.“用錢投票”:公眾環(huán)境關(guān)注度對(duì)不同產(chǎn)業(yè)資產(chǎn)價(jià)格的影響[J].管理世界,2018,(9):46-57.
[10]楊濤,郭萌萌.投資者關(guān)注度與股票市場(chǎng)——以PM 2.5概念股為例[J].金融研究,2019,(5):190-206.
[11]Afkhami M, Cormack L, Ghoddusi H. Google search keywords that best predict energy price volatility[J]. Energy Economics, 2017, 67: 17-27.
[12]白麗娟,閆相斌,金家華.基于搜索關(guān)鍵詞關(guān)注度的商品房?jī)r(jià)格指數(shù)預(yù)測(cè)[J].預(yù)測(cè),2015,34(5):65-70.
[13]戴德寶,蘭玉森,范體軍,等.基于文本挖掘和機(jī)器學(xué)習(xí)的股指預(yù)測(cè)與決策研究[J].中國(guó)軟科學(xué),2019,(4):166-174.
[14]Fan X, Yuan Y, Zhuang X. Long memory of abnormal investor attention and the cross-correlations between abnormal investor attention and trading volume, volatility respectively[J]. Physica A: Statistical Mechanics and Its Applications, 2017, 469: 323-333.
[15]Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[16]李娜,李秀婷,魏云捷,等.財(cái)政支出的社會(huì)經(jīng)濟(jì)效應(yīng)——基于面板隨機(jī)森林的分析與優(yōu)化[J].管理評(píng)論,2018,30(10):258-269.
[17]Stigler G J, Stigler S M, Friedland C. The economics of information[J]. Journal of Political Economy, 1961, 69(3): 213-225.
[18]Peng L, Xiong W. Investor attention, overconfidence and category learning[J]. Journal of Financial Economics, 2006, 80(3): 563-602.
[19]Hirshleifer D, Teoh S H. Limited attention, information disclosure, and financial reporting[J]. Journal of Accounting and Economics, 2003, 36(1-3): 337-386.
[20]Smith G E. Diagnosing the search cost effect: waiting time and the moderating impact of prior category knowledge[J]. Journal of Economic Psychology, 1999, 20(3): 285-314.
[21]Huang X. Mark Twain’s cat: investment experience, categorical thinking, and stock selection[J]. Journal of Financial Economics, 2019, 131(2): 404-432.
[22]Barberis N, Shleifer A. Style investing[J]. Journal of Financial Economics, 2003, 68(2): 161-199.
[23]Kahneman D. Attention and effort[M]. Prentice-Hall, 1973. 75-76.
[24]Barber B M, Odean T. All that glitters: the effect of attention and news on the buying behavior of individual and institutional investors[J]. Review of Financial Studies, 2008, 21(2): 785-818.
[25]Engelberg J, Sasseville C, Williams J. Market madness? The case of mad money[J]. Management Science, 2012, 58(2): 351-364.
[26]俞慶進(jìn),張兵.投資者有限關(guān)注與股票收益——以百度指數(shù)作為關(guān)注度的一項(xiàng)實(shí)證研究[J].金融研究,2012,(8):152-165.
[27]Burrowes A, Jones K. Initial public offerings: evidence from the UK[J]. Managerial Finance, 2004, 30(1): 46-62.
[28]方匡南,吳見彬,朱建平,等.信貸信息不對(duì)稱下的信用卡信用風(fēng)險(xiǎn)研究[J].經(jīng)濟(jì)研究,2010,(S1):97-107.