亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        投資者情緒的識別與統(tǒng)計
        ——基于非結(jié)構(gòu)數(shù)據(jù)的分析

        2023-12-01 09:17:50耿曉媛
        科學(xué)決策 2023年11期
        關(guān)鍵詞:雪球積極情緒投資者

        耿曉媛

        1 引 言

        行為金融理論是一個非常寬泛理論體系,它包含了多種不同的理論,比如前景理論等,該理論主張,多傾向于以投資人的風(fēng)險偏好表示其行為選擇,以此為切入點深入細(xì)致地分析經(jīng)濟(jì)現(xiàn)象后所存在的理論機(jī)制,尤其是研究經(jīng)濟(jì)現(xiàn)象發(fā)生過程中相關(guān)方的行為及其對經(jīng)濟(jì)現(xiàn)象產(chǎn)生的各種影響;不僅如此,還對未知環(huán)境下行為人做出的決策進(jìn)行深入全面地分析,使得經(jīng)濟(jì)學(xué)的解釋能力得到進(jìn)一步提升。不過,受各種因素的制約,個人投資者風(fēng)險偏好的精準(zhǔn)化、實時化測度始終都未得到有效攻克。在大數(shù)據(jù)發(fā)展環(huán)境下,基于結(jié)構(gòu)特征的不同,可將數(shù)據(jù)大體劃分為三類,分別是結(jié)構(gòu)性、半結(jié)構(gòu)性、非結(jié)構(gòu)性數(shù)據(jù)。在傳統(tǒng)統(tǒng)計學(xué)分析中,其分析對象皆是比較簡單且便于理解的結(jié)構(gòu)性數(shù)據(jù),也就是我們通常所講的狹義數(shù)據(jù)。在大數(shù)據(jù)發(fā)展環(huán)境下,統(tǒng)計研究中涉及到數(shù)據(jù)結(jié)構(gòu)多樣,涵蓋了上述三類不同結(jié)構(gòu)形式的數(shù)據(jù)。其中,結(jié)構(gòu)性數(shù)據(jù)能夠以二維表的形式進(jìn)行清晰直觀地排列與描述,往往以統(tǒng)一的格式安全規(guī)范地存儲于數(shù)據(jù)庫內(nèi);非結(jié)構(gòu)性數(shù)據(jù)簡單來講指的是無法按照一致的結(jié)構(gòu)形式進(jìn)行排列和描述的數(shù)據(jù)信息,往往指的是利用網(wǎng)絡(luò)社交等獲取的信息,譬如圖像、視頻等:半結(jié)構(gòu)性數(shù)據(jù)是介于上述兩種結(jié)構(gòu)形式之間的信息,其結(jié)構(gòu)與內(nèi)容并未明確劃分,而是相互融合,譬如E-Mail 或者網(wǎng)頁新聞等。大數(shù)據(jù)通過大規(guī)模、多元化的數(shù)據(jù)結(jié)構(gòu)為人們分析個體決策提供了重要依據(jù),借助數(shù)據(jù)挖掘等一系列先進(jìn)成熟的前沿技術(shù),將能夠反映個體投資者風(fēng)險偏好的大規(guī)模非結(jié)構(gòu)數(shù)據(jù)信息科學(xué)合理地轉(zhuǎn)變?yōu)榭梢泽w現(xiàn)其心理波動變化的結(jié)構(gòu)性信息,增強(qiáng)樣本數(shù)據(jù)的有效性。因此,本文以非結(jié)構(gòu)性數(shù)據(jù)為研究的切入點進(jìn)行研究。

        現(xiàn)有關(guān)于投資者情緒識別與統(tǒng)計的方法可以分為以下三類:一是使用直接調(diào)查的主觀指標(biāo)。該方法是通過問卷調(diào)查方式,直接調(diào)查投資者對股票市場未來行情走勢的判斷或?qū)ξ磥斫?jīng)濟(jì)和投資前景的信心狀況來直接反映投資者情緒,如投資者智能指數(shù)、央視看盤指數(shù)、巨潮投資者信心指數(shù)(黃燕芬等,2019[1];王德青等,2021[2])。二是使用市場公開交易數(shù)據(jù)構(gòu)建的單一客觀指標(biāo)。這種方法是采集金融市場中與情緒有關(guān)的公開交易數(shù)據(jù)并運(yùn)用的單一客觀指標(biāo)來間接反映投資者的心態(tài)和情緒。如首日公開發(fā)行(IPO)發(fā)行量及首日收益、市場換手率、封閉式基金折價率、共同基金凈贖回、非主力資金在股票或股票組合的買賣不平衡程度等(吳海燕和楊朝軍,2012[3];賀剛等,2018[4];何誠穎等,2021[5])。三是基于多項市場指標(biāo)構(gòu)建的復(fù)合指標(biāo)。這部分研究主要是指采集多項市場中與情緒有關(guān)的公開交易數(shù)據(jù)并構(gòu)建的復(fù)合指標(biāo)來間接反映投資者的情緒狀況,此方面較為典型的是Baker 和Wurgler(2006)[6]創(chuàng)建的B-W 方法和易志高和茅寧(2006)[7]通過主成分分析構(gòu)建的中國股票市場投資者情緒的綜合指數(shù)CICSI。但是第一類度量指標(biāo)由于問卷設(shè)計和調(diào)查群體等因素影響具有較強(qiáng)主觀性,而第二類度量指標(biāo)雖然能夠客觀反應(yīng)投資者的情緒心理,卻忽視外在的宏觀經(jīng)濟(jì)因素影響,因而前兩種指標(biāo)不能全面準(zhǔn)確地測度情緒變化,學(xué)者們大多采用第三類復(fù)合指標(biāo)構(gòu)建情緒指標(biāo)。此外,隨著互聯(lián)網(wǎng)大數(shù)據(jù)的發(fā)展,基于網(wǎng)絡(luò)搜索引擎(張永杰等,2018[8])和社交媒體平臺數(shù)據(jù)(Pi? 等,2021[9])構(gòu)建投資者情緒指數(shù)的研究日益豐富。如谷歌搜索引擎指數(shù)、百度搜索引擎指數(shù)、新聞情感指數(shù)以及財經(jīng)門戶網(wǎng)站的股票論發(fā)帖數(shù)量(Gao 等,2020[10];盧米雪,2022[11];高揚(yáng)等,2023[12])。其中雪球論壇是我國最典型的財經(jīng)論壇的代表之一,其以用戶群體素質(zhì)更高、號稱“聰明的投資者都在這里”而聞名(陳浪南和蘇湃,2017[13];熊艷,2022[14])。

        目前國內(nèi)學(xué)術(shù)界大多數(shù)的研究還是基于傳統(tǒng)指標(biāo)進(jìn)行的,基于互聯(lián)網(wǎng)社交媒體指標(biāo)探究其對股市影響的研究還較少。

        目前為止,在研究投資者情緒識別方面的文獻(xiàn)中,主要是以傳統(tǒng)的結(jié)構(gòu)數(shù)據(jù)進(jìn)行分析的,鮮少有以非結(jié)構(gòu)數(shù)據(jù)為切入點研究投資者的風(fēng)險偏好,基于此,本文關(guān)于投資者情緒方面研究的切入點為非結(jié)構(gòu)數(shù)據(jù)。

        通過科學(xué)合理的方法將大量非結(jié)構(gòu)性數(shù)據(jù)靈活合理地轉(zhuǎn)變?yōu)橛糜趥鹘y(tǒng)統(tǒng)計分析的結(jié)構(gòu)性數(shù)據(jù),促進(jìn)統(tǒng)計學(xué)方法在更多領(lǐng)域和行業(yè)得到大力推廣和積極應(yīng)用。本文的分析可知,選擇非結(jié)構(gòu)性數(shù)據(jù)進(jìn)行關(guān)于行為金融的分析更具有經(jīng)濟(jì)性,因此本文將深入細(xì)致的分析影響投資者風(fēng)險偏好的主要因素中非結(jié)構(gòu)性數(shù)據(jù)進(jìn)行識別與合成,比如注意力、情緒等,同時對上述因素間的關(guān)系展開全面深入地研究,準(zhǔn)確合理地明確投資人風(fēng)險偏好的作用機(jī)理,為后續(xù)研究做好基礎(chǔ)。

        2 投資者情緒特征變量的識別

        2.1 投資者情緒的內(nèi)涵界定

        情緒是一個非常抽象的概念,可將其視為各種主觀認(rèn)知經(jīng)驗與體會的結(jié)合體,是隨著人們成長和發(fā)展而形成的一種獨特心理現(xiàn)象。Izard(1977)[15]在進(jìn)行深入細(xì)致的分析之后表示,情緒是一個非常復(fù)雜的概念,不僅涉及到了認(rèn)知元素,同時也涵蓋了對外界事物主觀評判。在人格系統(tǒng)中,情緒是不可或缺的重要元素,呈現(xiàn)出明顯的個體差異性特征。無論是外界因素,還是個人主觀因素,它們均會對情緒產(chǎn)生非常大的影響,可以說,情緒不僅是個體對相關(guān)事物的一種主觀體會,同時也是對外界事物的一種客觀生理反應(yīng),是一種較為獨特的社會表達(dá)方法。另外,該學(xué)者還明確指出,情緒涉及到三大因素,一是主觀體驗,二是生理基礎(chǔ),三是表情行為。情緒不僅表現(xiàn)出較強(qiáng)的生物學(xué)價值,并且社會性色彩非常濃郁。Levin 等(2003)[16]在對情緒展開深入細(xì)致的分析后表示,人們對某種事物產(chǎn)生的情緒較為復(fù)雜,會因外界事物的性質(zhì)不同而呈現(xiàn)出較大差異。80 年代后,隨著神經(jīng)成像技術(shù)的日益發(fā)展及廣泛應(yīng)用,人們通過此技術(shù)了解到,神經(jīng)元回路能夠有效調(diào)節(jié)情緒,它們在對接收到的數(shù)據(jù)進(jìn)行處理后會輸出相應(yīng)的情緒。

        從行為金融學(xué)的層面來講,情緒可以說是個體對外界事物進(jìn)行感知判斷之后而形成的一種產(chǎn)物。情緒既能夠是個體生理特征的表現(xiàn),也可以是行為影響結(jié)果。投資者的情緒是不固定的,會受到諸多因素的影響與干擾,比如人格特質(zhì),它可以被視為最具代表性的投資者風(fēng)險偏好,即便是在相同的環(huán)境下,面對同樣的事與物,投資者的情緒也會因人格特質(zhì)的不同而呈現(xiàn)出明顯差別。

        2.2 投資者情緒的特征變量提取

        在行為金融學(xué)當(dāng)中,情緒屬于相當(dāng)關(guān)鍵的指標(biāo)之一,它不僅會對個體的投資者風(fēng)險偏好產(chǎn)生較為深刻的影響,在行為金融學(xué)當(dāng)中同樣有著非常關(guān)鍵的地位。Long 等(1990)[17]在經(jīng)過深層次的探究以后,創(chuàng)建了經(jīng)典的噪聲交易模型(DSSW),它著重介紹了外生有偏信息的投資者交易行為,對噪聲交易者在金融領(lǐng)域的立足能力展開了深入細(xì)致地研究。該模型能夠依托于對噪聲交易者特征的全面揭示及系統(tǒng)研究,科學(xué)合理地描述其對金融資產(chǎn)定價所產(chǎn)生的重要影響,并且針對其創(chuàng)造可觀回報的原因進(jìn)行了科學(xué)合理地闡釋。一般來講,在外生信息方面處于不利位置的交易者即為噪聲交易者;噪聲主要是指市場運(yùn)作過程中私自捏造或者被曲解的數(shù)據(jù),它是造成股價和其自身價值之間存在不同的重要因素。在市場領(lǐng)域,交易者往往會依托于其采集到的數(shù)據(jù)對市場變化趨勢、股價走向進(jìn)行科學(xué)合理地自主判定,盡管內(nèi)在價值不會隨著人的意志轉(zhuǎn)變而發(fā)生變化,其形成時間明顯在于價格,不過在現(xiàn)實交易中,噪聲交易者對于價格的曲解會形成“共識”。這種共識源于大量投資者心理的波動,內(nèi)在價值和價格之間所存在的差值即為噪聲。

        在行為金融學(xué)研究過程中,投資者情緒可被視為一個重要的參考指標(biāo),利用情緒指數(shù)能夠全面系統(tǒng)地分析情緒和行為人決策間的關(guān)系。以噪聲交易模型為例進(jìn)行說明,該模型主張,噪聲會造成產(chǎn)品價格與其實際價值之間產(chǎn)生一定差別,可將其用于對風(fēng)險資產(chǎn)后期回報的合理評估,大量研究證實,情緒的波動勢必會引起資產(chǎn)價格變化。對于損失的未知性,投資人一般會因情緒的隨機(jī)波動而呈現(xiàn)出較大的認(rèn)知偏差,對其選擇行為產(chǎn)生進(jìn)一步影響。Arkes 等(1988)[18]在進(jìn)行深入細(xì)致地分析后表示,當(dāng)保持樂觀積極的情緒時,投資者往往會夸大市場行情。Kaufmann 等(1997)[19]在對相關(guān)研究成果進(jìn)行系統(tǒng)全面地梳理后,通過廣泛深入地研究發(fā)現(xiàn),無論是投資者的情緒,還是其心理變動,均會對投資選擇產(chǎn)生較為顯著的影響。諸多心理實驗研究證實,情緒是一個非常寬泛且抽象的概念,不僅使得認(rèn)知風(fēng)險水平發(fā)生變化,也會使得預(yù)期收益率出現(xiàn)相應(yīng)的改變。Hastie(2001)[20]在進(jìn)行深入細(xì)致地分析后表示,情緒的波動勢必會對投資者決策產(chǎn)生較為顯著的影響。目前,在行為金融學(xué)研究領(lǐng)域,投資者情緒如何影響經(jīng)濟(jì)行為成為備受業(yè)內(nèi)人士高度關(guān)注的重要研究課題。

        2.3 投資者情緒的統(tǒng)計測度——情緒指數(shù)

        作為一種能夠反映情緒變化的重要參數(shù),情緒指數(shù)不僅能夠?qū)ν顿Y者的情緒變化情況進(jìn)行科學(xué)合理地度量,也能夠?qū)ι鐣榫w指數(shù)的變化情況進(jìn)行科學(xué)合理地度量。作為一種能夠有效量化且應(yīng)用比較廣泛的統(tǒng)計數(shù)據(jù),情緒指數(shù)可被用于評估人體情緒變化情況。在實際應(yīng)用中,可依托于創(chuàng)建情緒指標(biāo)體系的方式深入細(xì)致地分析各個變量間的關(guān)系,基于此構(gòu)建嚴(yán)謹(jǐn)合理的分析模型,在進(jìn)行嚴(yán)格規(guī)范地歸一化處理后,便捷高效地求解出相應(yīng)的情緒指數(shù)。其求解步驟如下:

        根據(jù)前文所知情緒是一個比較抽象且復(fù)雜的概念,基于不同的方法或者按照不同的標(biāo)準(zhǔn),可將其劃分為不同的類型,根據(jù)各種子情緒,科學(xué)合理地構(gòu)建指標(biāo)體系。

        情緒從長期的角度來講具有一定的穩(wěn)定性。所以,當(dāng)前情緒和穩(wěn)定狀況下的情緒之間所產(chǎn)生的偏差即為我們通常所講的情緒波動,基于此進(jìn)行科學(xué)合理地計算與分析,有效剔除由于各種情緒占比不同而產(chǎn)生的量綱偏差。若ix為第i種情緒的測度值,ei為行為人投資者第i種情緒比重,即式(1)、(2)與(3):

        通過方差測定情緒,以此描述情緒的變化水平即:

        綜上,均值-方差組合可以對情緒波動程度進(jìn)行合理測定。

        第一,確定權(quán)重。應(yīng)針對各種不同的情緒科學(xué)合理地確定權(quán)重。

        第二,求解情緒指數(shù),見式(4):

        通常來講,個體的期望值愈高,其情緒指數(shù)愈小,此時積極情緒較為嚴(yán)重;反之,情緒消極情緒較多。期望值愈高,情緒沖突愈強(qiáng),通過成功而獲得的滿足感愈小,但是基于失敗而造成的消極情緒愈嚴(yán)重。整體來講,情緒指數(shù)能夠?qū)η榫w變化水平進(jìn)行合理測定。

        3 投資者情緒指數(shù)的構(gòu)造

        本文在分析時所采用的數(shù)據(jù)主要源于雪球網(wǎng),其收集整理了大量社交數(shù)據(jù)、交易數(shù)據(jù),也就是前文提到的“社交投資平臺”。結(jié)合“社交投資平臺”的有關(guān)含義可知,雪球網(wǎng)除了具有“信號發(fā)送者”以及“信號接收者”之前,還涉及到“復(fù)制交易”的有關(guān)功能。本文在分析時使用的數(shù)據(jù)全部來源于雪球網(wǎng),同時采用Python 爬蟲技術(shù)中的開源爬蟲框架Scrapy 對該網(wǎng)站上的用戶好友關(guān)系、雪球組合、雪球?qū)嵄P等相關(guān)數(shù)據(jù)與記錄進(jìn)行抓取。獲取的基本思路是在遍歷雪球網(wǎng)的120 萬雪球數(shù)據(jù)時,剔除掉其中已經(jīng)關(guān)閉的組合,總計抓取794151 個雪球組合和雪球?qū)嵄P,并將這些信息進(jìn)行保存,保存的信息包括組合的ID、有效性、當(dāng)前狀態(tài)下的組合收益、創(chuàng)建日期、關(guān)注度、投資行為、投資版塊、情緒、掛單數(shù)據(jù)與實際交易數(shù)據(jù)等。本文在分析時采用的數(shù)據(jù)全部為雪球組合與雪球?qū)嵄P。在這樣的社交網(wǎng)絡(luò)投資平臺中,往往把信號發(fā)送者界定為主動交易者的身份,而信號接收者往往進(jìn)行的是“復(fù)制交易”。

        3.1 數(shù)據(jù)清洗與篩選

        雪球組合創(chuàng)立于2014 年10 月20 日,雪球?qū)嵄P則創(chuàng)立于2016 年6 月27 日。因此本文數(shù)據(jù)爬取的時間起點為2016 年7 月1 日,截至到2020 年6 月30 日。本研究總計抓取了794151 個雪球組合與雪球?qū)嵄P(不涉及已經(jīng)關(guān)閉的組合),包含所有雪球組合782603 個,所有雪球?qū)嵄P的共11547 個。雪球網(wǎng)曾經(jīng)公開表示,其平臺中大概擁有70 萬個處在存續(xù)狀態(tài)下的雪球組合與大約1.02 萬條處在存續(xù)狀態(tài)下的雪球?qū)嵄P,倘若把本文抓取的量與雪球公布的官方數(shù)據(jù)進(jìn)行對比,由此可知本文抓取的數(shù)量與現(xiàn)實狀況相符,同時大體上可以評估且不會出現(xiàn)大量遺漏的問題。

        (1)存續(xù)期篩選

        本文將其存續(xù)期都界定為首次買賣與最后一次交易跨越的時段。不過,由于本文選取的一部分雪球組合與實盤在形成和完成的時間上相隔只有幾天,因此通常這些功能均屬于用戶持有嘗試的心理,開啟了組合或者實盤的功能并及時關(guān)掉的,這些組合已經(jīng)沒有辦法反映出投資人的投資理念,應(yīng)予以全部刪除。其次,有些組合剛剛建立,并未有足夠長期的歷史業(yè)績能夠用于對其做出評估。在數(shù)據(jù)清洗的過程中,本文發(fā)現(xiàn)了樣本存在一些非正常值與錯誤,其中多數(shù)原因是由于網(wǎng)站后臺的數(shù)據(jù)分析出現(xiàn)有誤,比如有一些組合在不到二個月時間里凈值增長了一千倍,少部分則是在抓取的過程中形成的。綜上,我們把存續(xù)期少于六十天的雪球組合和雪球?qū)嵄P從統(tǒng)計中刪除。

        (2)交易市場篩選

        雪球組合準(zhǔn)許客戶在A 股、港股以及美股中任選一個市場展開投資,不過同一個組合僅可以在一個市場投放,不能同時在兩個市場投放。歷史數(shù)據(jù)證明,A 股組合中所占的比重最高,接近95%。據(jù)此,本文研究將著重關(guān)注A 股市場,在雪球?qū)嵄P上目前基本還是只支持A 股,從而剔除了在美股和香港市場的投資組合。

        (3)收益組合篩選

        在數(shù)據(jù)抓取過程中發(fā)現(xiàn),一些用戶的雪球?qū)嵄P公司盡管尚未關(guān)閉,但實際上在一至二日之間就對相關(guān)的財產(chǎn)進(jìn)行了處理與清空,此種等同于退出雪球?qū)嵄P的情形會造成凈值的急劇下降,從而造成異常負(fù)收益率的產(chǎn)生,為防止此類極端情形出現(xiàn),本文采用首末兩段1%的縮尾方法對收益組合進(jìn)行篩選。

        (4)交易行為篩選

        在雪球組合中,除了對用戶的主動調(diào)倉狀況展開記錄之外,同時還對各種非用戶因素(諸如分紅除權(quán)等)產(chǎn)生的持倉變動進(jìn)行記錄??紤]到非用戶因素引發(fā)的調(diào)倉行為無法反映用戶在資金方面的真實意愿,所以這種交易也將被刪除。

        除此之外,也有部分用戶做出的調(diào)倉行為是因為市價不滿足等原因而無法完成交易,所以雪球網(wǎng)的后臺會將這類行為標(biāo)記成異常的調(diào)倉記錄。鑒于此,本文在分析時也刪除了這類交易。

        另外,本文中還規(guī)定,進(jìn)入樣本的雪球組合或者雪球?qū)嵄P都應(yīng)當(dāng)具有全部的基礎(chǔ)信息、調(diào)倉歷史記錄、業(yè)績歷史記錄三部分?jǐn)?shù)據(jù),并且進(jìn)入樣本的用戶也應(yīng)當(dāng)已經(jīng)持有了某個雪球組合或雪球?qū)嵄P,以及該組合和實盤的基礎(chǔ)信息都齊全。

        通過上述的數(shù)據(jù)處理后,得到的組合共計有63.5 萬個,其中大都是雪球組合,數(shù)量達(dá)到62.6 萬個,雪球?qū)嵄P有0.9 萬個。

        3.2 描述統(tǒng)計分析

        (1)調(diào)倉統(tǒng)計

        本文認(rèn)為每變動一個證券都算一個調(diào)倉行為。假設(shè)在一個組合中對多個證券進(jìn)行操作,則每只證券的買賣行為均算一個調(diào)倉。如果在同一個組合中,買進(jìn)A 股,拋出B 股,則其屬于兩次調(diào)倉行為。此種調(diào)倉記錄方法不僅可以很好的體現(xiàn)調(diào)倉的頻率,同時還能夠展現(xiàn)出調(diào)倉中涉及的股票數(shù)。

        如果調(diào)倉后,該股票在組合中的比重發(fā)生變化,則前后變化的比重為調(diào)倉幅度,即調(diào)倉后該股票的比重-調(diào)倉前該股票的比重。這樣,以相對數(shù)形式衡量的調(diào)倉幅度不但有利于投資組合間相互對比,而且同時取得預(yù)測值之后可避免買進(jìn)和賣出的調(diào)倉相互對抗。

        通過抓取后的數(shù)據(jù)發(fā)現(xiàn),雪球?qū)嵄P用戶會在間隔15 天內(nèi)展開一次調(diào)倉,而雪球組合用戶會在間隔149天內(nèi)展開一次調(diào)倉。從調(diào)整幅度上分析,雪球組合用戶大概日均調(diào)倉幅度為15.4%,而雪球?qū)嵄P用戶更高,達(dá)到20.1%。

        根據(jù)調(diào)倉行為數(shù)據(jù),本文在捕捉與刻畫用戶的行為時需要用到月數(shù)據(jù),甚至是周數(shù)據(jù)。如果按月數(shù)據(jù)口徑下,本文會得到48 個月維度下的數(shù)據(jù),;如果按周數(shù)據(jù)口徑下,本文會得到200 個周維度下的數(shù)據(jù)。本文后續(xù)的分析中主要采用周維度下的數(shù)據(jù)。

        (2)用戶行為統(tǒng)計

        根據(jù)本文清洗后的數(shù)據(jù)可知,這些用戶中男人占據(jù)了大多數(shù),差不多是女生數(shù)量的十倍,特別是在雪球?qū)嵄P,其男用戶數(shù)量差不多是女生用戶的二十倍。用戶數(shù)最多的五大地區(qū),分別是:廣東、北京、上海、浙江以及江蘇。

        雪球網(wǎng)當(dāng)中設(shè)置了5 項可以反映出用戶行為的重要變量,分別為:一、關(guān)注數(shù),其是指此用戶關(guān)注別的用戶的數(shù)量;二、粉絲數(shù),其是指關(guān)注此用戶的其它用戶數(shù)量;三、自選股數(shù),用戶關(guān)注的股票數(shù)量,不但涉及個股,且包括組合;四、掌握的組合數(shù);五、發(fā)帖數(shù)。在雪球平臺上用戶的發(fā)帖量,不但涉及股票方面的評論,還涉及組合調(diào)倉方面的闡述。前二項體現(xiàn)出不同用戶間的互動情況,剩余三項反映出用戶在股票間的互動情況。

        縱觀這五個反映用戶活動程度的變量中,可總結(jié)出以下二個特征:首先實盤用戶通常要比組合用戶更為活躍。通過爬取的歷史數(shù)據(jù)顯示,實盤用戶平均關(guān)注86 個其它用戶,而組合用戶的平均關(guān)注數(shù)卻只有45;又比如,實盤用戶平均有112 個自選股,而組合用戶平均有53 個自選股,同樣是組合用戶的二倍。

        用戶活動的統(tǒng)計結(jié)果表現(xiàn)出相當(dāng)顯著的左偏分布特點,也就是活躍用戶有很多粉絲、關(guān)注很多股票,同時主動參加評論,但實際上這些用戶均是“沉默的”,即“馬太效應(yīng)”。基于此,為保證本文后續(xù)研究地順利進(jìn)行,本文采取隨機(jī)抽樣的方式隨機(jī)抽取100 位雪球用戶為樣本,其描述統(tǒng)計結(jié)果,具體見表1。

        表1 Python 爬蟲技術(shù)爬取的數(shù)據(jù)進(jìn)行描述性統(tǒng)計

        對比表1 與上述總體數(shù)據(jù)的結(jié)果,表1 中的數(shù)據(jù)基本符合總體數(shù)據(jù)的趨勢,因此,為本文后續(xù)分析結(jié)果的可靠性提供了保障。

        (3)收益統(tǒng)計

        本文針對雪球組合與雪球?qū)嵄P的整體收益展開分析,并主要采用了如下二種指標(biāo)來表現(xiàn)收益:總體收益率和年化收益率。

        其中:總收益計算見式(5)。

        年化收益是借助復(fù)利法展開計算的。對建立還不到1 年的組合,其年化收益與收益總額相等。為避免異常值的影響,本文將針對首尾進(jìn)行1%的縮尾處理,也就是將周收益當(dāng)中最大的1%和最小的1%進(jìn)行剔除。因為盡管在IPO 的過程中簽會增加投資收益,但是中簽結(jié)果卻無法反映投資人的實際投入水平,所以本文將在IPO 中簽的實盤用戶從樣本中去掉。

        本文計算周數(shù)據(jù)口徑下的收益結(jié)果。為了直接體現(xiàn)收益率和雪球用戶對投資組合中的風(fēng)險偏好之間的關(guān)聯(lián),即越風(fēng)險偏好型投資人所關(guān)注的組合就越多。為此,本文還給出了有五人及以上關(guān)注的組合及有一人及以上關(guān)注的組合的實際收益。結(jié)合下表2、3 與4 可知,雪球組合與實盤的收益率都具有著以下特征:

        表2 雪球組合和雪球?qū)嵄P的收益(年化收益,%)

        表3 雪球組合和雪球?qū)嵄P的收益

        表4 雪球組合和雪球?qū)嵄P的收益

        首先,雪球?qū)嵄P的收益率高于雪球組合,且方差也更大。其次,關(guān)注的數(shù)量也和收益率成正有關(guān)。很顯然,收益越多,便會吸引越多的人關(guān)注。諸如對于不少于5 人關(guān)注的雪球組合,其年化收益的中位數(shù)為74.8%,而對于所有樣本總體而言,其收益的中位數(shù)是25.1%,僅為1/3。

        本文針對半月收益同樣實施了縮尾處理,經(jīng)過處理以后總計擁有1.5 萬條數(shù)據(jù)用于觀測,結(jié)果見表5。

        表5 雪球組合與實盤的月數(shù)據(jù)口徑下的收益結(jié)果

        3.3 指數(shù)編制數(shù)據(jù)的預(yù)處理

        依托網(wǎng)絡(luò)爬蟲技術(shù)取得的數(shù)據(jù)屬于文本數(shù)據(jù),同時其中含有大量不完整、重復(fù)以及沒有價值的數(shù)據(jù),所以必須對這些文本數(shù)據(jù)實施預(yù)處理。具體來說,是針對龐大的數(shù)據(jù)實施整理、篩選等處理方式,主要是將重復(fù)和不完整的數(shù)據(jù)進(jìn)行剔除,將大小寫字母、繁簡字進(jìn)行統(tǒng)一,剔除和用戶情緒之間沒有關(guān)聯(lián)的帖子,剔除沒有價值的字段,剔除停用詞等。同時,還做了文本分詞處理,也就是將文本數(shù)據(jù)中的句子拆分成對應(yīng)的詞語,以確保機(jī)器學(xué)習(xí)模型可以正確的判斷各個句子的意思。

        通過以上這些預(yù)處理,讓數(shù)據(jù)噪音大大減少,實現(xiàn)對數(shù)據(jù)的初步篩選,對后續(xù)進(jìn)一步挖掘評論當(dāng)中的情緒有所幫助。將本文最后的數(shù)據(jù)通過以上預(yù)處理流程,剩下3.89 萬條文本數(shù)據(jù)。

        3.4 基于機(jī)器學(xué)習(xí)模型的投資者情感分類

        在展開分析前,需要對文本數(shù)據(jù)展開預(yù)處理,剔除數(shù)據(jù)中的無用信息,進(jìn)而從整體上提升數(shù)據(jù)的有效性。隨后開始構(gòu)建情感分類模型,其能夠?qū)γ織l評論數(shù)據(jù)中包含的情緒展開判斷,進(jìn)而給投資者的情緒指數(shù)提供必要的支持。

        (1)人工標(biāo)記與訓(xùn)練集的實踐

        機(jī)器學(xué)習(xí)是模型結(jié)合已掌握的數(shù)據(jù)集來找尋最佳參數(shù)的過程。為了讓模型分類效果實現(xiàn)更加準(zhǔn)確,挑選訓(xùn)練集變得非常關(guān)鍵。因為本文取得的數(shù)據(jù)是用戶的原始評論,而不同評論和特定情緒之間并未呈現(xiàn)出一一映射,也不存在現(xiàn)成的訓(xùn)練樣本,對于帖子中情感極性缺少評判標(biāo)準(zhǔn),所以本文利用人工標(biāo)記的形式來取得訓(xùn)練集,用于機(jī)器學(xué)習(xí)。

        本文運(yùn)用隨機(jī)抽樣法由通過預(yù)處理之后的數(shù)據(jù)當(dāng)中,按照隨機(jī)原則選取了1 萬條。依據(jù)二分類原則對這些數(shù)據(jù)加以標(biāo)記:其中,標(biāo)記值為1 代表投資者對當(dāng)前的風(fēng)險偏好情緒比較積極,其中根據(jù)對投資傾向的幅度不同加以區(qū)分,程度由弱至強(qiáng)分別為“大盤無憂”、“看漲、漲”以及“大膽加倉”,在標(biāo)記為“1”類別中分別賦值為1、2 和3;標(biāo)記值為-1 代表投資者對當(dāng)前的風(fēng)險偏好情緒比較消極,其中根據(jù)對投資傾向的幅度不同加以區(qū)分,程度由弱至強(qiáng)分別為“下跌、跌”、“逃”以及“割肉”,在標(biāo)記為“-1”類別中分別賦值為-1、-2 和-3。投資者的情感分類詞典是結(jié)合現(xiàn)有的文獻(xiàn)研究成果經(jīng)整理而成,見表6,據(jù)此標(biāo)記從預(yù)處理后數(shù)據(jù)中的1 萬條評論。

        表6 投資者投資情感分類詞典詞匯示例

        (2)基于樸素貝葉斯的評論文本投資者投資情感分類的實現(xiàn)

        應(yīng)用留出法把以上人工標(biāo)記評論文本當(dāng)中選取8000 條當(dāng)作訓(xùn)練集,剩余2000 條當(dāng)作測試集,針對投資者的情感分類展開精度檢驗,同時符合:人工標(biāo)記樣本訓(xùn)練集∪測試集=全集,訓(xùn)練集∩測試集= Φ。剩余的2.89 萬條評論劃分成文本集15 個,再分別使用訓(xùn)練完的模型展開測評。

        基于多項式樸素貝葉斯模型展開對應(yīng)的預(yù)測分類。針對分類任務(wù)而言,在已知全部有關(guān)概率的情形下,該模型考慮怎樣結(jié)合上述概率與誤判損失來篩選最佳的類別標(biāo)記。樸素貝葉斯分類器遵循屬性條件獨立性假設(shè)原則,也就是說針對已知事物的類別,倘若全部屬性彼此獨立,同時各個屬性可以對分類結(jié)果產(chǎn)生影響,具體見式(6):

        其中,d代表屬性類型,xi是在第i個屬性上的取值。因為針對全部類型而言,P(x)一樣,所以在貝葉斯基礎(chǔ)上的評判標(biāo)準(zhǔn)為式(7):

        基于Python 語言建立多項式樸素貝葉斯模型,從標(biāo)注的10000 條數(shù)據(jù)中選擇8000 條展開分類學(xué)習(xí),剩余的2000 條當(dāng)作精度驗證。表7 給出了模型分類的精度:

        表7 基于多項式樸素貝葉斯算法的精度表

        通過表7 可知,基于多項式樸素貝葉斯算法的訓(xùn)練集與測試集的準(zhǔn)確率均大于85%,預(yù)測的投資者情感分類效果比較理想。

        然后,本文在隨機(jī)選取1 萬條數(shù)據(jù)之后剩余的28900 條評論當(dāng)中,劃分成15 個文本集,各個文本集大概包括兩千條評論,分別使用訓(xùn)練好的模型展開投資者情感分類預(yù)測。當(dāng)中八千條訓(xùn)練集(人工標(biāo)記)、兩千條測試集(人工標(biāo)記),28900 條預(yù)測集(機(jī)器自動標(biāo)記),總共38900 條文本數(shù)據(jù),最后把所有評論劃分成“滿意”與“不滿意”2 個文本集合,具體統(tǒng)計情況見表8。

        表8 總體評論文本投資者情感分類分布情況

        根據(jù)前述式(1)、(2)、(3)可以分別計算不同類別情緒投資者的方差,分別為投資者積極情感的方差為0.6170,投資者消極情感的方差為0.6798。

        根據(jù)公式(7),投資者的內(nèi)心期望值可用投資者交易投資時的掛單價格Pe進(jìn)行衡量,本文將掛單價格定義為投資者在交易時委托系統(tǒng)提交的依據(jù)委托價格計算的交易金額,交易者提交的委托價格即為投資者的內(nèi)心期望值,投資者的期望實現(xiàn)值可用投資者交易時的真實價格P進(jìn)行衡量,因此將式(7)進(jìn)行改進(jìn),見式(8):

        根據(jù)對100 位投資者38900 條評論中的情感提取,依據(jù)式(8)計算100 位投資者分?jǐn)?shù)不同類別中投資者的情緒指數(shù),并將100 位投資者的情緒指數(shù)在時間維度上進(jìn)行平均數(shù)處理,投資者個體投資者情緒指數(shù)參見表9,投資者投資情緒指數(shù)在個體維度和時間維度的綜合均值如表10 所示。

        表9 投資者個體投資情緒指數(shù)

        表10 投資者投資情緒指數(shù)均值表

        根據(jù)表9 中的結(jié)果可知,積極投資情緒投資者的投資情緒指數(shù)小于100%,消極投資情緒投資者的投資情緒指數(shù)基本上均大于100%。根據(jù)行為金融理論,投資者的消極心理的作用相較于積極心理的作用更為明顯,表10 的結(jié)果也證明了這一點,投資者的消極情緒更具有渲染色彩,表現(xiàn)力更強(qiáng)。

        為確認(rèn)投資者情緒數(shù)據(jù)的穩(wěn)定性,本文針對表9 中的數(shù)據(jù),借助ADF 統(tǒng)計量展開穩(wěn)定性測試,具體結(jié)果見表11。

        表11 投資者投資情緒指數(shù)穩(wěn)定性檢驗

        基于穩(wěn)定性檢驗角度,投資者情緒指數(shù)的ADF 統(tǒng)計量達(dá)到-7.126,在5%的置信水平下,

        其閾值是-2.867,可見其已經(jīng)超過了閾值,表明投資者情緒指數(shù)是穩(wěn)定的。

        4 投資者的情緒指數(shù)與投資板塊、收益率的關(guān)系

        4.1 投資者的情緒指數(shù)與投資板塊的關(guān)系

        證券市場由不同板塊股票構(gòu)成,但在不同板塊間股票的投資風(fēng)險卻并不相同。因此,為驗證不同情緒組在風(fēng)險不同的板塊之間投資行為是否存在差異,本文將爬取的100 位投資者在不同板塊交易的交易數(shù)據(jù)進(jìn)行整理,發(fā)現(xiàn)這100 位投資者投資行為主要集中于銀行、保險、消費(fèi)、醫(yī)藥、食品及新興行業(yè)等板塊;結(jié)合之前的分析,本文分別將不同投資情緒投資者的投資板快分布進(jìn)行整理,見圖1。

        圖1 不同投資情緒投資者投資板快情況

        由圖1 所示,消極情緒投資者在銀行、保險、醫(yī)藥、電器等板塊投資所占比重超過積極情緒投資者,其中在銀行(消極情緒投資者21.39%)、保險(消極情緒投資者21.28%)等板塊所占比重最高;而積極情緒投資者在新興(積極情緒投資者15.59%)、食品(積極情緒投資者13.98%)、消費(fèi)(積極情緒投資者14.10%)等板塊所占比重超過消極情緒投資者,尤其是在新興行業(yè)板塊表現(xiàn)最為明顯。

        通過對比分析可以看出,積極情緒投資者對更具風(fēng)險性的新興行業(yè)板塊投資的可能性增加,且在持有多種板塊股票時,積極情緒投資者對此類股票的交易也會增加,使得交易版塊種類越多,積極情緒投資者所占比重越大。

        4.2 投資者的情緒指數(shù)與投資收益率的關(guān)系

        根據(jù)經(jīng)典金融學(xué)理論認(rèn)為,積極情緒投資者相對于消極情緒投資者要承擔(dān)更多的投資風(fēng)險,因此在做出投資行為時積極情緒投資者需要用更高的投資收益來對承擔(dān)的投資風(fēng)險進(jìn)行補(bǔ)償。在證券市場中,積極情緒投資者為了追逐更高的投資收益,其在投資方式和投資標(biāo)的選擇上相對于消極情緒投資者要更為激進(jìn),而消極情緒投資者則相對更加保守,這種在投資方式和投資標(biāo)的選擇上的差異通常會使得積極情緒投資者與消極情緒投資者獲得不同的收益率。因此,為了更深入地研究不同投資者情緒是否在各自投資收益率上存在顯著差異,本文將100 位投資者的情緒指數(shù)與各自投資收益率進(jìn)行獨立樣本T 檢驗。

        表12 顯示了100 位投資者的情緒指數(shù)以及投資收益率情況。其中積極情緒投資者的標(biāo)準(zhǔn)差相對于消極情緒投資者標(biāo)準(zhǔn)差較大,這可能是積極情緒投資者為追逐更高的投資收益率,在投資市場中表現(xiàn)得更為活躍,涉及的投資范圍更高等現(xiàn)象所致。同時,根據(jù)表12,可見投資者無論是具有消極的投資情緒還是積極的投資情緒,兩組間的投資收益率并無顯著差異。

        表12 不同投資情緒與收益率的獨立樣本T 檢驗

        5 結(jié)論與建議

        5.1 結(jié)論

        第一,本文在研究投資者情緒特征問題時,加入衡量投資者在投資時的心理特征的數(shù)據(jù)信息,而且這種數(shù)據(jù)信息特征不能來源于傳統(tǒng)的數(shù)據(jù)獲取方式,比如調(diào)查問卷等,而是來源于更具客觀、真實性的非結(jié)構(gòu)性數(shù)據(jù)。

        第二,本研究以非結(jié)構(gòu)性數(shù)據(jù)為切入點,以機(jī)器學(xué)習(xí)的方法進(jìn)行運(yùn)用,不僅區(qū)別了以往關(guān)于投資者情緒特征研究的切入點,并且較以往研究更具客觀性、合理性以及有效性,在一定程度上具有創(chuàng)新性。文章還介紹了數(shù)據(jù)清洗與篩選的過程,同時對其展開描述性統(tǒng)計分析,為投資者情緒分析提供依據(jù)。

        第三,在不同的投資板塊中,積極情緒投資者對投資風(fēng)險性較高的新興行業(yè)板塊更加青睞,且與消極情緒投資者呈現(xiàn)出顯著的分布差異,但是積極情緒投資者與消極情緒投資者在投資收益率方面并無顯著差異。

        5.2 建議

        第一,根據(jù)本文的研究結(jié)果,通過構(gòu)建的投資者情緒指數(shù)可以有效地識別不同情緒的投資者。因此,在證券市場中,可以將本文構(gòu)建的投資者情緒指數(shù)作為創(chuàng)新投資標(biāo)的與投資決策的參考指標(biāo),進(jìn)而進(jìn)一步提高證券市場的資源配置效率。

        第二,研究結(jié)果表明,積極情緒投資者與消極情緒投資者在投資收益率方面并無顯著差異,可以根據(jù)這一研究結(jié)果對投資者的投資行為帶來一定的指導(dǎo)作用,即在投資行為選擇上,積極情緒投資者要控制住為追逐更高的投資收益率而發(fā)生的頻繁交易行為,因為這并不會帶來更高的收益率,而消極情緒投資者則需穩(wěn)定住對投資行為的情緒。

        猜你喜歡
        雪球積極情緒投資者
        家有萌寵雪球
        投資者
        雪球上的紅腳掌
        中小學(xué)生積極情緒現(xiàn)狀特點及其影響因素
        聊聊“普通投資者”與“專業(yè)投資者”
        積極情緒助力更好記憶
        心理與健康(2021年1期)2021-07-22 07:46:43
        試論積極情緒對中學(xué)生的創(chuàng)新力的影響
        新興市場對投資者的吸引力不斷增強(qiáng)
        中國外匯(2019年7期)2019-07-13 05:45:04
        一個雪球滾下坡
        積極情緒相關(guān)研究綜述
        日本一区二区三级免费| 亚洲精品夜夜夜| 欧美日韩一区二区三区色综合| 亚洲视频在线中文字幕乱码| 丁香花五月六月综合激情| 两个人看的www免费视频中文| 亚洲人成无码网站久久99热国产| 国产99精品精品久久免费| 午夜亚洲精品视频在线| 乱中年女人伦av三区| 99精品视频在线观看| 亚洲无码观看a| 亚洲第一女人的天堂av| 女的扒开尿口让男人桶30分钟| 国产欧美VA欧美VA香蕉在| 国产不卡一区二区三区视频| 国产免费观看久久黄av麻豆| 中文人妻熟妇乱又伦精品| 国产伦精品一区二区三区视| 日本骚色老妇视频网站| 亚洲成人免费av影院| 国产亚洲午夜高清国产拍精品| 亚洲制服无码一区二区三区 | 欧美大胆性生话| 永久免费的av在线电影网无码 | 亚洲性无码av在线| 国产三级在线看完整版| 国产乱理伦在线观看美腿丝袜| 高潮迭起av乳颜射后入| 日韩中文字幕一区二区高清| 国产一区三区二区视频在线观看| 成人在线免费电影| 秋霞午夜无码鲁丝片午夜精品 | 免费无码中文字幕A级毛片| 国产激情视频高清在线免费观看 | 亚洲精品一区国产欧美| 国产爆乳无码一区二区在线 | 天天综合网天天综合色| 久久这里只精品国产2| 日本av不卡一区二区三区| 成人无码网www在线观看|