亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        網(wǎng)絡(luò)輿情作為社會傳感器對股票指數(shù)的影響
        ——基于LDA主題模型的挖掘分析

        2018-06-21 01:08:22呂偉欣
        財務(wù)與金融 2018年6期
        關(guān)鍵詞:殘差輿情顯著性

        徐 翔 靳 菁 呂偉欣

        一、引言與問題的提出

        新媒體環(huán)境下,網(wǎng)絡(luò)輿情作為社會公眾意見的重要“傳感器”,在不同領(lǐng)域發(fā)揮著越來越重要的作用。中國互聯(lián)網(wǎng)信息中心(CNNIC)發(fā)布的第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報告》顯示,截至2017年12月,我國網(wǎng)民規(guī)模已達(dá)7.72億,全年共計(jì)新增網(wǎng)民4074萬人,互聯(lián)網(wǎng)普及率為55.8%。網(wǎng)民規(guī)模的增加,說明網(wǎng)絡(luò)輿情的來源愈加豐富,網(wǎng)絡(luò)輿情的輻射范圍也更加廣泛。

        研究證券市場的漲跌與網(wǎng)絡(luò)輿情的變化之間是否存在相關(guān)性聯(lián)系的課題,有利于從傳播學(xué)角度探討網(wǎng)絡(luò)輿情的“社會傳感器”作用及其產(chǎn)生的社會影響。目前有關(guān)網(wǎng)絡(luò)輿情變化和股票市場關(guān)聯(lián)性的研究主要集中在經(jīng)濟(jì)學(xué)、金融學(xué)領(lǐng)域。本研究從網(wǎng)絡(luò)輿情動力學(xué)的角度考察輿情主題變化對股價漲跌的影響,有利于為傳播學(xué)的跨學(xué)科發(fā)展提供新的視角。另外,影響網(wǎng)絡(luò)輿情的因素眾多,受眾的選擇性注意、信息不對稱、缺少信息把關(guān)等問題,都有可能造成公眾的非理性投資行為,甚至導(dǎo)致股票市場異常。因此,挖掘網(wǎng)絡(luò)輿情的“社會傳感器”作用對證券市場的影響,還有利于加強(qiáng)證券市場的監(jiān)管,完善投資環(huán)境,促進(jìn)金融市場的穩(wěn)定。綜上,將網(wǎng)絡(luò)輿情變動和金融市場分別建立相應(yīng)的指標(biāo),通過文本挖掘和實(shí)證研究考察其關(guān)聯(lián)性的研究,具有一定的理論意義和現(xiàn)實(shí)關(guān)照。

        本文的核心觀點(diǎn)是,網(wǎng)絡(luò)輿情的變化與證券市場漲跌之間存在相關(guān)性。網(wǎng)絡(luò)輿情指向一定時期內(nèi)社會公眾的重大關(guān)切,而網(wǎng)絡(luò)輿情作為公眾認(rèn)知的重要“傳感器”,其變化說明受眾注意力的結(jié)構(gòu)發(fā)生改變。那么這種結(jié)構(gòu)性變化會不會對證券交易造成影響,會產(chǎn)生何種影響,就是本文試圖探討的話題。

        二、理論分析與文獻(xiàn)綜述

        本研究的理論依據(jù)主要包括兩個學(xué)科視角。首先,行為經(jīng)濟(jì)學(xué)表明金融市場的投資并不是完全理性的。投資過程可能存在認(rèn)知偏差。造成這種認(rèn)知偏差的因素多樣。一方面,市場有效性強(qiáng)調(diào)信息在股價預(yù)測中的作用。有效市場內(nèi)的信息會全面、迅速地反映在價格上。傳統(tǒng)股票市場的信息一般是單向傳播為主、并且有少數(shù)專業(yè)機(jī)構(gòu)發(fā)布,而隨著信息社會的發(fā)展,網(wǎng)絡(luò)輿情呈現(xiàn)出碎片化、多元化、智能化的特點(diǎn),投資者接受信息的渠道隨之增加,但良莠不齊的信息質(zhì)量并不一定能夠減少投資者的認(rèn)知偏差,還有可能誤導(dǎo)投資者。另一方面,投資者的內(nèi)在情緒和選擇性注意機(jī)制也會深刻影響決策活動。非理性行為還會引發(fā)群體效應(yīng),影響群體投資行為,形成“羊群效應(yīng)”。行為金融學(xué)突破了傳統(tǒng)金融學(xué)的理論桎梏,將金融市場的一些亂象從心理學(xué)、社會學(xué)角度進(jìn)行歸因,成功地從跨學(xué)科交叉的角度解釋了許多市場行為。

        其次,傳播學(xué)的經(jīng)典理論“議程設(shè)置”認(rèn)為,大眾傳播具有為受眾“設(shè)置議程”的功能。網(wǎng)絡(luò)所營造的“擬態(tài)環(huán)境”通過網(wǎng)絡(luò)輿情敏銳地將信息傳遞給投資者,造成投資者的注意力結(jié)構(gòu)、刻板印象和認(rèn)知水平等方面的變化,從而作用于證券交易市場。新媒體時代傳者泛化的特征,使得信息的提供者也不再僅僅局限于上市公司和監(jiān)管機(jī)構(gòu),普通股民也成為股市信息的提供者、傳播者和執(zhí)行者。從海量網(wǎng)絡(luò)輿情表現(xiàn)出的“議題”,可以代表受眾的重大關(guān)切和社會的普遍感知,實(shí)現(xiàn)了公共信息的凸顯和個性化信息的滿足。因此,網(wǎng)絡(luò)輿情的“社會傳感器”作用是不言而喻的。這種“社會傳感器”投射在本就對意見氣候極其敏銳的證券市場上,就很有可能影響市場的投資行為。

        國內(nèi)外學(xué)者從不同角度對于二者的關(guān)聯(lián)性進(jìn)行了研究。國外研究方面,Wysocki(1999)最早開始對網(wǎng)絡(luò)論壇討論進(jìn)行研究,他發(fā)現(xiàn)發(fā)帖量大的公司往往對應(yīng)的是交易量大的,市值價值比高的,機(jī)構(gòu)持股比例更小的公司。這表明前一日的股票評論數(shù)量對于后一日的股票收益率和成交量有一定的預(yù)測解釋能力。Antweiler(2004)等利用貝葉斯和向量機(jī)方法對RagingBull和雅虎金融板塊的論壇進(jìn)行分析,建立了投資者情緒指數(shù)和投資者意見分散度指數(shù),發(fā)現(xiàn)股票收益率與當(dāng)天論壇中的信息指標(biāo)呈顯著的相關(guān)關(guān)系。隨著社交媒體的發(fā)展,Blankespoor、Miller和White(2014)等人從市場有效性的角度研究社交媒體與股票交易的關(guān)聯(lián),他們發(fā)現(xiàn),公司在twitter上發(fā)布新聞,能夠減少信息不對稱性,以降低異常的買賣差價。

        國內(nèi)研究方面,饒育蕾(2010),金雪軍等(2013)以及馬俊偉等(2014)都通過分析不同數(shù)據(jù)源,證明了媒體信息與股價的相關(guān)性。游家興等(2012)借用"沉默的螺旋"理論,從金融市場的資產(chǎn)誤定價現(xiàn)象入手研究媒體情緒對于金融市場的負(fù)面影響。金曦(2016)分析了個股成交量與百度媒體指數(shù)的動態(tài)關(guān)聯(lián),得出了在不控制任何條件的情況下新聞量越大,個股成交量越大的結(jié)論??紫栌畹龋?016)深度挖掘了財經(jīng)新聞主題內(nèi)容與股市市場的相關(guān)性,并提出了一種基于理解當(dāng)日新聞主題分布來分析中國股市漲跌的預(yù)測模型。宋雙杰等(2011)人則通過分析網(wǎng)絡(luò)搜索量研究投資者關(guān)注和IPO溢價的異常情況。李正輝等人(2018)從文獻(xiàn)綜述的視角梳理了網(wǎng)絡(luò)輿情和金融市場的關(guān)系,圍繞投資者關(guān)注、信心和情緒等方面分析網(wǎng)絡(luò)輿情對資產(chǎn)定價波動的影響。

        但是,另一方面,也有學(xué)者認(rèn)為媒體信息和股票市場可能呈現(xiàn)不相關(guān)的情況。Tumarkin和Whitelaw(2001)分析了美國RagingBull論壇,以互聯(lián)網(wǎng)行業(yè)的72只股票為研究對象,著重觀察事件日前后各五天內(nèi)證券市場變量的變化情況。作者最后認(rèn)為,發(fā)帖者的情緒并不能預(yù)測股票成交量和回報,論壇上的開源信息主要是“市場噪音”。Das和Chen(2001)研究發(fā)現(xiàn),網(wǎng)絡(luò)討論能夠迅速反映信息,但無法預(yù)測股票收益。

        另外,還有研究認(rèn)為投資者情緒和關(guān)注度、搜索強(qiáng)度等媒體提供的信息也是對股價進(jìn)行預(yù)測的重要指標(biāo)。Bollen、Mao(2010)等學(xué)者對美國大型社交網(wǎng)站twitter近1000萬條網(wǎng)絡(luò)信息中表現(xiàn)出的投資者的不同情緒進(jìn)行挖掘分析,結(jié)果表明,把某情緒指數(shù)向后移動3天左右得到的結(jié)果,同道瓊斯工業(yè)的平均指數(shù)非常相近,準(zhǔn)確率甚至達(dá)到了86.7%。同樣關(guān)注投資者情緒對股價影響的還有Ljungqvist(2003)和Sapienza(2004)等。以搜索強(qiáng)度的媒體信息作為影響因素的研究中,Da和Gao(2009)通過網(wǎng)民在互聯(lián)網(wǎng)中的搜索指數(shù)來說明股票市場中投資者情緒的變化。他們搜集了Russell3000指數(shù)中所有公司股票簡稱的搜索強(qiáng)度數(shù)據(jù),得出的結(jié)論是規(guī)模較小的市場的搜索強(qiáng)度對于股價的預(yù)測能力更強(qiáng)。

        三、研究設(shè)計(jì)與概念界定

        研究假設(shè)即網(wǎng)絡(luò)輿情的變化與股票交易指數(shù)的漲跌幅有關(guān)聯(lián),網(wǎng)絡(luò)輿情變動能夠解釋股票市場交易量漲跌幅的變動。具體來說,通過LDA主題模型的反復(fù)迭代生成了100個主題,這些主題從第0天起到第6天末的變化情況,與上證指數(shù)、滬深三百、深證成指、創(chuàng)業(yè)板指這四個主要股指相對應(yīng)的交易日漲跌幅之間存在關(guān)聯(lián)。

        研究的基本思路是,首先,抓取今日頭條(https://www.toutiao.com)的約一千六百萬條帖子,這些帖子以傳者用戶為線索。這些用戶采取判斷抽樣方式,從今日頭條的“熱點(diǎn)”版塊中獲得發(fā)文者的url。對發(fā)問者的歷史發(fā)帖,按照從新到舊的順序排列,通過python編寫爬蟲抓取,其中由于頁面是“瀑布流”的下拉式ajax頁面,采用selenium技術(shù)模擬人類用戶在瀏覽今日頭條頁面時的下拉等操作行為。最后對數(shù)據(jù)進(jìn)行清洗和選擇,得到2016年2月15日至2017年11月29日所有交易日帖子樣本,并對這些帖子進(jìn)行LDA主題模型的分析。其次,分別獲取上證指數(shù)、滬深三百、深證成指、創(chuàng)業(yè)板指的數(shù)據(jù),整理這些股指在上述時間內(nèi)的漲跌幅變化數(shù)據(jù)。之所以選擇以上四個股指,是因?yàn)檫@四個股指的代表性較強(qiáng),上證指數(shù)和深證成指分別代表了滬深兩市的最綜合最全面的金融指標(biāo);滬深三百覆蓋滬深兩市,合理選擇樣本股描述股市投資情況;創(chuàng)業(yè)板指數(shù)全面地反映了創(chuàng)業(yè)板市場情況,向投資者提供了更豐富的金融指標(biāo)參考。因此,四個股指的漲跌幅分析能夠幫助我們更宏觀地了解股市變動情況,從而考察其與網(wǎng)絡(luò)輿情的關(guān)聯(lián)。第三,通過多元線性回歸分析計(jì)算出今日頭條帖子的LDA模型主題變動數(shù)值與各個股指的股價漲跌幅之間存在何種聯(lián)系。回歸分析可以從二者的關(guān)聯(lián)強(qiáng)度、顯著性檢驗(yàn)、擬合優(yōu)度、穩(wěn)健性等方面進(jìn)行。第四,運(yùn)用支持向量機(jī)(SVM)算法進(jìn)行機(jī)器學(xué)習(xí),輸入回歸結(jié)果中具有顯著作用的LDA數(shù)值作為訓(xùn)練樣本,運(yùn)用五折法進(jìn)行學(xué)習(xí)和預(yù)測(將樣本分為5份,機(jī)器學(xué)習(xí)五分之四的訓(xùn)練樣本之后,對剩余五分之一的樣本的股價漲跌進(jìn)行預(yù)測,反復(fù)進(jìn)行五次)。這一實(shí)證結(jié)果表明,通過回歸結(jié)果中具有顯著作用的LDA列生成的機(jī)器學(xué)習(xí)模型具有比較強(qiáng)的泛化能力,即LDA所代表的網(wǎng)絡(luò)輿情的變動能夠?qū)蓛r漲跌進(jìn)行預(yù)測。

        概念界定方面,首先,網(wǎng)絡(luò)輿情的概念學(xué)界尚未形成統(tǒng)一界定,一般來說,網(wǎng)絡(luò)輿情是指網(wǎng)民自發(fā)形成的零散的意見表達(dá)。在本研究中為了使網(wǎng)絡(luò)輿情可操作化,我們將“今日頭條”帖子作為數(shù)據(jù)源,通過LDA模型進(jìn)行文本分析,得出比較具有代表性的網(wǎng)絡(luò)輿情表達(dá)?!敖袢疹^條”是基于數(shù)據(jù)挖掘和個性化推薦生成新聞資訊的平臺,包括新聞門戶網(wǎng)站、手機(jī)新聞客戶端等產(chǎn)品,其內(nèi)容包含娛樂、科技、財經(jīng)、體育等方面,受眾分布也比較廣泛。根據(jù)今日頭條公布的數(shù)據(jù),截止2018年7月31日,其日活躍用戶數(shù)已經(jīng)達(dá)到了1.2億?;邶嫶蟮挠脩羧汉驮L問量,我們可以認(rèn)為抓取的共約1600萬今日頭條帖子代表了一定時期內(nèi)的社會關(guān)注和意見表達(dá)。其次,所謂網(wǎng)絡(luò)輿情的“社會傳感器”作用,是指網(wǎng)絡(luò)在生成海量信息的同時,也作為“社會傳感器”感知著社會意見分布,并將這種感知傳導(dǎo)到網(wǎng)絡(luò)的擬態(tài)環(huán)境中。這種“社會傳感器”作用對整合個體的感知能力,進(jìn)行統(tǒng)籌資源調(diào)配,都具有重要意義。為了使網(wǎng)絡(luò)輿情的“社會傳感器”作用在研究中變得更加可操作化,在本研究中我們引入了LDA主題模型以分析輿情文本的變化情況。LDA主題模型通過對頭條帖子的文本進(jìn)行挖掘,建立離散數(shù)據(jù)模型,分析不同主題的概率分布。我們可以通過觀察LDA主題模型相對于前0到6天的變化,了解公眾的注意力轉(zhuǎn)向何方,這種轉(zhuǎn)向是否與主要股指漲跌幅有關(guān),以此證明網(wǎng)絡(luò)輿情在金融市場中是否存在“社會傳感器”的作用,影響力有多少。

        四、網(wǎng)絡(luò)輿情的文本挖掘

        對于網(wǎng)絡(luò)輿情的文本挖掘,我們采用的是建立LDA主題模型以觀察其在第0天起到第6天末變動的方法。LDA主題模型是一種對于文本內(nèi)容進(jìn)行分析的方式,它通過對離散數(shù)據(jù)集建立模型,分析概率主題。這種模型的核心思想是,一個文檔包含了若干主題,而每一主題又包括若干個主題詞。本研究中,對于每條帖子,考察它在這些主題上的分布概率,這些概率的總和為1。這種處理方法很好地適應(yīng)了網(wǎng)絡(luò)內(nèi)容的多主題性及其模糊性。

        LDA主題模型的優(yōu)點(diǎn)主要包括以下三點(diǎn)。首先,LDA模型簡短描述文檔,并且引入先驗(yàn)參數(shù),減少了過度擬合的可能性。即使文檔數(shù)量增加,主題參數(shù)也不會隨之線性增加,而只會留下最本質(zhì)的統(tǒng)計(jì)信息,這使得大規(guī)模處理文檔信息,進(jìn)行文本分類變得更加高效。其次,3層貝葉斯結(jié)構(gòu)的LDA模型具有清晰的層次劃分,包括文檔集合層、主題、主題特征詞三層,這使得潛在語義分類更加科學(xué)化、智能化,減小了人工分類帶來的主觀偏見的影響,有助于提高聚類效果的質(zhì)量。第三,本文中的LDA是動態(tài)化的主題模型,不再關(guān)注單個靜態(tài)因素對因變量的影響,而是關(guān)注主題的動態(tài)變化與因變量的關(guān)聯(lián),這種動態(tài)演化過程很好地反映了主題相對于前段時間的演化過程,更有助于把握文本變化。但是,我們也應(yīng)該看到,LDA主題模型依然存在比較明顯的弊端,主要表現(xiàn)在采用強(qiáng)制方法分配隱含主題,挖掘語義上下文的能力有限。

        本研究的分析中,考慮到主題之間的差異度,將網(wǎng)絡(luò)輿情內(nèi)容的劃分設(shè)定為100個主題,LDA主題模型共迭代了500次,生成了區(qū)分度較優(yōu)的主題分布結(jié)果。劃分通過python程序語言及其LDA模塊進(jìn)行。LDA主題的確立很好地引導(dǎo)我們了解社會關(guān)注和輿情熱點(diǎn),文本語義挖掘結(jié)果比較合理。

        需要注意的是,我們需要明確的不是網(wǎng)絡(luò)輿情內(nèi)容指向與股價指數(shù)關(guān)注指向之間的靜態(tài)聯(lián)系,而是網(wǎng)絡(luò)輿情的動態(tài)變化,能否解釋股價市場的漲跌。因此,為了了解網(wǎng)絡(luò)輿情的動態(tài)變化,我們計(jì)算出了今日頭條每天的帖子在100個主題上的分布概率,相對與前一天的變化差值,了解LDA主題模型從第0天其到第6天末的變動情況。實(shí)際上,這種變化也是一階差分的處理,有助于通過輿情變化情況而非直接的輿情情況,更好地了解公眾的注意力變化情況和“議程設(shè)置”的情況。這里我們截選七天內(nèi)LDA前10列的變動差值如下。(見表1)

        表1 主題分布概率及相對于前一天的變化差值(以7天內(nèi)的部分主題為例)

        五、主要股指漲跌幅和網(wǎng)絡(luò)輿情主題變化的回歸分析

        (一)上證指數(shù)與從第0天起到第6天末的網(wǎng)絡(luò)輿情主題變化的多元回歸分析

        上證指數(shù)(000001)的樣本股是在上海證券交易所全部上市股票,包括A股和B股,反映了上海證券交易所上市股票價格的變動情況。多元線性回歸分析的因變量為上證指數(shù)在對應(yīng)日期內(nèi)的漲跌幅,自變量為2016年2月15日至2017年11月29日今日頭條帖子呈現(xiàn)的LDA主題模型從第0天起到第6天末的變化。變量的篩選采用了“逐步”分析策略,在每個變量進(jìn)入方程之后再次判斷是否可以剔除,這就在引入變量之后的每一個階段都提供了剔除不顯著變量的機(jī)會。

        關(guān)聯(lián)強(qiáng)度方面,回歸模型的調(diào)整R方為0.714(見表2),說明網(wǎng)絡(luò)輿情的變動能夠解釋上證指數(shù)約71.4%的變化,這說明網(wǎng)絡(luò)輿情對上證指數(shù)和證券市場的波動具有比較顯著的正向影響。

        顯著性檢驗(yàn)方面,從回歸方程的顯著性來看,F(xiàn)值為15.076,P-值為0.000(見表3),小于0.05,說明拒絕原假設(shè),認(rèn)為自變量和因變量的線性關(guān)系顯著?;貧w方程的顯著性檢驗(yàn)結(jié)果與擬合優(yōu)度也有一定關(guān)聯(lián),P-值較小,說明擬合優(yōu)度較好。從回歸系數(shù)的顯著性來看,僅有兩個t統(tǒng)計(jì)量對應(yīng)的概率P-值均大于0.05,需要被剔除,可以認(rèn)為自變量和因變量的線性關(guān)系顯著。

        殘差分析方面,殘差均值為0(見表4),說明總體上服從以0為均值的正態(tài)分布。殘差獨(dú)立性方面,Durbin-Watson值為1.651,約等于2,說明序列不存在自相關(guān)關(guān)系。另外,標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖中,數(shù)據(jù)沿對角線方向分布(見圖1),說明回歸模型滿足正態(tài)要求。

        多重共線性診斷方面,最大特征值為3.767,最小特征值為0.208,最大的條件指數(shù)為4.260,可以認(rèn)為多重共線性較弱,特征值檢驗(yàn)系統(tǒng)比較平穩(wěn),結(jié)論基本穩(wěn)健。

        表2 上證指數(shù)的模型匯總

        表3 上證指數(shù)的方差分析

        表4 上證指數(shù)的殘差統(tǒng)計(jì)量

        圖1 上證指數(shù)標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖

        (二)滬深300與從第0天起到第6天末的網(wǎng)絡(luò)輿情主題變化的多元回歸分析

        滬深300(000300)是由滬深證券交易所聯(lián)合發(fā)布的覆蓋滬深兩市的金融指標(biāo),該回歸分析的因變量是滬深300在對應(yīng)日期內(nèi)的漲跌幅,自變量依然是基于網(wǎng)絡(luò)輿情生成的LDA主題模型的從第0天起到第6天末的變化。采用“逐步”策略進(jìn)行分析。

        關(guān)聯(lián)強(qiáng)度方面,回歸模型的調(diào)整R方為0.667(見表5),說明網(wǎng)絡(luò)輿情的變動能夠解釋上證指數(shù)約66.7%的變化,這說明網(wǎng)絡(luò)輿情的變動對滬深300股指也有比較顯著的影響,但是影響幅度小于上證指數(shù)。

        顯著性檢驗(yàn)方面,從回歸方程的顯著性來看,F(xiàn)值為12.617,P-值為0.000(見表6),小于0.05,認(rèn)為自變量和因變量的線性關(guān)系顯著。回歸方程的顯著性檢驗(yàn)結(jié)果與擬合優(yōu)度也有一定關(guān)聯(lián),P-值較小,說明擬合優(yōu)度較好。從回歸系數(shù)的顯著性來看,每一個t統(tǒng)計(jì)量對應(yīng)的概率P-值均小于0.05,說明自變量和因變量的線性關(guān)系顯著。

        殘差分析方面,殘差均值為0(見表7),說明總體上服從以0為均值的正態(tài)分布。殘差獨(dú)立性方面,Durbin-Watson值為1.600,約等于2,說明序列不存在自相關(guān)關(guān)系。另外,標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖中,數(shù)據(jù)沿對角線方向分布(見圖2),說明回歸模型滿足正態(tài)要求。

        多重共線性診斷方面,最大特征值為3.573,最小特征值為0.191,最大的條件指數(shù)為4.325,說明多重共線性較弱,特征值檢驗(yàn)系統(tǒng)比較平穩(wěn),結(jié)論基本穩(wěn)健。

        表5 滬深300的模型匯總

        表6 滬深300的方差分析

        表7 滬深300的殘差統(tǒng)計(jì)量

        圖2 滬深300標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖

        (三)深證成指與從第0天起到第6天末的網(wǎng)絡(luò)輿情主題變化的多元回歸分析

        深證成指(399001)是深圳證券交易所的主要股指,它按一定標(biāo)準(zhǔn)選出500家有代表性的上市公司作為樣本股,以觀察股價變動的金融市場指標(biāo)。該回歸分析的因變量是深證成指在對應(yīng)日期內(nèi)的漲跌幅,自變量和分析策略與之前股指的分析相同。

        回歸結(jié)果表明,關(guān)聯(lián)強(qiáng)度方面,回歸模型的調(diào)整R方為0.627(見表8),說明網(wǎng)絡(luò)輿情的變動能夠解釋上證指數(shù)約62.7%的變化,這一結(jié)果小于上證指數(shù)和滬深300的解釋力。

        顯著性檢驗(yàn)方面,從回歸方程的顯著性來看,F(xiàn)值為12.566,P-值為0.000(見表9),小于0.05,認(rèn)為自變量和因變量的線性關(guān)系顯著。回歸方程的顯著性檢驗(yàn)結(jié)果與擬合優(yōu)度也有一定關(guān)聯(lián),P-值較小,說明擬合優(yōu)度較好。從回歸系數(shù)的顯著性來看,僅有兩個t統(tǒng)計(jì)量對應(yīng)的概率P-值均大于0.05,需要被剔除,可以認(rèn)為自變量和因變量的線性關(guān)系顯著。

        殘差分析方面,殘差均值為0(見表10),說明總體上服從以0為均值的正態(tài)分布。殘差獨(dú)立性方面,Durbin-Watson值為1.797,約等于2,說明序列不存在自相關(guān)關(guān)系。另外,標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖中,數(shù)據(jù)沿對角線方向分布(見圖3),說明回歸模型滿足正態(tài)要求。

        多重共線性診斷方面,最大特征值為3.165,最小特征值為0.260,最大的條件指數(shù)為3.492,說明多重共線性較弱,特征值檢驗(yàn)系統(tǒng)比較平穩(wěn),結(jié)論基本穩(wěn)健。

        表8 深證成指的模型匯總

        表9 深證成指的方差分析

        表10 深證成指的殘差統(tǒng)計(jì)量

        圖3 深證成指標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖

        (四)創(chuàng)業(yè)板指與從第0天起到第6天末的網(wǎng)絡(luò)輿情主題變化的多元回歸分析

        創(chuàng)業(yè)板指數(shù)(399006)是從深交所創(chuàng)業(yè)板上市的A股中選出500家代表性較強(qiáng)的公司作為樣本股,以觀察股價變動的指標(biāo)。創(chuàng)業(yè)板指的推出為我們分析資本市場提供了更多層次和角度。該回歸分析的因變量是創(chuàng)業(yè)板指在對應(yīng)日期內(nèi)的漲跌幅,自變量和分析策略與之前股指的分析相同。

        回歸結(jié)果表明,關(guān)聯(lián)強(qiáng)度方面,回歸模型的調(diào)整R方為0.638(見表11),說明網(wǎng)絡(luò)輿情的變動能夠解釋上證指數(shù)約63.8%的變化,這一結(jié)果小于上證指數(shù)和滬深300的解釋力。

        顯著性檢驗(yàn)方面,從回歸方程的顯著性來看,F(xiàn)值為12.062,P-值為0.000(見表12),小于0.05,認(rèn)為自變量和因變量的線性關(guān)系顯著?;貧w方程的顯著性檢驗(yàn)結(jié)果與擬合優(yōu)度也有一定關(guān)聯(lián),P-值較小,說明擬合優(yōu)度較好。從回歸系數(shù)的顯著性來看,每一個t統(tǒng)計(jì)量對應(yīng)的概率P-值均小于0.05,可以認(rèn)為自變量和因變量的線性關(guān)系顯著。

        殘差分析方面,殘差均值為0(見表13),說明總體上服從以0為均值的正態(tài)分布。殘差獨(dú)立性方面,Durbin-Watson值為1.828,約等于2,說明序列不存在自相關(guān)關(guān)系。另外,標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖中,數(shù)據(jù)沿對角線方向分布(見圖4),說明回歸模型滿足正態(tài)要求。

        多重共線性診斷方面,最大特征值為3.950,最小特征值為0.158,最大的條件指數(shù)為5.005,說明多重共線性較弱,特征值檢驗(yàn)系統(tǒng)比較平穩(wěn),結(jié)論基本穩(wěn)健。

        表11 創(chuàng)業(yè)板指的模型匯總

        表12 創(chuàng)業(yè)板指的方差分析

        表13 創(chuàng)業(yè)板指的殘差統(tǒng)計(jì)量

        圖4 創(chuàng)業(yè)板指標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖

        六、結(jié) 語

        通過多元線性回歸分析我們發(fā)現(xiàn),上述四個股指的調(diào)整R方均大于0.6,說明不同股指的影響因素雖然存在差異,但是總體上都能夠解釋網(wǎng)絡(luò)輿情變化超過60%的概率。所有股指的回歸分析結(jié)果均通過了顯著性檢驗(yàn)和穩(wěn)健性檢驗(yàn),得出的結(jié)論基本穩(wěn)健。從不同股指的個體差異來看,不同股指與輿情主題變化的關(guān)聯(lián)強(qiáng)度由小到大排列為:上證指數(shù)、滬深300、創(chuàng)業(yè)板指、深證成指。這說明不同股指所反映的市場變動存在差異,上證指數(shù)的樣本股包括在滬全部上市股票,總體即樣本的強(qiáng)大數(shù)據(jù)描述能力可能是其解釋力更加理想的原因之一。而創(chuàng)業(yè)板指只針對創(chuàng)業(yè)板市場,深證成指的樣本股為挑選得出的500家公司,不同股指的代表市場不同可能是解釋力稍低的原因。

        本研究關(guān)注的并非網(wǎng)絡(luò)輿情內(nèi)容與股票投資指向之間的關(guān)聯(lián),而是從網(wǎng)絡(luò)輿情動力學(xué)的角度出發(fā),描述網(wǎng)絡(luò)輿情變化與股指漲跌幅之間的關(guān)系,這種變化更能夠準(zhǔn)確揭示網(wǎng)絡(luò)輿情的“社會傳感器”作用,反映網(wǎng)絡(luò)輿情將社會意見分布傳導(dǎo)到股票市場的動態(tài)過程。在研究方法方面,我們采用量化方法進(jìn)行文本挖掘和數(shù)據(jù)分析,通過建立LDA主題模型進(jìn)行文本聚合和分析,建立多元統(tǒng)計(jì)的分析模型。將文本抓取和挖掘、數(shù)據(jù)分析等多種方法相結(jié)合的實(shí)證研究也彰顯出計(jì)算傳播學(xué)與金融研究融合創(chuàng)新的張力。

        猜你喜歡
        殘差輿情顯著性
        基于雙向GRU與殘差擬合的車輛跟馳建模
        基于殘差學(xué)習(xí)的自適應(yīng)無人機(jī)目標(biāo)跟蹤算法
        基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
        基于顯著性權(quán)重融合的圖像拼接算法
        電子制作(2019年24期)2019-02-23 13:22:26
        基于視覺顯著性的視頻差錯掩蓋算法
        一種基于顯著性邊緣的運(yùn)動模糊圖像復(fù)原方法
        論商標(biāo)固有顯著性的認(rèn)定
        輿情
        中國民政(2016年16期)2016-09-19 02:16:48
        輿情
        中國民政(2016年10期)2016-06-05 09:04:16
        輿情
        中國民政(2016年24期)2016-02-11 03:34:38
        亚洲中字永久一区二区三区| 无码AV午夜福利一区| 91精品日本久久久久久牛牛| 亚洲日产国无码| 亚洲av一区二区三区网站| 草青青视频手机免费观看| 中国男男女在线免费av| 富婆叫鸭一区二区三区| 国产免费人成视频网站在线18| 在线精品亚洲一区二区动态图| 亚洲av无码片vr一区二区三区| 国产精品v欧美精品v日韩精品| 亚洲av无码成人精品区在线观看| 亚洲夜夜骑| 国产精品成人av电影不卡| 一本大道综合久久丝袜精品| 蜜桃av中文字幕在线观看| 在线人成视频播放午夜| 免费人成激情视频在线观看冫| 国产99视频精品免视看9| 日韩高清亚洲日韩精品一区| 亚色中文字幕| 一本久道视频无线视频试看 | 国产精品人成在线观看不卡| 日本一二三区免费在线| 成人区人妻精品一区二区三区| 久久久国产乱子伦精品作者 | 国产亚洲av无码av男人的天堂| 色噜噜久久综合伊人一本| 欧洲日本一线二线三线区本庄铃| 国产农村妇女毛片精品久久久| 久久99老妇伦国产熟女高清| 一区二区黄色素人黄色| 亚洲国产精品国自产拍性色| 亚洲精品夜夜夜妓女网| 日韩国产欧美| 一区二区三区日本美女视频| 麻豆亚洲av熟女国产一区二| 国产伦精品一区二区三区| 午夜免费福利在线观看| 亚洲国产不卡免费视频|