亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LDA-BiLSTM 的金融恐慌輿情分析與預(yù)測

        2023-10-31 11:39:38張思揚(yáng)匡芳君
        軟件導(dǎo)刊 2023年10期
        關(guān)鍵詞:恐慌輿情金融

        張思揚(yáng),匡芳君

        (溫州商學(xué)院 信息工程學(xué)院,浙江 溫州 325035)

        0 引言

        金融恐慌是中國近代學(xué)界金融危機(jī)現(xiàn)象的表現(xiàn),指幾乎所有金融領(lǐng)域的金融狀況發(fā)生突發(fā)性惡化,將導(dǎo)致并惡化金融危機(jī)。經(jīng)濟(jì)資源和金融風(fēng)險(xiǎn)配置問題均可能導(dǎo)致金融恐慌,但風(fēng)險(xiǎn)配置更容易導(dǎo)致,另外政策變化也可能觸發(fā)金融恐慌。2018 年國家智庫報(bào)告指出,中國應(yīng)警惕金融恐慌。為此,政府對此高度重視,提前采取了一系列風(fēng)險(xiǎn)管理措施。

        預(yù)期管理是一種防范金融恐慌的工具,但作用有限,幾乎未涉及有關(guān)金融恐慌網(wǎng)絡(luò)輿情分析的研究,而輿情導(dǎo)向?qū)σl(fā)金融恐慌有著不可忽視的作用。因此,研究金融恐慌輿情,設(shè)計(jì)并實(shí)現(xiàn)金融恐慌網(wǎng)絡(luò)輿情分析與預(yù)警系統(tǒng),不僅能為金融市場決策者提供技術(shù)支撐,還為政府相關(guān)部門、銀行和金融市場管理者制定網(wǎng)絡(luò)輿情引導(dǎo)策略提供科學(xué)依據(jù)。

        1 相關(guān)工作

        國內(nèi)外學(xué)者對網(wǎng)絡(luò)輿情概念、內(nèi)涵和發(fā)展的研究較多,存在很多輿情理論和應(yīng)用研究。王丙坤等[1-2]提出一系列輿情預(yù)警模型,為網(wǎng)絡(luò)輿情預(yù)警機(jī)制提供解決問題的思路。劉英杰等[3-6]研究政府決策及信息發(fā)布對輿情調(diào)控的影響和網(wǎng)絡(luò)輿情情感識別研究,為政府決策提供參考。Wang 等[7]提出話題檢測算法,通過網(wǎng)絡(luò)輿情要素的多層次、多屬性、多維度等特征構(gòu)建多維網(wǎng)絡(luò)模型。Fang 等[8]研究網(wǎng)絡(luò)輿情意見差異閾值的影響提出GPF-NP 模型。Yu 等[9]在大數(shù)據(jù)背景下研究網(wǎng)絡(luò)輿情分析,為海量輿情分析和預(yù)警研究提供有益的思路。林萍等[10]利用LDA 主題挖掘模型,挖掘網(wǎng)絡(luò)突發(fā)事件熱門主題與演化趨勢。吳彥文等[11]融合主題詞和LDA 進(jìn)行文本分類。孫靖超等[12]研究循環(huán)神經(jīng)網(wǎng)絡(luò)輿情預(yù)測方法。陳福集等[13]利用人工蜂群算法優(yōu)化BP 模型參數(shù),提升網(wǎng)絡(luò)輿情熱度趨勢預(yù)測準(zhǔn)確率。邢云菲等[14]提出基于信息熵的負(fù)面網(wǎng)絡(luò)輿情監(jiān)測指標(biāo)體系。連芷萱等[15]結(jié)合定性、定量指標(biāo)體系,構(gòu)建微博輿情熱度預(yù)測模型。鄧楠等[16]結(jié)合情感詞向量和BiLSTM 進(jìn)行文本情感分析。周靈等[17]提出融合情感特征的短文本分類方法。周泳東等[18]利用分段卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行文本情感分析。Li 等[19]在雙向LSTM 中融合自我關(guān)注和多特征通道進(jìn)行情感分析。

        雖然,國內(nèi)外網(wǎng)絡(luò)輿情研究已取得一定成果,但金融恐慌輿情隱蔽性強(qiáng)、爆發(fā)速度快、網(wǎng)絡(luò)用語不規(guī)范,輿情研究成果仍然無法完全適用,金融恐慌輿情信息的預(yù)測方法仍需完善和改進(jìn)。

        因此,本文提出一種基于LDA-BiLSTM 模型的金融恐慌輿情監(jiān)測方法,以金融行業(yè)新聞網(wǎng)頁、論壇、微博、博客等為數(shù)據(jù)來源,挖掘數(shù)據(jù)中的熱點(diǎn)話題和網(wǎng)民對熱點(diǎn)話題的情感極性,篩選輿情數(shù)據(jù)中的有效信息,為政府相關(guān)部門和金融恐慌輿情管理者提供輿情提醒。

        2 金融恐慌網(wǎng)絡(luò)輿情演化

        金融恐慌作為金融市場預(yù)期突變的產(chǎn)物,對社會(huì)穩(wěn)定和實(shí)體經(jīng)濟(jì)發(fā)展帶來了危害和挑戰(zhàn)。金融恐慌信息的不當(dāng)傳播會(huì)造成巨大影響,可能相較于金融危機(jī)危害性更嚴(yán)重。因此,深入研究金融恐慌輿情信息傳播機(jī)理,構(gòu)建金融恐慌網(wǎng)絡(luò)輿情分析與預(yù)警系統(tǒng)迫在眉睫。

        本文以金融恐慌輿情信息為主線,分析在線金融交易用戶對金融恐慌網(wǎng)絡(luò)輿情信息的情感傾向性,充分利用大數(shù)據(jù)技術(shù)建立在線金融市場的金融恐慌輿情信息傳播中利益相關(guān)者的博弈仿真模型,制定金融恐慌信息輿情引導(dǎo)機(jī)制,利用仿真模型推演金融恐慌輿情的前兆和演化過程,提升金融市場和政府部門對金融恐慌輿情的預(yù)警與快速響應(yīng)能力,為領(lǐng)導(dǎo)提供及時(shí)、客觀、準(zhǔn)確的輿情信息,從體制、機(jī)制創(chuàng)新角度提供相應(yīng)的金融恐慌網(wǎng)絡(luò)輿情策略與決策參考,從而積極化解金融恐慌網(wǎng)絡(luò)輿情危機(jī)。金融恐慌網(wǎng)絡(luò)輿情演化要素關(guān)系如圖1所示。

        Fig.1 Relationship of evolution factors of financial panic network public opinion圖1 金融恐慌網(wǎng)絡(luò)輿情演化要素關(guān)系

        3 金融恐慌輿情分析流程與方法

        3.1 輿情分析流程

        金融恐慌輿情分析主要包括數(shù)據(jù)采集和預(yù)處理、模型構(gòu)建、預(yù)測輿情趨勢等步驟。首先,針對金融行業(yè)新聞網(wǎng)頁、論壇、微博、博客等目標(biāo)頁面編寫爬蟲程序,將采集的網(wǎng)頁相關(guān)數(shù)存儲(chǔ)在Mongo 數(shù)據(jù)庫,并對存儲(chǔ)文本進(jìn)行預(yù)處理;然后,對預(yù)處理后的數(shù)據(jù)建立主題提取和情感分析模型;最后,根據(jù)輿情信息分析挖掘出可能的輿情數(shù)據(jù),提醒相關(guān)金融部門和市場管理者。金融恐慌輿情分析流程如圖2所示。

        Fig.2 Analysis process of financial panic public opinion圖2 金融恐慌輿情分析流程

        3.2 數(shù)據(jù)采集與預(yù)處理

        金融恐慌輿情數(shù)據(jù)涉及領(lǐng)域廣,本文主要針對股市、匯市、債市、房地產(chǎn)等與金融行業(yè)緊密相關(guān)新聞網(wǎng)站、論壇、微博、博客、第三方支付等具有評論功能的網(wǎng)頁數(shù)據(jù)和信息進(jìn)行采集和數(shù)據(jù)預(yù)處理。首先利用Scrapy 框架編寫網(wǎng)絡(luò)爬蟲程序,采集涵蓋圖像、視頻、音頻和文本等金融恐慌輿情數(shù)據(jù);然后,將采集的數(shù)據(jù)存入Mongo 數(shù)據(jù)庫,通過數(shù)據(jù)清洗、合并、變換和標(biāo)準(zhǔn)化等預(yù)處理技術(shù)進(jìn)行整理,刪除無效網(wǎng)頁數(shù)據(jù)和重復(fù)數(shù)據(jù);最后,利用云數(shù)據(jù)存儲(chǔ)服務(wù)平臺Hadoop 和Mongodb 數(shù)據(jù)庫技術(shù),結(jié)合網(wǎng)絡(luò)信息采集與預(yù)處理技術(shù),收集網(wǎng)絡(luò)中各類金融恐慌輿情熱點(diǎn)的精品語料并存入系統(tǒng)知識庫,為金融恐慌網(wǎng)絡(luò)輿情預(yù)警與風(fēng)險(xiǎn)管制研究提供高質(zhì)量的數(shù)據(jù)基礎(chǔ)。

        3.3 大數(shù)據(jù)平臺下詞性過濾的LDA主題模型

        潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一種文檔主題生成模型[20],只根據(jù)單詞在主題中出現(xiàn)的概率判斷相關(guān)性,然而模型提取主題的可讀性受詞性影響,可能存在較大差異。因此,本文提出結(jié)合隱馬爾可夫模型(Hidden Markov Model,HMM)和字典匹配法的基于詞性過濾的LDA 主題模型自動(dòng)標(biāo)注單詞詞性,過濾解釋能力較差的詞性,從而提升LDA 主題模型的可讀性。其中,字典匹配法基于前綴字典掃描詞圖,構(gòu)造涵蓋所有可能分詞結(jié)果的有向無環(huán)圖,然后利用動(dòng)態(tài)規(guī)劃尋找最大概率路徑,并在前綴詞典中尋找該詞詞性,最后利用HMM 處理未知詞的分詞并標(biāo)注詞性。

        本文利用Spark 大數(shù)據(jù)平臺和MapReduce 編程模型,結(jié)合基于詞性過濾的LDA 話題模型處理發(fā)現(xiàn)的輿情熱點(diǎn)和敏感話題,重點(diǎn)尋找新信息、關(guān)注特殊熱點(diǎn),以提取語料庫的熱點(diǎn)主題和關(guān)鍵詞。通過聚類向用戶匯總信息,自動(dòng)跟蹤新聞事件,提供事件發(fā)展軌跡,實(shí)現(xiàn)多范圍、多角度、多層次的數(shù)據(jù)分析與挖掘等,包括網(wǎng)絡(luò)恐慌輿情識別、網(wǎng)民個(gè)人行為和情緒分析等,分析網(wǎng)民特點(diǎn)和行為,跟蹤輿情熱點(diǎn)趨勢。

        3.4 基于LSTM 的情感分析模型

        1997 年,長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)被提出,它是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種特殊類型,近年來被學(xué)者們廣泛應(yīng)用與改良,適用于處理、預(yù)測時(shí)間序列數(shù)據(jù)和事件[21-22]。

        LSTM 的隱含層輸出ht與ht-1間存在非線性關(guān)系,可解決循環(huán)神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練的問題;在記憶細(xì)胞ct和過去的ct-1間引入線性依賴性,通過引入控制門和記憶單元可解決梯度減小或爆炸問題。LSTM 中每個(gè)神經(jīng)元均具有存儲(chǔ)記憶單元、輸入門、輸出門和遺忘門。其中,輸入門、輸出門分別應(yīng)用于輸入端的非線性函數(shù)和輸出端的非線性函數(shù)[11,12];每個(gè)控制門均對前一個(gè)神經(jīng)元的存儲(chǔ)單元賦予權(quán)重。LSTM 網(wǎng)絡(luò)模型公式如式(1)—式(6)所示。

        式中:ct、it、ft、ot分別表示記憶細(xì)胞、輸入門、輸出門和遺忘門;σ(·)為sigmoid 函數(shù),主要用于激活門;g(·)為tanh函數(shù),主要用于激活block 輸入和輸出;W為權(quán)值系數(shù);b為偏置值。

        LSTM 模型不僅可彌補(bǔ)LDA 模型在短文本數(shù)據(jù)稀疏性方面存在的不足,還在記憶上下文信息和學(xué)習(xí)文本特征方面的效果良好,能較好地處理多個(gè)短文本語料庫、分析熱門主題情感極性,但在處理更細(xì)粒度的分類任務(wù)時(shí),單向LSTM 無法從后向前地編碼信息。

        為此,本文結(jié)合前向、后向LSTM,構(gòu)建雙向長短期記憶(Bi-Directional Long Short-Term Memory,Bi-LSTM)模型[23],以更好地挖掘雙向語義依賴。Bi-LSTM 提取文本特征向量公式如式(7)所示,Bi-LSTM 模型結(jié)構(gòu)如圖3所示。

        Fig.3 Bi-LSTM model structure圖3 Bi-LSTM 模型結(jié)構(gòu)

        4 實(shí)驗(yàn)結(jié)果與分析

        4.1 數(shù)據(jù)采集與預(yù)處理

        金融恐慌網(wǎng)絡(luò)輿情通過媒體報(bào)道、微博、博客、股吧等平臺影響投資者情緒和行為,導(dǎo)致金融市場波動(dòng),進(jìn)而引發(fā)金融恐慌。本文利用Scrapy 框架爬取2022 年2 月1 日—2 月28 日有關(guān)金融行業(yè)的股市、匯市、債市、房地產(chǎn)等與金融行業(yè)緊密相關(guān)的新聞網(wǎng)站、論壇、微博、博客、第三方支付等具有評論功能的網(wǎng)頁數(shù)據(jù),共獲取了輿情信息數(shù)據(jù)684 810條,如圖4所示。

        Fig.4 Trend of financial public opinion information圖4 金融行業(yè)輿情信息趨勢

        本文將爬取的輿情數(shù)據(jù)存入MongoDB 數(shù)據(jù)庫,再對存儲(chǔ)的輿情數(shù)據(jù)進(jìn)行預(yù)處理。具體步驟為:①根據(jù)內(nèi)容和昵稱對輿情數(shù)據(jù)進(jìn)行去重;②利用機(jī)械壓縮方式壓縮文本數(shù)據(jù);③結(jié)合詞和詞性標(biāo)注方式進(jìn)行分詞;④以哈爾濱工業(yè)大學(xué)停用詞為基礎(chǔ)構(gòu)建詞典,刪除輿情數(shù)據(jù)中的停用詞。

        為了更好地了解網(wǎng)民對經(jīng)濟(jì)方面的情緒反應(yīng),利用Python 編程分析網(wǎng)民情感,如圖5 所示。由此可見,網(wǎng)民的正面情緒為46.88%,負(fù)面情緒為53.12%,其中,能保持正常較好情緒的語言占34.56%,樂觀情緒占12.32%,恐懼情緒占25.75%,厭惡情緒占20.85%,憤怒情緒占2.08%,悲哀和驚恐情緒占比均為2.22%。

        Fig.5 Score of netizen sentiment analysis圖5 網(wǎng)民情感分析得分

        人們普遍抱有負(fù)面情緒的原因主要在于:①新冠疫情期間大眾心理狀態(tài)相對脆弱,網(wǎng)絡(luò)傳言與猜測不斷,個(gè)別網(wǎng)站報(bào)道時(shí)攜帶了個(gè)人色彩,引發(fā)了網(wǎng)民的負(fù)面情緒;②中東國家局勢緊張,原油、黃金、軍工股大漲及美股三大指數(shù)大跌,中美貿(mào)易摩擦減緩,制造業(yè)數(shù)據(jù)的收縮將嚴(yán)重拖累經(jīng)濟(jì)發(fā)展;③美聯(lián)儲(chǔ)的行動(dòng)影響全球多數(shù)央行決策,從而造成全球貨幣政策發(fā)生輿情;④新聞媒體、相關(guān)網(wǎng)站、論壇、微博、博客等不斷渲染宣傳民生經(jīng)濟(jì)狀況,使人們感受到生活、經(jīng)濟(jì)的緊張氣氛,衍生出恐慌、悲觀、厭惡等負(fù)面情緒。

        4.2 基于LDA的參數(shù)估計(jì)與主題提取

        本文首先通過預(yù)處理數(shù)據(jù),篩選數(shù)據(jù)集的數(shù)據(jù)詞性;然后去除非名詞詞性,將數(shù)據(jù)集導(dǎo)入LDA 主題模型;最后在LDA 模型中使用gensim 軟件包提供的方法訓(xùn)練語料庫,獲得每個(gè)主題的關(guān)鍵詞。由于LDA 模型參數(shù)較多,需要自行設(shè)定,其中主題數(shù)(Topic)最重要。因此,本文利用困惑度(Perplexity)計(jì)算模型的主題數(shù),困惑度越低聚類效果越好,即最小困惑度對應(yīng)最優(yōu)主題數(shù)。困惑度計(jì)算如式(8)所示:

        本文將主題個(gè)數(shù)設(shè)置為[5,200),步長為5,循環(huán)遞增主題個(gè)數(shù),根據(jù)式(8)計(jì)算不同主題數(shù)下LDA模型的困惑度并記錄相應(yīng)主題數(shù),在文本語料庫確定主題數(shù)后設(shè)置其他參數(shù)。首先,為了篩選不受歡迎的主題,將主題概率分布的最小閾值設(shè)置為0.01;然后,從語料庫中自動(dòng)學(xué)習(xí)先驗(yàn)知識以設(shè)置超參數(shù)α、β,并將迭代次數(shù)設(shè)置為5 000次。經(jīng)過50輪訓(xùn)練后,模型最終選取相關(guān)性較高的前20 個(gè)主題,文檔的預(yù)測主題則由LDA模型獲取每篇文檔相關(guān)性概率最高的主題來確定,然后選取8 個(gè)熱點(diǎn)主題下的文檔集作為測試語料庫,對每個(gè)熱點(diǎn)話題進(jìn)行后續(xù)的情感傾向分析。

        4.3 基于Bi-LSTM 的網(wǎng)民情感傾向分析

        在模型訓(xùn)練數(shù)據(jù)方面,本文在開源中文情感標(biāo)注語料庫中選取正面、負(fù)面語料,按4∶1 的比例劃分訓(xùn)練集和測試集,利用語料庫訓(xùn)練詞向量,將其用于訓(xùn)練語料庫中的字符映射。LSTM 隱藏層設(shè)置為128,學(xué)習(xí)速率設(shè)置為0.01,區(qū)域固定長度設(shè)為30,通過調(diào)整其他參數(shù)進(jìn)行50 輪訓(xùn)練,訓(xùn)練結(jié)果如表1所示。

        Table 1 Public opinion training results of LDA-BiLSTM表1 LDA-BiLSTM 模型輿情訓(xùn)練結(jié)果

        然后,利用訓(xùn)練后的模型預(yù)測測試集,LDA-BiLSTM與LSTM、BiLSTM 模型輿情預(yù)測結(jié)果比較結(jié)果如表2 所示。由表1、表2 可知,LDA-BiLSTM 模型的正面情緒(Positive)和負(fù)面情緒(Negative)的準(zhǔn)確率(Precision)、召回率(Recall)、F1 因子(F1-score)均在92%以上,宏平均(macro avg)和加權(quán)平均(weighted avg)均在91% 以上,證明了LDA-BiLSTM 模型能準(zhǔn)確預(yù)測金融恐慌輿情傾向,相較于直接使用LSTM 和BiLSTM 進(jìn)行訓(xùn)練和測試的效果更優(yōu)。

        Table 2 Comparison of public opinion prediction results of various models表2 各種模型輿情預(yù)測結(jié)果比較

        綜上所述,以LDA-BiLSTM 模型為基礎(chǔ),完善金融恐慌網(wǎng)絡(luò)輿情體系,能協(xié)助輿情相關(guān)部門恢復(fù)網(wǎng)絡(luò)正常秩序,防止或控制金融恐慌輿情再次發(fā)生,為今后金融恐慌網(wǎng)絡(luò)輿情的應(yīng)對和處理提供了經(jīng)驗(yàn)參考和決策支持。

        5 結(jié)語

        本文以金融恐慌網(wǎng)絡(luò)輿情為研究對象,提出基于LDA-BiLSTM 模型的金融恐慌輿情分析和輿情預(yù)測方法,構(gòu)建了結(jié)合主題挖掘和情感分析的輿情分析與預(yù)警模型。通過分析、預(yù)警金融恐慌網(wǎng)絡(luò)輿情,識別潛在風(fēng)險(xiǎn),實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)決策,預(yù)防虛假信息傳播,提升管理人員聯(lián)合數(shù)據(jù)趨勢研判的能力。

        同時(shí),通過實(shí)驗(yàn)研究大數(shù)據(jù)分析能力、金融市場管理者和政府應(yīng)急管理之間的關(guān)系,分析輿情的內(nèi)在特征和演變規(guī)律,以在新形勢下更好地控制金融恐慌網(wǎng)絡(luò)輿情,為管理者提供信息支持和輿情提醒。未來,將考慮利用集群、云服務(wù)技術(shù)解決輿情大數(shù)據(jù)增加導(dǎo)致的模型分析預(yù)測速度慢、及時(shí)性不強(qiáng)等問題。

        猜你喜歡
        恐慌輿情金融
        繩短不能汲深井——保持“本領(lǐng)恐慌”
        何方平:我與金融相伴25年
        金橋(2018年12期)2019-01-29 02:47:36
        君唯康的金融夢
        輿情
        中國民政(2016年16期)2016-09-19 02:16:48
        輿情
        中國民政(2016年10期)2016-06-05 09:04:16
        輿情
        中國民政(2016年24期)2016-02-11 03:34:38
        P2P金融解讀
        MERS可防可控別恐慌
        金融扶貧實(shí)踐與探索
        微博的輿情控制與言論自由
        国产成人精品a视频| 日韩国产一区| 国产v精品成人免费视频400条 | 国产免费资源高清小视频在线观看 | 日韩精品中文字幕 一区| 日本一级片一区二区三区| 日出白浆视频在线播放| 欧美伦费免费全部午夜最新| 品色堂永远免费| 成人性做爰aaa片免费看| 亚洲AV肉丝网站一区二区无码| 自拍偷拍另类三级三色四色| 男女裸体做爰视频高清| 2019最新中文字幕在线观看| 久久棈精品久久久久久噜噜| 国产九九在线观看播放| 日本一区二区三区四区在线视频| 人妻少妇中文字幕在线| 人人妻人人澡人人爽精品欧美| 狠狠爱无码一区二区三区| 精品在免费线中文字幕久久| 青青草是针对华人绿色超碰| 97cp在线视频免费观看| 欧美放荡的少妇| 人妻丰满熟妇av无码区hd| 超短裙老师在线观看一区| 少妇高潮太爽了在线看| 东北寡妇特级毛片免费| 蜜桃一区二区三区在线看| 女同中文字幕在线观看| 欧美精品色婷婷五月综合| 亚洲av无码一区二区三区四区| 国内视频一区| 国产精品黑丝美腿美臀| 亚洲日韩一区精品射精| 久久精品中文字幕极品| 亚洲一区二区三区四区精品| 妃光莉中文字幕一区二区| 无码精品人妻一区二区三区影院| 国产午夜激情视频自拍| 日韩五码一区二区三区地址 |