侯萍 崔孟杰
摘要:企業(yè)網(wǎng)絡(luò)輿情傳播對企業(yè)和社會產(chǎn)生不可忽視的影響,對企業(yè)網(wǎng)絡(luò)輿情監(jiān)測和預(yù)警的研究能夠為管理部門提供理論和實踐指導(dǎo)。從輿情熱度,輿情狀況和輿情趨勢三個方面,綜合現(xiàn)有指標(biāo)體系的優(yōu)缺點,構(gòu)建一個具有三個一級指標(biāo)、十個二級具體指標(biāo)的企業(yè)網(wǎng)絡(luò)輿情危機預(yù)警指標(biāo)體系。將獲取到的指標(biāo)數(shù)據(jù)運用定性與定量相結(jié)合的方法進行無量綱化處理,并利用Matlab進行BP神經(jīng)網(wǎng)絡(luò)模型創(chuàng)建,建立企業(yè)網(wǎng)絡(luò)輿情危機預(yù)警模型。選取2017年以及2018年輿論相對集中的“攜程親子園”事件以及“滴滴空姐遇害”事件進行模型的訓(xùn)練以及模型驗證。實驗結(jié)果表明,基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)網(wǎng)絡(luò)輿情危機預(yù)警模型是有效和可行的。
關(guān)鍵詞:網(wǎng)絡(luò)輿情;指標(biāo)體系;BP神經(jīng)網(wǎng)絡(luò);輿情預(yù)警
中圖分類號:G350;TP393
★基金項目:國家重點研發(fā)計劃課題(2017YFD0401005);江蘇省高校自然科學(xué)研究面上項目(18KJB520038)。
引言
隨著互聯(lián)網(wǎng)科技的迅速發(fā)展,網(wǎng)絡(luò)深入到人們的日常生活中,網(wǎng)絡(luò)輿情逐步轉(zhuǎn)化為社情民意的主體部分,網(wǎng)絡(luò)輿情技術(shù)隨著互聯(lián)網(wǎng)的發(fā)展,涉足面越來越廣,負面網(wǎng)絡(luò)輿情對于企業(yè)造成的影響越發(fā)凸顯,企業(yè)對于自身的輿論也越來越重視,能夠提前預(yù)知大規(guī)模負面輿論的爆發(fā),可以使企業(yè)及時采取有效的措施進行防范,盡可能的降低輿論帶來的負面效應(yīng),及時止損。一個完善的企業(yè)網(wǎng)絡(luò)輿情預(yù)警系統(tǒng)有著十分重要的現(xiàn)實意義。在負面輿論大規(guī)模爆發(fā)的前夕及時告知企業(yè)管理者,采取相應(yīng)的應(yīng)對措施減少負面輿論帶來的不利影響,及時規(guī)避輿論惡化。國內(nèi)外學(xué)者紛紛展開了網(wǎng)絡(luò)輿情指標(biāo)體系和預(yù)警模型構(gòu)建的研究。在網(wǎng)絡(luò)輿情危機預(yù)警方法方面,文獻[1]利用動態(tài)層次文本聚類法挖掘網(wǎng)絡(luò)輿情預(yù)警過程中的熱點話題。文獻[2,3]構(gòu)建了微博輿論場超網(wǎng)絡(luò)模型,提出了微博輿論場場強計算公式判別微博輿論場中輿情的演化。設(shè)計了基于微博輿論場的輿情演化規(guī)則。文獻[4]首先根據(jù)Lyapunov指數(shù)證明網(wǎng)絡(luò)輿情具備混沌的特征,然后對網(wǎng)絡(luò)輿情時間序列數(shù)據(jù)進行相空間重構(gòu),最后進行網(wǎng)絡(luò)輿情預(yù)測。文獻[5]提出一種基于模糊推理理論的網(wǎng)絡(luò)輿情觀點聚合的CA(Cellular Automaton)模型,在元胞自動機模型Moore鄰域結(jié)構(gòu)下演化并分析個體屬性以及鄰域環(huán)境對網(wǎng)絡(luò)輿情觀點聚合現(xiàn)象的影響。文獻[6]針對熱點傳播的問題提出改進的SIRS傳播模型,該模型結(jié)合博弈論對SIRS模型中的傳染體和免疫體進行演化博弈建模,對SIRS模型進行改進,得到熱點話題傳播的平衡點和規(guī)律。文獻[7]也構(gòu)建了謠言事件傳播模型,研究熱點事件傳播規(guī)律。文獻[8]為了解決網(wǎng)絡(luò)輿情預(yù)警評價問題中樣本數(shù)據(jù)的非線性和髙維性等實際難題,提出以投影尋蹤理論為基礎(chǔ),利用文化基因算法確定最佳投影方向,建立了基于文化基因算法的網(wǎng)絡(luò)輿情評價的投影尋蹤模型。文獻[9]將模糊神經(jīng)網(wǎng)絡(luò)模型用于公司產(chǎn)品市場銷售狀態(tài)的預(yù)警問題,為銷售人員處理市場危機問題提供參考意見。
綜上所述,國內(nèi)外學(xué)者針對輿情監(jiān)測預(yù)警模型主要集中在模型構(gòu)建及態(tài)勢評估等方面,從應(yīng)用角度對企業(yè)網(wǎng)絡(luò)輿情構(gòu)建模型并量化算法的實例研究的成果較少。本文構(gòu)造企業(yè)網(wǎng)絡(luò)輿情危機預(yù)警指標(biāo)體系并運用BP神經(jīng)網(wǎng)絡(luò)模型建立企業(yè)網(wǎng)絡(luò)輿情預(yù)警模型。選取2017年以及2018年輿論相對集中的“攜程親子園”事件以及“滴滴空姐遇害”事件進行模型的訓(xùn)練以及模型驗證。
1、企業(yè)輿情危機預(yù)警指標(biāo)體系
1.1 企業(yè)輿情危機預(yù)警指標(biāo)體系構(gòu)建
依據(jù)2006年國務(wù)院發(fā)布的《國家突發(fā)公共事件總體應(yīng)急預(yù)案》,將預(yù)警等級按照各類突發(fā)公共事件的嚴重程度、可控性和影響范圍等因素分為Ⅰ級(特別重大)、Ⅱ級(重大)、Ⅲ級(較大)和一般[10]。本文將輿情危機預(yù)警劃分為五個級別,分別是安全、一般、警告、嚴重,用1000、0100、0010、0001來表示。建立一個科學(xué)、嚴謹、高效、可行的完善的企業(yè)網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系最關(guān)鍵的在于指標(biāo)體系中各項指標(biāo)的選取,合理正確的指標(biāo)有助于提升指標(biāo)體系的合理性。我國的輿情預(yù)警研究的學(xué)者已經(jīng)在該方面取得了顯著的成果,文獻[11]從傳播媒體、傳播范圍、傳播速度、情緒傾向程度及相關(guān)度等方面對輿情潛在影響力進行探索,構(gòu)建了網(wǎng)絡(luò)輿情潛在影響力指標(biāo)體系并設(shè)計潛在影響力計算模型,對探討網(wǎng)絡(luò)輿論的潛在影響有一定的現(xiàn)實意義。文獻[12]基于網(wǎng)絡(luò)輿情中的輿情等級分類,劃分移動社交網(wǎng)絡(luò)中的輿情等級,同時結(jié)合生命周期理論,分析移動社交網(wǎng)絡(luò)輿情生命周期。并通過實證研究驗證指標(biāo)體系是否合理。本文依據(jù)前人的研究,網(wǎng)絡(luò)輿情預(yù)警指標(biāo)的選取本著定量為主,定性為輔、科學(xué)性、可操作性等原則,最終構(gòu)建3個一級指標(biāo),10個二級指標(biāo)的網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系。在選取指標(biāo)的同時,盡可能的以最少指標(biāo)達最優(yōu)預(yù)警目標(biāo)的準(zhǔn)則來選取,同時為了使模型容易構(gòu)建,進行量化處理,盡可能的選擇定量指標(biāo)。
1.2 企業(yè)輿情危機預(yù)警指標(biāo)說明
輿情熱度是研究輿情的重要指標(biāo),通過搜索量、轉(zhuǎn)發(fā)數(shù)、評論數(shù)、點贊數(shù)來衡量輿情熱度,末端數(shù)據(jù)的獲取主要來自于百度指數(shù)以及新浪微博。搜索量是指在一定的時間條件下,通過百度指數(shù)高級檢索,檢索指定企業(yè)名稱為關(guān)鍵字的網(wǎng)絡(luò)曝光率以及網(wǎng)民關(guān)注度。搜索量的多少反映了網(wǎng)民對于該話題的關(guān)注程度,通過搜索量的排序可以明確當(dāng)前的熱點話題。評論數(shù)是指在新浪微博中,網(wǎng)民對于某一輿情熱點話題的評論,通過評論的內(nèi)容以及評論數(shù)量的多少可以反映出該輿情事件在網(wǎng)民心中的關(guān)注程度。轉(zhuǎn)發(fā)數(shù)轉(zhuǎn)發(fā)數(shù)是指在新浪微博中,某條關(guān)于某熱點事件的評論被轉(zhuǎn)發(fā)的次數(shù),如果網(wǎng)民轉(zhuǎn)發(fā)該微博, 即表示他對于這一評論表示認同。轉(zhuǎn)發(fā)數(shù)反映了該條微博在網(wǎng)民中的認可度。點贊數(shù)是指在新浪微博中,某網(wǎng)絡(luò)輿情事件獲得的點贊數(shù)量,該數(shù)值越大,則表明網(wǎng)絡(luò)輿情發(fā)生的概率越大。
輿情狀況主要通過網(wǎng)絡(luò)輿情的真實性、輿情話題的敏感性、網(wǎng)民觀點的傾向度來表示。網(wǎng)絡(luò)輿情的真實性,話題的敏感程度以及觀點的傾向度較為全面地展示了輿情的狀況。真實性主要是因為網(wǎng)絡(luò)空間的虛擬性與真實性相互融合,再加上互聯(lián)網(wǎng)的虛擬性,許多言論難以辨分,輿情的真實性是反映輿情狀況的最關(guān)鍵的指標(biāo)。真實性采取定量分析的方法來確定,參考新浪微博的認證用戶關(guān)于某網(wǎng)絡(luò)輿情事件的微博數(shù)占全部的百分比來確定,認證用戶是實名認證的,需要對自己發(fā)言的真實性負責(zé),認證用戶的言論的真實性較高。輿情的敏感性是用來衡量輿情未來發(fā)展的主要指標(biāo)。敏感性越高,則該網(wǎng)絡(luò)輿情熱點話題的關(guān)注度越高,敏感性指標(biāo)通過定性分析獲取。傾向度是指網(wǎng)民對于某網(wǎng)絡(luò)輿情熱點話題所持的贊同、中立或是反對的態(tài)度。按照人們對于某事件的看法,傾向度可以分為贊同,中立,反對。該指標(biāo)通過新浪微博中負面微博的占比來表示。
輿情趨勢指的是輿情在接下來的一段時間內(nèi)的發(fā)展趨勢,主要是通過觀察網(wǎng)絡(luò)輿情的熱度變化得出,而網(wǎng)絡(luò)輿情熱度變化主要通過搜索量變化、轉(zhuǎn)發(fā)數(shù)變化、評論數(shù)變化得以體現(xiàn),最終得出網(wǎng)絡(luò)輿情的趨勢變化。搜索量變化通過百度指數(shù)中在一段時間內(nèi)對于某網(wǎng)絡(luò)輿情事件相應(yīng)關(guān)鍵詞檢索的數(shù)量變化來衡量。轉(zhuǎn)發(fā)數(shù)變化通過新浪微博中關(guān)于某網(wǎng)絡(luò)輿情事件的微博的轉(zhuǎn)發(fā)數(shù)量的變化來計算。評論數(shù)變化指的是新浪微博中關(guān)于某網(wǎng)絡(luò)輿情事件的微博的評論數(shù)數(shù)量的變化。
2、企業(yè)網(wǎng)絡(luò)輿情預(yù)警模型構(gòu)建
2.1 BP神經(jīng)網(wǎng)絡(luò)的設(shè)置
本文采用BP神經(jīng)網(wǎng)絡(luò)進行企業(yè)網(wǎng)絡(luò)輿情預(yù)警模型的構(gòu)建,由于BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中包含隱含層,通常情況下,隱含層越多,網(wǎng)絡(luò)的復(fù)雜性越高,計算難度越高。本文采用只包含一個隱含層的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
2.1.1 輸入層、輸出層、隱含層節(jié)點確定
依據(jù)構(gòu)建的企業(yè)網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系,在該體系中選取了10個指標(biāo)作為企業(yè)網(wǎng)絡(luò)輿情預(yù)警模型的預(yù)警指標(biāo),則輸入節(jié)點數(shù)為10,確定了預(yù)警等級為安全(1000)、一般(0100)、警告(0010)、嚴重(0001)四個等級,則輸出節(jié)點為4。
隱含節(jié)點的確定采用公式(1)進行隱含節(jié)點的計算。
其中m為輸入層節(jié)點數(shù),n為輸出層節(jié)點數(shù),a為1-10之間的常數(shù)。
2.1.2 輸入數(shù)據(jù)的歸一化處理
由于指標(biāo)選取的時候?qū)ο鄳?yīng)的各項預(yù)警指標(biāo)進行了一定的量化處理,在進行模型構(gòu)建時,為了便于計算,減小誤差,再一次的進行歸一化處理,即通過公式將所有收集到的原始數(shù)據(jù)進行整理,同意轉(zhuǎn)化為(0,1)區(qū)間內(nèi)的無量綱指標(biāo)值。
指標(biāo)有正負方向之分,所以在進行數(shù)據(jù)歸一化的無量綱指標(biāo)處理時,也有著不同的方法。正向指標(biāo)指標(biāo)值越大越安全,所以以最小值為基準(zhǔn)進行歸一化處理,即在進行無量綱化處理時采用公式(2)進行處理;而負項指標(biāo)與正向指標(biāo)恰好相反,指標(biāo)值越小越安全,在無量綱化處理時以最小值為基準(zhǔn),進行歸一化處理即采用公式(3)。
2.1.3 訓(xùn)練參數(shù)的設(shè)置
在對數(shù)據(jù)進行歸一化處理之后,設(shè)置訓(xùn)練參數(shù),訓(xùn)練參數(shù)的設(shè)置不同也會對網(wǎng)絡(luò)性能有一定的影響。
設(shè)置隱含層、輸出層傳遞函數(shù)為logsig(對數(shù)S型傳遞函數(shù)),具有非線性的特點,設(shè)置訓(xùn)練函數(shù)為traingdx(學(xué)習(xí)率可變的BP算法),學(xué)習(xí)函數(shù)為learngdm(梯度下降動量學(xué)習(xí)函數(shù)),在相對應(yīng)的訓(xùn)練參數(shù)設(shè)置中,設(shè)置顯示間隔show = 25,設(shè)置網(wǎng)絡(luò)學(xué)習(xí)效率lr = 0.05,設(shè)置動量參數(shù)mc = 0.9,設(shè)置最大訓(xùn)練次數(shù)epochs =1000,設(shè)置目標(biāo)誤差goal =1e-5,而其余的相關(guān)參數(shù)保持默認值不變。
2.2 預(yù)警模型建立
依據(jù)公式(1)進行隱含節(jié)點的確認,可計算出神經(jīng)元的個數(shù)為4-13之間,通過測試發(fā)現(xiàn)當(dāng)a=10時,神經(jīng)網(wǎng)絡(luò)的性能達到最佳,即確定隱含層節(jié)點數(shù)為10。選取2017年11月“攜程親子園虐童”事件作為本文的研究對象,以10個具體指標(biāo)建立企業(yè)網(wǎng)絡(luò)輿情危機預(yù)警指標(biāo)體系。首先分析企業(yè)網(wǎng)絡(luò)輿情指標(biāo)體系中的各項指標(biāo)的性質(zhì),得到分析結(jié)果如表1所示。按照攜程親子園事件的進展設(shè)定了8個時間點,方便數(shù)據(jù)采集以及觀測,如表2所示。
利用烽火輿情軟件進行相應(yīng)的關(guān)鍵詞檢索,得出“攜程親子園”事件的輿情走勢,分析相應(yīng)的負面輿情占比,通過當(dāng)日的負面輿情占全部輿情數(shù)的占比得出觀點傾向度,輿情走勢如圖2所示。利用百度指數(shù)工具高級檢索對“攜程親子園”限定關(guān)鍵詞進行檢索,得出搜索量以及搜索量變化指標(biāo)原始數(shù)據(jù)如圖3所示。
在每個時間節(jié)點以“天”為單位做平均值處理,使數(shù)據(jù)具備可比性。評論數(shù)、點贊數(shù)、真實性、敏感度、傾向度、轉(zhuǎn)發(fā)數(shù)、評論數(shù)變化、轉(zhuǎn)發(fā)數(shù)變化等指標(biāo)數(shù)據(jù)通過新浪微博獲取,在8個時間點獲取的原始數(shù)據(jù),為了使數(shù)據(jù)之間的關(guān)聯(lián)性更高,各個指標(biāo)之間的數(shù)據(jù)的可比性更強,在依據(jù)指標(biāo)的性質(zhì)的基礎(chǔ)上進行數(shù)據(jù)的歸一化處理,歸一化后的數(shù)據(jù)如表3所示。
利用Matlab 2017a軟件進行模型的建立,以時間1-時間7的指標(biāo)數(shù)據(jù)作為模型的訓(xùn)練樣本,選取時間8的指標(biāo)數(shù)據(jù)作為檢驗樣本來進行模型檢驗工作的實施。期望輸出如表4、表5所示。
通過調(diào)用Matlab 2017a軟件中的神經(jīng)網(wǎng)絡(luò)工具箱,參照上述的傳遞以及訓(xùn)練參數(shù)設(shè)置,進行BP神經(jīng)網(wǎng)絡(luò)的創(chuàng)建,對訓(xùn)練樣本進行167次訓(xùn)練后,誤差值為9.945e-6,達到訓(xùn)練目的,如圖4所示。
3、模型可靠性驗證
通過案例“滴滴空姐遇害事件” 進行模型可靠性驗證,數(shù)據(jù)如表6所示:
利用烽火輿情軟件進行相應(yīng)的關(guān)鍵詞檢索,得出“滴滴出空姐遇害”事件的輿情走勢,分析相應(yīng)的負面輿情占比,通過當(dāng)日的負面輿情占全部輿情數(shù)的占比得出觀點傾向度。利用百度指數(shù)工具高級檢索對“滴滴”限定關(guān)鍵詞進行檢索,得出搜索量以及搜索量變化指標(biāo)原始數(shù)據(jù)。在每個時間節(jié)點以“天”為單位做平均值處理,使數(shù)據(jù)具備可比性。評論數(shù)、點贊數(shù)、真實性、敏感度、傾向度、轉(zhuǎn)發(fā)數(shù)、評論數(shù)變化、轉(zhuǎn)發(fā)數(shù)變化等指標(biāo)數(shù)據(jù)通過新浪微博獲取,對9個時間點獲取的原始數(shù)據(jù)進行歸一化處理,歸一化后的數(shù)據(jù)如表7所示。
通過以上建立的模型將原始數(shù)據(jù)進行代入檢驗,與期望輸出結(jié)果表8進行比較。
與期望輸出結(jié)果進行比較后,發(fā)現(xiàn)時間6的輸出出現(xiàn)差錯,其余結(jié)果一致,準(zhǔn)確率達到87.5%。
4、結(jié)束語
根據(jù)上述構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)模型,通過對于時間1-時間7的獲取的企業(yè)網(wǎng)絡(luò)輿情預(yù)警指標(biāo)中的10個二級具體指標(biāo)數(shù)據(jù)進行訓(xùn)練測試,將時間8作為模型的檢驗樣本,在對訓(xùn)練樣本進行192次訓(xùn)練后,在未達到最小梯度以及最大的擬合次數(shù)的目標(biāo)要求內(nèi),達到最小誤差,使得模型達到最優(yōu)。通過調(diào)用神經(jīng)網(wǎng)絡(luò)工具箱中創(chuàng)建BP神經(jīng)網(wǎng)絡(luò)后的Simulate工具,進行檢驗數(shù)據(jù)的測試,將時間8的指標(biāo)數(shù)據(jù)進行歸一化處理后,導(dǎo)入為P_test,利用訓(xùn)練達標(biāo)的模型進行數(shù)據(jù)預(yù)測,輸出相應(yīng)的Y數(shù)據(jù),進行輸出規(guī)則轉(zhuǎn)化后與預(yù)計預(yù)警結(jié)果進行比較,發(fā)現(xiàn)結(jié)果一致。在建立模型后,再次通過“滴滴空姐遇害”事件的數(shù)據(jù)進行模型可靠性的驗證,通過將實際輸出與期望輸出的結(jié)果進行比較,發(fā)現(xiàn)模型預(yù)測的準(zhǔn)確率為87.5%。通過實踐證明,本文設(shè)計的企業(yè)網(wǎng)絡(luò)危機輿情預(yù)警指標(biāo)體系是合理的,同時也證明了基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)網(wǎng)絡(luò)輿情預(yù)警模型是有效的。
參考文獻
[1] Gil-Garcia R,Pons-Porrata A.Dynamic Hierarchi-cal Algorithms for Documentclustering[J].Pattern,RecogNition Letters,2010(31):469-477.
[2] 黃遠,沈乾,劉怡君.微博輿論場:突發(fā)事件輿情演化分析的新視角[J].系統(tǒng)工程理論與實踐,2015,35(10):2564-2572.
[3] Ma N, Liu Y J. Superedge rank algorithm and its application in identifying opinion leader of online public opinion supernetwork[J]. Expert Systems with Applications, 2014,41(4):1357-1368.
[4] 魏德志,陳福集,鄭小雪.基于混沌理論和改進徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情預(yù)測方法[J].物理學(xué)報,2015,64(11):52-59.
[5] 毛乾任,王朝斌,金洪穎,李艷梅.模糊推理的網(wǎng)絡(luò)輿情觀點聚合CA模型研究[J].小型微型計算機系統(tǒng),2017,38(07):1479-1484.
[6] 魏德志,陳福集,林麗娜.基于博弈論和SIRS的熱點事件傳播仿真研究[J].系統(tǒng)仿真學(xué)報,2018,30(06):2050-2057.
[7] 李喆.基于投影尋蹤模型的網(wǎng)絡(luò)輿情評價[J].計算機仿真,2017, 34(04):391-395.
[8] Carolin Kaiser,Sabine Schlick,F(xiàn)reimut Bodendorf. Warning System for Online Market Research-identifying Critical Situations in Online Opinion Formation[J]. Knowledge-based Systems,2011,24:824-836.
[9] Zhao L J, Xie W L, Gao H O, et al. A rumor spreading model with variable forgetting rate[J]. Physica A: Statistical Mechanics & Its Applications(S0378-4371), 2013, 392(23): 6146-6154.
[10] 游丹丹.我國網(wǎng)絡(luò)輿情預(yù)測研究綜述[J].情報科學(xué),2016,34(12):156-160.
[11] 賀恩鋒,莊林遠,徐文根.網(wǎng)絡(luò)輿情潛在影響力指標(biāo)體系構(gòu)建及應(yīng)用[J].情報雜志,2014,33(1):114-119.
[12] 聶峰英,張旸.移動社交網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系構(gòu)建[J].情報理論與實踐,2015,38(12):64-67.
作者簡介:
侯萍,南京郵電大學(xué)管理學(xué)院,博士,副教授,研究方向: 網(wǎng)絡(luò)輿情,電子商務(wù);
崔孟杰,南京郵電大學(xué)管理學(xué)院。