王 飛,姜 鑫
(甘肅政法大學網絡空間安全學院,甘肅 蘭州 730070)
區(qū)塊鏈技術的應用越來越普及,社會輿情事件迅速在網絡上傳播、擴展、衍生,甚至引發(fā)網絡輿情危機。
由于單一的網民觀點極性或者觀點強度不能充分描述網民觀點對網絡輿情的影響,因此從網絡輿情出發(fā),對基于區(qū)塊鏈技術的網絡輿情中的觀點樹進行挖掘并展開研究。
1.1.1 層次劃分的主要方法及其優(yōu)缺點
在層次劃分過程中,應用較多的是自頂向下的方法,這種方法也稱局部法,指的是在類別樹中每一層都構建一個或多個分類器,每個分類器在其所在層工作,從根節(jié)點開始,逐層向下進行分類,直到到達葉子節(jié)點[1]。
層次劃分的優(yōu)點在于,它較平坦的分類可以獲得更高的準確率,并且更能夠準確地描述出類與類之間的隸屬關系[2];其比較明顯的缺點在于,一次分類錯誤就會影響后面每一步都出錯,也就是 “一步錯,步步錯”。
1.1.2 面向網絡輿情的觀點樹挖掘方法
網絡輿情具有很強的時變性和環(huán)變性[3],為了進一步挖掘出網絡輿情信息,本文提出一種面向網絡輿情的觀點樹 (opinion tree)挖掘方法,進一步向下進行分類,實現觀點屬性的挖掘,從而基于層次劃分思想構建觀點樹,并提出一種觀點樹的網絡輿情層次信息表示的方法,構建網絡輿情事件的觀點樹。
此樹逐層向下展開,以此將某一網絡輿情事件的觀點極性、觀點強度、觀點屬性構成觀點樹,并最終構建面向網絡輿情的觀點樹挖掘模型。網絡輿情危機關注者能夠針對所關注細節(jié)內容,查看觀點樹中的任何一個節(jié)點[4]。
而網絡輿情挖掘的過程實際也是一個網絡輿情信息觀點傾向分類的過程。在這個分類過程中,文檔概念類別之間存在著層次關系,即觀點極性分類下包含觀點強度分類,觀點強度分類下包含著觀點屬性分類[5]。
1.2.1 觀點樹的構建過程
觀點樹的構建過程主要有3 種[6],以下分別予以介紹。
1)第一種:整體至上而下。首先,在主題確定的情況下,進行第一層粗粒度觀點挖掘 (Opinion Mining,OM),得到關于主題的3 種觀點 (正面、負面和中立)。其次,對正面、負面兩種粗粒度觀點進行中粒度OM,得到支持和反對的觀點強度。最后,對各個等級的觀點強度進行細粒度OM,得到某種強度觀點的觀點屬性。
2)第二種:先確定根節(jié)點,再進行自下而上的觀點樹構建。首先,基于某一輿情主題下進行細粒度OM;其次,在細粒度觀點的基礎上再進行中粒度OM;最后,在中粒度觀點的基礎上進行粗粒度OM,整棵觀點樹構建完畢。
3)第三種:觀點樹的構建過程和前兩種不同。首先,構建觀點樹的根節(jié)點;其次,根據預警指標的需要,構建觀點樹的第二層枝節(jié)點,即進行中粒度觀點挖掘;最后,構建觀點樹的第一層枝節(jié)點和葉子節(jié)點。
1.2.2 觀點樹的構建步驟
事實上,觀點樹的構建是一個層次劃分觀點樹挖掘 (Hierarchical Opinion Tree Mining,HOTM)算法。該算法的輸入為待劃分文檔di和層次劃分結構H=<C,≤>,輸出為文檔所屬類別。
采用該算法,觀點樹的構建步驟如下:首先,預處理,層次特征選擇;其次,根據各層的劃分器對文檔進行劃分;最后,對待劃分文檔從最頂層劃分器把文檔依次分到其他多路徑中,并給出文檔的最終類別。
具體觀點樹的挖掘步驟如下。
1.3.1 粗粒度節(jié)點
粗粒度節(jié)點值的計算公式為
粗粒度節(jié)點的解算,在于將正向態(tài)度、負向態(tài)度、中立態(tài)度等觀點極性挖掘出來,以此了解網民觀點中各種態(tài)度的分布情況。
1.3.2 中粒度節(jié)點
中粒度節(jié)點值的計算公式為
事實上,對于一件網絡輿情事件而言,較極端的高強度網民觀點對整個網絡輿情所起到的推動作用更大,更能夠影響其他網民的觀點。因此,可以對較極端的高強度負向觀點進行放大處理。
1.3.3 細粒度節(jié)點
Ahneg由Nhneg個二元組元素<對象,高強度負情感詞>構成;Amneg由Nmneg個二元組元素<對象,中強度負情感詞>構成;Alneg由Nlneg個二元組元素<對象,低強度負情感詞>構成。
選擇3 個網絡輿情事件 (分別標記為事件1、事件2 和事件3)在人民網強國論壇和微博等一些國內主流網絡平臺中的相關帖子,作為該實驗數據來源。
2.2.1 網絡輿情觀點樹挖掘的觀點分析
表1 為網絡輿情觀點樹挖掘結果,顯示了實驗過程中分別對事件1、事件2 和事件3 進行挖掘之后的粗粒度節(jié)點值和中粒度節(jié)點值。
在3 個事件中,獲得的負向觀點持有率分別為76.8%,65.7%,25.3%。
2.2.2 網絡輿情觀點樹挖掘的結果分析
第89 頁圖1 為事件1 的發(fā)帖總數折線圖。網絡輿情觀點樹給出了事件1 的各種粒度節(jié)點,網絡輿情監(jiān)控者可以根據各個節(jié)點值,對網絡輿情事件的整體狀況掌握透徹,能夠判斷事件1 的影響,并采取相關的管理措施。
如在事件1 中,僅僅對人民網強國論壇上的帖子進行統(tǒng)計,就可以發(fā)現其帖子總數在一段短時間內呈迅速上升的趨勢。
在圖1 中,橫坐標為日期,縱坐標為帖子總數。抽取人民網強國論壇中一個月的帖子進行觀察,通過曲線可以了解到該事件所引發(fā)的帖子總數并不是特別大,也沒有達到經驗值所設定的5 000 個(這一經驗值可以根據實際情況放大或者縮?。?,這需要對網民觀點進行進一步的挖掘。通過對負向觀點持有率、各種強度的負向觀點持有率以及觀點屬性的分析,從而判斷事件1 的影響程度以及進一步走向。
圖1 事件1 的發(fā)帖總數折線圖
因此,這樣一棵觀點樹能夠反映出整個網絡輿情狀態(tài),較好地表示了網絡輿情,并且觀點樹可以實現網絡輿情的量化。
面向網絡輿情的觀點樹挖掘研究,實現了對網絡輿情狀態(tài)的挖掘,為網絡輿情趨勢提供量化基礎,并提供進一步研究的基礎。
在區(qū)塊鏈時代,海量數據為網絡輿情決策提供了充足的數據參考,但是基于區(qū)塊鏈的網絡輿情決策的價值并不在于數據的容量大小,就數據本身而言,它并不能自動成為高效的生產要素。只有經過加工、挖掘、分析的數據,才能充分釋放其價值。
為了規(guī)避基于區(qū)塊鏈的網絡輿情決策的技術風險,需要不斷創(chuàng)新基于區(qū)塊鏈的網絡輿情決策的數據采集、挖掘、分析和使用技術,為網絡輿情決策提供更加可靠的數據。為基于區(qū)塊鏈的網絡輿情決策提供更加成熟、可靠、安全的技術支撐。