黃 煒, 余亞婷 , 王思婷
(1 湖北工業(yè)大學管理學院, 湖北 武漢 430068;2 武漢理工大學管理學院, 湖北 武漢 430070)
中國互聯(lián)網(wǎng)絡信息中心(CNNIC)在京發(fā)布的《第31次中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》中指出,截至2012年12月底,中國網(wǎng)民規(guī)模達到5.64億,互聯(lián)網(wǎng)普及率為42.1%,網(wǎng)絡信息將傳播得更加迅速和廣泛[1]。微博、BBS、QQ、MSN等網(wǎng)絡社區(qū)工具為網(wǎng)民的意見發(fā)表提供了平臺,但是網(wǎng)絡流言、謠言也有了滋生的環(huán)境。近年來發(fā)生了許多網(wǎng)絡群體性事件,給社會穩(wěn)定和經(jīng)濟發(fā)展帶來了嚴重的影響,給各級政府提高社會管理水平增加了難度,如何有效地處置網(wǎng)絡群體性事件是亟待解決的問題[2]。網(wǎng)絡群體性事件的爆發(fā)有其內外界因素,表現(xiàn)出一定的主題特征[3]。本文對網(wǎng)絡群體性事件的主題特征進行信息維、主題維、過程維三個維度的分析,構建網(wǎng)絡群體性事件的主題特征知識庫,對網(wǎng)絡群體性事件的發(fā)現(xiàn)、傳播擴散、預警監(jiān)控等起到一定的支持作用。
網(wǎng)絡群體性事件從概念分析來看,存在廣義和狹義之分[4],廣義上說,網(wǎng)絡群體性事件指在互聯(lián)網(wǎng)絡時代,由某個社會問題引起,以特定網(wǎng)民群體為主體,在理性或非理性狀態(tài)下,基于某種正當或不正當?shù)睦嫘枨?,為了達到一定目的,利用網(wǎng)絡交互信息,有組織或無組織的,有序或無序的制造網(wǎng)絡輿論,并隨事態(tài)變化迅速形成網(wǎng)絡輿論潮,甚至在某種情況下轉變?yōu)楝F(xiàn)實中的暴力或非暴力集群行為的現(xiàn)象[5]。狹義上說,網(wǎng)絡群體性事件指在互聯(lián)網(wǎng)絡時代,由某個社會問題引起,主要由網(wǎng)民群體發(fā)起,在理性或非理性狀態(tài)下,基于某種正當或不正當利益需求,為達到一定目的,利用網(wǎng)絡交互信息,有組織或無組織、有序或無序的制造網(wǎng)絡輿論,隨事態(tài)變化迅速形成網(wǎng)絡輿論潮并轉變?yōu)楝F(xiàn)實中的暴力或非暴力集群行為的現(xiàn)象[6]。
網(wǎng)絡群體性事件近年來頻繁發(fā)生,表1列出的是近年來發(fā)生的部分網(wǎng)絡群體性事件,網(wǎng)絡群體性事件涉及了我國物價、社會保障、收入分配、企業(yè)輿情、高校輿情等方面,這些事件已經(jīng)給社會發(fā)展帶來了不容忽視的影響。
表1 近年來部分網(wǎng)絡群體性事件
1.2.1信息維網(wǎng)絡群體性事件的信息具有傳遞性、可共享性、依附性、可處理性、價值相對性、真?zhèn)涡?、時效性等特征。從信息維的時間、內容和形式三個角度分析網(wǎng)絡群體性事件的特征。
從時間角度上看,網(wǎng)絡群體性事件具有及時性特征,一般是在很短的時間內爆發(fā)的,在網(wǎng)絡這個開放的環(huán)境里,信息的傳播比一般大眾媒體傳播得更加迅速和及時。信息一旦被發(fā)布,就通過即時通訊、網(wǎng)絡新聞、社交網(wǎng)站等多種途徑迅速地被大量轉載、評論,進而引發(fā)網(wǎng)絡群體性事件的發(fā)生。相反在短時間沒有產(chǎn)生強烈反響的信息往往會被互聯(lián)網(wǎng)數(shù)以萬計的信息給淹沒。
在其內容上網(wǎng)絡群體性事件可以表現(xiàn)為一個群體抗爭個人、一個群體抗爭另一個群體、網(wǎng)民對某些制度的抗爭等[7]。網(wǎng)絡審判可以說是一個群體抗爭個人的比較典型的表現(xiàn),網(wǎng)絡審判是最常見的一種網(wǎng)絡群體事件,其特點是:超出理性討論的邊界,直接使用非理性的語言為目標定罪,網(wǎng)上“審判”通常都是在試圖通過語言暴力達到網(wǎng)民心中的正義。我國處于社會轉型期,社會結構的不平衡,社會利益分化,貧富差距比較大,一個群體抗爭另一個群體在某些方面表現(xiàn)為相對較弱勢的群體對比較強勢群體的抗爭,這形成了網(wǎng)絡群體性事件信息內容的矛盾抗爭性特征。
在信息形式上,網(wǎng)絡群體性事件的信息從原始的網(wǎng)頁等文檔形式的帖子,到如今社會化網(wǎng)絡社區(qū)上簡單的幾句話或微博實時更新上的幾個字、幾張圖片、幾段視頻等,其表現(xiàn)形式上越來越簡潔和直觀。
1.2.2主體維網(wǎng)絡群體性事件參與的主體在年齡、學歷和職業(yè)等多方面呈現(xiàn)多元化的特點,根據(jù)中國互聯(lián)網(wǎng)絡信息中心(CNNIC)發(fā)布的《第31次中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》顯示,從年齡結構上來看,網(wǎng)民大多集中在10~50歲,其中20~29 歲的網(wǎng)民占全部網(wǎng)民的30.4%;從學歷結構上看,初中及以下學歷網(wǎng)民占46.5%;從職業(yè)結構上看網(wǎng)民中學生群體占比最高,達到 25.1%[1]。可見網(wǎng)絡群體性事件參與的主體仍以青年網(wǎng)民為主,青年人有這個時代賦予的特征,他們追求自由,思想比較開放,但也最容易產(chǎn)生過激行為,缺乏一種成熟的理性思考[8]。這就形成了網(wǎng)絡群體性事件主體心理、行為的潛在不穩(wěn)定與盲從特征。
1.2.3過程維網(wǎng)絡群體性事件的發(fā)展可分為四個過程。
第一階段為源事件的導入,即網(wǎng)絡群體性事件主題的形成。發(fā)起者將現(xiàn)實世界的事件導入到網(wǎng)絡虛擬世界。
第二階段為網(wǎng)絡群體性事件的發(fā)生。由第一階段導入的主題在短時間內能引起人們的高度關注,并在網(wǎng)上開展激烈的討論時,則形成網(wǎng)絡群體性事件。
第三階段為網(wǎng)絡群體性事件的發(fā)展。針對任何一個事件,人們的意見總是有兩面的,以意見不同的兩派“意見領袖”為軸心各自形成一個群體,意見的產(chǎn)生是網(wǎng)絡群體性事件進一步發(fā)展的推手,沒有意見的流動則沒有事件的運動。輿論就是多數(shù)人的聲音,當某種意見占上風的時候,它的擁護者會越來越多,進而成為網(wǎng)絡群體性事件輿論的中心。當這一輿論形成,網(wǎng)絡群體性事件由線下漸漸地向線上轉移,這時傳統(tǒng)媒體也介入其中,使其影響更加擴散開來。
第四階段為網(wǎng)絡群體性事件的衰退。網(wǎng)絡群體性事件有些本身并沒有“好”或“壞”的標簽,但由于參與者的目的、動機、價值觀不同會帶來截然不同的社會效果。當網(wǎng)絡群體性事件發(fā)展到一定階段時必定有一些相關部門出面制止,當這一事件得到解決,網(wǎng)上網(wǎng)下的討論也漸漸平息,網(wǎng)絡群體性事件也走進其衰退期。
分析網(wǎng)絡群體性事件主題特征和內容語義,建立網(wǎng)絡群體性事件主題特征知識庫,為網(wǎng)絡主題相關信息的清洗、過濾,獲取可能發(fā)展成為網(wǎng)絡群體性事件的源信息,起到至關重要的作用。通過對歷年發(fā)生的網(wǎng)絡群體性事件的分析,得到導致事件快速傳播、引起群眾圍觀的核心詞匯,把這些詞匯統(tǒng)計在一起并加以分析、組織,優(yōu)化整理形成網(wǎng)絡群體性事件的特征知識庫。
知識庫(Knowledge Base)是知識工程中結構化、易操作、易利用、全面有組織的知識集群,是針對某一(或某些)領域問題求解的需要,采用某種(或若干)知識表示方式在計算機存儲器中存儲、組織、管理和使用的互相聯(lián)系的知識片集合[8]。網(wǎng)絡群體性事件的主題特征知識庫是基于網(wǎng)絡群體性事件內在的特征來進行組建,每一個事件的主題特征詞匯就是它的知識片。
影響知識庫構建的因素主要包括知識發(fā)現(xiàn)、知識組織、構建知識庫三方面。其中知識發(fā)現(xiàn)是指對客觀存在的元知識進行認識,形成對特定主體具有一定意義的狀態(tài),這是知識庫構建的前提。知識組織是在知識發(fā)現(xiàn)的基礎上對客觀知識的無序化狀態(tài)所實施的一系列有序化組織活動。構建知識庫則是進一步在前兩者的基礎上運用相關性原理、知識體系等方法和模型,形成特定領域內的知識體系,其關系如圖1所示[9]。
圖 1 知識體系
采用人工建設和計算機輔助構建并存的半自動構建的方法,構建過程主要分為三個階段。
第一階段:人工構建。即在網(wǎng)絡信息世界里通過人腦意識加工對已經(jīng)存在知識片進行人工獲取,發(fā)現(xiàn)需要的元知識,為知識庫的構建添磚加瓦。包括定位目標知識庫、抽取關鍵詞匯、關聯(lián)關鍵詞匯、存儲關鍵詞4個環(huán)節(jié)(圖2)[10]。
圖 2 人工構建
第二階段:計算機輔助構建。利用計算機來幫助對知識進行組織和用一些方法規(guī)則來表示知識形成知識庫。
所謂知識表示(Knowledge Representation),就是把知識用計算機可接受的符號并以某種形式描述出來。本文采取語義網(wǎng)絡來表示知識。語義網(wǎng)絡一般由一些最基本的語義單元組成,這些最基本的語義單元被稱為語義基元,可用如下三元組來表示:節(jié)點1,弧,節(jié)點2,網(wǎng)絡的節(jié)點表示事物、對象、狀態(tài)、概念、屬性、情況、動作等,連接弧表示節(jié)點間的語義關系,節(jié)點和弧都必須帶有標識。語義網(wǎng)絡基本語義聯(lián)系包括:類屬關系、包含關系、屬性關系、時間關系、位置關系、相近關系、因果關系、組成關系[11]。如網(wǎng)絡群體性事件“溫州紅十字會女出納挪用126萬公款獲刑6年半”。首先確定對象及其屬性,可以發(fā)現(xiàn)對象有 “溫州紅十字會”、“女出納”、“公款”、“126萬”、“6年半”;其次,確定對象間的關系,“溫州紅十字會”是“女出納”的工作單位,“女出納”發(fā)出“挪用”的動作,“挪用”的對象是“公款”,“公款”的數(shù)目是“126萬元”,“女出納”獲刑“6年半”。將對象作為節(jié)點,對象之間的關系作為弧,連接成語義網(wǎng)絡(圖3)。
圖 3 “溫州紅十字會女出納”的語義網(wǎng)絡
第三階段:存儲知識庫。將網(wǎng)絡群體性事件主題特征知識庫分為多個子庫,有一級關鍵詞庫、二級關鍵詞庫、關聯(lián)網(wǎng)絡流行詞庫、網(wǎng)群事件知識庫。其中二級詞庫按研究領域不同又分為社會網(wǎng)絡輿情詞庫、食品安全詞庫、大學生輿情詞庫。如圖4所示,將組織好的不同類別的知識分別存儲在各個知識庫中,對于那些比較分散且難以用語義網(wǎng)絡組織的知識分散存儲在分布計算機環(huán)境下的不同節(jié)點上。
圖 4 網(wǎng)絡事件知識庫各節(jié)點
初步構建的知識庫是不成熟、不完善的,應用過程存在很多局限,需要對其進行不斷的優(yōu)化處理,并實時維護。知識庫的動態(tài)管理是向知識庫添加新知識、 修改知識庫中的知識以及根據(jù)知識的使用頻度對知識的索引級別進行調整的動態(tài)機制[12]。網(wǎng)絡群體性事件主題特征知識庫的動態(tài)管理可以分為對詞庫的添加和優(yōu)化整理。
1)詞庫的添加。對于網(wǎng)絡爬蟲從網(wǎng)上爬下來的網(wǎng)頁、帖子等,將其添加到網(wǎng)絡事件知識庫中,將網(wǎng)絡群體事件進行人工分析的詞匯添加到相應的詞庫中。
2)詞庫的優(yōu)化整理。將詞庫中的關鍵詞匯進行建立本體、語義分析,對關鍵詞匯進行設置權值;對網(wǎng)帖進行對比分析,檢測權值設置的準確程度;根據(jù)權值大小,使用頻率高低,對帖子在詞庫表中建立索引;對于重新獲得的詞匯,將其與原詞匯表進行比較,過濾掉已經(jīng)有的詞匯,將新添加的詞匯進行本體語義分析,添加到知識庫中;將使用頻率低、權值低的帖子和詞匯進行刪除,以節(jié)約知識庫的空間以及減少人員的工作量。
近年來,食品安全事件對社會穩(wěn)定產(chǎn)生了一定的影響,因此建立食品安全事件子庫顯得十分必要。
建立食品安全知識庫的過程中,第一階段進行人工構建,抽取有關食品安全事件關鍵詞匯,將2005年到2012年之間發(fā)生的食品安全事件進行搜索和整理,到目前為止找出了250個事件,其關鍵詞匯有2000多個(圖5)。
圖 5 2005年到2012年之間的食品安全事件
但整理出來的詞匯比較零散,不能表現(xiàn)其具體特征。本文將各種類型的事件進行分析、歸納。比如奶粉事件一直是人們關注的熱點,將搜索到的近幾年有關奶粉的事件進行歸納,將這類事件導致網(wǎng)絡群體性事件爆發(fā)的關鍵詞匯進行總結提煉。再如食品添加劑使用不當?shù)氖录?jīng)常被報道出來,也將這些事件歸為一類,將其關鍵詞匯進行歸納。
圖 6 食品安全領域本體
圖 7 食品安全領域本體代碼
第二階段進行計算機輔助構建,利用protege、jena等軟件構造本體,對其進行語義分析和表示。圖7為圖6部分本體代碼。大量的領域專業(yè)詞匯匯集到一起本身就代表了這個本體的領域特征,便于主題識別。在構建食品安全領域本體的時候,主要是從以往爆發(fā)的食品安全事件中提取的詞匯,所以對于這些詞應給予重視,相應給予較高權值。對關鍵詞匯賦予相應的邊界權值,為分析網(wǎng)絡群體性事件主題特征的識別提供一定的依據(jù)。
網(wǎng)絡群體性事件主題特征是針對近幾年發(fā)生的比較典型的網(wǎng)絡群體性事件進行分析總結而成的,它對發(fā)現(xiàn)類似事件會起到一定的作用,但是隨著社會結構與主題不斷地發(fā)生變化,網(wǎng)絡群體性事件的爆發(fā)速度會越來越快,產(chǎn)生形式也多元化,特別是微博的興起,對網(wǎng)絡群體性事件的主題信息獲取與知識格式化提出了新挑戰(zhàn),這將是今后研究的方向。
[參考文獻]
[1] 中國互聯(lián)網(wǎng)絡信息中心(CNNIC).《第31次中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》[R]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201301/t20130115_38508.htm[2013-04-15].
[2] 范鐵中. 快速轉型時期我國社會矛盾產(chǎn)生的原因解析[J]. 中國浦東干部學院學報, 2011(6):40-44.
[3] 王偉亮. 群體性突發(fā)公共事件與危機傳播——以貴州甕安 “6· 28” 事件為例[J]. 新聞記者, 2008(8):15-19.
[4] 揭 萍, 熊美保. 網(wǎng)絡群體性事件及其防范[J]. 江西社會科學, 2007(9):238-242.
[5] 楊久華. 關于當前我國網(wǎng)絡群體事件的研究[J]. 北京青年政治學院學報, 2009,18(3):75-80.
[6] 張向陽. 淺析網(wǎng)絡群體性事件概念之界定[J]. 金卡工程: 經(jīng)濟與法, 2010, 14(6):135-135.
[7] 杜駿飛. 網(wǎng)絡群體事件的類型辨析[J]. 國際新聞界, 2009(7):76-80.
[8] 彭 博. 網(wǎng)絡群體性事件的規(guī)律分析和防范策略研究[J]. 山東警察學院學報, 2008,1-.
[9] 耿 崇, 龐躍霞, 蘇建華. 基于引用關系的知識庫建設[J]. 圖書館雜志, 2008,27(8):55-58.
[10] 李耀昌, 劉建準, 姚 偉. 基于知識組織層次模型的知識庫構建[J]. 情報理論與實踐, 2010(8):29.
[11] 鄭金華, 肖松青. 一種實用的知識庫模型[J]. 湘潭大學自然科學學報, 1999, 21(3):104-106.
[12] 唐籍濤, 李 飛, 郭昌松. 網(wǎng)絡輿情監(jiān)控中新詞識別問題的研究[J]. 計算機技術與發(fā)展, 2012(1):31.