劉蔚 歐陽偉
摘 要 群體性突發(fā)事件的發(fā)生對當今社會的影響不容小覷?;ヂ?lián)網(wǎng)與現(xiàn)代通信技術的結合給我們社會和生活所帶來巨大變化,各種獲取信息的渠道日趨豐富,但這也為群體性突發(fā)事件引發(fā)的負面輿論提供了便利的平臺。本文論述如何將現(xiàn)代通信技術在群體性突發(fā)事件中進行適當應用,以達到對群體性突發(fā)事件進行防范、控制、引導的目的。
關鍵詞 群體性突發(fā)事件 現(xiàn)代通信技術 管控
基金項目:本文系2014年度湖南省科技廳科研項目《基于LBS的移動通信技術在偵查實戰(zhàn)中應用于研究》(課題編號:2014FJ6089)階段性成果。
作者簡介:劉蔚,湘潭大學法律碩士,湖南司法警官職業(yè)學院講師,研究方向:技術偵查;歐陽偉,碩士,湖南警察學院信息技術系教師,講師,研究方向:信息安全。
中圖分類號:D920.4 文獻標識碼:A 文章編號:1009-0592(2014)12-182-02
一、群體性突發(fā)事件概述
“群體性突發(fā)事件”的概念是在2005年底由公安部就國內(nèi)出現(xiàn)的一些群眾與政府矛盾的顯現(xiàn)而首次提出。在當前我們所看到極大部分群體性突發(fā)事件是指部分利益群體為了達到自己的不同目的,采取游行、集會、罷工等方式向相關部門機關施加壓力,出現(xiàn)擾亂社會治安、損壞公共財物、危害人們?nèi)罕娚敭a(chǎn)安全、制造網(wǎng)絡不實輿論等不良行為。
如今互聯(lián)網(wǎng)作為最主要的信息傳播的載體,為社會公眾表達心聲、共同參與政治生活探討,提供了一個廣闊的平臺。海量信息的傳播正迅速擴展,讓人目不暇接。在這樣的時代背景下,群體性突發(fā)事件的傳播更出乎人們的想象,它除了具備群體性、組織性、效仿性、破壞性、反復性等普遍性特征外,我們發(fā)現(xiàn)在全球信息化時代下,群體性突發(fā)事件目前顯現(xiàn)出以下的信息化傳播特征。
(一)信息傳播速度快
當今的信息傳播渠道豐富,傳播成本低,傳播程序高效,潛在的傳播主體多且分布面廣泛。
(二)形式與群體特殊
由于互聯(lián)網(wǎng)應用發(fā)展迅速,無地域限制,加之我國網(wǎng)絡監(jiān)察管控機制起步較晚,致使無法全面的監(jiān)管網(wǎng)絡群體,使得網(wǎng)民(包括手機上網(wǎng)用戶)成了一個人數(shù)巨多,具有很大不確定性的群體。某些境內(nèi)外“利益組織”乘機發(fā)揮,肆意宣傳,夸張事實,惡意引導,最終導致群體性事件的發(fā)生。
(三)信息傳播全面且多元
群體性突發(fā)事件所包含的信息量大,新媒介的信源總量多且十分豐富。而手機、電腦等電子通訊設備除了發(fā)布信息,更多的是因為其超強的互動能力而帶動各類信息資訊的轉發(fā)和復制,在各種新媒介的相互交叉中會使信息的傳播量得到大幅度提高。
二、現(xiàn)代通信技術在群體性突發(fā)事件中的監(jiān)測作用
對此我們需要積極應對,利用好現(xiàn)代通信技術與IT技術的結合,以計算機網(wǎng)絡監(jiān)控技術為防范群體性突發(fā)事件的主要手段,做到事前有效預防,實時監(jiān)管可控,盡量減少或制止正在發(fā)生的群體性突發(fā)事件的破壞后果。群體性突發(fā)事件所采用的網(wǎng)絡管控技術是對數(shù)據(jù)的進一步進行處理,其中網(wǎng)絡管控技術主要有兩種:一是對特征值信息檢測、審核和過濾,通過防火墻、入侵檢測等軟硬件系統(tǒng)保護網(wǎng)絡或個人PC,進行動態(tài)監(jiān)控,可阻止不實信息在網(wǎng)絡中惡意傳播,涉及網(wǎng)絡協(xié)議與網(wǎng)絡結構的研究。第二,對敏感信息的碰撞與電子取證,可以及時保護被入侵、破壞的網(wǎng)絡環(huán)境,對可疑網(wǎng)站、服務器存儲的數(shù)據(jù)文件、安全日志進行分析和提取,依照相關法律程序固化、收集電子證據(jù),為以后進一步的取證行動提供技術保障。這不僅涉及數(shù)據(jù)挖掘技術中的關鍵詞搜索和文本信息比對技術的研究,也相關于電子證據(jù)合法固化技術。通過大量樣本研究發(fā)現(xiàn),對于群體性突發(fā)事件的網(wǎng)絡管控,事前做到對其進行敏感信息安全等級分類、信息特征值描述、特征值提取、特征值數(shù)據(jù)庫的建立是最為關鍵的環(huán)節(jié)。這能為群體性突發(fā)事件的發(fā)生起到了良好的管控、預防作用。
對群體性突發(fā)事件網(wǎng)絡監(jiān)控系統(tǒng)建模分析,應該對其模塊功能描述如下:(1)數(shù)據(jù)獲取模塊。其功能是根據(jù)初始URL,利用特征值數(shù)據(jù)庫的存儲下載頁面,可以從定位網(wǎng)頁中提取有效網(wǎng)址。(2)有效特征值提取模塊。主要是利用特定訓練,根據(jù)經(jīng)驗,確定集合中物體描述、形狀、內(nèi)容、顏色等向量值,自動生成相關信息特征數(shù)據(jù)庫。(3)智能分析模塊。根據(jù)上一步驟信息特征數(shù)據(jù)庫的內(nèi)容,智能分析下載的網(wǎng)頁內(nèi)容,具體判斷閥值可由訓練集合和特征數(shù)據(jù)庫手動設定。(4)人機交互界面??蔀橛脩籼峁┦褂昧己玫牟僮鹘缑?,有統(tǒng)一接口,可在不同系統(tǒng)應用實現(xiàn),具體包括能夠顯示數(shù)據(jù)比對、用戶審核、歷史數(shù)據(jù)、設置監(jiān)控信息、特征庫管理、網(wǎng)站管理、輸出監(jiān)測結果、審核日志等功能。
(一)基于文本信息過濾的關鍵技術
對群體性突發(fā)事件進行監(jiān)測的過程中,信息過濾技術是其關鍵。大部分信息過濾系統(tǒng)都是采用網(wǎng)絡偵聽的方法來獲取原始數(shù)據(jù),通過設置路由器的監(jiān)聽端口并利用以太網(wǎng)廣播數(shù)據(jù)包的特性來實現(xiàn)。文本信息過濾技術主要有基于規(guī)則判斷和基于概率統(tǒng)計兩種方法,主要應用在基于文本信息的網(wǎng)絡通信手段中,如QQ聊天、論壇發(fā)帖、電子郵件文本等。
文本信息過濾的實現(xiàn)機制可以分解為三個步驟:一是首先建立需求模型,用來描述對文本信息過濾的具體要求;二是數(shù)據(jù)挖掘進行文本信息匹配,根據(jù)用戶模板與文本匹配程度進行闕值判斷。所以文本信息過濾流程描述如下:首先根據(jù)群體性突發(fā)事件的相關特征值,建立需求模型,然后在被監(jiān)控的文本流中搜索符合條件的信息;三是模塊因具備自我學習、反饋優(yōu)化功能,可以利用用戶的反饋信息優(yōu)化需求模型。
1.漢語分詞。漢語分詞是對中文句子進行合理分割,是中文文本最重要的預處理技術。自動分詞過程是指從用戶需求出發(fā),按照中文語法規(guī)范,對中文語句不確定性匹配,按自然分詞單位進行劃分的信息處理過程。自動分詞是我國漢語特有的特點,西方的英法語、拉丁語等語種,詞與詞之間存在著自然的分割,分析過程中一般不需要特意進行分詞處理。對文本信息進行漢語分詞的實施效果取決于系統(tǒng)采用的分詞方法。目前正在研究和所采用的主流分詞技術主要有三種。
機械分詞法:這是我們目前采用最為廣泛的方法,包括正向最大匹配法、逆向最大匹配法、設立標志法、逐詞匹配法、部件詞典法、詞頻統(tǒng)計法等。最大匹配法是在實際應用中最常見的,其中又有正向、反向之分?!罢颉本椭肝覀儚淖笾劣宜阉?,“最大”就是我們每次都取最大詞長進行匹配(由于中文有單字成詞的特點)。而反向最大匹配法顧名思義就是從右至左搜索。相比較而言,反向最大匹配法的切分精度略高于正向最大匹配法,遇到歧義的現(xiàn)象也較少。
語義分詞法:它引入了語義分析,可以結合文本信息中上下文對自然語言本身包含的語言信息進行分析。包括擴充轉移網(wǎng)絡法、知識分詞語義分析法等。其中擴充轉移網(wǎng)絡法是一種在數(shù)據(jù)庫自然語言查詢中普遍應用的方法,其實現(xiàn)過程是對句子語義進行分析時,由一個遞歸網(wǎng)絡進行信息傳導;寄存器用來保存短語或單詞被監(jiān)測和分析的結果,在寄存器內(nèi)進行特征比對;測試條件是用來判斷是否與檢查弧上的標識匹配,通過測試條件集合完成。要實現(xiàn)該方法需要建立一個語法知識庫,從而進一步提高分詞的精度和深度,但是這也加大了該方法實現(xiàn)的難度。人工智能法:包括神經(jīng)網(wǎng)絡、專家系統(tǒng)等方法。
2.過濾模型。信息過濾系統(tǒng)的效率和準確度,主要依賴文本信息模型的完善程度。布爾模型、向量空間模型、概率推理模型是目前描述文本信息的主要模型。
目前使用較多的是向量空間模型(VSM)。它最大優(yōu)勢是知識表示方面效率較高:文本被抽象描述成多維空間中的不同向量,將文本內(nèi)容的文字處理轉化為向量空間中的數(shù)學矢量運算,極大降低了問題復雜度,有效提高文本處理的效率和速度。
考慮一個向量空間模型構造的信息過濾系統(tǒng),可用字項向量來取代文本。比如一個包含敏感信息的文檔T可用一個n維向量組取代,其中n用來表示文檔T中分詞的總數(shù)。按照語法規(guī)定或用戶設定,可以根據(jù)每個分詞的重要性對其賦值即權重,用來表明它的重要程度。文檔T的向量數(shù)組描述為D={T1,T2...Tn},其中Tn表示第n個分詞的權重。進行文本信息過濾時,首先對發(fā)出請求的文本進行合并處理,轉換為一個由n個分項組成的向量組X,然后比較向量組T和向量組X兩者之間的權重相似度。計算兩組權重的余弦值,值越小,夾角越大,根據(jù)它們夾角度來判斷是否要過濾掉該頁面。把文本以向量的形式映射到數(shù)域空間的做法大大提高了文本信息處理速度,因此向量空間模型被廣泛采用。向量空間模型不足之處是:它忽略了特征項之間的順序,損失了大量的文本結構和本身的語義信息;此外VSM是基于所有分向量兩兩正交假設基礎之上,沒有考慮特征值向量兩兩之間關聯(lián)性,其假設過于簡單,不能很好地反映自然語言(中文)內(nèi)涵的豐富語義特征。如果只是用簡單的數(shù)學運算來代替語義分析,誤差總會存在。
(二)基于圖像信息內(nèi)容的識別分析技術
基于內(nèi)容的圖像識別技術是目前國內(nèi)外研究和應用的主要手段。其原理是把圖像中不同色彩區(qū)域分割出來,然后進行提取分析,從而判斷該色域是否為特征需求區(qū)域,最后根據(jù)識別結果進行攔截和過濾。把圖像信息的識別比對技術應用在群體性突發(fā)事件中,能夠更加有效的掌握監(jiān)控圖像的內(nèi)容,從而對其進行攔截和過濾,保護良好的網(wǎng)絡環(huán)境以及公共安全。
(三)基于視頻信息的識別分析技術
對網(wǎng)絡視頻進行文件結構分析,通過慢放對視頻每幀進行劃分,獲取關鍵幀,同時也可以結合視頻字幕文字和語音信息做多數(shù)據(jù)整合的分析技術,用來進行視頻內(nèi)容的監(jiān)測,實現(xiàn)網(wǎng)絡視頻內(nèi)容的過濾和識別,重點解決網(wǎng)絡中視頻識別系統(tǒng)自適應性、實時響應和可操作性,以便對實時視頻進行有效監(jiān)控,并對可疑的視頻信息進行記錄,按照可疑程度進行分級。
本文對當前群體性突發(fā)事件的特點進行了歸納分析,由現(xiàn)代通信技術入手,對其特征值進行了歸類總結,并針對不同領域給出了研究重點和實施手段,可對群體性突發(fā)事件進行有效的監(jiān)測、預防、引導,盡可能的減少群體性突發(fā)事件的發(fā)生以及降低群體性突發(fā)事件發(fā)生所帶來的損失和危害??梢灶A見的是群體性突發(fā)事件也會隨著信息化發(fā)展而有所變化,這樣導致應對群體性突發(fā)事件的解決方案也是不斷變化發(fā)展的,這需要我們不斷的改進和完善。
參考文獻:
[1]陳麟,林群珠.網(wǎng)絡群體性突發(fā)事件及其防范控制策略.公安學刊(浙江警察學院學報).2011.
[2]李偉.新媒體時代群體性突發(fā)事件輿論引導研究.北京:中共中央黨校.2010.
[3]張強.群體性突發(fā)事件的法律預防和處置.沈陽:沈陽師范大學.2011.
[4]Wilbur Schramm.An introduction to communication.Beijing: renmin university of Ch ina version of the club.2010.
[5]劉楊,陳暉,陳遠江.中文文本信息過濾技術研究.船電技術.2010.
[6]李麗蓉.網(wǎng)絡社會的信息傳播模式及不良信息監(jiān)控技術.山西警官高等??菩W報.2012.