摘 要:移動網(wǎng)絡(luò)的普及,豐富了人們網(wǎng)上沖浪的方式,提高了網(wǎng)絡(luò)使用效率,促進了互聯(lián)網(wǎng)的發(fā)展,也給網(wǎng)絡(luò)信息管理提出更高的要求。移動互聯(lián)網(wǎng)絡(luò)信息安全問題已經(jīng)引起政府部門和社會各界的普遍關(guān)注。文章圍繞移動互聯(lián)網(wǎng)不良信息監(jiān)測技術(shù)有關(guān)問題進行討論,介紹了移動網(wǎng)絡(luò)不良信息過濾方法和主要應(yīng)用技術(shù),討論了信息過濾監(jiān)測系統(tǒng)基本要素。
關(guān)鍵詞:不良信息監(jiān)測系統(tǒng);爬蟲技術(shù);網(wǎng)絡(luò)協(xié)議解析技術(shù);CMNET
引言
隨著信息技術(shù)、網(wǎng)絡(luò)技術(shù)等學(xué)科的不斷發(fā)展,以智能手機、平板電腦等設(shè)備為用戶終端的移動網(wǎng)絡(luò)日益繁榮。與此同時,移動、電信等通訊服務(wù)供應(yīng)商提供了許多種上網(wǎng)業(yè)務(wù),進一步促進了移動互聯(lián)網(wǎng)的發(fā)展。移動互聯(lián)網(wǎng)的出現(xiàn)與成長,在促進了互聯(lián)網(wǎng)整體發(fā)展的同時,其開放性的訪問機制、種類繁多的信息資源和上網(wǎng)用戶移動性高等特點給移動互聯(lián)網(wǎng)的管理,特別是信息管理方面帶來了更大的困難。大量不良信息利用移動互聯(lián)網(wǎng)的管理寬松的條件在網(wǎng)上迅速傳遞,污染了網(wǎng)絡(luò)環(huán)境,給國家安全、經(jīng)濟建設(shè)、社會和諧乃至個人切身利益都造成了嚴重損害。加強移動互聯(lián)網(wǎng)信息監(jiān)測管理,營造純凈的網(wǎng)絡(luò)環(huán)境,是我國有中國特色的社會主義事業(yè)順利推進、經(jīng)濟體制改革深入實施、實現(xiàn)國家富強和社會穩(wěn)定的重要保障措施。
1 移動網(wǎng)絡(luò)不良信息過濾方法
移動互聯(lián)網(wǎng)運行機制和容納的信息種類較多。實際工作中,根據(jù)網(wǎng)絡(luò)運行機制和監(jiān)督的內(nèi)容種類的不同采用不同方法予以過濾、監(jiān)督。常見的移動互聯(lián)網(wǎng)不良信息過濾方法有以下幾種。
1.1 分級法
通過將互聯(lián)網(wǎng)上的信息按照一定標準進行分級、分類,然后根據(jù)各自的級別采用針對性的處置措施的網(wǎng)絡(luò)信息管理方法稱之為分級法。納入分級體系的網(wǎng)頁都會得到一個分級標記,當用戶訪問該網(wǎng)頁時將其與過濾模板進行比較進而選址處置方案。
1.2 依據(jù)URL的站點過濾技術(shù)
和分級法不同的是,站點過濾技術(shù)采用的是以站點為監(jiān)測對象。該方法的前置要件是要有一個不良站點列表。系統(tǒng)通過對比用戶訪問站點的URL和列表中站點進行對比來決定是否過濾。因此,不良站點列表越齊全、越準確,那么該方法的執(zhí)行效率和質(zhì)量也就越高?;赨RL的站點過濾技術(shù)是當前主流互聯(lián)網(wǎng)不良信息監(jiān)測方法,廣泛應(yīng)用于國內(nèi)、外的網(wǎng)絡(luò)信息過濾產(chǎn)品中。使用該方法,重點是對不良站點列表的維護和整理。
1.3 依據(jù)內(nèi)容關(guān)鍵字的過濾技術(shù)
該項技術(shù)是人工智能技術(shù)在網(wǎng)絡(luò)管理方面的一個重要應(yīng)用。由于單純對比關(guān)鍵字而忽視語境、語義的影響,使得關(guān)鍵字過濾技術(shù)的錯誤率較高,嚴重影響用戶上網(wǎng)體驗。因此,通過應(yīng)用人工智能技術(shù)將語義分析引入網(wǎng)絡(luò)信息關(guān)鍵字過濾工作中,以提高分析判斷精度。但該技術(shù)缺陷也較為明顯,主要是實行效果和人工智能技術(shù)水平直接相關(guān)。由于當前人工智能技術(shù)還不夠完善,用戶不能自定義問題判定標準。所以該方法在實際工作中產(chǎn)品較少,主要應(yīng)用于某些特定領(lǐng)域,同時需要消耗大量計算機資源。
1.4 其他信息過濾的方法
除了上述方法外,下面兩種方法也較為常用。
一個是圖像識別技術(shù)。該技術(shù)以圖像的色彩、深淺、形狀和彼此間的位置關(guān)系為對比要素,將用戶訪問的圖像和數(shù)據(jù)庫中的標準圖像進行對比,根據(jù)二者間的相似度決定目標圖像的處理方案。由于圖像描述精確程度較低,在應(yīng)用過程中會造成一定程度的誤判,實際使用效果水平不高,有待繼續(xù)開發(fā)。
二是動態(tài)跟蹤技術(shù)。該技術(shù)通過對用戶訪問網(wǎng)絡(luò)情況的跟蹤記錄,實現(xiàn)對用戶上網(wǎng)行為的全程監(jiān)控,并以此為依據(jù)改進信息監(jiān)控、過濾相關(guān)方案。記錄的內(nèi)容包括訪問的時間、網(wǎng)頁、流量、出錯情況、屏幕快照、過濾原因、網(wǎng)頁所屬類目、關(guān)鍵詞等內(nèi)容。
2 不良信息監(jiān)測系統(tǒng)主要應(yīng)用技術(shù)
2.1 爬蟲技術(shù)
顧名思義,爬蟲技術(shù)就是利用半自動程序?qū)ヂ?lián)網(wǎng)上網(wǎng)頁信息進行采集,由于其情形如同爬蟲在物體上爬行一般,所以將這種程序稱之為爬蟲。爬蟲程序在啟動時,需要一個初始鏈接,如同爬蟲爬行的出發(fā)點,其后爬蟲程序進入自動運行,自動決策其“旅行”路線,這也是爬蟲程序半自動化的主要特征。爬蟲程序會對起始頁面進行掃描,經(jīng)由頁面中包含的鏈接訪問其他頁面,然后再對新頁面的鏈接進行掃描,從而去往下一個頁面。單純從理論而言,只要條件允許,爬蟲程序訪問到互聯(lián)網(wǎng)上所有頁面。這是因為互聯(lián)網(wǎng)上的頁面彼此間或多或少都會有鏈接存在。爬蟲技術(shù)的優(yōu)點是通過爬蟲程序的自動運行,可以通過獲取URL最大限度的對網(wǎng)頁、網(wǎng)站上的各類信息,比如文本、圖片和音頻、視頻等進行下載分析,從而達到主動監(jiān)控網(wǎng)站的目的。但由于該技術(shù)依賴爬蟲程序的正常有效運行,一旦網(wǎng)站環(huán)境采用對爬蟲程序進行限制的技術(shù),比如用戶驗證碼、反爬蟲技術(shù)等,其監(jiān)測效果就會大幅下降。
2.2 網(wǎng)絡(luò)協(xié)議解析技術(shù)
該技術(shù)是建立在網(wǎng)絡(luò)協(xié)議采用層次開發(fā)方式的基礎(chǔ)上的。網(wǎng)絡(luò)協(xié)議在開發(fā)過程中,每一層開發(fā)都有其特定的開發(fā)目的。網(wǎng)絡(luò)協(xié)議技術(shù)就是針對互聯(lián)網(wǎng)網(wǎng)絡(luò)層和應(yīng)用層中涉及的各類協(xié)議進行分析,進而處置的技術(shù)。監(jiān)控系統(tǒng)對數(shù)據(jù)網(wǎng)出口電路的網(wǎng)絡(luò)流量數(shù)據(jù)進行采集,并采用報文重組、協(xié)議規(guī)則分析等技術(shù)手段對信息進行分析,判斷其安全合法性,以此為基礎(chǔ)開展監(jiān)控工作。實施該技術(shù)需要配套使用協(xié)議還原設(shè)備,以達到解析還原、審核網(wǎng)絡(luò)中上下行數(shù)據(jù)內(nèi)容的目的。該技術(shù)應(yīng)用范圍較廣,可以用于網(wǎng)頁、彩信、文件傳輸、郵件等多種業(yè)務(wù)內(nèi)容的信息監(jiān)測。但受監(jiān)控工作運作機理所限,只能采用被動的監(jiān)控模式,同時,監(jiān)控行為對協(xié)議解析設(shè)備依賴性較大,不同設(shè)備間不能通用。
3 移動網(wǎng)絡(luò)不良信息監(jiān)測系統(tǒng)功能簡介
CMNET網(wǎng)絡(luò)是移動互聯(lián)網(wǎng)的主要架構(gòu)形式,當用戶使用移動終端對移動互聯(lián)網(wǎng)進行訪問時,監(jiān)控系統(tǒng)對用戶訪問和傳遞的信息進行采集和監(jiān)測,并按照一定標準進行對比、篩選,從中選出不良內(nèi)容。篩選過程包括系統(tǒng)自動篩選和人工篩選兩個環(huán)節(jié),這種篩選方法既保證篩選速度又保證篩選質(zhì)量。對于最終確定的不良信息,將其所屬網(wǎng)站的URL列入黑名單,在依照黑名單進行封堵處理,阻止用戶對其訪問。不良信息監(jiān)測系統(tǒng)采用中央、大區(qū)、前端采集三級架構(gòu)體系,首先由前端采集點進行信息采集,信息報送至大區(qū)設(shè)備進行分析、判斷,再由將所獲取的不良網(wǎng)站URL及IP地址相關(guān)信息以黑名單形式匯總之中央設(shè)備。中央設(shè)備收到各大區(qū)設(shè)備報送的黑名單后進行匯總和除重作業(yè),形成全網(wǎng)范圍的黑名單,將其提交給流控系統(tǒng),由其進行封堵。需要注意的是,如果有網(wǎng)站需要解封處理,也要由中央設(shè)備提交名單給流控系統(tǒng)進行解封作業(yè)。
4 結(jié)束語
互聯(lián)網(wǎng)產(chǎn)業(yè)是現(xiàn)代社會重要的朝陽產(chǎn)業(yè)。它的健康發(fā)展,不僅關(guān)系到國民經(jīng)濟總體發(fā)展狀況,同時對于人們的思想、行為習(xí)慣乃至社會公共道德等主管層面的表現(xiàn)都有著密切的影響。加強移動互聯(lián)網(wǎng)不良信息監(jiān)控,維護網(wǎng)絡(luò)世界的安定和諧,是推動互聯(lián)網(wǎng)產(chǎn)業(yè)順暢發(fā)展的重要舉措。隨著技術(shù)水平的提高,移動互聯(lián)網(wǎng)不良信息監(jiān)控技術(shù)勢必會更加完善,監(jiān)控系統(tǒng)的運行也會更加成熟。我們有理由相信,移動互聯(lián)網(wǎng)的明天一定會更好。
參考文獻
[1]蔣曉琳,黃紅艷.移動互聯(lián)網(wǎng)安全問題分析[J].電信網(wǎng)技術(shù),2009.
[2]曲德祥,唐新亭,徐連誠,等.網(wǎng)絡(luò)信息過濾系統(tǒng)研究綜述[J].山東師范大學(xué)學(xué)報:自然科學(xué)版,2007.