中國石油工程建設有限公司 修 宇
中央電視臺 陳 宇
隨著我國互聯(lián)網(wǎng)信息技術的不斷普及和網(wǎng)絡產業(yè)的迅速發(fā)展,人類生活方式、工作方式和學習方式發(fā)生了巨大轉變,計算機網(wǎng)絡在為人類生活提供巨大便利的同時,也給網(wǎng)絡數(shù)據(jù)安全帶來了巨大隱患。在此背景下,本文對網(wǎng)絡安全數(shù)據(jù)可視化的相關研究與探討,也就具備重要理論意義和現(xiàn)實價值。
在計算機信息產業(yè)可視化發(fā)展過程中網(wǎng)絡安全數(shù)據(jù)可視化是全新領域,主要利用人類視覺對模型和特殊結構的感知獲取能力,將抽象的網(wǎng)絡系統(tǒng)和網(wǎng)絡數(shù)據(jù)信息以圖像圖形方式直觀地表現(xiàn)出來,幫助網(wǎng)絡分析人員實時分析網(wǎng)絡狀況,識別異常入侵情況,預測網(wǎng)絡安全事件的可能發(fā)展趨勢。網(wǎng)絡安全數(shù)據(jù)可視化作為計算機的研究方向,目前已取得了較大進展。網(wǎng)絡安全數(shù)據(jù)可視化將網(wǎng)絡安全和可視化技術融為一體,更高效地加強對網(wǎng)絡環(huán)境安全性、可靠性和科學性的識別,彌補了日志數(shù)據(jù)可視化本身遭受的最大限制以及較差的實時性,實現(xiàn)了對日志數(shù)據(jù)信息的準確、科學檢測。
網(wǎng)絡安全數(shù)據(jù)可視化中的科學計算可視化技術最早源于美國科學家,是計算機圖像學中的新研究方向??茖W計算可視化是將大規(guī)模的網(wǎng)絡數(shù)據(jù)信息轉化為直觀淺顯的圖形和圖像,使網(wǎng)絡專家或者普通人員能夠通過感知直觀圖像察覺到大規(guī)模數(shù)據(jù)中難以看到或者難以看懂的現(xiàn)象。同時,科學計算可視化進一步提供了模擬和計算的視覺交互技術,能夠方便普通人自我操作網(wǎng)絡,保護網(wǎng)絡結構安全?,F(xiàn)階段隨著計算機軟硬件性能的不斷提高和計算機圖像學理論的不斷發(fā)展,科學計算可視化逐步應用于網(wǎng)絡安全數(shù)據(jù)可視化中。
信息可視化技術是現(xiàn)階段我國計算機網(wǎng)絡科學研究的重要方向,主要通過計算機技術將復雜的大量信息進行簡單抽象與直觀表達,數(shù)據(jù)信息可視化融合了科學可視化、計算機圖像可視化以及計算機圖像技術等多門學科理論知識。隨著當代社會網(wǎng)絡技術和計算機技術的發(fā)展,信息量不斷擴大,附加信息給人類信息理解和提取帶來巨大困難,信息可視化能夠良好解決該障礙,使人類更方便地查詢和獲取資料。
數(shù)據(jù)挖掘可視化主要是在大體量的數(shù)據(jù)信息中挖掘出高效的存在潛力的全新的數(shù)據(jù)信息,數(shù)據(jù)挖掘技術在于對大規(guī)模數(shù)據(jù)信息提取過程中,通過數(shù)據(jù)管理、數(shù)據(jù)收集、選擇甚至變化以及評估等多種模式,實現(xiàn)對數(shù)據(jù)信息的高效率挖掘和知識庫的重構,實現(xiàn)用戶的相互交流與溝通。數(shù)據(jù)可視化技術能夠通過分析數(shù)據(jù)得到潛在信息,實現(xiàn)對數(shù)據(jù)的分析,快速發(fā)現(xiàn)計算機網(wǎng)絡中的異常規(guī)律和異?,F(xiàn)象。
安全數(shù)據(jù)可視化主要是網(wǎng)絡安全數(shù)據(jù)可視化,將大規(guī)模復雜的數(shù)據(jù)信息轉換為直觀簡單圖像后,計算機管理人員能夠通過分析該類簡單圖像挖掘出大體量數(shù)據(jù)信息中所蘊含的網(wǎng)絡安全信息,從而為網(wǎng)絡安全數(shù)據(jù)可視化提供支撐,保證計算機網(wǎng)絡結構安全。
在計算機網(wǎng)絡安全數(shù)據(jù)可視化研究過程中,網(wǎng)絡安全數(shù)據(jù)的預處理主要包括基于啟發(fā)式評估函數(shù)的網(wǎng)絡數(shù)據(jù)特征提取和原始網(wǎng)絡數(shù)據(jù)的信息熵計算兩大部分內容。就基于啟發(fā)式評估函數(shù)的網(wǎng)絡數(shù)據(jù)特征提取而言,通過關聯(lián)的啟發(fā)式評估函數(shù),對大體量的網(wǎng)絡數(shù)據(jù)信息進行特征選擇,提取出與計算機網(wǎng)絡系統(tǒng)分類緊密相關且連數(shù)據(jù)網(wǎng)絡信息直接具備強烈相關性能的單個特征數(shù),將企業(yè)組成最優(yōu)特征值,從而消除計算機大體量網(wǎng)絡數(shù)據(jù)信息中的冗余特征,實現(xiàn)計算機網(wǎng)絡數(shù)據(jù)信息有效特征的高效率提取。
在網(wǎng)絡安全數(shù)據(jù)可視化的分析方法中,基于時間序列的網(wǎng)絡安全數(shù)據(jù)可視化分析技術主要通過網(wǎng)絡數(shù)據(jù)的時間序列監(jiān)測整個數(shù)據(jù)網(wǎng)絡的相關規(guī)律特征。在進行一定次數(shù)的檢測后,發(fā)現(xiàn)不同區(qū)數(shù)據(jù)在不同時間段內的預期值,從而得到不同數(shù)據(jù)在某一時刻真實發(fā)生時間的具體次數(shù)。根據(jù)時間序列的網(wǎng)絡安全數(shù)據(jù)建立相應的時間數(shù)學模型,設置與數(shù)據(jù)特征吻合的閾值,得到計算機網(wǎng)絡體系中入侵事件大概的發(fā)生時點,體現(xiàn)出入侵事件在某一時段發(fā)生具體行為。通過對多項時間序列的劃分,得到時間的具體分析,最后根據(jù)計算機網(wǎng)絡數(shù)據(jù)特征的預處理結果,對計算機網(wǎng)絡數(shù)據(jù)信息熵進行計算,采取時間序列的數(shù)據(jù)預處理方法后得到的時間參數(shù)和網(wǎng)絡數(shù)據(jù)計算概率分析結果,為計算機網(wǎng)絡入侵判斷打下扎實基礎。
在windows xp環(huán)境下,利用網(wǎng)絡測試基地對計算機網(wǎng)絡安全數(shù)據(jù)可視化技術進行一定分析,收集一定量的網(wǎng)絡數(shù)據(jù),并依次選擇不同網(wǎng)絡數(shù)據(jù)后進行實驗,數(shù)據(jù)規(guī)??蛇M一步設置為10組、50組、100組、150組、200組等。在對計算機網(wǎng)絡安全數(shù)據(jù)檢測閾值以及不同時間序列分析方法功能的影響進行探究時,針對不同時間序列分析方法的基本特征設置相應的檢測閾值,再選擇幾個數(shù)據(jù)得到大小不同的參數(shù)后進行實驗,其實驗結果如表1、表2所示。由表可知,當閾值選擇為2時,檢測效率較高,基本上能夠達到98%左右,但與此同時,計算機網(wǎng)絡數(shù)據(jù)信息可視化檢測的誤報率相對較高,平均高達1.6%。當閾值取值為3.5時,進行計算機網(wǎng)絡安全的檢測數(shù)據(jù)的異常判斷區(qū)域范圍進一步變小,區(qū)域內存在著較多的異常點,且辨識方式不容易通過,實際檢測效率較低,誤報率也就隨之下降到0.5%以下。
表1 不同檢測閾值以及不同時間序列分析方法的檢測率
表2 不同檢測閾值以及不同時間序列分析方法的誤報率
結論:隨著當今社會互聯(lián)網(wǎng)信息技術應用范圍的進一步拓寬,車聯(lián)網(wǎng)、物聯(lián)網(wǎng)等產業(yè)的不斷進步,計算機網(wǎng)絡信息技術在社會發(fā)展中所起到的重要價值進一步凸顯。想要更好地利用計算機網(wǎng)絡為經濟社會發(fā)展做貢獻,就必須確保計算機網(wǎng)絡安全,因此,應加強計算機網(wǎng)絡安全可視化技術研究與分析,通過對信息系統(tǒng)的全方位探討和研究,盡可能采用計算機網(wǎng)絡安全技術保證計算機網(wǎng)絡安全,為我國建立現(xiàn)代化信息化社會作出努力,增強我國計算機網(wǎng)絡數(shù)據(jù)安全性。