◆何堅安
(中國移動通信集團廣東有限公司 廣東 510623)
信息安全防御是當(dāng)前大數(shù)據(jù)時代的一項關(guān)鍵工作,保證政企單位或個人信息系統(tǒng)的安全成為許多學(xué)者的研究熱點,誕生了許多著名的信息安全公司,比如奇虎360、卡巴斯基、瑞星殺毒、江民殺毒、騰訊安全管家,一定程度上提高了信息安全防御水平。但是,當(dāng)前的網(wǎng)絡(luò)病毒和木馬多采用更加先進的脫殼技術(shù)或雙層水印技術(shù),導(dǎo)致常規(guī)的防御系統(tǒng)無法識別病毒,不能夠提高安全防御能力,為用戶帶來了不可估量的損失。
大數(shù)據(jù)是當(dāng)前互聯(lián)網(wǎng)及數(shù)據(jù)庫等計算機技術(shù)發(fā)展到一定階段的產(chǎn)物,由于各行業(yè)開發(fā)的分布式管理系統(tǒng)運行產(chǎn)生了海量的數(shù)據(jù)資源,因此信息系統(tǒng)進入到大數(shù)據(jù)時代。利用大數(shù)據(jù)資源開展各類型的工作就顯得非常重要。大數(shù)據(jù)具有占用空間大、使用數(shù)據(jù)量多等特點,目前已經(jīng)在電子商務(wù)、文檔分類、在線學(xué)習(xí)、智能旅游、列車運行、票務(wù)管理等多領(lǐng)域得到應(yīng)用,比如在電子商務(wù)領(lǐng)域,基于海量交易大數(shù)據(jù)挖掘潛在的客戶購買喜好,從而可以積極地為客戶推薦相同類型或相似類型的商品,還可以挖掘客戶的購買喜好和購買潛力。另外,人們基于大數(shù)據(jù)構(gòu)建了強大的信息系統(tǒng)云存儲平臺,比如百度公司、騰訊公司、華為公司均根據(jù)時代的發(fā)展需求,構(gòu)建了云存儲大數(shù)據(jù)中心,比如百度云、華為云和騰訊云,利用先進的光纖網(wǎng)絡(luò)構(gòu)建了云存儲架構(gòu),進一步滿足了云時代的大數(shù)據(jù)操作需求。云存儲可以部署許多應(yīng)用軟件,然后為用戶推送一個云桌面,用戶登錄云桌面即可實施各類型的操作,完現(xiàn)信息加工和處理功能。云存儲利用了先進的虛擬技術(shù),可以擴展實際物理存儲、CPU、內(nèi)存的大小,按照用戶的需求分配資源,提高系統(tǒng)資源的利用率。云存儲也引入了一些先進的算法,比如深度學(xué)習(xí)和人工智能算法等,利用這些算法可以優(yōu)化云存儲的實際應(yīng)用狀態(tài),比如可以根據(jù)應(yīng)用軟件的優(yōu)先級或操作頻繁度,為應(yīng)用軟件分配更多的資源。這些云存儲大數(shù)據(jù)平臺承載著高清視頻、網(wǎng)絡(luò)游戲、金融證券等行業(yè)數(shù)據(jù),這也是大數(shù)據(jù)時代的一個重要應(yīng)用體現(xiàn)。
隨著用戶數(shù)量的增多,信息系統(tǒng)安裝和部署的設(shè)備越來越多,因此數(shù)據(jù)信息流量非常大。信息系統(tǒng)監(jiān)控采集層需要及時采集用戶信息、設(shè)備信息和網(wǎng)絡(luò)流量信息。信息系統(tǒng)還需要將這些信息進行處理,以便能夠提高安全分析的效率。目前,雖然信息系統(tǒng)管理人員采取了很多的措施,但是由于信息系統(tǒng)攻擊的技術(shù)正不斷發(fā)展,目前信息系統(tǒng)安全依然存在一些問題,比如作業(yè)人員無法實時掌握系統(tǒng)運行狀態(tài),不能夠有效分析網(wǎng)絡(luò)流量狀態(tài),導(dǎo)致信息系統(tǒng)不能安全運行。本文為了提高信息安全防御系統(tǒng)響應(yīng)能力,實現(xiàn)安全防御的智能化、主動化,提出利用人工智能算法和大數(shù)據(jù)建立一個信息安全防御系統(tǒng),這個系統(tǒng)可以采集網(wǎng)絡(luò)數(shù)據(jù),利用人工神經(jīng)網(wǎng)絡(luò)或者其他數(shù)據(jù)挖掘算法,分析網(wǎng)絡(luò)中的數(shù)據(jù)信息,識別和預(yù)測網(wǎng)絡(luò)安全攻擊威脅,從而提高響應(yīng)速度。具體地,基于人工智能和大數(shù)據(jù)的信息安全防御系統(tǒng)包括四個功能層次,分別是網(wǎng)絡(luò)信息采集層、大數(shù)據(jù)分析層、安全防御層和防御效果評價層,如圖1 所示。
圖1 基于大數(shù)據(jù)和人工智能的信息安全防御系統(tǒng)運行流程
信息安全防御系統(tǒng)采用先進的大數(shù)據(jù)分析技術(shù)構(gòu)建一個完善的、動態(tài)的和可持續(xù)改進的深度學(xué)習(xí)模型,能夠準確識別網(wǎng)絡(luò)中的病毒威脅,以便能夠及時預(yù)判網(wǎng)絡(luò)病毒的走勢,及時清除網(wǎng)絡(luò)病毒[4]。該模型采用了卷積神經(jīng)網(wǎng)絡(luò),可以將學(xué)習(xí)過程劃分為六個關(guān)鍵層次,分別是輸入層、卷積層C1、池化層S1、卷積層C2、池化層S2 和全連接層,詳細學(xué)習(xí)結(jié)構(gòu)如圖2 所示。
圖2 大數(shù)據(jù)分析的關(guān)鍵算法運行流程
輸入層的主要作用就是對原始的信息數(shù)據(jù)進行預(yù)處理。
卷積層一般包含兩個操作,分別是特征提取和特征映射,卷積層C1 為特征提取層,C1 與輸入層神經(jīng)元連接在一起,可以獲取數(shù)據(jù)的局部特征,同時確定特征之間的相對位置關(guān)系,從而減少參數(shù)設(shè)置的數(shù)量。卷積層C2 為特征映射層,可以將數(shù)據(jù)的特征映射到一個平面上,實現(xiàn)數(shù)據(jù)特征的壓縮,過濾器對局部的信息數(shù)據(jù)進行計算,提高卷積準確度。卷積層可以采用的核函數(shù)非常多,比如Sigmoid 函數(shù),適用于網(wǎng)絡(luò)安全防御。
池化層的主要作用是用來壓縮信息數(shù)據(jù)和參數(shù)的數(shù)量,減小過擬合。在卷積層提取的木馬或病毒特征基礎(chǔ)上,池化可以計算某一個局部的卷積特征平均值,也可以計算最大值或最小值,減小卷積層特征的維數(shù),這樣就可以持續(xù)降低分類器的計算復(fù)雜度,減輕分類器的負擔(dān),也可以避免分類器過度擬合。
全連接層可以輸出分類結(jié)果,起到了一個分類器的作用,能夠?qū)⒂?xùn)練好的模型輸出出來,這樣就可以提取木馬或病毒的特征。
信息安全防御是一項非常復(fù)雜的、動態(tài)的工作,傳統(tǒng)信息安全防御采用被動模式,無法滿足大數(shù)據(jù)時代的安全防御需求。因此,本文基于大數(shù)據(jù)和深度學(xué)習(xí)提出了一個人工智能安全防御模型,構(gòu)建一個防患于未然的安全防御模型,主動發(fā)現(xiàn)信息系統(tǒng)中的病毒或木馬特征,從而及時地將這些數(shù)據(jù)清除。未來,信息安全防御模型還可以引入效果評估模型,發(fā)現(xiàn)殺毒是否徹底,如果不徹底可以持續(xù)訓(xùn)練深度學(xué)習(xí)模型,從而提高人工智能模型的分析準確度。