陳 良 英
(四川信息職業(yè)技術(shù)學(xué)院 四川 廣元 628017)
在互聯(lián)網(wǎng)和通信技術(shù)的推動(dòng)下,人類(lèi)目前已經(jīng)進(jìn)入了信息時(shí)代,網(wǎng)絡(luò)作為信息傳輸?shù)妮d體和媒介,在社會(huì)經(jīng)濟(jì)生活中發(fā)揮著越來(lái)越關(guān)鍵的主導(dǎo)作用。近年來(lái),中文互聯(lián)網(wǎng)信息資源呈現(xiàn)出了幾何數(shù)字的增長(zhǎng)[1-2],在這些網(wǎng)絡(luò)信息資源中包含著大量的虛擬信息及不良的網(wǎng)絡(luò)信息[3-4],干擾著網(wǎng)絡(luò)用戶正常的信息檢索和信息查詢[5],同時(shí)也給網(wǎng)絡(luò)安全帶來(lái)了一定程度的隱患。網(wǎng)絡(luò)的虛擬化大都指專(zhuān)用的虛擬網(wǎng)絡(luò)[6],即在虛擬的環(huán)境下允許網(wǎng)絡(luò)用戶以用戶名和密碼登錄的方式遠(yuǎn)程訪問(wèn)VPN網(wǎng)絡(luò)[7-8]。網(wǎng)絡(luò)虛擬化的最終目的是要節(jié)省網(wǎng)絡(luò)資源、共享網(wǎng)絡(luò)信息,并逐漸提高互聯(lián)網(wǎng)的聯(lián)通性,但在網(wǎng)絡(luò)虛擬化的過(guò)程中產(chǎn)生了大量的虛擬網(wǎng)絡(luò)信息,這些虛擬化的信息中包含有積極的、進(jìn)步的信息,同時(shí)也包含著大量惡意的、有威脅的不良信息。
對(duì)于惡意的計(jì)算機(jī)網(wǎng)絡(luò)虛擬信息而言應(yīng)及時(shí)地予以濾除,消除網(wǎng)絡(luò)威脅并釋放網(wǎng)絡(luò)硬件被占用資源空間,能夠讓網(wǎng)絡(luò)用戶快速、安全地訪問(wèn)網(wǎng)絡(luò)和查詢信息。當(dāng)前虛擬網(wǎng)絡(luò)信息的大量存在已經(jīng)給中文網(wǎng)絡(luò)資源帶來(lái)了嚴(yán)重的不利影響,而現(xiàn)有針對(duì)于海量虛擬信息而設(shè)計(jì)的網(wǎng)絡(luò)信息過(guò)濾系統(tǒng),都無(wú)法滿足虛擬信息處理的相關(guān)要求。例如,基于BP神經(jīng)網(wǎng)絡(luò)的虛擬信息過(guò)濾系統(tǒng)設(shè)計(jì)[9],在海量虛擬冗余信息處理效率上具有一定優(yōu)勢(shì),但在信息識(shí)別的準(zhǔn)確性方面有待提高,有時(shí)會(huì)濾除一些關(guān)鍵的有用信息;而基于SVM分類(lèi)算法的虛擬信息過(guò)濾系統(tǒng)[10],則無(wú)法有效地應(yīng)對(duì)海量性的計(jì)算機(jī)網(wǎng)絡(luò)虛擬信息,在虛擬信息過(guò)濾綜合能力上較差。為此本文從網(wǎng)絡(luò)虛擬信息處理的智能化和安全性角度出發(fā),提出一種基于動(dòng)態(tài)密鑰對(duì)稱(chēng)算法的網(wǎng)絡(luò)虛擬信息過(guò)濾系統(tǒng)研究,旨在降低互聯(lián)網(wǎng)虛擬信息對(duì)網(wǎng)絡(luò)安全和用戶上網(wǎng)體驗(yàn)造成的不利影響。
根據(jù)計(jì)算機(jī)虛擬網(wǎng)絡(luò)信息過(guò)濾系統(tǒng)總體功能性的要求,設(shè)計(jì)和確立了系統(tǒng)的硬件模塊結(jié)構(gòu)與軟件工作流程。系統(tǒng)總體架構(gòu)的設(shè)計(jì)需要具有一定的總體性和前瞻性,因?yàn)榘ㄌ摂M信息資源在內(nèi)的網(wǎng)絡(luò)信息資源總量在不斷地增長(zhǎng),過(guò)濾系統(tǒng)在信息過(guò)濾能力上要預(yù)留一定的成長(zhǎng)空間。過(guò)濾系統(tǒng)內(nèi)部功能模塊的設(shè)計(jì)方面,要考慮到接口的兼容性和模塊間配合協(xié)調(diào)性,保證過(guò)濾系統(tǒng)內(nèi)部各業(yè)務(wù)功能模塊以及軟件程序銜接得更為緊密。此外,計(jì)算機(jī)虛擬信息過(guò)濾系統(tǒng)在人機(jī)交互界面設(shè)計(jì)、關(guān)鍵數(shù)據(jù)信息存儲(chǔ)、提取的便捷性設(shè)計(jì)等方面,也要滿足終端用戶和網(wǎng)絡(luò)使用者的基本要求。為降低網(wǎng)絡(luò)虛擬信息過(guò)濾系統(tǒng)總體的運(yùn)行成本,方便硬件模塊及子程序的調(diào)用,在過(guò)濾系統(tǒng)總體架構(gòu)設(shè)計(jì)方面采用了自定義組件設(shè)計(jì)的方式,這種結(jié)構(gòu)設(shè)計(jì)模式提高了模塊組件和系統(tǒng)子程序的利用率和共享率。組件設(shè)計(jì)模式在操作的便捷性、易用性方面也有一定的優(yōu)勢(shì),因?yàn)樽远x模式下功能模塊組合與程序的組合在網(wǎng)絡(luò)虛擬信息過(guò)濾中,具有更好的容錯(cuò)能力和糾錯(cuò)能力,可以保證信息分類(lèi)的準(zhǔn)確性及有用關(guān)鍵信息的完整性。基于智能安全技術(shù)的計(jì)算機(jī)虛擬信息過(guò)濾系統(tǒng),從虛擬信息處理的安全性及邏輯程序的智能操作視角出發(fā),設(shè)計(jì)了一種C/S型的運(yùn)行架構(gòu),無(wú)論是在虛擬的網(wǎng)絡(luò)服務(wù)器端,還是在用戶的終端都可以進(jìn)行信息的過(guò)濾處理,以提高信息過(guò)濾的效果。虛擬網(wǎng)絡(luò)服務(wù)器與云端網(wǎng)絡(luò)連接,在云端強(qiáng)大的并行計(jì)算能力下,能夠?yàn)V除絕大多數(shù)的冗余虛擬信息;虛擬網(wǎng)絡(luò)服務(wù)器向下與網(wǎng)絡(luò)虛擬信息監(jiān)測(cè)端連接,可以對(duì)網(wǎng)絡(luò)信息進(jìn)行二次過(guò)濾,以最終保證終端用戶調(diào)取和使用信息的安全性與準(zhǔn)確性。
如圖1所示,從系統(tǒng)總體的邏輯層次分析可以將總體的架構(gòu)分為云端數(shù)據(jù)處理層、中間控制層和用戶層。云端網(wǎng)絡(luò)主要負(fù)責(zé)大量虛擬數(shù)據(jù)的計(jì)算、分類(lèi),中間控制層負(fù)責(zé)存儲(chǔ)數(shù)據(jù)和讀取數(shù)據(jù),并為用戶提供過(guò)濾處理后的關(guān)鍵信息。各個(gè)總體層次架構(gòu)之間依靠無(wú)線通信網(wǎng)絡(luò)連接,獨(dú)立的數(shù)據(jù)傳輸接口,可以為終端用戶提供更為便捷、透明和安全的網(wǎng)絡(luò)服務(wù)。
圖1 計(jì)算機(jī)信息虛擬過(guò)濾系統(tǒng)運(yùn)行的總體架構(gòu)
虛擬信息過(guò)濾系統(tǒng)的重要硬件單元由網(wǎng)絡(luò)處理器芯片、網(wǎng)絡(luò)通道控制器、靜態(tài)隨機(jī)存儲(chǔ)器、尋址存儲(chǔ)器、SPI接口及PCI總線等部分構(gòu)成。虛擬信息過(guò)濾系統(tǒng)關(guān)鍵硬件單元設(shè)計(jì)如圖2所示。
圖2 過(guò)濾系統(tǒng)的關(guān)鍵硬件單元設(shè)計(jì)
網(wǎng)絡(luò)處理器中內(nèi)置了兩片IXP2400芯片,該類(lèi)型芯片具有強(qiáng)大的可編程邏輯運(yùn)算能力和遠(yuǎn)程空間并行計(jì)算能力,且在成本和功耗方面也更有優(yōu)勢(shì)。采用了主從雙芯片的設(shè)計(jì),將控系統(tǒng)通道控制器與靜態(tài)隨機(jī)存儲(chǔ)器的連接分開(kāi),主芯片負(fù)責(zé)邏輯程序的控制和冗余網(wǎng)絡(luò)虛擬信息的濾除,而從芯片則負(fù)責(zé)對(duì)關(guān)鍵信息的靜態(tài)存儲(chǔ),保證網(wǎng)絡(luò)虛擬信息處理中不會(huì)誤刪除關(guān)鍵的網(wǎng)絡(luò)信息。IXP2400芯片設(shè)計(jì)基于Intel X86結(jié)構(gòu),內(nèi)部具有32位的多線程內(nèi)核計(jì)算引擎,每一個(gè)IXP2400芯片可以在1秒內(nèi),同時(shí)分析和處理12 GB大小的虛擬網(wǎng)絡(luò)數(shù)據(jù)。在虛擬信息的分類(lèi)與處理過(guò)程中,系統(tǒng)緩存發(fā)揮著重要的作用,在系統(tǒng)緩存控制方面本文選擇了4個(gè)SRAM型通道控制器,每一個(gè)通道控制器的內(nèi)存為8 GB,具有獨(dú)立訪問(wèn)的功能。同時(shí)通道控制器也可以與IXP2400芯片、PCI總線等并發(fā)操作,為過(guò)濾系統(tǒng)提供了密度更高、帶寬更大的運(yùn)行存儲(chǔ)。SRAM型通道控制器自帶時(shí)鐘功能和復(fù)位功能,每秒的數(shù)據(jù)轉(zhuǎn)換次數(shù)超過(guò)了50萬(wàn)次。
網(wǎng)絡(luò)信息過(guò)濾系統(tǒng)配備了4個(gè)靜態(tài)隨機(jī)存儲(chǔ)器,關(guān)鍵信息存儲(chǔ)中多存儲(chǔ)器并行工作的結(jié)構(gòu)提高了數(shù)據(jù)過(guò)濾與存儲(chǔ)的效率,當(dāng)字節(jié)的寫(xiě)入和讀取時(shí)內(nèi)置于微處理器芯片中的QDR協(xié)調(diào)器,能夠保證各數(shù)據(jù)運(yùn)行通道的暢通性。系統(tǒng)主控芯片與控制器、靜態(tài)隨機(jī)存儲(chǔ)器、尋址存儲(chǔ)器和電源管理模塊之間通過(guò)PCI總線連接,并且通過(guò)SPI接口和無(wú)線傳統(tǒng)模塊與云端網(wǎng)絡(luò)及終端用戶連接保證數(shù)據(jù)傳輸?shù)膶?shí)時(shí)性和完整性。SPI接口在物理層和通信鏈路層都保證了對(duì)虛擬網(wǎng)絡(luò)信息的有效濾除,接口轉(zhuǎn)換器為虛擬網(wǎng)絡(luò)服務(wù)器和檢測(cè)端之間提供了可配置的連接,減少了系統(tǒng)模塊之間邏輯聯(lián)系的復(fù)雜度。虛擬信息過(guò)濾系統(tǒng)的硬件結(jié)構(gòu)需要軟件的支持和串聯(lián),在完成硬件單元設(shè)計(jì)后,本文采用了一種嵌入式操作系統(tǒng),實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)冗余虛擬信息的濾除。
從系統(tǒng)軟件層面上考慮,網(wǎng)絡(luò)虛擬信息過(guò)濾系統(tǒng)的邏輯層次主要包括用戶層、虛擬信息業(yè)務(wù)過(guò)濾層和信息數(shù)據(jù)處理層。本文從智能安全技術(shù)的視角出發(fā)設(shè)計(jì)了總體軟件流程的具體功能,每一個(gè)系統(tǒng)軟件層次所包含的具體功能如圖3所示。
圖3 系統(tǒng)軟件層次的邏輯結(jié)構(gòu)
基于智能安全技術(shù)的網(wǎng)絡(luò)虛擬信息過(guò)濾系統(tǒng)軟件程序,由系統(tǒng)管理員授權(quán)開(kāi)啟和調(diào)試。具體的過(guò)程包括系統(tǒng)的啟動(dòng)、各模塊運(yùn)行參數(shù)的設(shè)定和調(diào)整,動(dòng)態(tài)密鑰對(duì)稱(chēng)冗余信息過(guò)濾算法流程的設(shè)計(jì)和調(diào)整等。完整的信息過(guò)濾系統(tǒng)程序由管理員控制或由管理員指定具體的負(fù)責(zé)人員,系統(tǒng)管理員還負(fù)責(zé)信息過(guò)濾中的程序運(yùn)行監(jiān)控,一旦出現(xiàn)故障或異常情況系統(tǒng)會(huì)自行報(bào)警并停止運(yùn)行。虛擬信息過(guò)濾系統(tǒng)配備了4個(gè)靜態(tài)隨機(jī)存儲(chǔ)器,而對(duì)于實(shí)時(shí)的虛擬數(shù)據(jù)過(guò)濾監(jiān)控結(jié)果而言,先存儲(chǔ)于系統(tǒng)自帶的RAM中,待主程序執(zhí)行完畢后再將過(guò)濾結(jié)果全部導(dǎo)入數(shù)據(jù)庫(kù)中,供其他用戶分享和調(diào)用。由于虛擬信息過(guò)濾系統(tǒng)配備了2個(gè)IXP2400芯片,因此可以同時(shí)執(zhí)行多套軟件子程序,也能夠輕松地應(yīng)對(duì)較為復(fù)雜的網(wǎng)絡(luò)信息過(guò)濾場(chǎng)景?;诨ヂ?lián)網(wǎng)智能安全技術(shù)開(kāi)發(fā)的網(wǎng)絡(luò)虛擬信息過(guò)濾系統(tǒng)通用流程如圖4所示。
圖4 基于智能安全技術(shù)的信息過(guò)濾系統(tǒng)工作流程
在執(zhí)行監(jiān)控程序及對(duì)虛擬網(wǎng)絡(luò)信息的進(jìn)行綜合分析的過(guò)程中,要應(yīng)用智能安全技術(shù)保證過(guò)濾系統(tǒng)的穩(wěn)定性和安全性。本文在執(zhí)行系統(tǒng)過(guò)濾程序時(shí)采用了一種動(dòng)態(tài)密鑰對(duì)稱(chēng)算法,在保證過(guò)濾程序穩(wěn)定運(yùn)行的前提條件下,還對(duì)有用關(guān)鍵用戶信息進(jìn)行加密處理,也能夠保證在過(guò)濾虛擬信息的同時(shí)關(guān)鍵信息的不被破壞和濾除。在過(guò)濾冗余虛擬信息中動(dòng)態(tài)密鑰對(duì)稱(chēng)算法的效率較高,加密密鑰能夠被多個(gè)子程序調(diào)用和共享,能夠更好地利用系統(tǒng)資源,獲取有效的空間序列集合。在基于動(dòng)態(tài)密鑰虛擬信息過(guò)濾算法下,對(duì)用戶有用的關(guān)鍵信息做好了密鑰標(biāo)記,防止在過(guò)濾冗余虛擬時(shí)誤刪除關(guān)鍵的網(wǎng)絡(luò)信息。動(dòng)態(tài)密鑰對(duì)稱(chēng)算法下有效空間數(shù)據(jù)序列的生成不依靠數(shù)據(jù)鏈路通信協(xié)議來(lái)確定,而是過(guò)濾系統(tǒng)主控芯片接收到用戶的請(qǐng)求時(shí),才及時(shí)地更新序列。在虛擬網(wǎng)絡(luò)不穩(wěn)定的條件下,傳統(tǒng)過(guò)濾算法控制下系統(tǒng)的隨機(jī)變化情況較差,而在動(dòng)態(tài)密鑰對(duì)稱(chēng)算法下憑借密鑰來(lái)判讀冗余虛擬信息和關(guān)鍵信息,增強(qiáng)了虛擬信息過(guò)濾系統(tǒng)的安全性和穩(wěn)定性。用An來(lái)描述動(dòng)態(tài)密鑰的安全性,若動(dòng)態(tài)密鑰的位數(shù)為m,當(dāng)滿足An=m時(shí)證明初始狀態(tài)下,過(guò)濾網(wǎng)絡(luò)虛擬信息是安全的;當(dāng)An=0時(shí)表明惡意程序已經(jīng)獲取了密鑰,此時(shí)再運(yùn)行虛擬信息過(guò)濾系統(tǒng)程序,被刪除的虛擬信息中可能包含著大量用戶需求的信息。動(dòng)態(tài)密鑰對(duì)稱(chēng)算法網(wǎng)絡(luò)虛擬信息過(guò)濾安全性的變化情況如圖5所示。
圖5 虛擬信息過(guò)濾安全性的變化示意圖
(1)
式中:T為對(duì)稱(chēng)密鑰的變化周期;ζ為系統(tǒng)可變參數(shù)。ζ的值可以表示為:
(2)
測(cè)試系統(tǒng)平臺(tái)的軟硬件配置會(huì)影響到最終的測(cè)試結(jié)果,基于智能安全技術(shù)的計(jì)算機(jī)虛擬信息過(guò)濾系統(tǒng)的基本測(cè)試環(huán)境和關(guān)鍵數(shù)據(jù)結(jié)構(gòu)分別如表1和表2所示。
表1 系統(tǒng)測(cè)試環(huán)境
表2 lib mod bus開(kāi)源庫(kù)的數(shù)據(jù)結(jié)構(gòu)
在測(cè)試網(wǎng)站上選取了6個(gè)含有計(jì)算機(jī)虛擬信息的網(wǎng)頁(yè),網(wǎng)頁(yè)的大小分別為5 KB、30 KB、100 KB、500 KB、1 MB和5 MB,利用lib mod bus開(kāi)源庫(kù)中的下載工具請(qǐng)求下載網(wǎng)頁(yè)的信息,并查看完成下載的文件數(shù),以此來(lái)驗(yàn)證系統(tǒng)的虛擬信息過(guò)濾性能。為了使測(cè)試的結(jié)果更為直觀,引入了傳統(tǒng)基于BP神經(jīng)網(wǎng)絡(luò)的虛擬信息過(guò)濾系統(tǒng)進(jìn)行對(duì)比,測(cè)試結(jié)果如表3所示。
表3 網(wǎng)絡(luò)虛擬數(shù)據(jù)過(guò)濾成功率對(duì)比
從統(tǒng)計(jì)數(shù)據(jù)的分析結(jié)果可知,隨著請(qǐng)求下載文件規(guī)模的不斷增加,信息過(guò)濾系統(tǒng)的成功率也在不斷提高。但在相同的文件規(guī)模和相同的請(qǐng)求次數(shù)條件下,文中提出的基于智能安全技術(shù)的過(guò)濾系統(tǒng)的過(guò)濾成功率,都要好于傳統(tǒng)基于BP神經(jīng)網(wǎng)絡(luò)過(guò)濾算法的成功率,這表明提出過(guò)濾系統(tǒng)具有更強(qiáng)的計(jì)算機(jī)網(wǎng)絡(luò)虛擬信息處理性能。
虛擬網(wǎng)絡(luò)信息過(guò)濾的最終目的,是讓網(wǎng)絡(luò)用戶排除干擾得到最需要的有用網(wǎng)絡(luò)信息。本文采用多指標(biāo)評(píng)價(jià)的方式來(lái)綜合衡量網(wǎng)絡(luò)虛擬信息的過(guò)濾效果,具體的指標(biāo)包括查全率、查準(zhǔn)率和F值。如果設(shè)測(cè)試網(wǎng)絡(luò)系統(tǒng)中的信息總量為ntotal、檢測(cè)出的相關(guān)有用信息總量為nas,那么查全率指標(biāo)γ1和查準(zhǔn)率指標(biāo)γ2,可以表示為:
(3)
(4)
在網(wǎng)絡(luò)訓(xùn)練文本總數(shù)量為4 000的條件下,分別測(cè)試傳統(tǒng)過(guò)濾系統(tǒng)與文中過(guò)濾系統(tǒng)的查準(zhǔn)率和查全率水平,統(tǒng)計(jì)分析結(jié)果如表4所示。
表4 網(wǎng)絡(luò)信息的查準(zhǔn)率和查全率對(duì)比
文本數(shù)量的增加會(huì)降低對(duì)計(jì)算機(jī)網(wǎng)絡(luò)信息的查準(zhǔn)率和查全率,但文中設(shè)計(jì)過(guò)濾系統(tǒng)的性能更加穩(wěn)定,指標(biāo)下降的趨勢(shì)相對(duì)平穩(wěn),在最高文本數(shù)量為4 000的條件下,查全率和查準(zhǔn)率還能夠保持在90%和85%以上,明顯優(yōu)于傳統(tǒng)SVM信息過(guò)濾系統(tǒng)。過(guò)濾信息的查全率和查準(zhǔn)率指標(biāo)之間存在一定的制約關(guān)系。如果要提高γ2指標(biāo),就需要更加明確用戶的需求,這就不可避免地導(dǎo)致一些關(guān)鍵信息的遺漏;如果要提高查全率指標(biāo)就需要擴(kuò)大對(duì)虛擬信息的檢索范圍。F值也是評(píng)價(jià)過(guò)濾系統(tǒng)性能的主要指標(biāo)之一,在不同的訓(xùn)練文本數(shù)量條件下分析兩種過(guò)濾系統(tǒng)的F值變化情況,如圖6所示。
圖6 兩種虛擬信息過(guò)濾系統(tǒng)下的F檢驗(yàn)值對(duì)比
在全部的4 000個(gè)網(wǎng)絡(luò)文件樣本訓(xùn)練過(guò)程中,基于智能安全技術(shù)的過(guò)濾系統(tǒng)的F值變化平穩(wěn),證明該過(guò)濾系統(tǒng)的性能更加穩(wěn)定,不會(huì)對(duì)用戶的有用信息造成誤刪除;而傳統(tǒng)的基于SVM的過(guò)濾系統(tǒng)控制下,隨著樣本數(shù)量的增加,F(xiàn)檢驗(yàn)值也在增加,表明系統(tǒng)的誤刪除率在不斷提高,在虛擬信息的檢索和濾除過(guò)程中付出過(guò)高的代價(jià)。
海量網(wǎng)絡(luò)虛擬信息的存在會(huì)給用戶正常的信息檢索帶來(lái)干擾,同時(shí)也會(huì)增加信息查詢系統(tǒng)的網(wǎng)絡(luò)負(fù)載和成本。本文從智能安全技術(shù)的視角出發(fā),設(shè)計(jì)了一種虛擬信息過(guò)濾系統(tǒng),能夠在提高虛擬信息過(guò)濾成功率的基礎(chǔ)上,最大限度的保全網(wǎng)絡(luò)用戶有用的網(wǎng)絡(luò)信息。