姚琨 王昕
摘? 要: 傳統(tǒng)的網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)對(duì)于冗余數(shù)據(jù)處理能力不足,導(dǎo)致實(shí)驗(yàn)數(shù)據(jù)獨(dú)立性較差。為此,設(shè)計(jì)基于文本過(guò)濾的網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)。在硬件設(shè)計(jì)上,使用單片機(jī)作為中央控制器,設(shè)計(jì)外部電源適配器以供驅(qū)動(dòng)模塊正常工作,引用PCI總線(xiàn)接口芯片設(shè)計(jì)網(wǎng)絡(luò)數(shù)據(jù)采集卡。在軟件設(shè)計(jì)上,通過(guò)程序代碼與網(wǎng)絡(luò)數(shù)據(jù)采集卡的結(jié)合實(shí)現(xiàn)數(shù)據(jù)采集,利用文本過(guò)濾技術(shù)標(biāo)記原始數(shù)據(jù)中的異常數(shù)據(jù)并將其過(guò)濾。結(jié)合硬件設(shè)計(jì)和軟件設(shè)計(jì)完成整個(gè)系統(tǒng)設(shè)計(jì)。測(cè)試結(jié)果表明,對(duì)于相同大小的冗余數(shù)據(jù),與傳統(tǒng)的檢測(cè)實(shí)驗(yàn)系統(tǒng)相比,設(shè)計(jì)的基于文本過(guò)濾技術(shù)的網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)數(shù)據(jù)處理能力更強(qiáng),數(shù)據(jù)獨(dú)立性更好。
關(guān)鍵詞: 網(wǎng)絡(luò)安全; 數(shù)據(jù)檢測(cè)實(shí)驗(yàn); 系統(tǒng)設(shè)計(jì); 數(shù)據(jù)采集; 文本過(guò)濾; 系統(tǒng)測(cè)試
Abstract: As the traditional network security data detection experiment system has insufficient processing capacity for redundant data, which causes the poor independence of experimental data, a network security data detection experiment system based on text filtering is designed. In terms of hardware design, MCU is used as the central controller to design the external power adapter for the normal operation of the driver module, and the PCI bus interface chip is introduced to design the network data acquisition card. In terms of software design, the program code and network data acquisition card are combined to realize the data collection, and the text filtering technology is used to mark the abnormal data in the original data and then filtering it. The overall system design is completed in combination of the hardware design and the software design. The testing results show that, for redundant data of the same size, the designed network security data detection experiment system based on text filtering technology has stronger data processing ability and better data independence in comparison with the traditional detection experiment system.
Keywords: network security; data detection experiment; system design; data collection; text filtering; system testing
0? 引? 言
網(wǎng)絡(luò)是當(dāng)今社會(huì)不可或缺的組成元素,已經(jīng)滲入到人們的日常生活中,而網(wǎng)絡(luò)安全事件頻繁發(fā)生,也給人們的日常生活帶來(lái)了困擾[1]。網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)是保證網(wǎng)絡(luò)安全的一個(gè)重要手段,現(xiàn)今網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)技術(shù)層出不窮,需要利用網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)驗(yàn)證網(wǎng)絡(luò)安全檢測(cè)技術(shù)的有效性和可靠性[2]。但是傳統(tǒng)的網(wǎng)絡(luò)安全數(shù)據(jù)實(shí)驗(yàn)系統(tǒng)對(duì)于數(shù)據(jù)的抓取和處理存在一定的弊端,在使用的實(shí)驗(yàn)數(shù)據(jù)中存在大量的冗余數(shù)據(jù),數(shù)據(jù)的獨(dú)立性較差[3]。因此,引用文本過(guò)濾技術(shù),設(shè)計(jì)基于文本過(guò)濾技術(shù)的網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)。文本過(guò)濾技術(shù)是一種按照一定的標(biāo)準(zhǔn)和要求,從大量動(dòng)態(tài)的數(shù)據(jù)中剔除用戶(hù)不需要的數(shù)據(jù)的方法和過(guò)程[4]。利用該技術(shù)處理網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)中的實(shí)驗(yàn)數(shù)據(jù),解決傳統(tǒng)的網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)系統(tǒng)中存在的問(wèn)題。
1? 基于文本過(guò)濾技術(shù)的網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)設(shè)計(jì)
1.1? 網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)硬件設(shè)計(jì)
采用單片機(jī)作為網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)的中央處理器來(lái)完成檢測(cè)實(shí)驗(yàn),采用AT89C52型單片機(jī),通過(guò)外部按鈕SWITCH0和SWITCH1控制實(shí)驗(yàn)的開(kāi)啟與暫停以及檢測(cè)實(shí)驗(yàn)進(jìn)度的調(diào)控[5]。中央處理器以脈沖的形式將控制信號(hào)傳輸?shù)津?qū)動(dòng)模塊,驅(qū)動(dòng)模塊實(shí)際工作電壓[6]為24 V。根據(jù)實(shí)際情況選擇適當(dāng)?shù)念l率驅(qū)動(dòng)單片機(jī)工作,使之與網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)的頻率相協(xié)調(diào)[7]。系統(tǒng)硬件組成框圖如圖1所示。
數(shù)據(jù)采集與處理是硬件設(shè)計(jì)的重要部分,該模塊采用CAN網(wǎng)絡(luò)數(shù)據(jù)采集卡[8],使用PCI總線(xiàn)接口芯片PCI9052以及CAN總線(xiàn)控制器等主要器件實(shí)現(xiàn)數(shù)據(jù)的采集。
將PCI總線(xiàn)接口芯片與配置寄存器芯片相結(jié)合,實(shí)現(xiàn)兩者之間的連接,PCI總線(xiàn)接口芯片與中央控制器之間的數(shù)據(jù)傳輸依靠雙口RAM實(shí)現(xiàn)[9]。其中,PCI9052芯片是一種低功耗的CMOS芯片,支持在PCI總線(xiàn)上的突發(fā)數(shù)據(jù)傳輸速率[10]可達(dá)147 Mb/s。PCI總線(xiàn)接口芯片PCI9052與上位機(jī)的連接主要通過(guò)PCI總線(xiàn)實(shí)現(xiàn)。設(shè)計(jì)連接電路如圖2所示。
圖中顯示了PCI總線(xiàn)接口與上位機(jī)之間的硬件連接,依靠PCI總線(xiàn)上實(shí)際連接情況判斷是否存在適配卡,根據(jù)實(shí)際需求選擇7.5 W的適配卡[11]。
1.2? 網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)軟件設(shè)計(jì)
在軟件設(shè)計(jì)中,利用程序代碼完成對(duì)實(shí)時(shí)數(shù)據(jù)的捕捉,將網(wǎng)卡設(shè)置成混雜模式,通過(guò)原始套接字接收目的地址的數(shù)據(jù)幀,封裝并提取數(shù)據(jù)幀中的MAC地址、IP地址和端口號(hào)。根據(jù)滑動(dòng)窗口協(xié)議,通過(guò)結(jié)構(gòu)體stuct data表示待接收的數(shù)據(jù),通過(guò)int start定義起始位置,int end定義終止位置,struct data*next定義下一個(gè)待接收的數(shù)據(jù)單元,int time_end表示數(shù)據(jù)完成提取時(shí)間[12]。通過(guò)程序代碼與硬件部分相結(jié)合完成數(shù)據(jù)提取操作。
完成數(shù)據(jù)提取后,引用文本過(guò)濾技術(shù)處理網(wǎng)絡(luò)數(shù)據(jù),以備后續(xù)使用。提取的原始數(shù)據(jù)中存在部分異常數(shù)據(jù),利用文本過(guò)濾技術(shù)標(biāo)記原始數(shù)據(jù)中的異常數(shù)據(jù),通過(guò)公式計(jì)算異常數(shù)據(jù)的標(biāo)記情況:
式中:[q]為異常數(shù)據(jù)標(biāo)記程度;[r]為已經(jīng)完成標(biāo)記的異常數(shù)據(jù)的數(shù)量;[N]為待標(biāo)記的異常數(shù)據(jù)數(shù)量。[q]的取值范圍為0~100%,通過(guò)計(jì)算[q]值判斷異常數(shù)據(jù)標(biāo)記進(jìn)度[13]。一些異常數(shù)據(jù)很難標(biāo)記成功,始終處于待標(biāo)記狀態(tài),此時(shí)利用公式(2)計(jì)算該異常數(shù)據(jù)對(duì)檢測(cè)實(shí)驗(yàn)的影響程度,影響大則進(jìn)行累積標(biāo)記;影響小則繼續(xù)執(zhí)行后續(xù)操作。
式中:[k]為異常數(shù)據(jù)對(duì)檢測(cè)實(shí)驗(yàn)的影響程度,其值在[[0,1]]之間;[σ]為平滑系數(shù);[k′]為上一個(gè)未標(biāo)記的異常數(shù)據(jù)的影響程度[14]。
在異常數(shù)據(jù)標(biāo)記中引入標(biāo)記質(zhì)量的概念,通過(guò)公式(3)統(tǒng)一異常數(shù)據(jù)標(biāo)記:
式中:[w]為統(tǒng)一后的已標(biāo)記的異常數(shù)據(jù);[φ]為標(biāo)記統(tǒng)一標(biāo)準(zhǔn);[q′]為未成功標(biāo)記的異常數(shù)據(jù)[15]。
通過(guò)式(1)~式(3)完成異常數(shù)據(jù)的統(tǒng)一標(biāo)記,已完成標(biāo)記的數(shù)據(jù)在數(shù)據(jù)處理過(guò)程中通過(guò)解碼識(shí)別為異常數(shù)據(jù)將其過(guò)濾,實(shí)驗(yàn)數(shù)據(jù)處理完成。至此基于文本過(guò)濾技術(shù)的網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)設(shè)計(jì)完成。
2? 網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)性能測(cè)試
2.1? 測(cè)試平臺(tái)搭建
根據(jù)網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)的實(shí)際需求,選擇操作系統(tǒng)為Windows XP的主機(jī)作為測(cè)試主要PC機(jī)。該操作系統(tǒng)測(cè)試實(shí)時(shí)性較好,占用資源較少,運(yùn)行速度快,對(duì)于硬件部分引起的中斷,其響應(yīng)延時(shí)低于50 μs;兼容性良好,便于對(duì)實(shí)驗(yàn)系統(tǒng)的擴(kuò)展和升級(jí);用戶(hù)界面較為出色,能夠?qū)崿F(xiàn)良好的人機(jī)交互功能。測(cè)試實(shí)際環(huán)境如圖3所示。
在以上測(cè)試環(huán)境下,測(cè)試網(wǎng)路安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)實(shí)際性能。
2.2? 系統(tǒng)集成測(cè)試
實(shí)驗(yàn)系統(tǒng)集成測(cè)試主要測(cè)試各個(gè)模塊之間的協(xié)調(diào)性和融合性,以及系統(tǒng)整體運(yùn)行的穩(wěn)定性,以保證系統(tǒng)在測(cè)試中能夠正常穩(wěn)定的運(yùn)行。利用該系統(tǒng)實(shí)際訪(fǎng)問(wèn)數(shù)據(jù)的能力,判斷實(shí)驗(yàn)系統(tǒng)的阻斷能力和承受的壓力。系統(tǒng)訪(fǎng)問(wèn)網(wǎng)絡(luò)數(shù)據(jù)的時(shí)間如表1所示。
從表1數(shù)據(jù)可知,實(shí)驗(yàn)系統(tǒng)對(duì)于網(wǎng)絡(luò)數(shù)據(jù)的訪(fǎng)問(wèn)能夠及時(shí)的阻斷,保證網(wǎng)絡(luò)數(shù)據(jù)安全;同時(shí)也說(shuō)明所設(shè)計(jì)系統(tǒng)各個(gè)模塊之間具有良好的融合性和協(xié)調(diào)性,并且運(yùn)行穩(wěn)定正常,滿(mǎn)足后續(xù)測(cè)試需求。
2.3? 數(shù)據(jù)獨(dú)立性測(cè)試及分析
在某大型網(wǎng)站抓捕大量數(shù)據(jù),檢測(cè)其中包含的冗余數(shù)據(jù),選擇三種不同的數(shù)據(jù)檢測(cè)其在不同的數(shù)據(jù)包中出現(xiàn)的次數(shù),為了保證數(shù)據(jù)的安全,三種不同的數(shù)據(jù)分別記為數(shù)據(jù)A,B和C。檢測(cè)結(jié)果如圖4所示。
使用所設(shè)計(jì)系統(tǒng)處理冗余數(shù)據(jù),同時(shí)引用傳統(tǒng)的挖掘網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng),對(duì)相同的數(shù)據(jù)進(jìn)行處理,檢測(cè)經(jīng)過(guò)處理后的數(shù)據(jù),結(jié)果如圖5所示。
由圖5可知,使用設(shè)計(jì)的實(shí)驗(yàn)系統(tǒng)處理冗余數(shù)據(jù),處理的三種數(shù)據(jù)分別只存在一個(gè)數(shù)據(jù)包中,沒(méi)有出現(xiàn)重復(fù)的冗余數(shù)據(jù);使用傳統(tǒng)的實(shí)驗(yàn)系統(tǒng)處理數(shù)據(jù),經(jīng)過(guò)檢測(cè),包含數(shù)據(jù)A的數(shù)據(jù)包有21個(gè),包含數(shù)據(jù)B的數(shù)據(jù)包有17個(gè),包含數(shù)據(jù)C的數(shù)據(jù)包有3個(gè),相對(duì)于原始數(shù)據(jù),剔除了部分冗余數(shù)據(jù),但是依然存在一小部分冗余數(shù)據(jù)沒(méi)有剔除干凈。
3? 結(jié)? 語(yǔ)
文本通過(guò)對(duì)網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)的軟件和硬件的設(shè)計(jì),實(shí)現(xiàn)了基于文本過(guò)濾技術(shù)的網(wǎng)絡(luò)安全數(shù)據(jù)檢測(cè)實(shí)驗(yàn)系統(tǒng)。通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),該系統(tǒng)能有效地將原始數(shù)據(jù)中的冗余數(shù)據(jù)剔除干凈,數(shù)據(jù)獨(dú)立性更強(qiáng),以及實(shí)驗(yàn)系統(tǒng)的數(shù)據(jù)處理能力,提高了實(shí)驗(yàn)數(shù)據(jù)的可靠性。
參考文獻(xiàn)
[1] 段秀娟.基于混沌粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估系統(tǒng)設(shè)計(jì)[J].科學(xué)技術(shù)與工程,2019,19(16):251?255.
[2] 劉立芳,趙麗莎,齊小剛,等.基于排隊(duì)模型的網(wǎng)絡(luò)性能仿真與安全評(píng)估技術(shù)[J].系統(tǒng)仿真學(xué)報(bào),2018,30(1):191?196.
[3] 方芳,王亞,王石,等.基于語(yǔ)義分類(lèi)和描述框架的網(wǎng)絡(luò)攻擊知識(shí)抽取研究及其應(yīng)用[J].中文信息學(xué)報(bào),2019,33(4):48?59.
[4] 謝麗霞,王志華.基于布谷鳥(niǎo)搜索優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估方法[J].計(jì)算機(jī)應(yīng)用,2017,37(7):1926?1930.
[5] 錢(qián)斌,蔡梓文,肖勇,等.基于模糊推理的計(jì)量自動(dòng)化系統(tǒng)網(wǎng)絡(luò)安全態(tài)勢(shì)感知[J].南方電網(wǎng)技術(shù),2019,13(2):51?58.
[6] 王慧,楊秋實(shí),王禹澗.大流量安全閥動(dòng)態(tài)測(cè)試系統(tǒng)設(shè)計(jì)及其仿真與實(shí)驗(yàn)[J].機(jī)械設(shè)計(jì)與研究,2017,33(6):150?153.
[7] 周海坤.高并發(fā)煤礦安全監(jiān)控?cái)?shù)據(jù)采集系統(tǒng)的設(shè)計(jì)[J].煤礦安全,2018,49(6):85?87.
[8] 王戰(zhàn)平,馮揚(yáng)文,朱宸良.大數(shù)據(jù)時(shí)代數(shù)字資源整合方法研究:模型設(shè)計(jì)和實(shí)驗(yàn)分析:以物流行業(yè)為例[J].現(xiàn)代情報(bào),2019,39(9):92?100.
[9] 彭貴琴,陳萬(wàn)一.奧希替尼上市后安全信號(hào)的數(shù)據(jù)挖掘與分析[J].中國(guó)藥房,2019,30(12):1692?1696.
[10] 韓曉冬,高飛.抗污染攻擊的流內(nèi)安全網(wǎng)絡(luò)糾錯(cuò)編碼[J].北京理工大學(xué)學(xué)報(bào),2018,38(11):1182?1187.
[11] 王明輝,陳冰懷,黃海,等.自動(dòng)氣象站常規(guī)傳感器現(xiàn)場(chǎng)檢測(cè)系統(tǒng)設(shè)計(jì)[J].氣象科技,2019,47(3):402?407.
[12] 裴世鑫,崔芬萍,謝欣桐.基于光纖干涉的溫度與壓力傳感實(shí)驗(yàn)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].大學(xué)物理,2018,37(5):52?56.
[13] 張紅,張福高.基于激光虛擬的遠(yuǎn)程實(shí)驗(yàn)室系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].激光雜志,2019,40(3):187?191.
[14] 付安民,宋建業(yè),蘇铓,等.云存儲(chǔ)中密文數(shù)據(jù)的客戶(hù)端安全去重方案[J].電子學(xué)報(bào),2017,45(12):2863?2872.
[15] 張玉玲,尹傳環(huán).依特征頻率的安卓惡意軟件異常檢測(cè)的研究[J].智能系統(tǒng)學(xué)報(bào),2018,13(2):168?173.