隆文超 湖南司法警官職業(yè)學(xué)院
大數(shù)據(jù)挖掘下的網(wǎng)絡(luò)安全預(yù)警,是一個(gè)新的概念,是指將一些零散的、不能形成系統(tǒng)的網(wǎng)絡(luò)數(shù)據(jù)和信息安全系統(tǒng)進(jìn)行有效的融合,形成數(shù)據(jù)共享體系,通過(guò)智能算法分析數(shù)據(jù)量化后存在的網(wǎng)絡(luò)應(yīng)用工具和系統(tǒng)的漏洞和潛在風(fēng)險(xiǎn),給網(wǎng)絡(luò)安全提供事前預(yù)防。
(一)網(wǎng)絡(luò)安全管理問(wèn)題。隨著大數(shù)據(jù)技術(shù)的發(fā)展,互聯(lián)網(wǎng)的普及,“網(wǎng)警”這一網(wǎng)絡(luò)安全管理職業(yè)由此誕生。網(wǎng)警的出現(xiàn),在一定程度上對(duì)網(wǎng)絡(luò)安全的管理起到了一定的作用,通過(guò)對(duì)網(wǎng)絡(luò)違法犯罪活動(dòng)的打擊,凈化了網(wǎng)絡(luò)環(huán)境,給網(wǎng)民一個(gè)安全的上網(wǎng)環(huán)境。但是由于很多企業(yè)和單位對(duì)網(wǎng)絡(luò)管理工作不太重視,缺乏一定的網(wǎng)絡(luò)管理制度,企業(yè)內(nèi)部人員缺乏安全使用計(jì)算機(jī)網(wǎng)絡(luò)的意識(shí),導(dǎo)致很多網(wǎng)絡(luò)黑客對(duì)企業(yè)的公共網(wǎng)絡(luò)進(jìn)行攻擊和信息竊取,企業(yè)卻難以追究責(zé)任。由于對(duì)計(jì)算機(jī)網(wǎng)絡(luò)缺乏相應(yīng)的系統(tǒng)化管理,很多網(wǎng)絡(luò)安全問(wèn)題得不到切實(shí)的解決。
(二)個(gè)人信息的保護(hù)。在大數(shù)據(jù)時(shí)代,個(gè)人信息安全面臨三大問(wèn)題:
1.公民個(gè)人信息遭泄露。以訂票網(wǎng)站泄露公民隱私,導(dǎo)致黑客撞庫(kù)事例為典型,大數(shù)據(jù)環(huán)境下,公民的姓名、身份證號(hào)、手機(jī)號(hào)等信息遭泄露,很多黑客利用“撞庫(kù)”獲取用戶(hù)密碼,獲得非法牟利。
2.個(gè)人網(wǎng)絡(luò)消費(fèi)信息安全面臨危機(jī)。大數(shù)據(jù)時(shí)代,人們?cè)诶梦⑿?、淘寶進(jìn)行支付,用微博進(jìn)行轉(zhuǎn)發(fā)的過(guò)程中,個(gè)人信息被商家用大數(shù)據(jù)分析工具截獲。大數(shù)據(jù)時(shí)代,每個(gè)人都是數(shù)據(jù)的貢獻(xiàn)者,在貢獻(xiàn)數(shù)據(jù)過(guò)程中,個(gè)人信息的網(wǎng)絡(luò)安全面臨著威脅。
3.個(gè)人信息遭濫用。在大數(shù)據(jù)信息的收集過(guò)程中,有很多未經(jīng)授權(quán)的個(gè)人信息被濫用,還有的個(gè)人信息數(shù)據(jù)經(jīng)過(guò)企業(yè)合法收集之后,用于一些非法用途,還有的是黑客轉(zhuǎn)賣(mài)給第三家。
(三)系統(tǒng)面臨的安全問(wèn)題
1.大數(shù)據(jù)平臺(tái)依托于互聯(lián)網(wǎng)面向政府和社會(huì)大眾服務(wù),網(wǎng)絡(luò)基礎(chǔ)設(shè)施和軟硬件系統(tǒng)受制于人,企業(yè)系統(tǒng)管理具有不可控因素。
2.網(wǎng)站應(yīng)用漏洞百出,這是大數(shù)據(jù)環(huán)境下,企業(yè)系統(tǒng)平臺(tái)面臨的最大威脅之一,雖然有些企業(yè)采用了第三方數(shù)據(jù)庫(kù)或者中間件,但是系統(tǒng)的穩(wěn)定性不容樂(lè)觀(guān),還是存在運(yùn)行風(fēng)險(xiǎn)和漏洞。
3.黑客利用終端惡意軟件、代碼攻擊大數(shù)據(jù)平臺(tái)、竊取企業(yè)重要數(shù)據(jù)。隨著網(wǎng)絡(luò)攻擊的方式越來(lái)越先進(jìn),企業(yè)的軟硬件系統(tǒng)不夠強(qiáng)大,雖然一些網(wǎng)絡(luò)防火墻和殺毒軟件起到了防護(hù)作用,但是在企業(yè)互聯(lián)網(wǎng)系統(tǒng)運(yùn)行當(dāng)中,還是會(huì)產(chǎn)生很多漏洞和安全問(wèn)題。
(一)大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)安全及時(shí)性的需要。大數(shù)據(jù)挖掘的網(wǎng)絡(luò)安全預(yù)警,通過(guò)各種算法構(gòu)建一個(gè)自動(dòng)化網(wǎng)絡(luò)安全預(yù)警模式,可以有效的提高網(wǎng)絡(luò)安全應(yīng)急系統(tǒng)的及時(shí)性,降低網(wǎng)絡(luò)應(yīng)用系統(tǒng)遭受攻擊、篡改、木馬等安全問(wèn)題,不斷提升網(wǎng)絡(luò)安全能力。
(二)大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)安全主動(dòng)防御的需要。網(wǎng)絡(luò)安全預(yù)警以主動(dòng)防御為主要特征,其主要功能包括:網(wǎng)絡(luò)數(shù)據(jù)采集、網(wǎng)絡(luò)事件和行為評(píng)測(cè)、網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)、網(wǎng)絡(luò)協(xié)議分析和網(wǎng)絡(luò)內(nèi)容檢測(cè)等。通過(guò)對(duì)網(wǎng)絡(luò)數(shù)據(jù)的收集,可以實(shí)時(shí)分析數(shù)據(jù)設(shè)備運(yùn)行中的日志數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)。利用大數(shù)據(jù)發(fā)掘技術(shù)對(duì)網(wǎng)絡(luò)數(shù)據(jù)、行為、協(xié)議等進(jìn)行分析,檢測(cè)網(wǎng)絡(luò)中是否存在異?;蛘邼撛陲L(fēng)險(xiǎn),并將其反饋到安全防御系統(tǒng)。
(三)大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)提高安全管理的效率的需要。隨著信息系統(tǒng)大集中模式的不斷發(fā)展,網(wǎng)絡(luò)信息環(huán)境變得越來(lái)越復(fù)雜,隨著網(wǎng)絡(luò)數(shù)據(jù)輸出的規(guī)模越來(lái)越大,網(wǎng)絡(luò)安全問(wèn)題也受到更多的重視。網(wǎng)絡(luò)信息在運(yùn)行和傳播過(guò)程中產(chǎn)生大量的安全問(wèn)題。針對(duì)這些龐大的數(shù)據(jù)問(wèn)題,網(wǎng)絡(luò)管理員顯得束手無(wú)策,不能及時(shí)發(fā)現(xiàn)安全隱患,降低了網(wǎng)絡(luò)信息安全的工作效率。在這種情況下,急需一種有效的自動(dòng)化網(wǎng)絡(luò)管理模式,來(lái)提高網(wǎng)絡(luò)安全管理工作的效率。
基于網(wǎng)絡(luò)安全預(yù)警模式分析數(shù)據(jù)量龐大的特點(diǎn),人工分析模式不能滿(mǎn)足其實(shí)時(shí)性和快速性的需求,利用大數(shù)據(jù)挖掘技術(shù),通過(guò)遺傳神經(jīng)網(wǎng)絡(luò)的算法,實(shí)現(xiàn)數(shù)據(jù)分析的自動(dòng)化和智能化,能夠很好地節(jié)省人工成本,節(jié)約時(shí)間,快速的從海量的網(wǎng)絡(luò)數(shù)據(jù)中提取異常數(shù)據(jù),并進(jìn)行風(fēng)險(xiǎn)評(píng)測(cè),對(duì)網(wǎng)絡(luò)數(shù)據(jù)中存在的安全問(wèn)題提前預(yù)警。
(一)通過(guò)系統(tǒng)自動(dòng)采集網(wǎng)絡(luò)數(shù)據(jù),包括應(yīng)用數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、網(wǎng)絡(luò)設(shè)備數(shù)據(jù)等。通過(guò)將這些數(shù)據(jù)進(jìn)行分類(lèi)存儲(chǔ)和集中管理,整合分布式系統(tǒng)、關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)、數(shù)據(jù)庫(kù)集群等,建立混合型數(shù)據(jù)庫(kù),實(shí)現(xiàn)對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)的存儲(chǔ);
(二)根據(jù)遺傳神經(jīng)系統(tǒng)的特點(diǎn),對(duì)采集和存儲(chǔ)的數(shù)據(jù)建模,目的是將這些網(wǎng)絡(luò)數(shù)據(jù)包轉(zhuǎn)換為能夠被神經(jīng)系統(tǒng)識(shí)別的數(shù)據(jù)向量。初始化遺傳神將網(wǎng)絡(luò)的訓(xùn)練樣本、期望輸出、算法、訓(xùn)練次數(shù)等;
(三)根據(jù)已知的、達(dá)到理想狀態(tài)的數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。首先,對(duì)網(wǎng)絡(luò)實(shí)行離線(xiàn)訓(xùn)練,對(duì)存儲(chǔ)在數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行反復(fù)的挖掘、計(jì)算,實(shí)現(xiàn)重復(fù)利用,這樣能夠獲取較好的訓(xùn)練效果,保證訓(xùn)練結(jié)果的可靠性和實(shí)用性,進(jìn)而將其應(yīng)用到網(wǎng)絡(luò)安全預(yù)警系統(tǒng)中。遺傳神經(jīng)網(wǎng)絡(luò)系統(tǒng)過(guò)程是學(xué)習(xí)的過(guò)程,通過(guò)特定的學(xué)習(xí)樣本庫(kù)和期望輸出數(shù)據(jù),為遺傳神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)輸入數(shù)據(jù),學(xué)習(xí)樣本的選擇要滿(mǎn)足以下特點(diǎn):一是要包括正常的網(wǎng)絡(luò)數(shù)據(jù);一是要含有典型的帶有攻擊行為特征的典型樣本數(shù)據(jù)。BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成之后,將輸出結(jié)果和期望結(jié)果進(jìn)行比對(duì),如果輸出結(jié)果大于期望值,就要再重復(fù)學(xué)習(xí)過(guò)程,指導(dǎo)輸出結(jié)果小于期望值以后,才符合網(wǎng)絡(luò)安全預(yù)警系統(tǒng)模式的要求;
(四)遺傳神經(jīng)系統(tǒng)網(wǎng)絡(luò)訓(xùn)練結(jié)束以后,就可以用權(quán)值的形式保存起來(lái)了。可以將其用于對(duì)網(wǎng)絡(luò)數(shù)據(jù)的檢測(cè),通過(guò)在大數(shù)據(jù)環(huán)境下對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行檢測(cè),遺傳神經(jīng)系統(tǒng)充分發(fā)揮它檢測(cè)數(shù)據(jù)的優(yōu)勢(shì),快速的完成數(shù)據(jù)檢測(cè)以后,將處理結(jié)果保存到數(shù)據(jù)庫(kù)中;
(五)更新遺傳神經(jīng)網(wǎng)絡(luò)算法,具體要重復(fù)執(zhí)行(三)和(四)步驟的操作,進(jìn)化神經(jīng)網(wǎng)絡(luò)算法,進(jìn)行更準(zhǔn)確、及時(shí)的網(wǎng)絡(luò)安全數(shù)據(jù)分析;
(六)網(wǎng)絡(luò)安全響應(yīng)。在系統(tǒng)發(fā)現(xiàn)網(wǎng)絡(luò)中的攻擊行為之后,會(huì)將其反饋給網(wǎng)絡(luò)安全防御系統(tǒng),對(duì)網(wǎng)絡(luò)中的不安全因素進(jìn)行排除,保證網(wǎng)絡(luò)安全的正常運(yùn)行。
綜上所述,大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)安全形勢(shì)越來(lái)越嚴(yán)峻,通過(guò)遺傳神將網(wǎng)絡(luò)這種大數(shù)據(jù)分析技術(shù)的應(yīng)用,可以在訓(xùn)練之后形成網(wǎng)絡(luò)安全預(yù)警模型,及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)中潛在的危險(xiǎn),并反饋給安全防御系統(tǒng),不斷提高網(wǎng)絡(luò)安全。