文君
摘 要:現(xiàn)階段,我國已逐步加快信息化建設(shè)步伐,在現(xiàn)代化信息技術(shù)飛速發(fā)展帶動下,極大增長了整個網(wǎng)絡(luò)空間數(shù)據(jù)量,與此同時,也將更多的難題帶給網(wǎng)絡(luò)空間安全管理。不斷增加的網(wǎng)絡(luò)空間連入點,使得傳統(tǒng)網(wǎng)絡(luò)空間安全處理方式無法滿足海量數(shù)據(jù)需求,在這樣的背景下,逐漸凸顯出機器學習優(yōu)勢,將機器學習應(yīng)用于網(wǎng)絡(luò)安全研究中可以有效解決網(wǎng)絡(luò)空間安全問題。
關(guān)鍵詞:機器學習;網(wǎng)絡(luò)空間;安全研究
0引言
網(wǎng)絡(luò)空間涉及內(nèi)容十分廣闊,既包括通信網(wǎng)、各種計算系統(tǒng)、互聯(lián)網(wǎng)、各類嵌入式控制器、處理器等硬件和軟件,又包括這些硬軟件產(chǎn)生、處理、儲存的各種數(shù)據(jù)信息,還包括人類活動在其中產(chǎn)生的影響。因此,網(wǎng)絡(luò)空間也被稱為除陸、海、空、太空以外的第五大空間。近幾年,頻繁發(fā)生網(wǎng)絡(luò)空間中各類安全事件和網(wǎng)絡(luò)攻擊,其危害十分巨大,造成嚴重的經(jīng)濟損失。每年我國因為數(shù)字犯罪造成的損失也達到上百億元。由此可見,網(wǎng)絡(luò)空間安全對國家經(jīng)濟發(fā)展、社會穩(wěn)定、國家安全都有重大影響,必須引起各方高度重視。
1 機器學習的內(nèi)涵
人工智能最核心的內(nèi)容是機器學習,它存在的目的是對人類行為進行模擬。采取學習方法,使計算機獲取到更多知識和技能,讓其變得更加智能和聰明,實現(xiàn)優(yōu)化組織結(jié)構(gòu)的目標,促進機器學習智能化。針對如何讓機器擁有特定學習行為,不同學者有不同的探索內(nèi)容,獲得大部分人認同的觀點是機器學習密切聯(lián)系推理過程。因此,可以將機器學習策略劃分成不同板塊,機器學習涉及廣闊范圍,這種結(jié)果在多種知識、技術(shù)交叉作用之下產(chǎn)生。其中又涉及很多專業(yè)學科,可以將機器學習分為以下幾類:第一,以學習策略為分類依據(jù),將其分成機械學習、示教學習、類比學習、基于解釋的學習等。第二,從獲取知識及表示方式角度分類,可以劃分為代數(shù)表達式參數(shù)、圖、網(wǎng)絡(luò)、多種表示形式組合等。第三,以應(yīng)用領(lǐng)域為根據(jù)進行分類,可以分為自然語言、圖像識別、知識模擬等。第四,綜合分類可以劃分為經(jīng)驗性歸納性學習、分析學習、類比學習等[1]。
2 機器學習對研究網(wǎng)絡(luò)空間安全的重要作用
2.1? 檢測網(wǎng)絡(luò)運營
互聯(lián)網(wǎng)體系的重要內(nèi)容是網(wǎng)關(guān)協(xié)議,網(wǎng)關(guān)協(xié)議對路由通信質(zhì)量會產(chǎn)生一定影響。但是,在實際運營中,由于網(wǎng)關(guān)協(xié)議的認證體系不夠完整,造成有故障存在路由信息識別過程中,進而使網(wǎng)絡(luò)遭到攻擊。由此看來,有必要對機器學習進行充分利用,實現(xiàn)以實時跟蹤檢查網(wǎng)關(guān)協(xié)議運營情況為目標,為數(shù)據(jù)安全性提供保障。
2.2? 域名系統(tǒng)安全檢測
網(wǎng)絡(luò)空間中最容易受到攻擊的是域名系統(tǒng),如果遭到攻擊就無法保障正常使用網(wǎng)絡(luò)。通常情況下,記錄惡意域名是域名系統(tǒng)供給的處理方式,如果域名發(fā)生異常情況,就會以記錄的信息為依據(jù),展開進一步監(jiān)測,進而防止安全問題。然而,應(yīng)用傳統(tǒng)檢測方式會出現(xiàn)很多問題,攻擊者可能會對記錄的信息進行竊取和屏蔽,造成檢測識別空白的現(xiàn)象,使其錯誤判斷惡意域名的性質(zhì)為安全。在網(wǎng)絡(luò)空間安全研究中應(yīng)用機器學習,可以將記錄惡意域名的數(shù)據(jù)有效提取和分析出來,在對域名進行對比和監(jiān)測之后,對域名安全性進行準確判斷。
2.3? 網(wǎng)絡(luò)安全檢測
有很多網(wǎng)絡(luò)接入點存在網(wǎng)絡(luò)空間中,在檢測網(wǎng)絡(luò)安全時還需要收集、分析和控制數(shù)據(jù),通過機器學習,可以快速發(fā)現(xiàn)安全隱患,采取有效防范手段高效的處理安全問題。在網(wǎng)絡(luò)空間安全研究中應(yīng)用機器學習,可以更有效的將網(wǎng)絡(luò)空間中攻擊、入侵等行為檢測出來,促進檢測效率的提升,保障網(wǎng)絡(luò)空間安全(見表1)。
3 網(wǎng)絡(luò)空間安全研究中應(yīng)用機器學習
網(wǎng)絡(luò)空間的重要內(nèi)容是網(wǎng)絡(luò)空間安全,對網(wǎng)絡(luò)基礎(chǔ)設(shè)施進行完善有利于增加網(wǎng)絡(luò)空間的安全性,為其安全運行提供保障和支持,通過對機器學習的充分利用,能夠?qū)W(wǎng)絡(luò)空間實施各種安全檢測,有利于提高互聯(lián)網(wǎng)網(wǎng)絡(luò)運行的安全性。
3.1? 應(yīng)用于網(wǎng)絡(luò)基礎(chǔ)設(shè)施安全中的研究
網(wǎng)絡(luò)基礎(chǔ)設(shè)施是計算機實現(xiàn)運行的基礎(chǔ)設(shè)施,遠程通信網(wǎng)、有線電視網(wǎng)、路由系統(tǒng)及域名系統(tǒng)是最重要的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,因此,在研究網(wǎng)絡(luò)空間安全中需要重點關(guān)注路由系統(tǒng)和域名系統(tǒng)的安全,在最新研究中,借助機器學習,對網(wǎng)絡(luò)空間實施BGP異常檢測和DNS惡意攻擊檢測取得了一定成果,主要從以下方面進行分析:首先,BGP異常檢測。BGP是英文單詞的縮寫形式,全拼是Border Gateway Protocol,意思是邊界網(wǎng)關(guān)協(xié)議,它在TCP上運行,是自治系統(tǒng)路由協(xié)議的一種。BGP系統(tǒng)的功能比較強大,可以促進不相關(guān)互聯(lián)網(wǎng)路由區(qū)域間的連接,達到交換信息的目的,通過與其他BGP系統(tǒng)交換網(wǎng)絡(luò)獲取信息。然而,它也存在一個問題,因為其路由認證體系不可信任,導致大量危機存在其路由系統(tǒng)中,包括異常BGP更新消息、前綴劫持等使網(wǎng)絡(luò)安全性大幅度降低,傳統(tǒng)識別異常路由是通過綜合利用各種方式進行處理,然而,這種方式無法有效識別所有異常路由。在開展網(wǎng)絡(luò)空間研究過程中通過對機器學習的充分利用,研究人員又進行大量實踐,最終發(fā)現(xiàn)長短期記憶網(wǎng)絡(luò),可以對異常路由進行有效監(jiān)測,它能將BGP更新消息或時序中的異常信息及時提取出來,還能進行警告。然而,在網(wǎng)絡(luò)空間安全研究中異常路由檢測應(yīng)用機器學習,還不能保證其準確性,往往會有誤報、漏報等問題出現(xiàn),因此,當前機器學習在檢測異常路由器中的應(yīng)用還處于構(gòu)建模型和討論階段,有必要進行深入研究,以提高機器學習在檢測異常路由中的準確性。其次,檢測惡意域名。DNS是域名系統(tǒng)縮寫形式,域名系統(tǒng)是互聯(lián)網(wǎng)的一項服務(wù),能夠更加方便互聯(lián)網(wǎng)的防衛(wèi)。因此,惡意攻擊域名系統(tǒng)的情況比較多,這也是域名系統(tǒng)成為網(wǎng)絡(luò)空間安全重要內(nèi)容的主要原因。在網(wǎng)絡(luò)空間安全研究中應(yīng)用機器學習有利于推動惡意域名檢測的研究進程,對促進惡意域名研究會產(chǎn)生一定成果。然而,也存在兩個問題,第一是攻擊方一旦對域名檢測系統(tǒng)原理熟悉掌握后,就可以將檢測系統(tǒng)避開,再次攻擊;第二是當前惡意域名檢測系統(tǒng)是利用已知域名作為基礎(chǔ)數(shù)據(jù)進行建設(shè)的,因此其效果難以發(fā)揮出來。由此看來,還需要充分利用機器學習深入研究惡意域名檢測系統(tǒng)。
3.2? 應(yīng)用于網(wǎng)絡(luò)安全檢測中的研究
主要從3個方面分析利用機器學習對軟件安全的監(jiān)測:首先,對網(wǎng)頁安全進行檢測。通過對惡意網(wǎng)頁的利用,許多網(wǎng)絡(luò)供給會竊取使用者的個人信息,造成網(wǎng)絡(luò)用戶泄露信息情況。一般情況下,采用記錄識別法檢測網(wǎng)頁安全,但是受到多種因素影響,檢測周期較長,而且監(jiān)測效果也不盡人意,嚴重危害網(wǎng)絡(luò)空間安全。通過對機器學習的利用,可以檢測網(wǎng)頁安全,記錄下存在安全隱患的網(wǎng)絡(luò),然后再對這些信息開展數(shù)據(jù)采集和數(shù)據(jù)特征分析工作,在檢測網(wǎng)頁安全過程中,在這些信息的基礎(chǔ)上,采取分類計算方法進行計算,可以將網(wǎng)頁安全性有效檢測出來[2]。其次,對郵件安全的檢測。大量垃圾郵件儲存在網(wǎng)絡(luò)空間中,占據(jù)系統(tǒng)內(nèi)存,對網(wǎng)絡(luò)運行速度造成影響,增加隱藏的安全隱患,一旦不能及時有效進行系統(tǒng)檢測,就會增加網(wǎng)絡(luò)空間被攻擊的概率,對用戶信息安全造成不利影響。以前采用人工方式檢測郵件安全性,處理效率較低,應(yīng)用機器學習之后,可以將垃圾軟件檢測系統(tǒng)構(gòu)建起來,這樣技術(shù)人員以文本處理標準為依據(jù)輸入特征,就可以驅(qū)動程序?qū)︵]件安全進行自動檢測,能夠為用戶信息提供保障。最后,對PDF安全進行檢測。使用互聯(lián)網(wǎng)過程中,用戶不可避免會在網(wǎng)絡(luò)空間中生成很多PDF文件,許多惡意程序就隱藏在某些PDF文件中,應(yīng)用傳統(tǒng)檢測軟件,無法檢測出這些惡意程序(見表2)。想要解決這類問題,就需要將機器學習應(yīng)用在網(wǎng)絡(luò)空間中,將文件檢測系統(tǒng)構(gòu)建起來,通過提取信息特點,及時有效檢測出隱藏在PDF文件中的惡意程序[3]。
4結(jié)語
綜上所述,存在網(wǎng)絡(luò)空間安全研究中的安全威脅和防護問題,對國家安全和人們?nèi)粘I钣兄苯雍椭匾挠绊憽I钊胪诰蚓W(wǎng)絡(luò)空間中大量存在的日志信息、網(wǎng)絡(luò)流量等數(shù)據(jù)特點和連接關(guān)系,可以將安全防護措施提供給網(wǎng)絡(luò)空間各級應(yīng)用。機器學習在很多領(lǐng)域取得舉世矚目的研究成果,越來越多的網(wǎng)絡(luò)空間研究人員開始給予其高度關(guān)注。本文重點分析機器學習在網(wǎng)絡(luò)空間安全領(lǐng)域中的應(yīng)用,希望給有關(guān)機構(gòu)提供參考與借鑒。
[參考文獻]
[1]劉艷東,李晨.從人才培養(yǎng)體系建設(shè)談實踐型網(wǎng)絡(luò)空間安全人才培養(yǎng)[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020(9):39-43.
[2]劉金鵬.基于機器學習技術(shù)的網(wǎng)絡(luò)安全防護[J]. 網(wǎng)絡(luò)空間安全,2018(9):96-102.
[3]李欣姣,吳國偉,姚琳,等. 機器學習安全攻擊與防御機制研究進展和未來挑戰(zhàn)[J]. 軟件學報,2021(2):406-423.
(編輯 何 琳)