◆邵迎春
基于人工智能的互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)安全優(yōu)化算法研究
◆邵迎春
(河源理工學(xué)校 廣東 517000)
隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)入侵的類型和發(fā)生率正在迅速增加。在此基礎(chǔ)上,本文嘗試分析傳統(tǒng)算法和以人工技術(shù)特征為基礎(chǔ)的機(jī)器學(xué)習(xí)算法特征、指標(biāo)變化情況,結(jié)果表明:(1)通過(guò)使用基于人工智能的Sparktool工具進(jìn)行機(jī)器學(xué)習(xí)算法和傳統(tǒng)算法優(yōu)化調(diào)節(jié)后,數(shù)據(jù)安全精準(zhǔn)性、精度、TPR、TNR和F測(cè)量效率精度均顯著提升;(2)相較于傳統(tǒng)算法,人工智能機(jī)器學(xué)習(xí)算法執(zhí)行時(shí)間低,互聯(lián)網(wǎng)數(shù)據(jù)分類管理優(yōu)質(zhì),入侵式防治效果出色。以期通過(guò)人工智能技術(shù)特征的機(jī)器學(xué)習(xí)算法為數(shù)據(jù)安全提供一定的科學(xué)依據(jù)。
人工智能;互聯(lián)網(wǎng);數(shù)據(jù)安全;優(yōu)化算法;研究
當(dāng)前,隨著互聯(lián)網(wǎng)科技、經(jīng)濟(jì)的快速發(fā)展,人工智能技術(shù)也逐步發(fā)展崛起,并逐漸被應(yīng)用在多個(gè)領(lǐng)域。相較于低精度、低效率和高誤差的傳統(tǒng)網(wǎng)絡(luò)數(shù)據(jù)安全算法,人工智能安全算法通過(guò)計(jì)算機(jī)技術(shù)模擬思維,采用機(jī)器學(xué)習(xí)算法簡(jiǎn)化網(wǎng)絡(luò)安全數(shù)據(jù)調(diào)節(jié)優(yōu)化流程,不僅提升了網(wǎng)絡(luò)安全算法精準(zhǔn)度,而且有效實(shí)現(xiàn)了人機(jī)互動(dòng),互聯(lián)網(wǎng)數(shù)據(jù)信息交叉驗(yàn)證分析等安全操作?;诖?,本文以人工智能技術(shù)為依據(jù),采用Sparktool工具和NSLKDDCUP數(shù)據(jù)集特征和功能,分別比較分析傳統(tǒng)K-均值聚類算法與基于人工智能技術(shù)的機(jī)器學(xué)習(xí)算法(支持向量算法,SVM、FS-SVM算法)準(zhǔn)確性、精度、召回性率、真負(fù)比(TNR)、F測(cè)量等指標(biāo)結(jié)果,進(jìn)而分析通過(guò)人工智能技術(shù)優(yōu)化下數(shù)據(jù)安全具體特征性,以確保在實(shí)現(xiàn)技術(shù)創(chuàng)新的同時(shí)有效實(shí)現(xiàn)人工智能與機(jī)器學(xué)習(xí)算法數(shù)據(jù)的安全協(xié)調(diào)、效率互助等分析結(jié)果。
目前,互聯(lián)網(wǎng)信息化發(fā)展越發(fā)成熟,但信息安全卻受到網(wǎng)絡(luò)入侵、病毒入侵等挑戰(zhàn)更加嚴(yán)重,在此基礎(chǔ)上,本文探索通過(guò)人工智能技術(shù)優(yōu)化安全算法,實(shí)現(xiàn)各項(xiàng)數(shù)據(jù)優(yōu)化管理,提升數(shù)據(jù)處理效率和準(zhǔn)確度。首先,人工智能具備更優(yōu)的信息深度特征,不僅有助于安全優(yōu)化過(guò)程中擴(kuò)大信息規(guī)模,而且實(shí)現(xiàn)了網(wǎng)絡(luò)數(shù)據(jù)多樣化的特點(diǎn);其次,人工智能具備管理性和穩(wěn)定性特征,在進(jìn)行算法優(yōu)化調(diào)整過(guò)程中,有效增加了算法處理數(shù)據(jù)能力、數(shù)據(jù)交互性等,一定程度提升了網(wǎng)絡(luò)信息安全算法運(yùn)行實(shí)現(xiàn)效率和準(zhǔn)確率;最終,由于人工智能技術(shù)具備信息交叉驗(yàn)證、大量數(shù)據(jù)分析等特征,當(dāng)網(wǎng)絡(luò)信息安全受到分布式入侵、密碼學(xué)入侵、協(xié)作入侵等現(xiàn)象時(shí),人工智能技術(shù)通過(guò)機(jī)器學(xué)習(xí)算法深度優(yōu)化數(shù)據(jù)結(jié)構(gòu)類型、分析數(shù)據(jù)源信息、分析密碼資源信息,進(jìn)而通過(guò)海量數(shù)據(jù)庫(kù)信息分類檢測(cè)分析后,實(shí)現(xiàn)安全保護(hù)系統(tǒng)的構(gòu)建等,以降低網(wǎng)絡(luò)信息遺失率,保障計(jì)算機(jī)信息系統(tǒng)更加穩(wěn)定、安全、高效的運(yùn)行,同時(shí)協(xié)同優(yōu)質(zhì)算法分析實(shí)現(xiàn)信息安全。
本文選取KDDCUP99網(wǎng)絡(luò)數(shù)據(jù)集為安全算法對(duì)象,以人工智能及時(shí)性、高效性為技術(shù)基礎(chǔ),通過(guò)機(jī)器學(xué)習(xí)算法對(duì)計(jì)算機(jī)網(wǎng)絡(luò)數(shù)據(jù)集安全性、穩(wěn)定性、多樣性、靈敏性等測(cè)試分析。在網(wǎng)絡(luò)數(shù)據(jù)安全運(yùn)營(yíng)中,病毒入侵是數(shù)據(jù)損害的主要來(lái)源,而人工智能面對(duì)入侵損害,能及時(shí)協(xié)同機(jī)器學(xué)習(xí)算法提前進(jìn)行預(yù)估評(píng)判,相比較傳統(tǒng)數(shù)據(jù)安全算法,其工作效率、識(shí)別精度更為優(yōu)質(zhì);其次,在網(wǎng)絡(luò)安全管理中,人工智能技術(shù)協(xié)同機(jī)器學(xué)習(xí)算法對(duì)網(wǎng)絡(luò)系統(tǒng)信息進(jìn)行了解,進(jìn)而實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)不確定性信息可控,提升了數(shù)據(jù)安全性。
在網(wǎng)絡(luò)信息安全實(shí)際應(yīng)用中,網(wǎng)絡(luò)安全算法在人工智能的輔助下,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)數(shù)據(jù)安全的定期有效檢測(cè),同時(shí)利用算法卷積運(yùn)算能力,實(shí)現(xiàn)了在學(xué)習(xí)、數(shù)據(jù)處理過(guò)程等非線性方面解決問(wèn)題能力的快速提升。
網(wǎng)絡(luò)數(shù)據(jù)安全對(duì)維護(hù)網(wǎng)絡(luò)健康運(yùn)營(yíng)、用戶自身信息安全、生產(chǎn)工作等方面極為重要,為此,本文借助人工智能高效化、智能化、安全化等特征測(cè)試分析傳人工智能優(yōu)化后的機(jī)器學(xué)習(xí)算法流程變化及效率等級(jí)。
第一階段,依據(jù)機(jī)器算法特征,選取進(jìn)行測(cè)試和培訓(xùn)的網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行相關(guān)分析。首先進(jìn)行數(shù)據(jù)格式調(diào)整,統(tǒng)一變更格式類型為csv格式;其次,開(kāi)展數(shù)據(jù)處理過(guò)程,(1)進(jìn)行數(shù)據(jù)預(yù)處理分析,它將字符串值轉(zhuǎn)換為數(shù)值,以便所有記錄只包含數(shù)值,并將所有數(shù)據(jù)都轉(zhuǎn)換成相同格式進(jìn)行測(cè)試集和訓(xùn)練集分析;(2)數(shù)據(jù)標(biāo)簽分類。分別記錄數(shù)據(jù)類型兩個(gè)標(biāo)簽,即正?;蚬?。0表示正常,1表示攻擊,通過(guò)二進(jìn)制分類便于機(jī)器學(xué)習(xí)過(guò)程檢索分析。
第二階段,選取特征向量,根據(jù)入侵類型特征格式使用分類器對(duì)入侵進(jìn)行分類選取,選取的特征向量,符合所有總體中生成隨機(jī)總體。生成初始總體后,計(jì)算個(gè)體的計(jì)數(shù)函數(shù)和信息增益函數(shù)。通過(guò)特征信息數(shù)據(jù)的選取,優(yōu)化調(diào)節(jié)分析最佳總體,稱為帕累托前沿,帕累托前沿是必須選擇的最佳總體集。
第三階段,通過(guò)人工智能分類器對(duì)數(shù)據(jù)進(jìn)行分類。首先使用訓(xùn)練數(shù)據(jù)集訓(xùn)練人工智能,由于人工智能采用有監(jiān)督機(jī)器學(xué)習(xí),因此它比無(wú)監(jiān)督學(xué)習(xí)技術(shù)具有更高的準(zhǔn)確性。人工智能分析訓(xùn)練數(shù)據(jù)并識(shí)別模式,形成分類器推斷函數(shù)?;镜闹С窒蛄繖C(jī)研究一組輸入數(shù)據(jù),并為每個(gè)給定的輸入決定兩種可能的類別中的哪一種形成輸出,這使得它成為一個(gè)二元分類器。它在訓(xùn)練時(shí)使用核函數(shù)進(jìn)行映射,機(jī)器學(xué)習(xí)算法(SVM和FS-SVM算法)協(xié)同人工智能技術(shù)實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)信息安全分類。
本文依據(jù)人工智能技術(shù)特征,選取ConversionMatrix衡量網(wǎng)絡(luò)數(shù)據(jù)安全性能,并通過(guò)準(zhǔn)確度、精密度、召回率、FMEASURE等6方面進(jìn)行算法優(yōu)化調(diào)整后安全性能評(píng)估分析。
圖1為傳統(tǒng)算法與基于人工智能的機(jī)器學(xué)習(xí)方法分析數(shù)據(jù)準(zhǔn)確性示意結(jié)果。通過(guò)圖1可知,傳統(tǒng)Kmeans算法準(zhǔn)確性最低,為60.1%,優(yōu)化后機(jī)器學(xué)習(xí)方法FS-SVM算法準(zhǔn)確性最高,為84.03%,兩者算法精度相差23.93%,表明經(jīng)人工智能技術(shù)協(xié)同后機(jī)器學(xué)習(xí)算法對(duì)入侵式安全的檢測(cè)結(jié)果更優(yōu),適用性和安全性更為出色。
圖1 網(wǎng)絡(luò)數(shù)據(jù)傳統(tǒng)算法和機(jī)器學(xué)習(xí)算法間精度分析
精度是用于網(wǎng)絡(luò)安全性能比較的另一個(gè)重要參數(shù),其精度變化表明正確預(yù)測(cè)的攻擊與總預(yù)測(cè)攻擊的比率。比較分析后,SVM模型和FS-SVM算法精度值分別為98.02%和97.98%,顯著優(yōu)于傳統(tǒng)算法精度。
TPR指標(biāo)示分析預(yù)測(cè)的攻擊觀察值與實(shí)際攻擊等級(jí)中所有觀察值比率變化的重要指標(biāo),通過(guò)圖2可知,機(jī)器學(xué)習(xí)FS-SVM算法精度值最高(78.89%),與傳統(tǒng)方法相比,該方法具有較高的查全率,同時(shí)高召回率結(jié)果表明在網(wǎng)絡(luò)數(shù)據(jù)安全分析預(yù)測(cè)中,以對(duì)最相關(guān)數(shù)據(jù)進(jìn)行了選取。
TNR參數(shù)是正確的正常預(yù)測(cè)與正常觀測(cè)總數(shù)比率的指標(biāo)。通過(guò)圖2可知,相較于傳統(tǒng)方法,人工智能模式下的機(jī)器學(xué)習(xí)算法真陰性率高達(dá)96.16%,相較于其余指標(biāo)結(jié)果更為出色,表明提出的模式也比傳統(tǒng)檢測(cè)到更多的正常數(shù)據(jù)。
F測(cè)量指標(biāo)用于測(cè)量分類器的有效性,同時(shí)該指標(biāo)明確精確性和召回率指標(biāo)加權(quán)平均值,F(xiàn)測(cè)量也稱為傳統(tǒng)測(cè)量或平衡Fscore。它不僅考慮了假陽(yáng)性和假陰性,而且提升了篩選類型,提升了數(shù)據(jù)安全性能。結(jié)果表明,該方法比傳統(tǒng)方法具有更高的故障檢測(cè)率,故障檢測(cè)率為87.41%,在入侵檢測(cè)評(píng)估參數(shù)的各個(gè)方面都有較好的性能。
圖2 傳統(tǒng)方法與改進(jìn)后方法比較示意圖
本文以人工智能特征開(kāi)展互聯(lián)網(wǎng)信息安全優(yōu)化算法研究,通過(guò)對(duì)人工智能技術(shù)的數(shù)據(jù)安全算法設(shè)計(jì)分析、數(shù)據(jù)集算法優(yōu)化分析和優(yōu)化調(diào)整后,通過(guò)Spark工具對(duì)傳統(tǒng)算法與人工智能技術(shù)的機(jī)器學(xué)習(xí)算法進(jìn)行5項(xiàng)關(guān)鍵要素分析,并得到以下相關(guān)結(jié)論:(1)Spark工具進(jìn)行大數(shù)據(jù)入侵檢測(cè)時(shí),具有優(yōu)化特征選擇的支持向量機(jī)比傳統(tǒng)更適合于大數(shù)據(jù)入侵檢測(cè);(2)與傳統(tǒng)相比,準(zhǔn)確度、查全率、召回率、TN和fmeasure等所有評(píng)估參數(shù)都顯示出更好的結(jié)果;(3)與傳統(tǒng)相比,優(yōu)化的基于人工智能的機(jī)器學(xué)習(xí)算法所需的執(zhí)行時(shí)間更少,能有效實(shí)現(xiàn)數(shù)據(jù)分類管理、防止病毒入侵等,準(zhǔn)確地將數(shù)據(jù)分類為攻擊或正常。
[1]閆衛(wèi)剛.基于人工智能的互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)安全優(yōu)化算法研究[J].物聯(lián)網(wǎng)技術(shù),2021,11(08):96-99+102.
[2]柴夢(mèng)竹.人工智能技術(shù)在大數(shù)據(jù)網(wǎng)絡(luò)安全防御中的應(yīng)用[J].計(jì)算機(jī)與網(wǎng)絡(luò),2021,47(15):44-45.
[3]姜濤.人工智能數(shù)據(jù)安全風(fēng)險(xiǎn)和有效治理措施[J].法制博覽,2021(22):155-156.
[4]黃灼.人工智能在計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)中的應(yīng)用[J].中國(guó)新通信,2020,22(15):98.