關(guān)鍵詞:卷積神經(jīng)算法;直覺模糊時(shí)間序列;電力物聯(lián)網(wǎng);視頻終端;異常流量
中圖分類號(hào):TM711;TP27412 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1001-5922(2024)12-0142-04
電力物聯(lián)網(wǎng)視頻終端特殊的信息感知和傳輸方式,使得視頻信息極易被盜、轉(zhuǎn)賣,傳統(tǒng)的安全措施已不能滿足電力物聯(lián)網(wǎng)的安全防護(hù)要求[1]。且視頻終端異常流量攻擊通過單個(gè)計(jì)算節(jié)點(diǎn)向服務(wù)器或網(wǎng)絡(luò)發(fā)起大量異常流量,導(dǎo)致物聯(lián)網(wǎng)視頻終端性能下降甚至癱瘓[2]。傳統(tǒng)的異常流量檢測(cè)方法從交換板流表中提取流量特征,然后實(shí)現(xiàn)異常流量的特征檢測(cè)[3]。為了有效檢測(cè)異常流量,許多學(xué)者研究將機(jī)器學(xué)習(xí)方法引入到異常流量檢測(cè)中。如在無監(jiān)督特征學(xué)習(xí)的基礎(chǔ)上,提出了一種非對(duì)稱深度自編碼器檢測(cè)異常流量[4]。提出了利用混合卷積神經(jīng)算法來實(shí)現(xiàn)異常數(shù)據(jù)入侵檢測(cè),并利用傳播神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)分類檢測(cè)[5]。提出了基于卷積神經(jīng)網(wǎng)絡(luò)的跨層聚集網(wǎng)絡(luò)模型,并將改進(jìn)的卷積神經(jīng)算法應(yīng)用于異常流量數(shù)據(jù)檢測(cè)框架中,進(jìn)一步提高檢測(cè)的精度[6]。利用間類和內(nèi)部異同,提出一種基于改進(jìn)的卷積神經(jīng)異常流量檢測(cè)算法,以減少檢測(cè)系統(tǒng)的錯(cuò)誤陽性率[7]。上述卷積神經(jīng)方法在處理異常流量數(shù)據(jù)檢測(cè)方面表現(xiàn)良好,但在效率上存在問題,無法解決異常流量數(shù)據(jù)的多維屬性熵識(shí)別[8]。針對(duì)電力物聯(lián)網(wǎng)視頻終端流量中蘊(yùn)含的大量不確定信息和消息,將利用直覺模糊時(shí)間序列模型改進(jìn)分析的網(wǎng)絡(luò)流量預(yù)測(cè)模型,準(zhǔn)確表達(dá)網(wǎng)絡(luò)流量的模糊性和不確定性特征。
1基于改進(jìn)的卷積神經(jīng)算法
1.1卷積神經(jīng)算法
卷積神經(jīng)算法作為半元神經(jīng)網(wǎng)絡(luò),在數(shù)據(jù)流特征抽象的機(jī)器學(xué)習(xí)中有較好的效果,且具有良好的特征學(xué)習(xí)能力,是近年來入侵檢測(cè)領(lǐng)域應(yīng)用研究的熱點(diǎn)。卷積神經(jīng)算法由2個(gè)部分組成:卷積層和池層[9]。卷積層的特點(diǎn)是通過卷積操作提取原始數(shù)據(jù)的數(shù)據(jù)特征。相對(duì)而言,池層更關(guān)注原始數(shù)據(jù)本身而非其特性,保留了原始數(shù)據(jù)的主要特征,減小了高維度數(shù)據(jù)空間的尺寸[10]。卷積神經(jīng)算法的核心思想是提取數(shù)據(jù)特征,因此應(yīng)用在電力物聯(lián)網(wǎng)視頻終端中,可以提高異常數(shù)據(jù)流量檢測(cè)的檢測(cè)效率[11]。將數(shù)據(jù)集經(jīng)過多個(gè)卷積層和池層后,經(jīng)過完全連接層的處理,最后對(duì)電力物聯(lián)網(wǎng)視頻終端異常流量進(jìn)行分類,獲得異常流量檢測(cè)的分類結(jié)果。而由于視頻終端流量數(shù)據(jù)較大,卷積層和池層處理數(shù)據(jù)的效率會(huì)降低,因此需要對(duì)卷積神經(jīng)算法改進(jìn),進(jìn)一步提高異常流量識(shí)別效率。
1.3改進(jìn)卷積神經(jīng)算法
將直覺模糊時(shí)間序列模型與卷積神經(jīng)算法相結(jié)合,進(jìn)一步提高提高卷積神經(jīng)算法的異常流量檢測(cè)效率,基于改進(jìn)卷積神經(jīng)算法的視頻終端流量異常檢測(cè)模型的基本思想是分別針對(duì)源和目的IP地址、源和目的端口以及分組長(zhǎng)度屬性的信息熵值,建立具有可變排序啟發(fā)式的直覺模糊時(shí)間序列預(yù)測(cè)模型。這5個(gè)屬性從物聯(lián)網(wǎng)視頻終端流量數(shù)據(jù)中提取出來,在時(shí)間維度中有5個(gè)平行熵直覺模糊時(shí)間序列[13]。在時(shí)間維中得到一個(gè)直覺模糊時(shí)間序列。在任意時(shí)間t,構(gòu)造空間維度上的5頂點(diǎn)完全圖,其5個(gè)頂點(diǎn)代表5個(gè)直覺模糊時(shí)間序列值,每個(gè)邊緣代表其2個(gè)頂點(diǎn)所代表的直覺模糊時(shí)間序列值變化的相似性。在時(shí)間t+1內(nèi),可根據(jù)5個(gè)直覺模糊時(shí)間序列的預(yù)測(cè)值構(gòu)造完整的預(yù)測(cè)圖,并可利用實(shí)際測(cè)量視頻終端數(shù)據(jù)構(gòu)造完整的實(shí)際圖。根據(jù)歷史時(shí)間序列圖的特點(diǎn),對(duì)這2個(gè)完整的圖進(jìn)行挖掘和分析[14]。利用異常向量表示結(jié)果的挖掘,分析異常向量間的距離,可以確定電力物聯(lián)網(wǎng)視頻終端流量是否在時(shí)間上異常。
1.3.3異常判定標(biāo)準(zhǔn)
在正常電力物聯(lián)網(wǎng)視頻終端運(yùn)行情況下,5種電力物聯(lián)網(wǎng)視頻終端流量屬性的信息熵相對(duì)穩(wěn)定,通過挖掘可以得到的頻繁子圖較少。在這些有限的頻繁子圖中,雙頂點(diǎn)子圖最為常見,3頂點(diǎn)子圖次之,4頂點(diǎn)和5頂點(diǎn)子圖幾乎不存在。然而,當(dāng)視頻終端流量異常時(shí),頻繁出現(xiàn)的子圖的數(shù)量會(huì)顯著增加。其中,3、4、5頂點(diǎn)子圖數(shù)量的變化最為明顯。這是因?yàn)楫?dāng)異常情況發(fā)生時(shí),多個(gè)屬性的熵值往往同時(shí)大幅增加或減少,而式(7)定義的子圖的支持度反映了各頂點(diǎn)熵值在同一時(shí)間的大振幅變化的相似性。
2實(shí)驗(yàn)結(jié)果與分析
2.1異常流量數(shù)據(jù)F1測(cè)量值誤差分布
本文實(shí)驗(yàn)環(huán)境為Windows操作系統(tǒng),實(shí)驗(yàn)所用計(jì)算機(jī)配置為16G內(nèi)存、1T硬盤。通過研究F1值,可以進(jìn)一步研究改進(jìn)卷積神經(jīng)算法的檢測(cè)性能,且F1值越接近1,檢測(cè)效果越好,可以滿足異常流量檢測(cè)的分類和識(shí)別要求。F1測(cè)量值誤差分布如圖1所示。
由圖1可知,當(dāng)電力物聯(lián)網(wǎng)視頻終端數(shù)據(jù)包規(guī)模較小時(shí),改進(jìn)卷積神經(jīng)算法對(duì)異常流量數(shù)據(jù)檢測(cè)精度的影響較大,F(xiàn)1值遠(yuǎn)離1且分布不均勻。而隨著終端數(shù)據(jù)包規(guī)模逐漸增大時(shí),F(xiàn)1值接近1,且可以觀察到F1值相對(duì)分布均勻。數(shù)據(jù)包規(guī)模在23時(shí)突然增大,通過檢查原始數(shù)據(jù)集發(fā)現(xiàn),在突然增大點(diǎn)附近幾天的視頻終端出現(xiàn)異常,因此會(huì)誘使F1值突然增大。
2.2模型準(zhǔn)確度分析
圖2為卷積神經(jīng)算法和本文所提出的改進(jìn)卷積神經(jīng)算法的混淆矩陣。其中,y軸為真實(shí)標(biāo)簽,x軸為預(yù)測(cè)標(biāo)簽。
由圖2可知,在改進(jìn)卷積神經(jīng)算法中,97%的正常流量被正確分類,優(yōu)于卷積神經(jīng)算法。而在卷積神經(jīng)算法中,所有異常數(shù)據(jù)流量都被錯(cuò)誤分類,其中86%被預(yù)測(cè)為正常,13%被預(yù)測(cè)為入侵?jǐn)?shù)據(jù)流量。在改進(jìn)卷積神經(jīng)算法中,14%的視頻終端流量被正確分類,83%被預(yù)測(cè)為正常,5%被預(yù)測(cè)為入侵?jǐn)?shù)據(jù)流量。且數(shù)量較少的異常流量,在卷積神經(jīng)算法和改進(jìn)卷積神經(jīng)算法中全部被錯(cuò)誤分類。此外,在卷積神經(jīng)算法中,75%的異常流量被正確分類,64%的異常流量被正確分類。在改進(jìn)卷積神經(jīng)算法中,82%的異常流量被正確分類。在檢測(cè)上述數(shù)據(jù)中的正常流量方面,改進(jìn)卷積神經(jīng)算法模型的性能優(yōu)于卷積神經(jīng)算法,在檢測(cè)異常流量方面表現(xiàn)出色。而由于異常流量樣本數(shù)量較少,尤其是異常流量占整個(gè)流量樣本的0.04%,且傳統(tǒng)的卷積神經(jīng)算法很容易聚類到數(shù)量最多的正常流量中,在檢測(cè)異常流量時(shí)出現(xiàn)誤差。綜上,改進(jìn)卷積神經(jīng)算法的性能優(yōu)于傳統(tǒng)卷積神經(jīng)算法。
2.3卷神經(jīng)算法性能
將基于改進(jìn)卷積神經(jīng)算法的異常視頻終端流量檢測(cè)模型與卷積神經(jīng)算法模型進(jìn)行比較,并進(jìn)一步研究準(zhǔn)確率、假陽率(FPR)和丟包率(RTP)等性能。準(zhǔn)確率表示檢測(cè)模型正確分類正常和異常流量的能力。FPR為被誤判異常流量占總正常流量的百分比。RTP表示異常流量報(bào)警模型過濾的文件,與流量負(fù)載有關(guān)。tsum是檢測(cè)模型處理視頻終端文件的總耗時(shí),tmean是平均耗時(shí);Nd是用于測(cè)試的視頻終端文件數(shù)量。
表1分別顯示了卷積神經(jīng)算法和基于改進(jìn)卷積神經(jīng)算法的異常流量檢測(cè)結(jié)果。
由表1可知,卷積神經(jīng)算法的準(zhǔn)確率約為79.02%,改進(jìn)卷積神經(jīng)算法的準(zhǔn)確率約為95.48%。改進(jìn)卷積神經(jīng)算法的FPR比卷積神經(jīng)算法低78.45%,主要因?yàn)榫矸e神經(jīng)算法的卷積層預(yù)測(cè)誤差的積累會(huì)降低準(zhǔn)確度,增加FPR。而改進(jìn)卷積神經(jīng)算法的平均耗時(shí)少于卷積神經(jīng)算法。因此,改進(jìn)卷積神經(jīng)算法實(shí)現(xiàn)了更高的精度、更低的FPR和更短的檢測(cè)時(shí)間。此外,由于卷積神經(jīng)算法結(jié)構(gòu)復(fù)雜,必須部署在電力物聯(lián)網(wǎng)視頻終端控制中心,因此需要將所有數(shù)據(jù)包上傳到電力物聯(lián)網(wǎng)視頻終端控制中心進(jìn)行分析。卷積神經(jīng)算法的RTP為0,進(jìn)一步導(dǎo)致異常流量檢測(cè)負(fù)荷加大。相比之下,本文所提出的改進(jìn)卷積神經(jīng)算法檢測(cè)結(jié)構(gòu)可以減少84964個(gè)傳輸?shù)皆贫说臄?shù)據(jù)包,可以降低異常流量檢測(cè)負(fù)荷。
3結(jié)語
本文通過對(duì)改進(jìn)卷積神經(jīng)算法,將直觀模糊時(shí)間序列與卷積神經(jīng)算法相結(jié)合進(jìn)行子圖挖掘,建立基于卷積神經(jīng)算法的異常向量,實(shí)現(xiàn)電力物聯(lián)網(wǎng)視頻終端的自適應(yīng)確定,并將改進(jìn)卷積神經(jīng)算法與卷積神經(jīng)算法進(jìn)行比較。結(jié)果表明,改進(jìn)后卷積神經(jīng)算法能夠有效、高效地檢測(cè)電力物聯(lián)網(wǎng)異常流量。改進(jìn)卷積神經(jīng)算法的準(zhǔn)確率約為95.48%。且改進(jìn)卷積神經(jīng)算法的FPR比卷積神經(jīng)算法低78.45%。