徐胤博,于 洋
(天津師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,天津 300100)
在艦船通信網(wǎng)絡(luò)中,異常數(shù)據(jù)來(lái)源于各種因素,如電磁干擾、多徑傳播、設(shè)備故障、多用戶干擾、惡劣天氣等[1,2]。異常數(shù)據(jù)會(huì)導(dǎo)致通信系統(tǒng)的性能下降,增加通信延遲,甚至引發(fā)通信故障[3]。因此,及時(shí)準(zhǔn)確地檢測(cè)和識(shí)別異常數(shù)據(jù)對(duì)于保障艦船通信網(wǎng)絡(luò)的正常運(yùn)行至關(guān)重要。
目前已有很多學(xué)者研究艦船通信網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)方法,如孫文慧等[4]提出高維空間聚類的數(shù)據(jù)異常檢測(cè)方法,但該方法沒(méi)有對(duì)艦船通信通信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行處理,導(dǎo)致其最終檢測(cè)效果不佳。馬莉莉等[5]提出光纖通信網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)方法,但該方法沒(méi)有考慮干擾因素,致使該方法應(yīng)用效果不佳。
為了解決上述問(wèn)題,提出基于K-means 聚類的艦船通信網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)方法。結(jié)合艦船通信網(wǎng)絡(luò)通信多徑信道模型,應(yīng)用超窄帶濾波處理方法,通過(guò)去除艦船通信網(wǎng)絡(luò)數(shù)據(jù)中的干擾噪聲,提高信號(hào)質(zhì)量和可靠性。使用K-means 聚類算法進(jìn)行異常數(shù)據(jù)檢測(cè),可以自動(dòng)發(fā)現(xiàn)異常數(shù)據(jù),為提升艦船通信網(wǎng)絡(luò)傳輸提供基礎(chǔ)。
在艦船通信網(wǎng)絡(luò)中,多徑傳播是常見(jiàn)現(xiàn)象,會(huì)導(dǎo)致信號(hào)衰落、頻偏等問(wèn)題[6]。構(gòu)建艦船通信網(wǎng)絡(luò)通信多徑信道模型,利用該模型獲取艦船通信網(wǎng)絡(luò)數(shù)據(jù),能夠更準(zhǔn)確地反映實(shí)際通信環(huán)境下的數(shù)據(jù)特征。
結(jié)合艦船通信網(wǎng)絡(luò)帶寬分層結(jié)構(gòu),依據(jù)數(shù)據(jù)傳輸調(diào)度負(fù)載區(qū)域,設(shè)計(jì)艦船通信網(wǎng)絡(luò)數(shù)據(jù)交互中心結(jié)構(gòu),再依據(jù)該數(shù)據(jù)交互中心結(jié)構(gòu)建立其通信信道模型,獲取艦船通信網(wǎng)絡(luò)傳輸數(shù)據(jù)。
艦船通信網(wǎng)絡(luò)節(jié)點(diǎn)由N=2P個(gè)陣元組成,該陣元組成波特間隔均衡的陣列,數(shù)據(jù)傳輸節(jié)點(diǎn)陣元分布的徑向距離用d表示,則艦船通信網(wǎng)絡(luò)數(shù)據(jù)傳輸調(diào)度接收的數(shù)據(jù)幀表達(dá)公式為:
式中:Gi(t) 為 貫序處理后接收數(shù)據(jù)第i個(gè)相位偏轉(zhuǎn)信息;xm(t) 為第m個(gè)數(shù)據(jù)傳輸節(jié)點(diǎn)真元接收的數(shù)據(jù)幀;θi(t) 為艦船通信數(shù)據(jù)在信道內(nèi)的掃頻帶寬;j為虛數(shù);t為時(shí)刻;nm(t)為 信道內(nèi)數(shù)據(jù)傳輸節(jié)點(diǎn)數(shù)量;I為相位偏轉(zhuǎn)信息總數(shù)。
艦船通信網(wǎng)絡(luò)數(shù)據(jù)傳輸時(shí)的信道沖擊響應(yīng)公式為:
式中:e為自然對(duì)數(shù)函數(shù);Ts為 偏轉(zhuǎn)信息s為的數(shù)據(jù)幀長(zhǎng)度;ai(t)為 第i個(gè) 載頻數(shù)據(jù);v為信道內(nèi)數(shù)據(jù)傳輸節(jié)點(diǎn)的運(yùn)動(dòng)速度。
使用訓(xùn)練序列方法對(duì)式(2)結(jié)果進(jìn)行估計(jì),可得到短時(shí)間內(nèi)的信道沖擊響應(yīng)[7],使用離散化二自由度系統(tǒng)建立艦船通信網(wǎng)絡(luò)信道模型,其公式為:
式中:X(n)為 艦船通信網(wǎng)絡(luò)通信數(shù)據(jù); τn(t)為 第n個(gè)艦船通信網(wǎng)絡(luò)信道傳輸時(shí)延;fc為信道中心頻率。
至此艦船通信網(wǎng)絡(luò)信道模型構(gòu)建完畢,利用式(3)即可得到艦船通信網(wǎng)絡(luò)通信數(shù)據(jù)。
利用超窄帶濾波方式對(duì)艦船通信網(wǎng)絡(luò)數(shù)據(jù)信息濾波處理,去除數(shù)據(jù)內(nèi)存在的干擾噪聲,并將該數(shù)據(jù)的環(huán)境熱噪聲看作白噪聲數(shù)據(jù),公式為:
式中:B(n)為艦船通信網(wǎng)絡(luò)通信數(shù)據(jù)超窄帶干擾;O′(n) 為白噪聲數(shù)據(jù);O(n) 為環(huán)境熱噪聲;n為艦船通信網(wǎng)絡(luò)數(shù)據(jù)數(shù)量;S(n)為寬頻帶艦船通信網(wǎng)絡(luò)通信數(shù)據(jù)。
當(dāng)艦船通信網(wǎng)絡(luò)通信數(shù)據(jù)內(nèi)存在M個(gè)距離采樣,任意距離采樣值用x表示,并使用L表示艦船通信網(wǎng)絡(luò)通信數(shù)據(jù)定長(zhǎng),則利用矩陣X描述艦船通信網(wǎng)絡(luò)通信數(shù)據(jù),該矩陣維數(shù)為L(zhǎng)(M-L+1),該矩陣表達(dá)式為:
在艦船通信網(wǎng)絡(luò)通信數(shù)據(jù)矩陣內(nèi),數(shù)據(jù)定長(zhǎng)L過(guò)大或者過(guò)小均會(huì)造成通信數(shù)據(jù)特征分解不完全[8],噪聲濾除效果不佳。數(shù)據(jù)定長(zhǎng)取值滿足條件如下:
依據(jù)公式(8)選擇合適的數(shù)據(jù)定長(zhǎng)L后,建立艦船通信數(shù)據(jù)超窄帶特征矩陣R?, 再對(duì)R?進(jìn)行特征分解處理得到超窄帶濾波干擾子空間,表達(dá)公式為:
式中: Ω為超窄帶濾波干擾子空間;l∈L;Ui為超窄帶濾波干擾子空間內(nèi)元素;span為擴(kuò)張空間。
艦船通信網(wǎng)絡(luò)數(shù)據(jù)超窄帶干擾是數(shù)據(jù)矩陣X內(nèi)每個(gè)矢量Xk向 空間 Ω 投影的分量 Ωk,該分量計(jì)算公式為:
以式(8)和式(9)為基礎(chǔ),經(jīng)過(guò)超窄帶濾波后的艦船通信網(wǎng)絡(luò)數(shù)據(jù)X?k表達(dá)式為:
經(jīng)過(guò)上述步驟,完成艦船艦船通信網(wǎng)絡(luò)數(shù)據(jù)濾波處理,為通信網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)提供高質(zhì)量的數(shù)據(jù)。
將經(jīng)過(guò)濾波處理后的艦船通信網(wǎng)絡(luò)數(shù)據(jù)X?k作為輸入,使用K-means 聚類算法檢測(cè)艦船通信網(wǎng)絡(luò)數(shù)據(jù)內(nèi)的異常數(shù)據(jù)。
令艦船通信網(wǎng)絡(luò)數(shù)據(jù)總數(shù)為n個(gè),在艦船通信網(wǎng)絡(luò)數(shù)據(jù)找到k個(gè)中心,使艦船通信網(wǎng)絡(luò)數(shù)據(jù)點(diǎn)與其最近中心點(diǎn)的距離平方和數(shù)值最小,則數(shù)據(jù)點(diǎn)距離表達(dá)式為:
式中:Wn為 艦船通信網(wǎng)絡(luò)數(shù)據(jù)點(diǎn)距離;xi為第i個(gè)數(shù)據(jù)中心點(diǎn);zi為 第j個(gè)數(shù)據(jù)中心點(diǎn)。
檢測(cè)異常艦船通信網(wǎng)絡(luò)數(shù)據(jù)步驟為:
步驟1 從n個(gè)艦船通信網(wǎng)絡(luò)數(shù)據(jù)內(nèi)選擇k個(gè)數(shù)據(jù)作為類簇中心。
步驟2 計(jì)算剩余數(shù)據(jù)到k個(gè)聚類中心的歐式距離,其表達(dá)式為:
式 中:F(x,ci)為 剩余艦船數(shù)據(jù)x到 第i個(gè) 聚類中心ci的 歐式距離。
步驟3 依據(jù)式(13)結(jié)果重新計(jì)算k個(gè)簇中心,并有簇內(nèi)所有艦船通信網(wǎng)絡(luò)數(shù)據(jù)維度計(jì)算數(shù)據(jù)平均數(shù),依據(jù)該平均數(shù)重新選擇數(shù)據(jù)中心點(diǎn)。
步驟4 以新選擇的艦船通信網(wǎng)絡(luò)數(shù)據(jù)中心點(diǎn)再次聚類,并重復(fù)該過(guò)程直到聚類結(jié)果不再發(fā)生變化為止。
步驟5 計(jì)算聚類結(jié)果馬氏距離,用于判斷聚類結(jié)果是否為艦船通信網(wǎng)絡(luò)異常數(shù)據(jù)。將K-means 第一次聚類結(jié)果作為輸入,利用馬氏距離計(jì)算艦船通信網(wǎng)絡(luò)數(shù)據(jù)集的聚類中心點(diǎn)c后,再分別計(jì)算簇到該中心點(diǎn)的距離,表達(dá)式為:
式中:Fi為第i個(gè)簇到中心點(diǎn)的馬氏距離;dist(rj,c)為數(shù)據(jù)點(diǎn)rj到中心點(diǎn)的距離;ni為 第i個(gè)簇內(nèi)含有的艦船通信網(wǎng)絡(luò)數(shù)據(jù)個(gè)數(shù)。
設(shè)置數(shù)據(jù)距離閾值 ?,當(dāng)式(14)結(jié)果大于距離閾值 ?時(shí),則說(shuō)明該聚類簇內(nèi)的艦船通信網(wǎng)絡(luò)數(shù)據(jù)為異常數(shù)據(jù),完成艦船通信網(wǎng)絡(luò)數(shù)據(jù)異常檢測(cè)。
使用Matlab 對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和濾波處理,通過(guò)scikit-learn 和Matlab 應(yīng)用K-means 聚類算法,對(duì)輸入數(shù)據(jù)進(jìn)行聚類分析,檢測(cè)艦船通信網(wǎng)絡(luò)中的異常數(shù)據(jù),以驗(yàn)證本文方法的應(yīng)用效果。
采集艦船通信網(wǎng)絡(luò)數(shù)據(jù)是實(shí)現(xiàn)異常數(shù)據(jù)檢測(cè)的基礎(chǔ),使用本文方法采集該艦船在某一時(shí)段內(nèi)的通信數(shù)據(jù),采集結(jié)果如表1 所示。
表1 艦船通信網(wǎng)絡(luò)數(shù)據(jù)采集結(jié)果(GHz)Tab.1 Data collection results of ship communicationnetwork (GHz)
分析可知,應(yīng)用本文方法采集該艦船通信網(wǎng)絡(luò)數(shù)據(jù),采集結(jié)果與實(shí)際結(jié)果最大差值僅為0.003 GHz。這是因?yàn)槌瓗V波技術(shù)用于處理采集到的數(shù)據(jù),去除干擾噪聲,并將數(shù)據(jù)轉(zhuǎn)化為矩陣形式,有助于提高數(shù)據(jù)的質(zhì)量和準(zhǔn)確性,使得采集到的數(shù)據(jù)更接近實(shí)際結(jié)果。因此,本文方法可有效采集艦船通信網(wǎng)絡(luò)信道在通信狀態(tài)下的數(shù)據(jù),為后續(xù)檢測(cè)該通信網(wǎng)絡(luò)異常數(shù)據(jù)打下良好的基礎(chǔ)。
以一組艦船通信網(wǎng)絡(luò)數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象,使用本文方法對(duì)其進(jìn)行濾波處理,去除其內(nèi)部含有的噪聲,結(jié)果如圖1 所示。
圖1 艦船通信網(wǎng)絡(luò)數(shù)據(jù)去噪結(jié)果Fig.1 Data denoising results of ship communication network
分析可知,艦船通信網(wǎng)絡(luò)數(shù)據(jù)內(nèi)存在干擾噪聲,導(dǎo)致數(shù)據(jù)幅值波動(dòng)區(qū)間擴(kuò)大,未去噪處理的艦船通信網(wǎng)絡(luò)數(shù)據(jù)幅值波動(dòng)區(qū)間為5~35 db,而使用本文方法對(duì)該艦船通信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行去噪后,其幅值僅在20 db左右波動(dòng)。這是因?yàn)槌瓗V波處理方法可以針對(duì)特定的頻率范圍進(jìn)行濾波操作,將干擾噪聲濾除,從而得到干凈的艦船通信網(wǎng)絡(luò)數(shù)據(jù)。因此,本文方法可以有效去除艦船通信網(wǎng)絡(luò)數(shù)據(jù)內(nèi)存在的干擾噪聲。
以200 條艦船通信網(wǎng)絡(luò)數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象,該200 條艦船通信網(wǎng)絡(luò)數(shù)據(jù)內(nèi)存有9 個(gè)異常數(shù)據(jù),使用本文方法對(duì)該200 條數(shù)據(jù)進(jìn)行異常數(shù)據(jù)檢測(cè),數(shù)據(jù)分布與異常數(shù)據(jù)檢測(cè)結(jié)果如圖2 所示。
圖2 艦船通信網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)結(jié)果Fig.2 Abnormal data detection results of ship communication network
分析可知,該200 條艦船通信網(wǎng)絡(luò)數(shù)據(jù)內(nèi)的正常數(shù)據(jù)點(diǎn)和異常數(shù)據(jù)點(diǎn)混合分布,數(shù)據(jù)點(diǎn)之間分布較為密集。使用本文方法對(duì)該200 條艦船通信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行異常檢測(cè)后,可將艦船通信網(wǎng)絡(luò)內(nèi)的正常數(shù)據(jù)和異常數(shù)據(jù)聚類,使相同類的艦船通信網(wǎng)絡(luò)數(shù)據(jù)分布較為密集,而不同類的艦船通信網(wǎng)絡(luò)數(shù)據(jù)類簇分布較遠(yuǎn)。這是因?yàn)槭褂肒-means 聚類算法對(duì)輸入數(shù)據(jù)進(jìn)行聚類分析,將數(shù)據(jù)樣本分為不同的簇,其中可能包含異常數(shù)據(jù)。通過(guò)聚類算法的輸出結(jié)果,將正常數(shù)據(jù)點(diǎn)和異常數(shù)據(jù)點(diǎn)分別歸類到不同的簇中,從而實(shí)現(xiàn)對(duì)艦船通信網(wǎng)絡(luò)異常數(shù)據(jù)的檢測(cè)。在異常類簇內(nèi)存在9 個(gè)艦船通信數(shù)據(jù),說(shuō)明本文方法可有效檢測(cè)艦船通信網(wǎng)絡(luò)異常數(shù)據(jù),具備較好的應(yīng)用效果。
1)經(jīng)過(guò)濾波處理后的艦船通信網(wǎng)絡(luò)數(shù)據(jù)與實(shí)際結(jié)果之間的差值較小,證明了本文方法在采集艦船通信網(wǎng)絡(luò)數(shù)據(jù)時(shí)具有較好的效果。
2)能夠有效地檢測(cè)到艦船通信網(wǎng)絡(luò)中的異常數(shù)據(jù)。通過(guò)聚類算法的應(yīng)用,將正常數(shù)據(jù)點(diǎn)和異常數(shù)據(jù)點(diǎn)分別聚類到不同的簇中,從而實(shí)現(xiàn)了對(duì)艦船通信網(wǎng)絡(luò)異常數(shù)據(jù)的有效檢測(cè)。
3)能夠?qū)⒄?shù)據(jù)和異常數(shù)據(jù)區(qū)分開(kāi)來(lái),使得相同類的艦船通信網(wǎng)絡(luò)數(shù)據(jù)分布較為密集,而不同類的艦船通信網(wǎng)絡(luò)數(shù)據(jù)類簇分布較遠(yuǎn)。證明了本文方法異常數(shù)據(jù)檢測(cè)的準(zhǔn)確性。