王朝衛(wèi)
(青海省廣播電視局 青海中波臺管理中心, 青海 西寧 810001)
非法廣播俗稱“黑廣播”,不僅形式多樣,而且占用頻率,在缺少有效的信號識別技術(shù)的情況下,非法組織者采取改變發(fā)射位置或者頻繁切換頻率的手段來躲避追索,這給無線電行業(yè)的有序發(fā)展造成嚴(yán)重危害[1]。這種危害的表征,具體體現(xiàn)在以下幾點(diǎn):其一,非法廣播信號具有欺騙性,嚴(yán)重?cái)_亂公共秩序;其二,選用低劣的違法發(fā)射機(jī)對外發(fā)射無線信號,會(huì)對正常通信信號造成干擾。針對于此,必須引用先進(jìn)的信號識別技術(shù)對非法廣播信號進(jìn)行識別和追蹤,從而遏制非法廣播的肆意發(fā)展,達(dá)到無線電行業(yè)擁有正常秩序的目的。雖我國對識別非法廣播信號的文獻(xiàn)較少,但研究成果頗為豐富,已形成了一套完整的識別體系。。如杜利敏(2014)[2]利用聚類算法與ReliefF算法相結(jié)合的方法對無線點(diǎn)信號的特征進(jìn)行提取;張自豪(2015)[3]為了對地空通信信號進(jìn)行識別,運(yùn)用結(jié)合了聚類算法與SVM算法的識別方法,這一策略不僅能夠達(dá)到信號識別的效果,而且可以有效規(guī)避外部信號的干擾;杜利敏(2017)[4]、Xuezhi He(2018)[5]、何學(xué)智(2018)[6]等學(xué)者在模式識別領(lǐng)域引入深度學(xué)習(xí)算法,實(shí)現(xiàn)了對各種無線電信號特征的準(zhǔn)確提??;孫潔(2018)[7]構(gòu)建了以狼群搜索算法為基礎(chǔ)的信號特征識別方法,相較于傳統(tǒng)算法表現(xiàn)出更高地識別率。同時(shí)研究發(fā)現(xiàn)在中頻測量數(shù)據(jù)中包含許多的孤立點(diǎn)及噪聲,使得對中頻信號的分類識別變得復(fù)雜,如采用傳統(tǒng)的單一SVM進(jìn)行分類識別,難以達(dá)成理想效果。因此本研究嘗試在進(jìn)行SVM分類識別前,結(jié)合中頻信號數(shù)據(jù)的多維特征,引入改進(jìn)密度聚類對數(shù)據(jù)進(jìn)行處理,以減少數(shù)據(jù)的維度。最后利用SVM算法對無線電信號進(jìn)行識別并分類,為識別非法廣播信號提供了新途徑。
假設(shè)SVM分類器的訓(xùn)練樣本為{(xi,yi)},i=1,2,…,N,xi∈Rd式子中的xi含有d個(gè)不相同的特征,yi={-1,+1},將非松弛變量ξi引入公式,i=1,2,…,N。為了實(shí)現(xiàn)不同類型樣本的分離來達(dá)到分類的效果,需要通過尋找最優(yōu)超平面來實(shí)現(xiàn),具體數(shù)學(xué)描述[8-12],如式(1)、式(2)。
(1)
s.t.yi=(ωTxi+b)≥1-ξi,i=1,2,…,N
(2)
式中,C指的是懲罰因子,它可以平衡分類邊界大小。
(3)
運(yùn)用K(Xi,Yi)將核函數(shù)的樣本映射到高維空間,從而實(shí)現(xiàn)將兩類非線性問題轉(zhuǎn)化為一個(gè)線性分類問題的目的。
分類決策函數(shù),如式(4)。
f(x)=sgn(∑yiαi*K(X,Xi)+b*)
(4)
(5)
式中,dc指的是截?cái)嗑嚯x,ρi可通過高斯核函數(shù)進(jìn)行求解。根據(jù)上式,隨著ρi值的增大,與xi的間距在dc以內(nèi)的數(shù)據(jù)增多,反之則數(shù)據(jù)越少。
通過求解點(diǎn)i與其他高密度點(diǎn)的最小距離,從而推算出δi值,如式(6)。
(6)
從上述式子中可以看出,數(shù)據(jù)點(diǎn)xi為最大局部密度時(shí),δi代表數(shù)據(jù)集S中xi與距離xi最大點(diǎn)的間距;反之,δi代表在局部密度大于xi的點(diǎn)內(nèi),xi與距離xi最小點(diǎn)的間距。
密度聚類算法的實(shí)現(xiàn)過程分如下三步。
1、運(yùn)用樣本數(shù)據(jù)計(jì)算歐式距離dij和截?cái)嗑嚯xdc;
3、確立聚類中心并輸出結(jié)果。
聚類算法實(shí)現(xiàn)分類有三個(gè)環(huán)節(jié),分別為提取特征、計(jì)算相似度和確立聚類中心。在過去,人們通過歐式定理計(jì)算相似度,如式(7)。
(7)
能夠?qū)θ我獾臄?shù)據(jù)樣本xi與xj的空間距離進(jìn)行計(jì)算,但在測量出的調(diào)頻信號數(shù)據(jù)不難發(fā)現(xiàn),在整體樣本中不同樣本的分布具有差異性,那么其對距離產(chǎn)生的影響也隨之發(fā)生改變。由此可見,給予不同分布比例的樣本權(quán)重,對提高計(jì)算歐式距離準(zhǔn)確性有積極作用。
基于此,對式(7)進(jìn)行改進(jìn),如式(8)。
(8)
中頻測量,又名單頻測量,即依據(jù)對單一信號點(diǎn)進(jìn)行監(jiān)測后得到的監(jiān)測結(jié)果判斷信號的頻譜信號正常與否。具體操作過程為:第一步,檢測人員向監(jiān)測設(shè)備發(fā)出數(shù)據(jù)監(jiān)測請求;第二步,對指定信號進(jìn)行監(jiān)測;第三步,運(yùn)用頻譜圖展示中頻信號參數(shù)的特征(例如頻率的寬帶和頻偏)。87.5-108 MHz頻段的光譜測量圖,深色區(qū)域表示在此頻段下的信號強(qiáng)度大,如圖1所示。
為了避免采樣信號中產(chǎn)生冗余數(shù)據(jù),從連續(xù)采樣的x廣播信號中選取N個(gè)不同采樣點(diǎn)。從這N個(gè)采樣點(diǎn)中采集到的廣播信號十分復(fù)雜,選用傳統(tǒng)算法(比如去噪)進(jìn)行信號預(yù)處理,需要占用較長時(shí)間。對此,本文通過提取關(guān)鍵特征的做法進(jìn)行信號預(yù)處理,極大縮減了計(jì)算量。結(jié)合裴崢教授的研究成果,選擇以下關(guān)鍵特征[5]。
(9)
方差Var,如式(10)。
(10)
(11)
峭度K,如式(12)。
(12)
歸一化峰度Peak,如式(13)。
(13)
零中心歸一化絕對值標(biāo)準(zhǔn)差De,如式(14)。
(14)
根據(jù)中頻測量數(shù)據(jù)提取不同頻率信號的關(guān)鍵特征,通過加權(quán)方式確定不同樣本的權(quán)重,引用歐氏定律計(jì)算距離,據(jù)此確定聚類中心,并建立起完成聚類的訓(xùn)練樣本。上述處理方法在極大程度上減少了訓(xùn)練樣本數(shù)量,消除了冗余數(shù)據(jù)對信號的干擾。運(yùn)用SVM分類器將聚類后的數(shù)據(jù)樣本分類歸納為非法廣播信號和正常廣播信號。
中頻測量信號識別模型,如圖2所示。
圖2 非法廣播異常信號識別模型
以上模型是由3個(gè)部分構(gòu)成的,分別是信號樣本聚類、SVM訓(xùn)練和SVM分類器。在完成信號樣本聚類以后,根據(jù)計(jì)算出的ρi、δi值,建立起正常信號與非法信號的特征集合V1,如式(15)。
(15)
為了方便后續(xù)的分類識別,輸入樣本使用式(15)中的特殊參數(shù)。
選定某省廣播電視局中波臺管理中心的中頻數(shù)據(jù)監(jiān)測項(xiàng)目作為案例,對前文闡述的思路方法進(jìn)行驗(yàn)證。在實(shí)際操作過程中,為了保證某省廣播電視臺正常的參數(shù)監(jiān)測環(huán)境,包含信號的強(qiáng)度、帶寬以及頻率等等,需要運(yùn)用相應(yīng)的監(jiān)測軟件對發(fā)出的中頻信號進(jìn)行整點(diǎn)掃描,并將其結(jié)果保存于系統(tǒng)數(shù)據(jù)庫內(nèi),從中篩選數(shù)據(jù)并建立訓(xùn)練樣本。選用密度聚類效果、非法廣播信號識別準(zhǔn)確率和分類訓(xùn)練效率等指標(biāo)對上述模型的優(yōu)劣進(jìn)行評價(jià)。在穩(wěn)定的信噪比(S/N)下對該試驗(yàn)進(jìn)行驗(yàn)證,并選擇200 kHz帶寬的R&S. EM100設(shè)備,并返回電平值。另外,出于保密要求,本次實(shí)驗(yàn)對部分廣播信號數(shù)據(jù)進(jìn)行了適當(dāng)處理。
所選擇的300幀信號數(shù)據(jù)中包含了正常廣播信號和非法廣播信號,從中提取出六個(gè)關(guān)鍵性特征,并構(gòu)建300*6的六維特征空間。假設(shè)聚類密度閾值為ρ=0.5;SVM核函數(shù)采用徑向函數(shù),并運(yùn)用交叉驗(yàn)證和網(wǎng)格搜索的方法訓(xùn)練各項(xiàng)參數(shù),確定C=10 000,σ=0.05。
5.3.1 正常廣播信號聚類結(jié)果與頻譜圖
由R&S. EM100設(shè)備監(jiān)測獲得連續(xù)300幀信號數(shù)據(jù),采用密度聚類算法,所得靜音信號聚類結(jié)果,如圖3所示。
圖3 密度聚類結(jié)果
上圖中的綠點(diǎn)和紅點(diǎn)均為聚類中心,據(jù)此對信號數(shù)據(jù)進(jìn)行重新分配,如圖4所示。
圖4 靜音信號頻譜圖
5.3.2 非法廣播信號的聚類結(jié)果以及頻譜圖
在特定時(shí)間段采集300幀非法廣播信號,并利用密度聚類算法進(jìn)行處理,所得該非法廣播信號的聚類結(jié)果,如圖5所示。
圖5 非法廣播信號聚類圖
在正常廣播信號中加入非法廣播信號,所得頻譜圖展示,如圖6所示。
圖6 加入非法廣播信號后的頻譜圖
分析可知,在正常廣播信號中加入非法廣播信號,頻譜圖中的靜音信號大為減少?;谶@一規(guī)律,可以根據(jù)頻譜圖中的靜音信號對非法廣播信號進(jìn)行識別。
5.3.3 分類結(jié)果
針對聚類后的樣本,對比分析SVM、K-均值聚類+SVM、密度聚類+SVM的分類結(jié)果,從而證實(shí)本文算法的優(yōu)越性。在本次實(shí)驗(yàn)中保持相關(guān)參量不變,實(shí)驗(yàn)結(jié)果,如表1所示。
表1 分類結(jié)果對比
可見,與SVM、K-均值聚類+SVM等算法作對比,本文提出的改進(jìn)密度聚類+SVM算法在信號識別的正確率和訓(xùn)練時(shí)間等方面都具有顯著優(yōu)勢。
經(jīng)過對傳統(tǒng)DBSCAN聚類樣本縮減的了解和分析,本文為了減小采集樣本的數(shù)量,運(yùn)用了引入聚類算法,因而提升SVM的分類訓(xùn)練效率和準(zhǔn)確率。正常廣播段會(huì)受到中頻非法廣播段影響,致使正常廣播頻率中的靜音信號變少,為了徹底根除“黑廣播”這一頑疾,本文提出的改進(jìn)密度聚類+SVM算法,能夠準(zhǔn)確、高效地識別非法廣播信號,從而維持無線電行業(yè)的正常秩序。