林秋海,龍 華
(昆明理工大學,云南 昆明 650100)
非法調頻廣播電臺即常說的“黑廣播”?!缎谭ㄐ拚福ň牛芳白罡邫z、最高法《關于辦理擾亂無線電通訊管理秩序罪的司法解釋》相繼出臺以后,各地公安、無線電以及廣電等部門通力合作,僅2020 年就取締了2 876 起“黑廣播”[1],嚴厲打擊了違法犯罪分子的囂張氣焰。為躲避打擊,違法犯罪分子轉而在夜間開啟非法調頻廣播電臺或直接占用合法電臺頻道,增加了政府部門查處的難度。
非法調頻廣播最理想的判斷方法是利用無線電管理部門的臺站數據庫,將采集到的調頻廣播頻率與臺站數據庫進行逐一比對,其中未登記者即為“黑廣播”。徐磊等[2]提出了利用關鍵詞識別的判定方法,將廣播語音轉換為文字后再與詞典進行匹配,當超過一定的概率即判斷為“黑廣播”。但是,此種方法需人工提前錄入目前非法調頻廣播電臺常見的不雅詞匯,以作為判定詞典。
近年來,機器學習和深度學習方興未艾,在各行各業(yè)均有深入的應用。王朝衛(wèi)[3]提出了基于密度聚類與SVM 的非法調頻廣播識別方法,采用SVM對信號特征進行分類,提高了信號識別的準確率。考慮到機器學習判斷方法的多樣性,筆者嘗試將貝葉斯判斷方法引入非法調頻廣播電臺的識別,以分析貝葉斯判斷方法在非法調頻廣播電臺識別中的準確度和訓練時間。
信號特征的建立是機器學習的第一步。合理選擇信號特征,能提高機器訓練的準確率。綜合過往研究,一般在選擇特征上需要特征具有較好的穩(wěn)定性和魯棒性,同時盡可能包含更多的信號信息。此外,要求特征的計算量盡可能小,以方便進行提取。喬濤[4]在研究民航地空通信導航系統(tǒng)干擾檢測技術時,提出了時頻域峰態(tài)系數、近似熵、環(huán)形統(tǒng)計量以及高階累積量等信號特征,對分離干擾信號具有很好的判斷作用。筆者結合工作實際和相關研究,選擇如下幾個特征信號。
(1)連續(xù)采樣電平均值X1,假設對某調頻廣播K進行連續(xù)采樣得到N個電平值xi(i=1,2,…,N),則X1表示為:
(2)連續(xù)采樣電平方差X2,可以用來表示該信號的波動幅度,具體公式為:
(3)短時平均能量X3,表示信號頻譜的變化,具體公式為:
(4)偏度X4為:
式中,σ是標準差。
(5)峰度X5為:
式中,σ是標準差。
(6)零中心歸一化絕對值的標準差X6為:
貝葉斯判別分析方法是根據貝葉斯準則進行判別分析的一種多元統(tǒng)計分析方法,具有廣泛的應用[5]。筆者引入貝葉斯判別分析法,并根據6 個信號特征構建6 維矩陣。
算法具體步驟如下。
步驟1:對選擇的調頻廣播每隔時長t后進行頻譜采樣,并分別分析合法調頻廣播和非法調頻廣播信號,以構建信號特征數據。播放音樂、語音時,信號特征存在一定的區(qū)別。所以,實驗中需要對音樂廣播和新聞廣播進行區(qū)分對待。
步驟2:構建3 個總體G1、G2、G3分別代表合法音樂廣播、合法語音廣播以及非法調頻廣播,并計算總體的先驗概率。
步驟3:判斷3 個總體的協(xié)方差矩陣Σ1、Σ2、是否相等。
步驟4:根據貝葉斯判斷準則進行待判樣本歸屬的判斷。
當Σ1、Σ2、Σ3不全相等時,有:
對昆明本地調頻廣播頻段87~108 MHz 進行掃頻分析,并在后臺數據庫判斷和人工解調聽音判斷后,確認88.7 MHz、89.8 MHz、91.8 MHz、93.0 MHz、95.4 MHz、97.0 MHz、99.0 MHz、100.0 MHz、100.8 MHz、101.7 MHz、102.8 MHz、105 MHz、105.8 MHz、107 MHz 為合法調頻廣播,98.5 MHz、103.6 MHz、104.0 MHz 為非法調頻廣播。結合各頻率在無線電管理部門的臺站信息備案和實際收聽情況,此次選擇89.8 MHz 中央人民廣播電臺《經濟之聲》、93 MHz 中央人民廣播電臺《音樂之聲》以及98.5 MHz 非法調頻廣播作為3 個擬分析的總體G1、G2、G3,并將103.6 MHz 非法調頻廣播所采集到數據作為待判樣本X。
本文利用德國羅德與施瓦茨公司的監(jiān)測與測量接收機ESMB 設備對頻譜進行采集。ESMB 在我國無線電監(jiān)測領域應用廣泛。近年較多廠家生產的無線電固定監(jiān)測站均立足于ESMB 進行軟件集成,顯示了其較高的穩(wěn)定性和受眾度。在軟件上下達監(jiān)測任務,且考慮到調頻廣播的中頻帶寬一般為200~300 kHz,將采集頻段設置為中頻帶寬左右各擴寬100~200 kHz,即每次采集時避開臨頻間的采集,又盡量采滿600 kHz 帶寬,具體見圖1。設置采樣步長為1 kHz,即每次頻譜能采樣600 個電平值。同時,設置每間隔10 s 對該頻譜進行采樣,共進行300 次。
對每個頻段采集到的300×600 數據集進行壓縮,即將采集到的600 kHz 帶寬的電平值數據依次帶入式(1)~式(6)以計算各調頻廣播頻率的信號特征,得到300×6 的矩陣,具體如表2 所示。
圖1 調頻廣播89.8 MHz 的采樣圖例
表1 各采樣調頻廣播信號特征
本次實驗平臺基于MATLAB R2014a 進行。將表1 數據依據算法步驟1~步驟4 進行計算,并根據式(8)對待判樣本X進行判斷分析,結果如表2 所示。
表2 實驗數據
從表2 可以看出,對待判樣品300 幀的貝葉斯判斷準確率達到97%,驗證了貝葉斯判斷在調頻廣播合規(guī)性上的檢查具有重要的現實意義。
通過研究可以看出,貝葉斯判別方法在非法調頻廣播的信號特征識別上具有積極作用。通過這種信號特征分析,對非法調頻廣播的識別率上達到了97%,完全滿足實際工作對非法調頻廣播的判斷意義。但是,目前只選取了頻譜信號特征,存在一定的局限性。下一步考慮把“零點報時”[6]的頻譜作為頻譜信號特征的主要重點,減少頻譜采樣數量或者增加頻譜信號特征的數量,以提高貝葉斯判別的準確率。