徐鳳琴,賈 年*
(西華大學(xué) 無線電管理技術(shù)研究中心,成都 610039)
特征選擇一直是無線電信號識別的基礎(chǔ)與核心問題。信號的特征屬性呈現(xiàn)連續(xù)性、高維性、非線性等復(fù)雜特點(diǎn),因此,處理異常信號復(fù)雜數(shù)據(jù)的特征約簡,對識別信號類型具有重要意義。通過特征選擇,可以縮小數(shù)據(jù)集并且集中具有明顯類別差異的信息。傳統(tǒng)的特征選擇方法大致分為2類:過濾法和包裝法。過濾法效率高但準(zhǔn)確率低,包裝法準(zhǔn)確率高但計算復(fù)雜。近年來,特征選擇算法得到進(jìn)一步重視與創(chuàng)新,學(xué)者們提出了多種特征選擇算法。文獻(xiàn)[1]提出一種基于遺傳算法(Genetic Algorithm,GA)的異常信號特征選擇,以遺傳算法作為約簡算法進(jìn)行特征選擇,結(jié)果表明該算法較傳統(tǒng)算法分類效果更優(yōu)。文獻(xiàn)[2]提出一種基于模糊偏好粗糙集的屬性約簡進(jìn)行異常信號特征選擇,將結(jié)果應(yīng)用于異常信號識別,結(jié)果顯示識別率較傳統(tǒng)方法高??梢姮F(xiàn)有方法已經(jīng)使特征選擇的研究越來越精細(xì)準(zhǔn)確,但是針對信號高維非線性的復(fù)雜特性,為了得到更加完美高效的最優(yōu)特征約簡,實現(xiàn)異常信號更高的識別率,需要尋找更有效的特征選擇算法。
膜計算(Membrane Computing,MC)是由歐洲科學(xué)院院士Gheorghe Paun在1998年首次提出,也被稱為 P系統(tǒng)(P Systems)[3-5]。作為計算機(jī)科學(xué)中的一個全新的研究領(lǐng)域,膜計算提出后很快成為眾多學(xué)者研究的熱點(diǎn),許多膜計算模型已分別應(yīng)用到近似優(yōu)化、計算機(jī)圖形學(xué)、密碼學(xué)、并行計算等眾多領(lǐng)域[6]。目前,膜計算用于優(yōu)化領(lǐng)域已經(jīng)有初步的研究。日本富山大學(xué)的Nishida提出了一種具有分布式和動態(tài)進(jìn)化結(jié)構(gòu)的優(yōu)化算法——膜算法,該算法被看作高層次的進(jìn)化算法,用于求解“旅行商問題”這個經(jīng)典的組合優(yōu)化問題優(yōu)勢明顯;文獻(xiàn)[7]提出了一些基于膜計算的優(yōu)化方法用于化工過程的建模優(yōu)化和控制器多目標(biāo)優(yōu)化設(shè)計;文獻(xiàn)[8]提出了一種基于膜計算的高維函數(shù)全局優(yōu)化算法,采用2層膜結(jié)構(gòu),差分算法局部搜索,微粒群算法實現(xiàn)全局優(yōu)化,結(jié)果顯示膜計算對于高維結(jié)構(gòu)優(yōu)化問題極具優(yōu)勢;文獻(xiàn)[9]也提出類似于文獻(xiàn)[8]的求解非線性方程組的優(yōu)化算法,也是2層膜結(jié)構(gòu),進(jìn)化策略局部搜索,粒子群算法全局優(yōu)化,結(jié)果顯示膜計算對于非線性的優(yōu)化效果極好。從以上研究可以看出,膜計算對于信號特征這類高維非線性的復(fù)雜數(shù)據(jù)的知識約簡具有極大優(yōu)勢。
結(jié)合遺傳算法泛化搜索與膜計算并行優(yōu)化的特點(diǎn),本文提出了一種基于膜計算的知識約簡,通過膜與膜之間交流逐步搜索得到最優(yōu)解。該算法將膜系統(tǒng)分為2層:基本膜(Elementary Membrane)和表層膜(Skin Membrane),每個基本膜區(qū)域中采用遺傳算法局部尋優(yōu)策略提高算法的局部搜索能力和收斂速度,基本膜區(qū)域?qū)⒕植孔顑?yōu)解定時傳遞給表層膜,表層膜區(qū)域中再次采用遺傳算法尋找全局最優(yōu)解。仿真實驗結(jié)果表明,算法收斂速度更快,求解精度較高,尤其對本文的C波段異常信號識別的決策表優(yōu)化問題不會陷入局部最優(yōu),能夠求得高精度全局最優(yōu)解。
一個m維轉(zhuǎn)移P系統(tǒng)的一般模型是:
其中:O是非空有限的符號表,每個符號表示膜結(jié)構(gòu)中的一種物質(zhì);μ是膜結(jié)構(gòu),深度為m,每個膜都有相應(yīng)的序號,一般用1,2,…,m標(biāo)志;Wi表示膜i中的字符串i=1,2,…,m;Ri代表了由膜i構(gòu)成的區(qū)室里的進(jìn)化規(guī)則,i=1,2,…,m。一個進(jìn)化規(guī)則是一個序?qū)?μ,v),一般也寫作 u→v或 u→δv,其中 δ是一個特殊字符,它并不在V上,是一個溶解操作,它溶解物質(zhì)u所在的膜,其所在膜內(nèi)所有的物質(zhì)都被釋放到其外層膜,并且被溶解膜的規(guī)則也會隨之消失,u是V上的一個字符串,V是下列集合上的字符串:(V×{here,out})(V×{inj丨1≤j≤n});ρi代表了Ri上的一個偏序關(guān)系,表示的是規(guī)則間的優(yōu)先級關(guān)系;i0是膜結(jié)構(gòu)的輸出區(qū)域,保存最后的計算結(jié)果[8]。
概括地說,膜系統(tǒng)由3部分構(gòu)成:膜的層次關(guān)系、表示對象的多重集和進(jìn)化規(guī)則。膜計算優(yōu)化時首先在每個子區(qū)域內(nèi)并行運(yùn)用子算法更新該區(qū)域的解,然后分別將每個子區(qū)域的優(yōu)化最優(yōu)或最差解送至父層區(qū)域中,重復(fù)上述2個步驟直到滿足終止條件計算結(jié)束。在膜計算每個膜區(qū)域內(nèi),進(jìn)化規(guī)則獨(dú)立運(yùn)行,算法被分割,膜間交流(通信、傳輸)僅僅在相鄰的2個區(qū)域之間發(fā)生,所以膜算法很容易并行運(yùn)行,而且膜計算可以在各個子膜中使用任何優(yōu)化算法,如遺傳算法等,因此可以在膜內(nèi)引入局部搜索算法來提高整體最優(yōu)解的精度。
C波段無線電信號作為衛(wèi)星與地面的通信頻段,在各衛(wèi)星電視廣播和各類小型衛(wèi)星地面站中一直被廣泛應(yīng)用。日常監(jiān)測發(fā)現(xiàn),C波段上的業(yè)務(wù)信號經(jīng)常受到5類異常信號的干擾,分別為:雷達(dá)、干擾機(jī)、單載波、單頻點(diǎn)和底噪聲,已嚴(yán)重影響社會及人民財產(chǎn)安全,因此異常信號的識別尤為重要[1]。無線電監(jiān)測中,異常信號分析的流程如圖1所示。
圖1 信號分析流程
特征提取對于無線電監(jiān)測中各類信號的識別起著決策性作用,可以獲得一個初始特征集合。在該集合中,并非所有的特征對無線電信號的識別都有用,有些特征甚至可能會降低識別系統(tǒng)的性能,因此特征選擇在信號識別中的地位尤為重要。通過特征選擇不僅可以去除冗余的信息達(dá)到精簡系統(tǒng)的目的,而且可以集中那些對分類有用的信息以提高分類的正確率。在評價準(zhǔn)則確定之后,特征選擇問題就轉(zhuǎn)化成了一個組合優(yōu)化問題。由于遺傳算法是模擬生物在自然環(huán)境中的遺傳和進(jìn)化過程而形成的一種自適應(yīng)全局優(yōu)化概率搜索算法,其搜索方式不是單一的方向或結(jié)構(gòu),而是將多個個體作為可能的解并考慮搜索空間全局范圍內(nèi)的抽樣,以更大可能性地收斂到全局最優(yōu)解,因此遺傳算法具有很強(qiáng)的全局搜索能力,能夠在較短時間內(nèi)找到全局最優(yōu)解[14]。所以本文將遺傳算法作為基本膜與表層膜的優(yōu)化基礎(chǔ)方法,有絕對的優(yōu)勢實現(xiàn)全局最優(yōu)。
本文提出一種基于膜計算的C波段異常信號特征選擇算法。采用基于{0,1}符號集的二進(jìn)制一維編碼形式,17位的二進(jìn)制串表示一個個體,對應(yīng)了條件屬性空間中的一個屬性子集,即屬性選取的一個可能解,個體中每一位對應(yīng)一個特征,某位取值為1表示選擇其對應(yīng)的特征,取值為0表示去除其對應(yīng)的特征,最終根據(jù)進(jìn)化規(guī)則計算得到的最優(yōu)個體即為最重要的約簡特征集合。算法中膜系統(tǒng)分為2層:基本膜和表層膜。首先先對C波段實測異常信號進(jìn)行數(shù)據(jù)處理、統(tǒng)計分析,提取被識別信號的有效頻域特征(均值、方差、峰值1、峰值2、峰值3、低噪聲閾值、幅度值大于0的連續(xù)點(diǎn)的個數(shù)、幅度值大于0的連續(xù)點(diǎn)的間隔、峰值的個數(shù)的比率、濾除閾值后極值點(diǎn)的方差(峰值能量的方差)、頻段占用度、過零率、歸一化瞬時幅度絕對值的均方差、歸一化瞬時振幅的峭度、瞬時振幅絕對值的標(biāo)準(zhǔn)差、歸一化瞬時振幅均方差與均值之比、大于閾值點(diǎn)個數(shù)的比率)作為基本膜的決策表條件屬性,異常信號的類別作為決策屬性,在基本膜內(nèi)采用標(biāo)準(zhǔn)遺傳算法實現(xiàn)收斂與局部搜索優(yōu)化?;灸^(qū)域?qū)⒆顑?yōu)解傳遞給表層膜。表層膜區(qū)域中再次使用遺傳算法實現(xiàn)全局最優(yōu)搜索。
輸入一個決策表 S=(U,A,V,F(xiàn)),A=C∪D,C是條件屬性,D是決策屬性。設(shè)決策表對象有m個個體,n個條件屬性,k個基本膜,用Am×n表示由 C與D構(gòu)成的初始矩陣,構(gòu)造本算法的膜系統(tǒng)結(jié)構(gòu)如圖2所示。
圖2 本文算法膜結(jié)構(gòu)
如圖2所示,P系統(tǒng)置于環(huán)境中,膜系統(tǒng)由k+1個膜按層次結(jié)構(gòu)組織,最外層的膜1為表層膜,膜2,3…,k+1都不含有其他膜,為基本膜。每個膜所包圍的部分為它的區(qū)域,區(qū)域中包含此膜的對象和進(jìn)化規(guī)則。膜1 中的X1,X2,…,Xk→Xbestδ為進(jìn)化規(guī)則;膜2,3,…,k 里的 Am×n為對象,Am×n→(Xlδ,in1),Am×n→(Xlδ,in1)i=2,3,…,k -1,Am×n→(Xkδ,in1)都是進(jìn)化規(guī)則。理論上每一個膜應(yīng)該按并行方式各自進(jìn)化,為了便于實現(xiàn),我們將各個膜放在一臺計算機(jī)上串行完成計算。具體執(zhí)行步驟如下:
Step 1:在初始狀態(tài)時,表層膜1中僅含進(jìn)化規(guī)則不含對象故不執(zhí)行;
Step 2:在基本膜2,3,…,k+1中,都含有一個Am×n對象,且有相應(yīng)進(jìn)化規(guī)則,以膜2為例,膜2中,進(jìn)化規(guī)則為 Am×n(X1δ,in1),計算中將對象 Am×n根據(jù)其規(guī)則生成X1,并將生成X1的送入表層膜1中。相對應(yīng)的,膜3,4,…,k+1依次進(jìn)行類似膜2的計算,最后膜1中便有對象X1,X2,…,Xk(即本文的局部最優(yōu)解集合),而膜2,3,…,k+1因為執(zhí)行完畢,無剩余可執(zhí)行對象,故停止執(zhí)行,進(jìn)化規(guī)則含δ,此膜溶解,執(zhí)行過程轉(zhuǎn)至膜1內(nèi),基本膜中的具體局部尋優(yōu)步驟在下文詳細(xì)介紹;
Step 3:經(jīng)過以上步驟執(zhí)行后,膜1中此時有對象 X1,X2,…,Xk,進(jìn)化規(guī)則 X1,X2,…,Xk→Xbestδ,故對象按照相應(yīng)進(jìn)化規(guī)則執(zhí)行,生成持續(xù)多代的適應(yīng)值不再提高的整個膜結(jié)構(gòu)的最優(yōu)個體Xbest(即本文的全局最優(yōu)解),表層膜溶解,執(zhí)行完畢。
由于基本膜與表層膜結(jié)合的尋優(yōu)算法都是遺傳算法,故下面只介紹基本膜的局部優(yōu)化進(jìn)化規(guī)則[15]。
Step 1:膜內(nèi)對象Am×n。為連續(xù)的數(shù)據(jù),因為本算法僅能處理離散的數(shù)據(jù),故首先對連續(xù)數(shù)據(jù)進(jìn)行模糊C均值(Fuzzy C-means,F(xiàn)CM)聚類,將數(shù)據(jù)離散化;
Step 2:由式(2)計算數(shù)據(jù)離散化后的決策表的決策屬性D對條件屬性C的依賴度γC(D),其中card(x)為染色體串中1的個數(shù);
Step 3:令Core(C)=φ逐個去掉一個屬性c∈C,若 γC-c≠γC,則 Core(C)=Core(C)∪{c};若γC-c=γC,則 Core即為最小相對約簡;
Step 4:隨機(jī)產(chǎn)生m個長度為n(條件屬性的個數(shù))的二進(jìn)制串組成初始群體,對于核中的屬性,其對應(yīng)位取1,其他則對應(yīng)位隨機(jī)取0或1;
Step 5:由式(2)計算出決策屬性對每個個體所含條件屬性的依賴度;由式(3)計算出每個個體的適應(yīng)值;由式(4)計算出每個個體被選擇的概率;最后使用模擬賭盤操作(即0到1之間的隨機(jī)數(shù))來選擇個體;
Step 6:根據(jù)交叉概率Pc進(jìn)行交叉操作,采用單點(diǎn)交叉方式;
Step 7:根據(jù)變異概率Pm進(jìn)行變異操作,采用基本位變異方式,其中核中屬性的對應(yīng)位不發(fā)生變異;
Step 8:采用最優(yōu)保存策略,將最優(yōu)個體復(fù)制到下一代群體中;
Step 9:如果連續(xù)多代的最優(yōu)個體的適應(yīng)值不再提高,則終止計算,否則轉(zhuǎn)Step 5。
以無線電監(jiān)測的已識別的139個C波段異常信號特征樣本庫為決策表。其中論域U={1,2,…,139},條件屬性集為 C={均值、方差、峰值1、峰值2、峰值3、低噪聲閾值、幅度值大于0的連續(xù)點(diǎn)的個數(shù)、幅度值大于0的連續(xù)點(diǎn)的間隔、峰值的個數(shù)的比率、濾除閾值后極值點(diǎn)的方差(峰值能量的方差)、頻段占用度、過零率、歸一化瞬時幅度絕對值的均方差、歸一化瞬時振幅的峭度、瞬時振幅絕對值的標(biāo)準(zhǔn)差、歸一化瞬時振幅均方差與均值之比、大于閾值點(diǎn)個數(shù)的比率},決策屬性為D={低噪聲、單頻點(diǎn)、單載波、干擾機(jī)、雷達(dá)}。由于特征值連續(xù),故使用FCM聚類將條件屬性特征的數(shù)據(jù)聚為5類,根據(jù)距離將特征離散化。由粗糙集計算出的決策表核屬性為均值,取m=20,Pc=0.6,Pm=0.02,基本膜個數(shù) =10。
由式(3)可知,控制染色體的決策屬性D對條件屬性C的依賴度,控制染色體所含條件屬性的長度,通過這2個方面可以使一個個體在保持決策屬性對整體條件屬性依賴度不變的情況下所含的條件屬性最少的最優(yōu)約簡。所以本文將個體的適應(yīng)值作為衡量個體優(yōu)劣的評價標(biāo)準(zhǔn),適應(yīng)值越高同時包含的條件屬性越少,證明所得的個體越優(yōu)質(zhì)。
表1結(jié)果顯示C波段異常信號特征選擇一次膜計算中10個基本膜中的局部最優(yōu)的個體和適應(yīng)值,以及它的基本膜得到的最優(yōu)個體和適應(yīng)值。表層膜得到了屬性約簡{均值,過零率}。
表1 膜計算所得基本膜與表層膜結(jié)果
為了進(jìn)一步驗證本算法的優(yōu)化效果,本文分別使用遺傳算法和約翰遜算法(Johnson’s algorithm)對決策表的139個已識別的C波段異常信號進(jìn)行仿真實驗。表2顯示了分別執(zhí)行10次本文提出的膜計算的算法、遺傳算法和約翰遜算法得到的最優(yōu)個體及適應(yīng)值。應(yīng)用本文提出的算法所得最優(yōu)個體的適應(yīng)值平均比另2個算法都高,因而約簡效果更佳,實用性更高。
表2 3種算法特征選擇實驗結(jié)果
受膜計算啟發(fā),提出基于膜計算的C波段異常信號特征選擇算法。該算法構(gòu)建2層膜系統(tǒng)結(jié)構(gòu),基本膜采用遺傳算法進(jìn)行局部搜索,表層膜采用全局搜索策略進(jìn)行全局高精度搜索。由于每個膜區(qū)域內(nèi)子算法獨(dú)立運(yùn)行,膜間交流僅僅在基本膜和表層膜之間發(fā)生,算法被分割,因此該算法可以在計算機(jī)中并行實現(xiàn)。通過無線電監(jiān)測C波段異常信號特征識別決策表進(jìn)行仿真實驗,結(jié)果顯示,本文算法在異常信號特征選擇應(yīng)用上優(yōu)勢明顯,不會陷入局部最優(yōu),并且求解精度更高,穩(wěn)定性更好。
[1]周璇.基于遺傳算法的無線電異常信號特征選擇[D].成都:西華大學(xué),2013.
[2]楊杰.基于模糊偏好粗糙集的屬性約簡和信號識別[D].成都:西華大學(xué),2013.
[3]BUSI N.Using well-structured transition systems to decide divergence for catalytic P systems[J].Theoretical Computer Science,2007,372(2/3):125-135.
[4]NISHIDA T Y.An application of P system:a new algorithm for NP-complete optimization problems[C]//Proceedings of 8th World Multi-Conference on Systems,Cybernetics and Information,2004:109-112.
[5]NISHIDA T Y.An approximatealgorithm forNP-complete optimization problems exploiting P systems[C]//Proceedings of Brain-storming Workshop on Uncertainty in Membrane Computing,Palma de Majorca,2004:185 -192.
[6]張葛祥,潘林.自然計算的新分支:膜計算[J].計算機(jī)學(xué)報,2010,33(2):208 -214.
[7]黃亮.膜計算優(yōu)化方法研究[D].杭州:浙江大學(xué),2007.
[8]拓守恒.一種利用膜計算求解高維函數(shù)的全局優(yōu)化算法[J].計算機(jī)工程與應(yīng)用,2011,47(19):27 -30.
[9]郭德龍.基于膜計算的一種新型求解非線性方程組的優(yōu)化算法[J].計算機(jī)應(yīng)用與軟件,2013,30(2):165 -167.
[10]彭勇,吳友情.一種新的聚類有效性函數(shù)[J].計算機(jī)工程與應(yīng)用,2010,46(6):124 -126.
[11]馮博,裴崢,伊良忠,等.基于支持向量機(jī)的 C波段無線電異常信號識別[J].中國無線電,2013(1):60-62 .
[12]黃春毅.用P系統(tǒng)解決排序問題[J].上海交通大學(xué)學(xué)報,2008,42(2):206-208.
[13]賴玉霞,劉建平.基于遺傳算法的K均值聚類分析[J].計算機(jī)工程,2008,34(20):200 -202.
[14]陶志,許寶棟,汪定偉,等.基于遺傳算法的粗糙集知識約簡方法[J].系統(tǒng)工程,2003,21(4):116 -122.
[15]任永功.基于遺傳算法的粗糙集屬性約簡算法[J].小型微型計算機(jī)系統(tǒng),2006,27(5):862 -865.
[16]NISHIDA T Y.Membrane algorithms:Approximate algorithms for NP-complete optimization[M].Berlin:Springer,2005:301 -312.
[17]ZHANG Q,LEUNG Y W.An orthogonal genetic algorithm for multimedia multicast routing[J].IEEE Trans on Evolutionary Computation,1999,3(1):53 -62.
[18]周世兵,徐振源,唐旭清.新的 K-均值算法最佳聚類數(shù)確定方法[J].計算機(jī)工程與應(yīng)用,2010,46(16):27 -31.
[19]紀(jì)震,周家銳.智能單粒子優(yōu)化算法[J].計算機(jī)學(xué)報,2010,33(3):556-561.
[20]PAUN G.Computing with membrane[J].International Journal of Foundations of Computer Science,2000,11(1):167 -182.
[21]DASH M,LIU H.Feature selection for classification[J].Intelligent Data Analysise,1997:131 -156.