陳 偉,呂文華,行鴻彥
(1.南京信息工程大學江蘇省氣象災害預報預警與評估協(xié)同創(chuàng)新中心,江蘇 南京 210044;2.南京信息工程大學江蘇省氣象探測與信息處理重點實驗室,江蘇 南京 210044;3.中國氣象局氣象探測中心,北京 100081)
混沌是由非線性確定系統(tǒng)產生的不規(guī)則運動。通常把雷達映照在海面上后散射的返回波稱作海雜波。伴隨著海浪里面機理科研的進步,人們發(fā)覺海雜波具備混沌的特征[1]。因為遭到變化多端的環(huán)境的干擾,雷達接收的信號數據包含有噪聲的特征。混沌原理與其他學科的相互交錯,讓混沌特征和微弱信號檢測方面的結合得到了廣泛應用,使海雜波背景中微弱信號的檢測成為信號檢測的熱點之一[2]。海雜波信號的去噪分析與海雜波背景下的微弱信號檢測具有重大價值,可以提升海面監(jiān)察能力,故而得到海內外學者的高度重視。因此,對混沌背景中的微弱信號檢測問題進行研究擁有極其重大的意義[3]。
以往人們都采用傳統(tǒng)的統(tǒng)計方法處理信號,大多基于隨機理論,但這些方法并不能體現(xiàn)混沌信號的內在物理特性,且各個模型都有其適用范圍,不具有普適性。近年來,統(tǒng)計學習理論已成為預測學習的最佳理論,在其基礎上發(fā)展了一種新的學習方法-支持向量機(Support Vector Machine,SVM)。支持向量機使用了結構風險最小化原則,可以對各類混沌系統(tǒng)形成不錯的預測效果,基于SVM的微弱信號檢測給混沌背景中的微弱目標檢測提供了新思路。國外方面,1995年,Haykin和Li[1]吸收混沌背景的相關知識,通過神經網絡建立了非線性預測模型,并在預測誤差中檢測信號,成功引入了預測模型檢測方法。1997年,Mukherjee等[4]把支持向量機引入到混沌時間序列預測中,其更佳的預測性能讓研究又進一步。2009年,Kurian等[5]利用重構動態(tài)特性與混沌同步方法對微弱目標信號進行評估和檢測,讓相空間重構在信號檢測領域奠定了理論基礎。在國內,2002年,李士心和劉魯源[6]提出了基于小波閾值去噪方法的研究,系統(tǒng)全面的解析了小波的軟閾值去噪、硬閾值去噪、garrote閾值去噪以及semisoft閾值去噪四種閾值去噪方法,為以后的去噪研究提供了基礎。2005年,崔萬照等[7]利用相空間理論與SVM對混沌時間序列進行了預測,預測模型取得了比較好的預測結果,說明了這個方法的實用性;2006年,高飛和童恒慶[8]在研究含有噪聲的Lorenz混沌系統(tǒng)時,引進粒子群算法對其參數進行了估計,從而削減了噪聲。2010年,金天力[9]提出了基于對偶約束最小二乘支持向量機的微弱信號檢測,通過改變等式約束[10]和損失函數提高了收斂速度,但此方法有一定局限性,預測精度也不夠高。
支持向量機中的懲罰系數和核函數參數的優(yōu)化設置將直接影響預測的精度和效果[11]。傳統(tǒng)的參數優(yōu)化設置容易限于局部最優(yōu),并且沒有較快的收斂速度,從而影響了模型整體的檢測能力和預測精度。本文針對此問題,引進了蜂群算法[12]來優(yōu)化支持向量機的兩個參數,提出了基于蜂群算法優(yōu)化向量機的微弱信號檢測方法。
一般來講,在非線性系統(tǒng)中的相空間擁有無窮無盡的維數,每個維數的值都難以確定[3]。從非線性系統(tǒng)里[9],獲得一個時間間隔為△t的單變量時間序列{x1,x2,…,xn},其中:
xj=x(tj),tj=t0+j△t,j=1,2,…,N
(1)
Takens的相空間重構的時間延遲坐標法為混沌系統(tǒng)單變量觀測值重構奠定了數學基礎[9]。相空間重構的高維映射實現(xiàn)與支持向量機的基本思想相似,都是將輸入空間的向量拓展到高維空間,進而挖掘系統(tǒng)蘊藏的信息與規(guī)律,重構出原系統(tǒng)模型[13]。對于觀測序列(1),假設它的嵌入維是DE、重構時間延遲是τ,那么重構出的Nm個DE維矢量為Y=[xj,xj+τ,xj+2τ,xj+(DE-1)τ],j=1,2,···,Nm,Nm=N-(DE-1)τ.,對于延遲時間τ與嵌入維DE,一種認為兩者不相關,有求DE的遺傳編程(Grassberger-Procaccia,GP)算法、偽最臨近點法與它的改進形式Cao方法等。另一種認為相關,像C-C法以及它的改進方法等。Takens[13]理論提出,相空間軌跡里的每一點擁有映射關系:
xj+DEτ=F([xj,xj+τ,xj+2τ,xj+(DE-1)τ])
(2)
延遲時間τ與嵌入維數DE不可以隨意定值,不然會嚴重干擾重構的相空間質量。本文使用典型的Grassberger與Procaccia提出的GP[14]算法確定嵌入維DE,并用改良的自相關法確定時間延遲τ。
支持向量機理論[15]是設立在統(tǒng)計學理論的Vapnik-Chervonenkis維理論與結構風險最小原理基礎上的,是一個有監(jiān)督的學習模型。它把訓練誤差當作優(yōu)化問題的約束條件,以模型復雜程度與學習能力之間為優(yōu)化條件,在兩者之間尋找最佳折衷,以便可以得到最好的泛化效果。對于給定的一個訓練集(xi,yi),i=1,2,…,l,xi∈Rn,yi∈R,回歸估計函數為:
f(x)=ω·φ(x)+b
(3)
其中,ω,x∈Rn,b∈R,φ是讓訓練集映射到一個高維特征空間的非線性映射[16]。
最優(yōu)化問題為:
(4)
其中,C>0為懲罰因子,是用來在經驗風險和模型復雜度之間進行折衷。ξ和ξ*是松弛變量,ε為引進的不敏感損失參數。為了可以處理上面描述的二次規(guī)劃難題,采用Lagrange乘子法求解,最后得到SVM回歸模型為:
(5)
其中,K(xi,x)=φ(xi)·φ(x)為滿足Mercer[16]的核函數,這里采用徑向基核函數K(xi,x)=exp(||xi-x||2/σ2)。SVM主要參數懲罰因子C和核函數參數σ對SVM的學習和泛化能力影響很大,如何選擇最佳匹配的懲罰因子C和核函數參數σ是取得好的回歸預測效果的重要一步[13]。本文涉及到的懲罰因子C和徑向基核函數參數σ是通過蜂群算法(Artifical Bee Colony,ABC)來最優(yōu)選擇的。
泛化能力是衡量預測模型的關鍵指標,SVM的泛化性能主要與懲罰系數C和核函數參數σ有關[16]。蜂群算法是人們模仿蜜蜂行為而創(chuàng)造的一種優(yōu)化算法,是智能思想的一種體現(xiàn)。蜂群算法的主要特征是沒必要清楚問題的特定信息,僅要求對問題進行優(yōu)劣的對比。人工蜂的個體通過局部尋優(yōu),把全局最優(yōu)值在群體中突顯出來。人工蜂[17]一直保持著較快的收斂速度,并持續(xù)到尋優(yōu)結束。通過蜂群算法可以快速的優(yōu)化支持向量機中的兩個參數,進而消除以往支持向量機模型參數依靠經驗確定的弊端,提高向量機的泛化能力。然后,使用優(yōu)化后的參數進行建模和預測,進而從預測誤差中檢測出微弱目標信號。
人工蜂群算法里,蜂群尋找食物源的過程就是尋找待優(yōu)化問題最優(yōu)解的過程,而食物源就是待優(yōu)化問題解空間中的點。換言之,每個食物源對應問題的一個解,食物源的質量對應優(yōu)化問題的適應度,適應度越高,該食物源的質量越優(yōu),也就是該食物源的收益率越高,所對應的解最優(yōu)。
在基本蜂群算法中,人工蜂群包含3種個體:雇傭蜂、觀察蜂和偵查蜂,每個雇傭蜂對應一個確定的蜜源(解向量)并在迭代中對蜜源的鄰域進行搜索。根據蜜源豐富程度(適應值的大小)采用輪盤賭的方式雇傭觀察峰采蜜(搜索新蜜源)。如果蜜源多次更新沒有改進,則放棄該蜜源,雇傭蜂轉為偵查蜂隨機搜索新蜜源。
初始化時,隨機產生SN個可行解(等于雇傭蜂的數目)并且計算適應度函數值。隨機產生可行解的公式如下:
xmn=xmin,n+rand(0,1)(xmax,n-xmin,n)
(6)
式中,xmn(m=1,2,…,SN;n=1,2,…,D)為D維向量,D為優(yōu)化參數的個數。
蜜蜂記錄自己到目前為止的最優(yōu)值,并在當前蜜源鄰域內展開搜索,基本ABC在蜜源附近搜索新蜜源的公式為:
vmn=xmn+φmn(xmn-xkn)
(7)
式中,m∈{1,2,…,SN},n∈{1,2,…,D},K為隨機生成且K不等于m,φmn為[-1,1]之間的隨機數。算法將新生成的可能解與原來的解作對比,并且使用貪婪選擇方法保存較好的解。每一個觀察蜂根據概率選取一個蜜源,概率公式為:
(8)
式中,x是蜜源的適應值,fit(xm)是第m個解的適應值對應蜜源的豐富程度,蜜源越豐富,被觀察蜂選擇的概率就越大。為了避免算法陷入局部最優(yōu),當全體采蜜蜂與觀察蜂都搜索完全部搜索空間時,假如某個蜜源的適應值在給定的步驟內(本文控制參數“l(fā)imit”選為50)沒有被提升,那么就丟棄該蜜源。而和該蜜源相對應的采蜂蜜變成偵查蜂,偵查蜂使用以下公式搜索新的可能解。
(9)
蜂群算法的時間復雜度與種群數量、迭代次數等相關。根據上文,SN表示種群數量,limit表示最大迭代次數,x為蜜源的適應值,求解時間復雜度函數為O(f),那么ABC算法的時間復雜度為O(limit*x*SN)。ABC算法的時間復雜度并不是很小,但是其收斂速度卻僅次于遺傳算法。遺傳算法雖然時間復雜度較小,但隨著所遇問題維數的增加,遺傳算法對其參數的要求也越來越嚴格,參數不當就會導致其無法收斂。ABC算法卻沒有這些問題,只要給ABC算法足夠的評估次數,ABC都能較好較快收斂于全局最優(yōu)解。與蜂群算法類似的蟻群算法雖然也有不錯的問題處理能力和收斂速度,但因其時間復雜度較大,因此需要較多的運行時間,遠不如蜂群算法理想。
ABC-SVM預測方法流程圖如圖1所示。
主要步驟如下:
步驟1 選定試驗所需要的個體,把相空間重構后的序列作為向量機的輸入序列,輸入向量機進行建模、訓練并完成預測。SVM中的核函數采用徑向基核函數。由懲罰因子C與核函數參數σ組成ABC蜂群算法的個體,構造初始種群。
步驟2 初始化參數,計算個體適應度值。本文選擇均方誤差的倒數表示適應度值,適應度函數定義為:
(10)
其中,L是數據長度,T(i)是真實值,G(i)是預測值。
步驟3 根據適應度值更新蜜源,不斷優(yōu)化SVM的懲罰因子C和核函數參數σ,使它們達到最優(yōu)。
步驟4 把優(yōu)化后的SVM參數帶入SVM預測模型,進行相空間重構和單步預測,獲得最佳預測結果。
步驟5 計算單步誤差,對預測誤差進行頻譜分析與門限比較,并從中判斷是否存在微弱信號,從而實現(xiàn)混沌背景下微弱信號的檢測。
為了證明ABC-SVM預測方法的有效性,本文進行了三個仿真實驗。實驗1與實驗2均使用典型的Lorenz系統(tǒng)作為混沌背景噪聲進行研究,分別在其中加入瞬態(tài)信號與周期信號,然后進行建模訓練預測,研究預測精度和檢測門限。實驗3采用雷達實測的海雜波數據作為混沌噪聲,驗證預測方法的檢測精度。將預測均方根誤差作為衡量該預測模型的整體預測效果的性能指標,使用信噪比值來衡量該模型檢測微弱信號的能力。
實驗1 Lorenz系統(tǒng)的迭代方程為:
(11)
式中,α=10,ρ=25,β=8/3。假定初始條件x0=7,y0=4,z0=10,利用四階龍格-庫塔法求解方程,步長為0.01,待系統(tǒng)完全進入混沌狀態(tài)后,取其中的2 000個數據作為實驗室數據進行仿真研究。前1 000個數據作為訓練集,用來建立預測模型。后1 000個數據作為驗證集,用來驗證模型的有效性。利用嵌入維數5和時間延遲1進行相空間重構。
在預測集的第505~554個點處加入幅值為0.000 000 15,長度為50的微弱信號,將微弱信號疊加到Lorenz仿真系統(tǒng)中,作為預測對象。信噪比(Signal to Noise Ratio,SNR)達到-153.936 9 dB,歸一化后進行相空間重構和ABC-SVM單步預測,得到的最優(yōu)參數為C=14.947 9,σ=0.004 220 3,反歸一化后,預測結果的均方根誤差(Root Mean Squared Error,RMSE)為0.000 047 592。圖2為檢測結果,有圖2(b)可知,樣本點n=505~554的誤差明顯偏大,這與加入微弱信號的位置一致,所以可以確認得到的誤差為微弱信號。與傳統(tǒng)的SVM方法和徑向基函數(Radial Basis Function,RBF)神經網絡方法相比,本文使用的模型的檢測能力提升了很多,如表1所示。
ABC-SVM對偶約束LS-SVMLS-SVMSVMRBF神經網絡SNR/dB-153.9369-77.33-62.82-54.60-30.20RMSE0.000047590.00800.0220.0490.058
實驗2 對微弱周期信號進行檢測,目標信號定義為:
s(n)=0.000 25sin(2πfn)
(12)
歸一化頻率f為0.01,把周期信號加入到Lorenz混沌背景噪聲中,按照實驗1的步驟進行檢測,信噪比為-89.5 dB,得到的最優(yōu)參數為C=236.548 3,σ=0.042 771,得到單步預測誤差。在預測誤差中,可以檢測出混沌背景中微弱周期信號的頻譜特性。因為從單步預測誤差中不能明確信號的確切方位,這里必須對單步誤差進行快速傅里葉變換。圖3(a)是沒有微弱信號時的混沌背景噪聲的頻譜圖。從圖3(b)的預測誤差頻譜圖能夠看到,歸一化頻率在f=0.01處頻譜出現(xiàn)峰值,因此能夠肯定有微弱信號的存在。對數據進行反歸一化處理,得到的RMSE為0.000 072 874。與文獻[11]的RMSE(0.022)相比,模型的誤差有較大提高。從圖3(b)中還能夠看到,在其他頻率處也出現(xiàn)了一些峰值,這是預測自身的誤差和在預測的整個系統(tǒng)中受到引入的小信號干擾所造成的。
實驗3 本實驗使用加拿大McMaster大學的IPIX海雜波數據進行仿真分析。它采用的雷達工作頻率是9.39 GHz,天線高度是30 m,天線增益為45.7 dB,每個距離單元的數據包含131 072個采樣點,采用VV極化方式。
這次實驗首先選取不存在小目標的海雜波數據。拿出前面1 000個點作為訓練的樣本數據,后面的1 000個點作為預測的樣本數據,并用它們進行相空間重構與ABC-SVM單步預測。實驗仿真結果如圖4(a)所示。接著用含有目標的海雜波數據進行實驗,同樣選用1 000個點作為訓練的樣本數據,后面的1 000個點作為預測的樣本數據,ABC算法優(yōu)化的最優(yōu)參數為C=6.408 1,σ=0.088 95,得到的均方誤差為0.000 066 649 7,比文獻[18]的均方誤差0.013 7降低了三個數量級。圖4(b)呈現(xiàn)的誤差幅值包含著鮮明的諧波特性,對預測誤差進行頻譜分析獲得圖4(c)的誤差頻譜圖。從圖4(c)能夠看出,歸一化頻率在0.016附近出現(xiàn)鮮明的峰值,這表明該預測模型可以檢測到混沌背景噪聲中包含的微弱信號,并且對海雜波微弱信號擁有較強的敏感性。
本文提出了基于蜂群算法優(yōu)化支持向量機的微弱信號檢測方法。該方法通過混沌信號的時間延遲和嵌入維實現(xiàn)相空間重構,利用蜂群算法對支持向量機的懲罰系數和核函數參數進行優(yōu)化,結合支持向量機建立混沌序列的單步預測模型,從預測誤差中檢測淹沒在混沌背景中的微弱信號。通過Lorenz混沌系統(tǒng)與雷達實測的海雜波數據進行仿真分析,利用均方差誤差來判斷預測性能效果,并與其它方法進行對比。仿真實驗結果表明,該方法可以有效的檢測出混沌背景中的微弱信號。與傳統(tǒng)的神經網絡方法和SVM方法相比,該方法擁有較低的檢測門限與預測誤差,其精度、可行性、泛化能力都有了顯著性的提升。本文不足之處是沒有考慮背景噪聲中混有高斯白噪聲的情況,下面的工作就是研究該預測模型對上述情況的微弱信號檢測能力。
[1]Haykin S, Li X B. Detection of signals in chaos[J]. Proceedings of the IEEE,1995, 83(1) : 95-122.
[2]鄭紅利, 行鴻彥, 徐偉. 混沌背景中微弱信號檢測的回聲狀態(tài)網絡方法[J]. 信號處理, 2015, 31(3) :336-345.
[3]行鴻彥, 徐偉. 混沌背景中微弱信號檢測的神經網絡方法[J]. 物理學報, 2007, 56(7) : 3771-3776.
[4]Mukherjee S, Osuna E, Girosi F. Nonlinear prediction of chaotic time series using a support vector machine[J]. Proceedings of the IEEE Workshop on Neural Networks for Signal Processing. 1997(7): 511-512.
[5]Kurian A P, Leung H. Weak signal estimation in chaotic clutter using model-based coupled synchronization[J]. IEEE Transactions on Circuits and Systems-I, 2009, 56(4) : 820-828.
[6]李士心, 劉魯源. 基于小波閥值去噪方法的研究[J], 儀器儀表學報, 2002, 23(3): 478-479.
[7]崔萬照,,朱長純,保文星,等. 混沌時間序列的支持向量機預測[J]. 物理學報,2004, 53(10) : 3303-3310.
[8]高飛,童恒慶. 基于改進粒子群優(yōu)化算法的混沌系數參數估計方法[J]. 物理學報, 2006, 55(2) : 577-582.
[9]行鴻彥, 金天力. 基于對偶約束最小二乘支持向量機的混沌海雜波背景中的微弱信號檢測[J]. 物理學報, 2010, 59(1) : 140-146.
[10]張家樹, 肖先賜. 混沌時間序列的Volterra自適應預測[J]. 物理學報, 2000, 49(3) : 403-408.
[11]何建華, 楊宗凱, 王殊. 基于混沌和神經網絡的微弱信號探測[J]. 電子學報, 1998, 26(10) : 33-37.
[12]秦全德, 程適, 李麗, 史玉回. 人工蜂群算法研究綜述[J]. 智能系統(tǒng)學報, 2014, 9(2) : 127-135.
[13]行鴻彥, 鄭紅利, 徐偉. 基于多參數組合優(yōu)化的微弱信號檢測方法[J]. 探測與控制學報, 2015, 37(1) : 20-26.
[14]Grassberger P, Procaccia I. Measuring the strangeness of strange attractors [J]. Physical D: Nonlinear Phenomena, 1983, 9(1) : 189-208.
[15]Meng Q F, Chen Y H, Peng Y H. Small-time scale network traffic prediction based on a local support vector machine regression model[J]. Chinese Physics B. 2009,18(6) : 2194-2199.
[16]行鴻彥, 張強, 徐偉. 混沌海雜波背景下的微弱信號檢測混合算法[J]. 物理學報, 2015, 64(4) : 48-54.
[17]王偉, 龍文. 基于交叉算子的改進人工蜂群算法[J]. 蘭州理工大學學報, 2015, 41(1) : 101-106.
[18]王福友, 袁贛南, 謝燕軍, 喬相偉. 海雜波的短時非線性預測研究[J]. 雷達科學與技術. 2009, 7(1) : 52-58.