劉 坤,畢 楊
(西安航空學院,陜西 西安 710077)
隱式信息場是自然界中普遍存在的一種信息源,其場特征的參數(shù)分布與地理坐標之間具有顯著的非線性映射關系,同時受觀測能力的限制,無法獲得未到達鄰域的場特征[1-2]。這就為隱式信息場的開發(fā)和利用帶來困難,如地磁導航、氣味尋源等[3-5]。在現(xiàn)代工業(yè)環(huán)境中也存在類似的場景,如在核泄露環(huán)境中開展對核泄露源的尋找;指紋定位應用中對故障指紋源的反向定位等。
目前對于隱式信息場的尋源問題,主要以基于路徑規(guī)劃的搜索方法和基于數(shù)據(jù)驅動的搜索方法為代表。
基于路徑規(guī)劃的搜索方法[6-7]是指載體通過執(zhí)行特定路線,開展對目標源的搜索,典型方式有遍歷搜索、Z 字型搜索等。該方法不區(qū)分信息源的類型,具有一定的普適性。這一類算法可以通過對路徑的優(yōu)化,以及探測能力的拓展,在一定程度內提升搜索效率。然而,該方法的缺陷在于尋源耗時與搜索空間呈指數(shù)關系,在大場景應用背景下,尋源耗時將是難以被接受的。
基于數(shù)據(jù)驅動的搜索方法[8-10]是指從獲得數(shù)據(jù)和利用數(shù)據(jù)角度開展尋源方法的研究。在獲得數(shù)據(jù)方面,以多個體編隊協(xié)同搜索為代表,增強了對隱式信息場環(huán)境特征的測量能力,可獲得更多的數(shù)據(jù),然而該方法容易因信息冗余或沖突導致尋源失敗。在利用數(shù)據(jù)方面,以概率預測搜索為代表,以歷史實測數(shù)據(jù)為基礎,采用一定的概率模型預測目標點所在方位,在隨后的搜索中不斷調整預測的結果,進而引導載體實現(xiàn)尋源,然而該方法容易陷入局部極小。
本文受生物尋源行為的啟發(fā),從自主搜索的角度提出了一種基于動態(tài)均衡策略的尋源方法。首先,借助多目標優(yōu)化理論,將載體運動與尋源搜索相結合,建立隱式信息場尋源模型;然后,從搜索行為的偏向性角度出發(fā),設計了一種動態(tài)均衡的搜索策略,并給出搜索算法;最后,以地磁場為隱式信息場的代表,開展尋源仿真驗證,其仿真結果證實了算法的有效性和合理性。
不失一般性,記E為隱式信息場特征集,由n個參量e1,e2,…,en組成;P代表空間位置,P與E之間具有一一對應的映射關系。而在隱式信息場中,這一映射關系不明確,且難以利用有限的已歷信息準確地建立映射模型。
從仿生學角度看,尋源過程表現(xiàn)為個體對在任意位置出發(fā),用實測數(shù)據(jù)結合自主搜索向目標信息源特征ET搜索收斂的過程。
考慮在二維平面內,視移動載體為質點,則載體的運動學方程可描述如下:
式中:Pk= (xk,yk)表示k時刻載體所處位置;u為運動參數(shù),由步長L和運動方向θ組成。
借助多目標優(yōu)化理論,可將隱式信息尋源問題歸結為在無先驗數(shù)據(jù)庫的條件下,多種環(huán)境參量向目標環(huán)境參量搜索收斂的過程,如下所示:
式中:k表示時刻信息;目標函數(shù)F為k時刻實測環(huán)境特征Ek與目標環(huán)境特征ET的差異;G為搜索行為約束函數(shù),由環(huán)境參量E、搜索行為u以及時刻信息k構成。
因此,隱式信息場尋源問題歸結為在函數(shù)F未知條件下,通過對載體搜索行為u的求解,使載體到達源目標點的問題。需要強調,本文中不開展函數(shù)F具體形式如何建立的研究,假定函數(shù)F為未知的。
探索與開發(fā)是搜索優(yōu)化過程中的兩種基本策略,其中,探索是指在搜索過程中從廣度層面上以獲取目標函數(shù)信息為目的的搜索策略;開發(fā)則是指以探索獲得的函數(shù)信息為基礎,在深度層面上以尋找最優(yōu)解為目的的搜索策略。
探索與開發(fā)在搜索中的偏向如圖1 所示。
圖1 探索與開發(fā)在搜索中的偏向
以自然界中動物尋源為例,動物通過對未知環(huán)境的探索和歷史信息的開發(fā),搜索尋源路徑,并引導個體完成尋源任務。其尋源過程可以描述如下:起始階段,動物通過自身運動探索環(huán)境,獲取特征的分布信息,以彌補對環(huán)境認知的不足;而后,利用已獲取的信息搜索尋源路徑,并響應環(huán)境特征分布情況的變化,搜索行為的偏向維持在探索與開發(fā)間的均衡狀態(tài),以期獲取最大化收益(此處,收益包括對環(huán)境認知的信息收益和對目標點收斂的優(yōu)化收益),進而引導個體到達目標點。
從仿生學角度看,在隱式信息場內,由于缺少先驗數(shù)據(jù)庫的參照,尋源行為表現(xiàn)出對環(huán)境的探索和對已歷信息的利用,并以目標處信息源的特征參量為收斂目標開展的自主搜索行為?;诖?,本文提出一種動態(tài)均衡策略(Dynamic Balancing Strategy, DBS),以對環(huán)境信息的探索與開發(fā)為核心,圍繞信息收益和優(yōu)化收益的動態(tài)平衡,結合搜索的不同階段開展均衡搜索。搜索初期,通過隨機性漫游探索環(huán)境信息,逐漸形成趨勢性運動;尋源階段,以收益最大化為目的,搜索偏向在探索與開發(fā)之間的動態(tài)調整。
依據(jù)2.1 節(jié)內容,本小節(jié)給出具體的尋源算法。首先,以進化算法為原型,設計尋源搜索行為;而后,引入行為熵的概念,度量搜索偏向性;最后,給出DBS 尋源算法。
1)基于進化算法的搜索行為設計
進化算法是模擬自然進化規(guī)律而產生的一種隨機性搜索方法,以試錯為檢驗方法,將得到的環(huán)境信息轉化為種群中樣本的分布概率。這種搜索方法具有明顯的后驗特征,符合隱式信息場尋源的搜索特點。然而,進化算法屬于并行搜索算法,在單個體進行尋源任務中難以直接使用,為此本文結合載體的移動搜索對進化算法進行了改進。
尋源過程依賴于載體移動,其搜索行為可由運動參數(shù)u表征。進化算法的思想是以可行性搜索行為為進化種群的樣本構建進化種群。其中,第j個樣本個體可表示為:
式中:R∈[ 1,…,2πDθ]為隨機數(shù),Dθ為搜索空間壓縮比;Npop表示種群規(guī)模,通常取Npop>2πDθ。
載體對目標環(huán)境特征的尋源依賴于空間的移動,多目標搜索與尋源空間移動具有如圖2 所示的時序特征。
圖2 尋源搜索原理示意圖
結合圖2,可將尋源過程描述為:k時刻從進化種群pop:Qk中等概率選取某一樣本作為載體的運動參數(shù),通過執(zhí)行載體將獲得Lk的運動位移。
將實測位移前后隱式信息場特征參量集合Ek和Ek+1代入式(2)中進行多目標解算,得到多目標函數(shù)F。
依據(jù)多目標函數(shù)F的收斂狀態(tài)對被執(zhí)行樣本進行尋源性能評估,采用繁殖或淘汰操作,增加或降低該類樣本的存在比例。通過變異操作提升種群多樣性,得到新的種群pop:Qk+1,重新進入下輪搜索過程。通過反復迭代,最終使得多目標函數(shù)收斂至最小,實現(xiàn)尋源任務。
2)搜索偏向度量
在尋源過程中,搜索行為的偏向可由進化種群的多樣性度量。種群的多樣性越高,意味著種群中樣本分布越分散,導致搜索行為的隨機性越大,此刻搜索行為偏向于探索;種群的多樣性越低,意味著種群中樣本分布越集中,導致搜索行為的隨機性越小,此刻搜索行為偏向于開發(fā)。為了度量種群的多樣性,此處引入分布熵的概念。
定義1分布熵:樣本種類為N類,樣本個體可表示為C1,C2,…,CN。群體進化的某時刻,樣本個體在群體中的比例分別為p1,p2,…,pN,滿足=1,則 分 布熵為:
分布熵在分布空間內具有非負性、對稱性和可加性,是一個嚴格凹函數(shù)。當各類樣本均勻分布p1=p2=… =pN=1/N時,H具有唯一最大值;當某一類個體占據(jù)了群體絕大部分時,即p1→1,pi→0(?i>1),有:
此時分布熵最低。
分布熵量化了種群的多樣性,反映了種群的搜索偏向。熵值越大,種群的全局探索行為越強;熵值越小,種群的局部開發(fā)能力越強。
3)動態(tài)均衡搜索算法設計
在搜索過程中,進化種群的分布熵過大或過小,均不利于對尋源路徑的跟蹤。為此,結合進化算法的結構特點與尋源路徑的分布特征,給出均衡搜索策略的具體算法。
將尋源過程分為三個階段,如圖3 所示。
圖3 動態(tài)均衡搜索策略時序圖
第一階段:尋源初始階段,搜索行為以探索為主,在時刻k大于2 倍的種群樣本種類后,將進入尋源階段;
第二階段:尋源搜索階段,搜索行為在探索與開發(fā)間動態(tài)變化,當分布熵H小于等于最高門限熵Hhigh-th時,尋源進入以開發(fā)為主的搜索過程,避免過多的隨機運動導致尋源失??;當分布熵H大于等于最低門限熵Hlow-th時,尋源進入以探索為主的搜索過程,避免種群多樣性過低,而導致的種群早熟問題出現(xiàn);其余時間內,載體依據(jù)種群進化的結果執(zhí)行搜索任務;
第三階段:尋源任務結束,當參量收斂至目標值,即可結束尋源任務。
至此,給出基于均衡搜索策略的尋源方法,后面將結合實驗仿真驗證算法的有效性和合理性。
地磁場是地球固有資源,擁有豐富的特征參量,是自然界中天然的導航信息源,其參量分布與地理位置具有非常復雜的非線性映射關系,是典型的隱式信息場。以動物利用地磁場開展洄游、歸巢、遷徙等尋源行為為原型,開展尋源方法驗證。
選取E={Bx,By,Bz},其中,Bx,By,Bz分別為磁場水平分量、磁北分量和磁場垂直分量,已在文獻[11]中證明,此三個分量具備可尋性。選取目標位置地磁場環(huán)境特征為(27 016 nT,-2 821.3 nT,58 480 nT)。
采用全球地磁模型WMM2020,在Matlab 中構建尋源環(huán)境。考慮到實際地磁場傳感器的精確性,設置運動步長L=500 m,每步運動引起約1~2 nT 總場強的變化。
設采樣間隔Dθ=30°、種群規(guī)模Npop=36、繁殖算子Pb=2、變異算子Pmut=0.02,取Hth=1.5,Hhigh-th=1.8,Hlow-th=1.2。
為了對比算法的合理性和搜索性能,此處引入兩種參考算法。
參考算法1:梯度下降法(GDA)。假定移動載體能夠獲取相鄰單元的磁場分布,則式(2)所描述的尋源問題轉化為動態(tài)多目標優(yōu)化問題,采用梯度下降法可求解出尋源路徑。顯然,隱式信息場是無法獲知相鄰單元的磁場分布,故此處將該方法得到的結果作為理想結果,僅用于對比。
參考算法2:以時序進化算法(Timing Evolution Searching Strategy, TES)為參考算法。
對本文所提出的DBS 算法以及上述兩種算法,依據(jù)3.1 節(jié)所設置的參數(shù)進行實驗仿真,其尋源路徑如圖4所示。
圖4 不同算法仿真結果對比
圖4 中,“O”為載體出發(fā)點,“T”為目標源點位置。圖4 展示了三種不同算法得到的尋源路徑,其中黑色曲線為GDA 算法得到的理想尋源路徑,灰色曲線為參考算法TES 得到的尋源路徑,點線為本文提出的DBS 算法得到的尋源路徑??梢钥吹饺N算法均能夠引導載體到達目標源位置T處。由于TES 算法在尋源過程中僅依靠算法自身調整搜索偏向,容易在路徑偏轉處出現(xiàn)較為嚴重的偏離;而基于DBS 算法的尋源方法在尋源過程中由于引入了動態(tài)均衡策略,能夠及時地調整自身搜索偏向,當路徑發(fā)生偏轉,在較短時間內即可跟蹤上理想軌跡。
為了進一步對比TES 算法與DBS 算法的不同,采用TES 與DBS 算法選取4 個不同的尋源任務,分別進行100 次尋源實驗,其尋源耗時的平均值如表1 所示。
表1 三種不同算法的尋源耗時均值統(tǒng)計
通過表1 可以看到,整體上采用TES 的尋源耗時大體是GDA 的1.98 倍,而DBS 尋源耗時大體是GDA 的1.78 倍。顯然,DBS 的尋源效果優(yōu)于TES 的尋源效果。
本文從搜索行為的偏向角度,開展了對隱式信息場尋源方法的研究,提出了一種動態(tài)均衡搜索策略,將搜索路徑引入尋源問題求解中,構建了以可行性搜索行為為個體的進化種群,引入分布熵的度量搜索偏向,結合進化尋優(yōu)和尋源進程,設計了一種均衡搜索策略。通過算法性能分析和仿真實驗驗證,證實了本文方法的有效性和合理性。下一步的工作重點是考慮具有局部極小值情況下的隱式信息場尋源方法。