樓建坤,王鴻東*,王檢耀,易宏
1 上海交通大學(xué) 海洋智能裝備與系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室,上海 200240
2 上海交通大學(xué) 海洋工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200240
隨著人工智能技術(shù)在船海裝備領(lǐng)域的滲透與應(yīng)用,以無(wú)人艇(USV)為代表的海洋智能裝備與系統(tǒng)迎來(lái)前所未有的發(fā)展機(jī)遇,并逐漸應(yīng)用于水路運(yùn)輸、海洋測(cè)繪和軍事作戰(zhàn)等領(lǐng)域[1-3]。不同于基于人機(jī)交互操控的傳統(tǒng)裝備,無(wú)人艇的功能實(shí)質(zhì)上是由算法軟件所定義。信息感知、規(guī)劃決策和運(yùn)動(dòng)控制等無(wú)人艇自主系統(tǒng)關(guān)鍵技術(shù)在實(shí)際應(yīng)用中存在的問(wèn)題,也逐漸被人們所認(rèn)知,并提出了“無(wú)人艇智能演進(jìn)”需求的概念[1]。
無(wú)人艇效能是指無(wú)人艇在給定時(shí)間內(nèi)特定海域完成指定任務(wù)的能力,是無(wú)人艇價(jià)值高低的度量[4-5]。因此,無(wú)人艇智能演進(jìn)的目標(biāo),是裝備效能的提升。無(wú)人艇智能演進(jìn)的路徑,是通過(guò)學(xué)習(xí)運(yùn)行過(guò)程中的觀測(cè)數(shù)據(jù),實(shí)現(xiàn)自主系統(tǒng)的持續(xù)迭代優(yōu)化[6]。然而,相比于無(wú)人機(jī)、無(wú)人車(chē)等無(wú)人裝備,無(wú)人艇自主系統(tǒng)的學(xué)習(xí)與迭代面臨更大的挑戰(zhàn):
一是無(wú)人艇自身系統(tǒng)的復(fù)雜性。同其他復(fù)雜裝備的系統(tǒng)類似,無(wú)人艇系統(tǒng)本身繼承了大量子系統(tǒng),屬于“系統(tǒng)之系統(tǒng)”。而無(wú)人艇系統(tǒng)子功能單項(xiàng)性能的提高與無(wú)人艇系統(tǒng)效能的增長(zhǎng)并非單調(diào)遞增的線性關(guān)系。因此,無(wú)人艇效能評(píng)估具有乏信息、多層次和強(qiáng)耦合等特點(diǎn)。例如,感知系統(tǒng)的輸出結(jié)果會(huì)顯著影響規(guī)劃算法的表現(xiàn),進(jìn)而對(duì)控制系統(tǒng)提出更高的要求。
二是無(wú)人艇任務(wù)環(huán)境的復(fù)雜性。在海洋環(huán)境中,無(wú)人艇面臨的風(fēng)浪流等外部隨機(jī)載荷與艇體控制力相比,大多處于同一量級(jí)。在惡劣條件下,甚至?xí)霈F(xiàn)外載荷遠(yuǎn)大于艇體控制力的情況[7]。目前,大部分無(wú)人艇控制算法在投入工程應(yīng)用時(shí),都需要針對(duì)運(yùn)行環(huán)境特點(diǎn),進(jìn)行控制參數(shù)的人工整定。這一現(xiàn)象雖然在船舶控制領(lǐng)域已被廣泛討論,也形成了一些應(yīng)對(duì)方法,然而,面對(duì)變幻莫測(cè)的海洋環(huán)境,無(wú)人艇單純依靠控制算法參數(shù)的自整定并不能解決問(wèn)題。例如,圖像識(shí)別預(yù)處理過(guò)程中的濾波算法參數(shù)需根據(jù)天氣和光線條件隨時(shí)改變;路徑規(guī)劃算法的步長(zhǎng)應(yīng)根據(jù)任務(wù)執(zhí)行范圍和障礙物分布情形進(jìn)行調(diào)整。
針對(duì)上述問(wèn)題,本文認(rèn)為無(wú)人艇智能演進(jìn)應(yīng)聚焦于無(wú)人艇自主系統(tǒng)中算法函數(shù)和算法參數(shù)的演進(jìn),并將提出相應(yīng)的智能演進(jìn)方法流程。在此基礎(chǔ)上,擬給出一套可演進(jìn)的無(wú)人艇自主系統(tǒng)控制結(jié)構(gòu)體系。最后,以無(wú)人艇避碰算法為例,結(jié)合實(shí)海域測(cè)試,驗(yàn)證機(jī)器學(xué)習(xí)方法在無(wú)人艇智能演進(jìn)中的可行性和有效性。
當(dāng)無(wú)人艇完成前期設(shè)計(jì)和建造后,其硬件設(shè)備及性能已基本固定。因此,無(wú)人艇智能演進(jìn)應(yīng)重點(diǎn)聚焦自主系統(tǒng)中算法函數(shù)及算法參數(shù)的演進(jìn)。目前,在自主系統(tǒng)算法函數(shù)方面,已形成大量研究成果。例如,在感知方面,有語(yǔ)義分割和監(jiān)督學(xué)習(xí)等圖像識(shí)別算法[8];在規(guī)劃方面,有A*,D*和快速搜索樹(shù)(RRT)等路徑規(guī)劃算法[9];在控制方面,有PID和自抗擾控制(ADRC)等航行控制算法[7,10]。算法函數(shù)的演進(jìn),是指通過(guò)函數(shù)的構(gòu)建、調(diào)用或組合,拓展無(wú)人艇自主系統(tǒng)的功能,為無(wú)人艇完成更多復(fù)雜任務(wù)提供可能。在自主系統(tǒng)算法參數(shù)方面,人工智能方法也已被廣泛應(yīng)用于感知、規(guī)劃和控制算法參數(shù)的整定[11-12]?,F(xiàn)有算法參數(shù)的整定大多基于準(zhǔn)確的量化目標(biāo)函數(shù),在仿真層面或?qū)崪y(cè)階段取得了一定效果,但是在考慮算法之間耦合作用及環(huán)境影響的問(wèn)題上尚無(wú)深入研究。算法參數(shù)的演進(jìn),是指通過(guò)協(xié)同整定各算法參數(shù)集合,使自適應(yīng)系統(tǒng)適應(yīng)當(dāng)前海洋環(huán)境和任務(wù)需求,不斷提升無(wú)人艇的裝備效能。
綜上分析,無(wú)人艇智能演進(jìn)方法應(yīng)用流程如圖1 所示。
無(wú)人艇人工演進(jìn)階段是指在無(wú)人艇自主系統(tǒng)的早期設(shè)計(jì)階段,設(shè)計(jì)者需基于標(biāo)準(zhǔn)化的輸入輸出,建立算法函數(shù)庫(kù),豐富無(wú)人艇自主系統(tǒng)的算法庫(kù)儲(chǔ)備,并根據(jù)實(shí)海域測(cè)試情況,對(duì)算法參數(shù)進(jìn)行初步整定。其中,無(wú)人艇裝備效能的評(píng)估可由人工完成。這一階段的演進(jìn)能夠建立對(duì)于算法性能和適用范圍的認(rèn)知,并為后續(xù)自主演進(jìn)及在線演進(jìn)階段提供具有參考意義的參數(shù)集分類、可行參數(shù)域和演進(jìn)目標(biāo)函數(shù)。
無(wú)人艇自主演進(jìn)階段是指無(wú)人艇在實(shí)海域測(cè)試場(chǎng)地,開(kāi)展大量標(biāo)準(zhǔn)科目測(cè)試工作,并根據(jù)目標(biāo)函數(shù)對(duì)裝備效能的自主評(píng)估結(jié)果[13],實(shí)現(xiàn)多種海洋環(huán)境下算法參數(shù)的自主整定。在完成該階段的演進(jìn)流程后,無(wú)人艇將初步形成一組能夠應(yīng)對(duì)多種海洋環(huán)境載荷特性,并完成任務(wù)的算法函數(shù)及參數(shù)集合。
無(wú)人艇在線演進(jìn)階段是指在實(shí)際執(zhí)行任務(wù)的過(guò)程中,保持對(duì)于無(wú)人艇自主系統(tǒng)的動(dòng)態(tài)測(cè)試和評(píng)估。若系統(tǒng)判斷當(dāng)前算法函數(shù)及參數(shù)能滿足任務(wù)需求,則接受一定范圍內(nèi)的裝備效能降低,減少頻繁更換算法或改變系統(tǒng)參數(shù)對(duì)于系統(tǒng)穩(wěn)定性的影響;當(dāng)裝備效能降低至一定閾值,被系統(tǒng)判定為無(wú)法滿足任務(wù)需求,系統(tǒng)將根據(jù)積累的在線測(cè)試數(shù)據(jù)和以往訓(xùn)練集,調(diào)節(jié)算法參數(shù)或選擇其他算法函數(shù)。由于無(wú)人艇硬件性能的限制,在某些極端天氣下,外載荷的影響可能超出無(wú)人艇自身調(diào)節(jié)范圍。此時(shí),系統(tǒng)可及時(shí)反饋情況,根據(jù)岸基指揮決策,選擇返航、人工遙控或改變?nèi)蝿?wù)需求等方式,減少在惡劣情況下的損失。
圖1 無(wú)人艇智能演進(jìn)方法應(yīng)用流程Fig. 1 The application process of USV intelligent evolution
可演進(jìn)的無(wú)人艇自主系統(tǒng)(圖2)主要是指在不同總體任務(wù)需求下,能夠選擇不同算法函數(shù)并整定參數(shù),實(shí)現(xiàn)無(wú)人艇裝備效能提升的智能系統(tǒng)。系統(tǒng)中的數(shù)據(jù)流程是一種面向?qū)ο蟮奶幚磉^(guò)程,算法可被定義為對(duì)于相應(yīng)數(shù)據(jù)對(duì)象的處理方法,因此,算法本身的變化不影響數(shù)據(jù)對(duì)象的傳遞,從而確保系統(tǒng)的高效運(yùn)行。
可演進(jìn)的無(wú)人艇自主系統(tǒng)包含演進(jìn)器,感知器,規(guī)劃器和執(zhí)行器4 個(gè)子系統(tǒng),受總體任務(wù)和海洋環(huán)境影響表現(xiàn)出不同的性能[7,14]。演進(jìn)器平行作用于感知器、規(guī)劃器和執(zhí)行器,將各子系統(tǒng)產(chǎn)生的數(shù)據(jù)用于無(wú)人艇裝備效能的測(cè)試與評(píng)估,作為子系統(tǒng)算法單獨(dú)優(yōu)化的參考,并將總體任務(wù)的表現(xiàn)記錄作為系統(tǒng)演進(jìn)的方向。算法函數(shù)的改變和參數(shù)的調(diào)整,不影響系統(tǒng)架構(gòu)和運(yùn)行模式。該無(wú)人艇自主系統(tǒng)的演進(jìn)目標(biāo)是提升無(wú)人艇裝備效能,也即提升無(wú)人艇在給定時(shí)間內(nèi)特定海洋環(huán)境下完成指定任務(wù)的能力。
圖2 可演進(jìn)的無(wú)人艇自主系統(tǒng)控制體系Fig. 2 The evolution-capable control architecture of USV autonomous system
無(wú)人艇完成預(yù)期規(guī)定任務(wù)的能力受到多層次多技術(shù)節(jié)點(diǎn)耦合影響。如表1 所示,首先,指標(biāo)層是指無(wú)人艇的硬件基礎(chǔ),例如推進(jìn)功率、油耗、配置算力和光學(xué)圖像分辨率等,該層次的優(yōu)化主要針對(duì)無(wú)人艇前期設(shè)計(jì)和建造水平。其次,行為層是指無(wú)人艇硬件設(shè)施在一系列時(shí)序操作指令下的表現(xiàn),例如船舶戰(zhàn)術(shù)半徑、制動(dòng)距離和垂蕩加速度等,該層次的優(yōu)化主要針對(duì)指令給出的頻率和方式。第三,功能層是指各類智能算法的表現(xiàn),例如圖像識(shí)別算法和路徑規(guī)劃算法,該層次的優(yōu)化主要針對(duì)算法函數(shù)與算法參數(shù)。最后,任務(wù)層是指無(wú)人艇投入實(shí)際場(chǎng)景應(yīng)用后的裝備效能,該層次是前3 個(gè)層次多技術(shù)節(jié)點(diǎn)基于系統(tǒng)設(shè)計(jì)架構(gòu)耦合影響的結(jié)果??梢?jiàn),傳統(tǒng)的自主系統(tǒng)優(yōu)化方法,大多針對(duì)某個(gè)單一節(jié)點(diǎn)的表現(xiàn)進(jìn)行優(yōu)化,例如更換動(dòng)力設(shè)備、改變操控模式和優(yōu)化控制算法,其優(yōu)化過(guò)程缺乏對(duì)于裝備效能的綜合考量。
目前,大量研究致力于子系統(tǒng)的獨(dú)立優(yōu)化,對(duì)于子系統(tǒng)之間的互動(dòng)影響考慮較少。例如,感知器的識(shí)別結(jié)果是規(guī)劃器的必要信息,規(guī)劃的結(jié)果(例如規(guī)劃路徑點(diǎn))將影響控制器中自動(dòng)舵的參數(shù),進(jìn)而影響感知器的識(shí)別準(zhǔn)確率、識(shí)別時(shí)間等性能。因此,一個(gè)設(shè)計(jì)良好的無(wú)人艇自主系統(tǒng),其智能演進(jìn)是在針對(duì)各部分算法進(jìn)行獨(dú)立優(yōu)化的基礎(chǔ)上,充分考慮各部分之間的耦合影響,對(duì)算法進(jìn)行學(xué)習(xí)迭代[6],以實(shí)現(xiàn)無(wú)人艇裝備效能的持續(xù)優(yōu)化。
可演進(jìn)的無(wú)人艇自主系統(tǒng)能夠充分利用實(shí)海域的觀測(cè)數(shù)據(jù),基于建立的目標(biāo)函數(shù)量化算法,對(duì)各子系統(tǒng)及裝備效能進(jìn)行優(yōu)化。其先進(jìn)性在于,系統(tǒng)可在原有子系統(tǒng)算法單獨(dú)優(yōu)化的基礎(chǔ)上,結(jié)合復(fù)雜的海洋環(huán)境影響及總體任務(wù)需求,對(duì)系統(tǒng)中存在耦合關(guān)系的算法特征進(jìn)行持續(xù)改進(jìn),以獲得更好的裝備效能。
作為算法軟件定義的裝備,無(wú)人艇智能演進(jìn)面臨的首要問(wèn)題,是算法與裝備效能之間的關(guān)系缺少可量化的數(shù)學(xué)表達(dá),難以采用解析方法將演進(jìn)目標(biāo)函數(shù)分解至各子算法。該問(wèn)題屬于智能無(wú)人裝備效能評(píng)估研究范疇[13]。因此,為快速驗(yàn)證所提方法的可行性與有效性,研究團(tuán)隊(duì)選取演進(jìn)目標(biāo)函數(shù)較為明確的RRT 局部路徑規(guī)劃算法,開(kāi)展實(shí)海域無(wú)人艇智能演進(jìn)示例研究工作。
局部路徑規(guī)劃算法的計(jì)算性能,例如時(shí)間復(fù)雜度和空間復(fù)雜度,由其算法本身結(jié)構(gòu)決定。以RRT 算法為例,其對(duì)裝備效能的影響,通過(guò)算法中步長(zhǎng)與目標(biāo)偏向概率的變化得以體現(xiàn),可選為待演進(jìn)參數(shù)[8]??紤]實(shí)海域測(cè)試環(huán)境,無(wú)人艇路徑規(guī)劃算法的最終效能,受無(wú)人艇本身控制系統(tǒng)特性與環(huán)境載荷影響,其運(yùn)動(dòng)狀態(tài)信號(hào)傳遞的系統(tǒng)框圖如圖3 所示。
根據(jù)無(wú)人艇感知算法給出的地圖信息,在路徑規(guī)劃算法給出期望航路信息T(x,y)后,在每一個(gè)采樣周期下,無(wú)人艇的運(yùn)動(dòng)狀態(tài)都與其上一時(shí)刻運(yùn)動(dòng)狀態(tài)、上一時(shí)刻控制指令、環(huán)境載荷及無(wú)人艇的軟、硬件系統(tǒng)時(shí)延有關(guān)。無(wú)人艇的運(yùn)動(dòng)狀態(tài)s通過(guò)慣導(dǎo)直接測(cè)量,由位置、速度與加速度等表示,即
式中:x,y,z為位置信息;u,v,r為速度信息; α,β,γ為加速度信息。同時(shí),運(yùn)動(dòng)狀態(tài)還可包括加速度與角加速度等高階量。
而無(wú)人艇的控制算法可被表示為基于期望航路和運(yùn)動(dòng)狀態(tài)s生 成控制量e的映射,即
式中,fc為控制算法關(guān)于運(yùn)動(dòng)狀態(tài)到控制量的映射??刂屏縠視不同無(wú)人艇動(dòng)力系統(tǒng)而改變。
在此案例中,考慮虛擬障礙物的前提條件,在單次避碰航行任務(wù)過(guò)程中,期望航路為定值。
此外,海洋環(huán)境載荷一般難以測(cè)量,F(xiàn)ossen 等[7]采用概率分布方法對(duì)其進(jìn)行描述,環(huán)境載荷可表示為
式中:fenv為當(dāng)前運(yùn)動(dòng)狀態(tài)下的外載荷預(yù)測(cè)值;PDF(ωw,A)為 當(dāng)前海況下波浪頻率 ωw和浪高A的概率分布。在特定海域條件下,一段時(shí)間內(nèi)可認(rèn)為概率分布不變,也即該函數(shù)是時(shí)不變的。
隨后,考慮在無(wú)人艇系統(tǒng)的實(shí)際運(yùn)行中,算法功能模塊之間的通信及計(jì)算延遲由系統(tǒng)設(shè)計(jì)及算法決定,一般固定不變;實(shí)海域環(huán)境下的軟、硬件系統(tǒng)延遲主要體現(xiàn)為執(zhí)行器執(zhí)行時(shí)間的延遲。例如,打舵時(shí)間與打舵的大小有關(guān)。因此,無(wú)人艇系統(tǒng)時(shí)延對(duì)運(yùn)動(dòng)狀態(tài)的影響可被表示為一個(gè)與控制量e有關(guān)的函數(shù),即
式中:fd為運(yùn)動(dòng)狀態(tài)到系統(tǒng)時(shí)延的映射;gd為控制量到系統(tǒng)時(shí)延的映射。因此,特定海域環(huán)境下,單次避碰的無(wú)人艇運(yùn)動(dòng)狀態(tài)的變化可被表示為多個(gè)影響因子映射函數(shù)的卷積,也即
式中,st(k+1),stk分別表示連續(xù)的2 個(gè)測(cè)量時(shí)刻下無(wú)人艇的運(yùn)動(dòng)狀態(tài)。
由此,可得到對(duì)于無(wú)人艇運(yùn)動(dòng)狀態(tài)總體表現(xiàn)的分析結(jié)果,其中包含控制算法性能、環(huán)境載荷及系統(tǒng)時(shí)延等多種信息??紤]無(wú)人艇避碰性能時(shí),可從無(wú)人艇的運(yùn)動(dòng)軌跡(位置及速度信息)及其運(yùn)動(dòng)穩(wěn)定性(角速度等信息)方面來(lái)進(jìn)行。
基于上述分析,特定海域環(huán)境下單次任務(wù)無(wú)人艇避碰效能可通過(guò)對(duì)測(cè)試過(guò)程中的無(wú)人艇運(yùn)動(dòng)狀態(tài)分析來(lái)度量,無(wú)人艇自身特性及環(huán)境載荷等未知因素已耦合在運(yùn)動(dòng)狀態(tài)變化的過(guò)程中。此外,考慮到在實(shí)際應(yīng)用中,運(yùn)動(dòng)狀態(tài)是最容易被監(jiān)測(cè)和記錄的系統(tǒng)信息,基于運(yùn)動(dòng)狀態(tài)分析的效能評(píng)價(jià)極為重要。
在此案例中,受限于測(cè)量數(shù)據(jù),研究團(tuán)隊(duì)基于無(wú)人艇任務(wù)需求,選取路徑長(zhǎng)度及路徑平滑度2 個(gè)指標(biāo),生成算法演進(jìn)的目標(biāo)函數(shù)。其中,路徑長(zhǎng)度是用于考察在給定起點(diǎn)與終點(diǎn)時(shí)路徑規(guī)劃算法所規(guī)劃的避碰路徑的工作效率,較小的路徑長(zhǎng)度表示無(wú)人艇能較為有效地避開(kāi)地圖中的障礙物;路徑平滑度影響規(guī)劃的路徑對(duì)無(wú)人艇操縱性的需求,較小的路徑平滑度表示生成路徑對(duì)于無(wú)人艇水動(dòng)力性能需求較小,在較復(fù)雜的環(huán)境下有更高的穩(wěn)定性。兩者的計(jì)算公式分別為:
式 中:n為 路 徑 段 數(shù); ?Li為 第i段 路 徑 的 長(zhǎng) 度;?θi為第i段路徑與第i+1 段路徑的角度變化。對(duì)同一組測(cè)試的結(jié)果,采用歸一化方法將測(cè)試指標(biāo)映射到[0,100]的范圍內(nèi)。
對(duì)于路徑規(guī)劃算法的傳統(tǒng)優(yōu)化方法為:基于式(6)中的2 個(gè)目標(biāo)函數(shù),尋找使2 個(gè)表達(dá)式值最小的算法參數(shù)。此方法雖能在一定程度上提升算法的表現(xiàn),但是,對(duì)于生成的路徑與無(wú)人艇航跡跟蹤算法之間的耦合效應(yīng)和實(shí)海域環(huán)境下的外載荷擾動(dòng)考慮不足。
若考慮實(shí)海域測(cè)試,路徑規(guī)劃及航跡跟蹤算法的耦合效應(yīng)體現(xiàn)為:基于給出的規(guī)劃路徑,無(wú)人艇在實(shí)海域環(huán)境下的實(shí)際軌跡。因此,無(wú)人艇路徑規(guī)劃算法的實(shí)際表現(xiàn)可相應(yīng)地通過(guò)無(wú)人艇的航跡長(zhǎng)度和累計(jì)艏向變化表述,其表達(dá)式為:
考慮RRT 算法的隨機(jī)性,即針對(duì)每一組超參數(shù)值可能存在不同解,以及有限的實(shí)海域測(cè)試資源。在利用算法規(guī)劃路徑的過(guò)程中,采用式(6)和式(7)對(duì)規(guī)劃結(jié)果進(jìn)行分析,選取實(shí)際生成的若干組路徑中效果最好的一組作為該組超參數(shù)下的規(guī)劃路徑結(jié)果,用于實(shí)海域測(cè)試。
經(jīng)過(guò)歸一化方法處理后,實(shí)海域測(cè)試環(huán)境下局部路徑規(guī)劃算法的目標(biāo)函數(shù)可表示為
考慮到實(shí)際環(huán)境的復(fù)雜性,一般可認(rèn)為系統(tǒng)參數(shù)與無(wú)人艇裝備效能之間的關(guān)系為一個(gè)多峰函數(shù),難以使用傳統(tǒng)的線性或非線性回歸方法來(lái)擬合兩者的關(guān)系。同時(shí),無(wú)人艇單次測(cè)試持續(xù)時(shí)間長(zhǎng)、過(guò)程復(fù)雜,且獲取的數(shù)據(jù)樣本量少。有鑒于此,研究團(tuán)隊(duì)利用實(shí)驗(yàn)設(shè)計(jì)原理,在高維的參數(shù)空間內(nèi)選取分散錯(cuò)落的數(shù)據(jù)點(diǎn),以減少實(shí)海域環(huán)境下對(duì)數(shù)據(jù)的需求[15]。隨后,采用以高斯回歸過(guò)程(Gaussian regression process,GRP)為代表的機(jī)器學(xué)習(xí)方法,用代理模型代替尋優(yōu)算法中目標(biāo)函數(shù)和優(yōu)化參數(shù)之間的關(guān)系[16-20]。在此基礎(chǔ)上,通過(guò)快速遍歷或遺傳算法等尋優(yōu)算法,找到裝備效能最優(yōu)的參數(shù)集。
算法參數(shù)演進(jìn)流程如圖4 所示,其中,高斯代理模型的擬合精度一方面受到樣本集的分布影響;另一方面,其核函數(shù)、均值函數(shù)及似然函數(shù)的模型都會(huì)影響其收斂精度。針對(duì)不同的參數(shù)集,考慮其運(yùn)行過(guò)程中的物理過(guò)程特點(diǎn),選取合適的數(shù)學(xué)模型,有助于提高算法參數(shù)演進(jìn)的可靠性和精度。
圖4 基于代理模型的算法參數(shù)演進(jìn)流程Fig. 4 The evolution process of algorithm parameter based on the surrogated model
此外,考慮到工程實(shí)際中的調(diào)整參數(shù)過(guò)程,確定一個(gè)可用參數(shù)的定義域并不困難,但是使無(wú)人艇效能最優(yōu)的參數(shù)組一定落在所選定義域內(nèi)卻難以確定。因此,基于代理模型的算法參數(shù)演進(jìn),主要解決基于樣本集數(shù)據(jù)分布形成的參數(shù)定義域及其鄰域中尋找最優(yōu)參數(shù)組的問(wèn)題。
本次用來(lái)測(cè)試的船艇為“追夢(mèng)三號(hào)”無(wú)人艇,艇長(zhǎng)約7 m,計(jì)劃航速8~10 kn,其外觀如圖5 所示。
圖5 “追夢(mèng)三號(hào)”無(wú)人艇Fig. 5 Zhuimeng 3 USV
“追夢(mèng)三號(hào)”無(wú)人艇的組成系統(tǒng)包括:供電系統(tǒng)、執(zhí)行機(jī)構(gòu)系統(tǒng)、監(jiān)控系統(tǒng)、感知系統(tǒng)、計(jì)算系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)。其中:供電系統(tǒng)包括發(fā)電機(jī)和蓄電池,感知系統(tǒng)包括海事雷達(dá)、攝像機(jī)群和風(fēng)速計(jì),執(zhí)行機(jī)構(gòu)為水星舷外機(jī)。該無(wú)人艇的航跡跟蹤控制算法受限于舷外掛機(jī)的物理特性,相較于傳統(tǒng)的槳舵或噴泵的控制精度不足,對(duì)路徑規(guī)劃算法的結(jié)果要求較高。此外,測(cè)試海域常處于3~4級(jí)海況,對(duì)于被測(cè)試無(wú)人艇來(lái)說(shuō),此時(shí)的海況屬于外載荷較大的情況,因此,這對(duì)于路徑規(guī)劃算法的參數(shù)演進(jìn)有較高實(shí)際應(yīng)用價(jià)值。
測(cè)試時(shí),航速約8 kn,考慮單次測(cè)試時(shí)長(zhǎng)不超過(guò)30 min,選取的地圖大小為2 400 m×2 400 m。在算法程序中,使用的實(shí)際網(wǎng)格數(shù)為600×600,因此,單個(gè)網(wǎng)格的長(zhǎng)度對(duì)應(yīng)實(shí)際地圖長(zhǎng)度為4 m。以網(wǎng)格左上角為零點(diǎn),相應(yīng)障礙物位置及障礙物半徑(膨脹安全半徑為15 m)如表2 所示。
表2 虛擬障礙物坐標(biāo)及相應(yīng)避碰半徑Table 2 The location of virtual obstacles and corresponding avoiding radius
路徑規(guī)劃的起點(diǎn)與終點(diǎn)分別設(shè)置為(100 m,100 m)和(480 m,500 m)。其虛擬障礙物地圖如圖6 所示。
圖6 虛擬障礙物設(shè)置Fig. 6 The virtual obstacle setting
在前期算法的仿真測(cè)試中,選取了目標(biāo)偏向概率和步長(zhǎng)的范圍分別為[0.1,0.3]和[150 m,180 m]。
根據(jù)實(shí)驗(yàn)設(shè)計(jì)原理,選擇了9 組參數(shù)作為實(shí)海域測(cè)試的樣本點(diǎn),令權(quán)重向量 ω=(0.5, 0.5)T,得到參數(shù)值及實(shí)海域測(cè)試結(jié)果如表3 和圖7 所示。
基于上述數(shù)據(jù),采用高斯模型建立“參數(shù)?評(píng)分”關(guān)系代理模型[16],其核函數(shù)k選為
式中: σ 和 ξ 分別為預(yù)測(cè)方差和縮放系數(shù);x,x′為輸入的參數(shù)組。該核函數(shù)適用于輸出結(jié)果隨參數(shù)變化平滑的物理過(guò)程[17],考慮RRT 算法中的隨機(jī)性,可以認(rèn)為實(shí)海域測(cè)試評(píng)分應(yīng)當(dāng)隨2 個(gè)參數(shù)平滑變化。同時(shí),相應(yīng)代理模型收斂條件為調(diào)整 σ和ξ的值以最小化損失函數(shù),也即相應(yīng)預(yù)測(cè)值應(yīng)滿足:
式中:x?為 需要預(yù)測(cè)的參數(shù)對(duì);yguess為相應(yīng)的預(yù)測(cè)值;R?L為期望的損失函數(shù),arg min 為求損失函數(shù)值最小的預(yù)測(cè)值。本次測(cè)試中采用的損失函數(shù)為
式中:y?為 真實(shí)值。R?L即 為預(yù)測(cè)值yguess和真實(shí)值y?之差的平方和。令該值最小的預(yù)測(cè)模型為最終得到的參數(shù)?評(píng)分映射模型。
實(shí)海域測(cè)試數(shù)據(jù)隨算法參數(shù)變化的高斯模型回歸結(jié)果如圖8(a)所示, 其中“+”表示實(shí)測(cè)數(shù)據(jù),曲面為擬合數(shù)據(jù)。損失函數(shù)隨迭代次數(shù)變化的趨勢(shì)如圖8(b)所示。由高斯模型擬合得到的地圖與海域環(huán)境下的最優(yōu)RRT 算法參數(shù)如下:步長(zhǎng)D=164 m,目標(biāo)偏向概率P=0.05。
由該參數(shù)組生成的避碰路徑如圖9 所示。根據(jù)實(shí)測(cè)結(jié)果,用于測(cè)試的樣本集參數(shù)組在實(shí)際任務(wù)場(chǎng)景中已滿足需求,能夠完成避碰任務(wù)。通過(guò)代理模型方法得到的結(jié)果,是在樣本空間對(duì)應(yīng)的參數(shù)組定義域中表現(xiàn)更好的參數(shù)組。因此,基于代理模型生成的參數(shù)?評(píng)價(jià)映射中,已經(jīng)包含了最優(yōu)參數(shù)組與隨機(jī)選用的可用參數(shù)組對(duì)應(yīng)的無(wú)人艇效能之間的比較結(jié)果。通過(guò)擴(kuò)大樣本數(shù)量,增加循環(huán)測(cè)試等手段,能夠更準(zhǔn)確地生成測(cè)試海域下對(duì)于“追夢(mèng)三號(hào)”無(wú)人艇最優(yōu)的避碰參數(shù)。
此外,考慮RRT 算法參數(shù)對(duì)其運(yùn)算結(jié)果的影響,最優(yōu)步長(zhǎng)的選取趨勢(shì)體現(xiàn)為在有限空間內(nèi)盡可能搜索障礙物避碰半徑區(qū)域的邊界。圖9 中路徑與數(shù)個(gè)障礙物膨脹后的避碰半徑接近相切,說(shuō)明對(duì)空間進(jìn)行了盡可能的搜索。目標(biāo)偏向概率的選取趨勢(shì)體現(xiàn)為在空間中搜索路徑的發(fā)散性,在上述障礙物地圖中,起點(diǎn)與終點(diǎn)間存在較多障礙物,且障礙物間距較小,目標(biāo)偏向概率的合理減小有助于規(guī)劃算法對(duì)空間的搜索性,在狹窄范圍內(nèi)搜索到高質(zhì)量路徑。由此可見(jiàn),在有限組數(shù)據(jù)集前提下,高斯代理模型能有效擬合系統(tǒng)在實(shí)海域條件下相應(yīng)算法效能的變化趨勢(shì),其生成的最優(yōu)參數(shù)值具有符合實(shí)際情況的可解釋性。
圖8 高斯代理模型擬合數(shù)據(jù)Fig. 8 The fitting data based on Gaussian surrogated model
圖9 采用RRT 算法基于最優(yōu)參數(shù)集生成的避碰路徑Fig. 9 The obstacle-avoidance path generated by RRT algorithm based on optimized parameters
海洋環(huán)境是一個(gè)巨大的復(fù)雜隨機(jī)系統(tǒng),無(wú)人艇自身又由多個(gè)復(fù)雜子系統(tǒng)構(gòu)成,這導(dǎo)致了無(wú)人艇裝備效能是一個(gè)復(fù)雜多系統(tǒng)耦合作用的結(jié)果。針對(duì)上述難點(diǎn)問(wèn)題,結(jié)合無(wú)人艇自主系統(tǒng)算法特征,本文從智能算法的角度提出了無(wú)人艇智能演進(jìn)的2 種主要形式:一是算法函數(shù)的演進(jìn);二是算法參數(shù)的演進(jìn)。在此基礎(chǔ)上,本文以無(wú)人艇避碰算法為例,基于實(shí)海域環(huán)境下的測(cè)試結(jié)果,初步驗(yàn)證了所提方法在提升無(wú)人艇裝備效能方面的可行性與有效性。
受限于對(duì)無(wú)人裝備智能戰(zhàn)斗力生成機(jī)理認(rèn)識(shí)深度的不足,以及實(shí)海域環(huán)境下測(cè)試技術(shù)的不完善,本研究尚處實(shí)驗(yàn)探索階段,未來(lái)還需針對(duì)海洋無(wú)人裝備的智能演進(jìn)機(jī)理與實(shí)海域環(huán)境測(cè)試技術(shù),開(kāi)展更加廣泛而深入的研究。針對(duì)無(wú)人艇智能演進(jìn)問(wèn)題,提出以下研究方法建議:
一是無(wú)人艇智能演進(jìn)目標(biāo)函數(shù)的量化模型研究。由于無(wú)人艇裝備效能是一個(gè)復(fù)雜環(huán)境與多算法耦合作用的結(jié)果,難以用解析方法描述其智能演進(jìn)目標(biāo)函數(shù)。因此,基于無(wú)人裝備智能裝備戰(zhàn)斗力生成機(jī)理,提出無(wú)人艇智能演進(jìn)目標(biāo)函數(shù)的量化模型,是實(shí)現(xiàn)智能演進(jìn)的前提。
二是無(wú)人艇智能演進(jìn)機(jī)器學(xué)習(xí)模型構(gòu)建方法研究。機(jī)器學(xué)習(xí)的底層是各類線性或非線性的數(shù)學(xué)回歸模型,這些模型也稱為機(jī)器學(xué)習(xí)中的超參數(shù)?,F(xiàn)有的大量研究證明,不同的超參數(shù)選取,面對(duì)不同的學(xué)習(xí)對(duì)象時(shí)會(huì)呈現(xiàn)完全不同的結(jié)果。因此,探究這些超參數(shù)與無(wú)人艇裝備效能之間的作用機(jī)理,進(jìn)而提出無(wú)人艇智能演進(jìn)機(jī)器學(xué)習(xí)模型的構(gòu)建方法,是實(shí)現(xiàn)智能演進(jìn)的路徑。
三是無(wú)人艇智能演進(jìn)學(xué)習(xí)數(shù)據(jù)高效獲取的方法研究。大中型無(wú)人艇在實(shí)海域環(huán)境下的測(cè)試成本高、時(shí)間長(zhǎng),且單次測(cè)試流程復(fù)雜,應(yīng)根據(jù)無(wú)人艇系統(tǒng)的特點(diǎn)合理地進(jìn)行具有代表性的測(cè)試。大批高質(zhì)量的學(xué)習(xí)數(shù)據(jù)集是無(wú)人艇智能演進(jìn)的原材料。因此,在建設(shè)海洋無(wú)人裝備實(shí)海域測(cè)試場(chǎng)的基礎(chǔ)上,研究標(biāo)準(zhǔn)化測(cè)試科目的制定、測(cè)試數(shù)據(jù)的采集處理,是實(shí)現(xiàn)智能演進(jìn)的保障。