(海軍航空大學(xué)青島校區(qū) 青島 266100)
在過去的幾十年中,水陸平面上的受控對象已成為眾多學(xué)者的研究主題。受控對象主要是輪式移動機器人和螺旋槳式車船,該控制過程中存在控制理論中諸多難題亟待解決,因此目標(biāo)對象的控制遇到重重困難,諸多文獻為解決部分問題提供了各種控制方法,如使用時變控制器,通常具有較低的收斂速度[1~2];或使用以指數(shù)收斂速度[3]為特征的定??刂破?,該控制器具有不連續(xù)性。
本文探討了控制學(xué)科中的導(dǎo)航問題,即一個物體在水平面上,從起始航行到所需的航線,定向到目標(biāo)點的最佳定向運動。物體的運動具有以下參數(shù):全運動時間的剛性約束、單向操縱的可能性和有限數(shù)量的沖量。上述參數(shù)由數(shù)學(xué)模型解釋,但同時也促使開發(fā)了用于對象控制的方法。本文介紹了三種新的控制方法:基于改進多重打靶法、誤差定位法、模糊邏輯法,目的是通過確定沖量的執(zhí)行類型和順序,來評估從初始航向到目標(biāo)點的最佳導(dǎo)航操縱軌跡??刂品椒ㄔ谲浻布嶒炂脚_上進行仿真,該平臺設(shè)計用于模擬通過上述方法計算出的沖量類型和執(zhí)行順序。以期為水平面上受控對象的控制方法研究提供參考。
假定目標(biāo)物體的運動是在水平面內(nèi)實現(xiàn)的,其受不變的確定時間和相同的初始到目標(biāo)的距離的約束(圖1a)。此運動包括兩個階段,第一個階段是勻速直線階段,沒有任何外部控制輸入;而第二個階段是控制定向階段。在極坐標(biāo)系下,在目標(biāo)物體定位前,第一階段的航向及其徑向位移的運動方程為式(1)。
圖1 受控對象的軌跡和參數(shù)
其中,φ0是初始速度,是物體在第一階段中的速度。
第二定向階段主要由兩個參數(shù)定義,一個是相對時間因子τ*,另一個是轉(zhuǎn)彎航向角Δφ(圖1(a))。第二個定向階段分為N個子階段,記為i+1(i=1,2,…,N)。
沿追蹤線BC(見圖1(b))的相位持續(xù)時間為τ(2)=τ-τ(1)。
假設(shè)在操縱時刻的初始水平速度已知,對于每一階段,水平速度通常表示為式(3):
在特定相位i+1中,徑向單位矢量λ和轉(zhuǎn)向單位矢量μ的初始值分別等于上一階段i結(jié)束時的值λ0(i)和μ0(i),如式(5)所示:
如果一個子階段的持續(xù)時間為τ(2),從操縱開始點B開始達到目標(biāo)點C,則轉(zhuǎn)向運動只有一個子階段。這種情況被認為是單相的,其轉(zhuǎn)向距離和時間在上述模型中都是不變的值。單相位轉(zhuǎn)彎對運動的定向速度分量要求較高,而多相位轉(zhuǎn)彎約束較少,可以避免定向過程中的剛性運動條件[6]。沿追索線(B到C)(圖1(a))的單相操縱路徑為參考距離,用于測試各子階段中最終目標(biāo)C的運動誤差。
1)轉(zhuǎn)向運動的橫向沖量(Lat)。其中定向速度的特征是具有有限的幅值和在80°附近的固定角度υ。這種類型的沖量具有兩個分量:一個是與物體的速度正交的分量,該速度代表對轉(zhuǎn)彎運動的唯一貢獻,也是定位速度大小的重要主要部分。另一個是縱向分量,作為沿方向的速度相加,以略微調(diào)整由于橫向運動路徑而引起的錯位。物體速度的表達式,在極坐標(biāo)下,階段(i+1)中物體速度的表達式為式(7):
2)橫向運動的縱向沖量(Lon)。該沖量是到目標(biāo)運動的一個貢獻。在這種情況下,定向速度記為,由有限的幅值和零角υ定義。該沖量的作用是糾正由于將對象移動到目標(biāo)點C所經(jīng)過的約束時間而導(dǎo)致的到目標(biāo)的錯過距離[7]。的表達式如式(8):
3)沒有沖量(Ni)。這種運動是最常見的,物體在同一方向上以相同的速度大小繼續(xù)運動。在這種情況下,定向速度矢量的大小等于零,因為物體的速度表示式(9):
通過確定每個子階段中沖量的類型,操縱相位可以根據(jù)與目標(biāo)的距離和方向來調(diào)整和校正。
通過計算啟動時間和沖量類型,提出并實現(xiàn)了三種優(yōu)化連續(xù)轉(zhuǎn)向軌跡的方法。其基本思想是將操縱相位時間τ2劃分為N個Δt的間隔,然后在從1到N的每個間隔分別應(yīng)用下列決策方法之一,通過式(7)、(8)和(9)激活其中一種沖量類型。目標(biāo)是計算每個間隔的子軌跡,以便到目標(biāo)C的軌跡是N個子軌跡的連接[8~9]。
經(jīng)典的單次打靶法是一種廣泛用于求解兩點邊界值問題的數(shù)值方法,這些問題主要是具有給定解的初值和終值的微分方程[10~11]。該方法通過更改初始斜率,以表示物體從初始點“射出”的軌跡,這個初始斜率會導(dǎo)致軌跡“擊中”目標(biāo)或最終值??梢詫⑹芸貙ο蟮倪\動階段視為一種邊界值問題,其中初始值和最終值分別是操縱起始點B和目標(biāo)點C。
改進的多重打靶法(MMS)使用了問題的時間分解。確切地說,時域被劃分為N個區(qū)間Δt=[ti-1,ti] ,i=1,2,...,N,其 中τ(2)=[t0,tN] ,且τ(1)=t0<t1<...<tN=τ。該方法的新穎之處在于,MMS無需為每個時間間隔引入人為初始值,而是在選擇最佳打靶之前應(yīng)用三個單次打靶。EN(IN,tN-1)為到目標(biāo)的最終誤差距離,式(10)所示:
上述MMS旨在評估邊界點B和C之間的最佳軌跡,該軌跡將目標(biāo)的臨時最終誤差的成本函數(shù)J最小化為式(12):
MMS的輸出是應(yīng)用在tk-1實例上的沖量類型,這些沖量產(chǎn)生最佳軌跡。將MMS應(yīng)用到實際中,例如,對于從1到N的第j個間隔,該算法計算出三次打靶后剩余時間的軌跡。最接近目標(biāo)的打靶被選為最佳打靶。然后在第j個區(qū)間采用最佳打靶誘導(dǎo)的軌跡,并以其最終值作為初值,確定第(j+1)個區(qū)間的最佳打靶,該方法產(chǎn)生的最佳耦合數(shù)據(jù)可用于評估其他方法。
考慮到上述系統(tǒng)規(guī)范,將操縱目標(biāo)的運動視為開始定向點B和目標(biāo)C之間的受控導(dǎo)航。基于這些事實,設(shè)計了一種邏輯決策控制器,以保證該類系統(tǒng)對目標(biāo)的最小誤差[12~13]。本研究設(shè)計了一種新型時不變控制器,即誤差定向控制器(Current Error Orientation,CEO),其結(jié)構(gòu)如圖2所示。
圖2 CEO方法的結(jié)構(gòu)和輸入/輸出
設(shè)計的兩輸入一輸出誤差定向控制器作為輸入:誤差E1(t)表示期望角度βc與角度β(t)之間的差值,誤差E2(t)表示期望誤差εc和實際誤差ε(t)之間的差值,其中β(t)表示物體的速度矢量與目標(biāo)的夾角(見圖1(b))。誤差ε(t)定義為到目標(biāo)d2T的剩余距離與到d2go的距離之差,在由計算的運動方向上,誤差ε(t)與剩余運動時間t2go的關(guān)系為式(13):
式(14)和式(15)分別給出了E1(t)和E2(t)的數(shù)學(xué)表達式。
CEO控制器通過橫向沖量調(diào)節(jié)物體朝向目標(biāo)的方向β(t),由E1(t)解釋。在達到期望方向β(t)后,CEO控制器通過執(zhí)行縱向沖量來控制誤差值ε(t),從而隱式地調(diào)整最終誤差。在達到期望方向β(t)和誤差ε(t)的情況下,控制器做出無沖量使用的決策,與第三種類型相對應(yīng)。這些邏輯決策是在操作階段為每個實例t生成的。
圖3顯示了決策模糊邏輯控制器(FLC)的結(jié)構(gòu),其中FLC用于控制驅(qū)動對象的橫向運動。在目前的應(yīng)用程序中,F(xiàn)LC被設(shè)計成在每個時間間隔內(nèi)決定要執(zhí)行的沖量類型[14~15]。該沖量序列旨在確保每個預(yù)定角度和相對運動因子的最小誤差。
圖3 模糊邏輯結(jié)構(gòu)
模糊邏輯使用隸屬函數(shù)來定義清晰的物理輸入值在多大程度上屬于語言變量集中的術(shù)語。一般來說,模糊控制系統(tǒng)主要由三個基本組成部分組成,即模糊化塊、模糊推理機(規(guī)則庫)和反模糊化塊。任何FLC的本質(zhì)都是模糊推理機,它既包括決策邏輯又包括知識庫。模糊化塊將每個清晰的輸入信息轉(zhuǎn)換為模糊值。知識庫由一個數(shù)據(jù)庫組成,數(shù)據(jù)庫中有必要的語言變量作為規(guī)則集,而決策邏輯用于決定模糊邏輯運算的執(zhí)行方式。模糊推理機以模糊值的形式確定每個模糊規(guī)則的輸出,這些模糊值(輸出)在去模糊化塊中轉(zhuǎn)換為脆值。
本文設(shè)計的模糊控制器是一個雙輸入單輸出控制器,輸入是角β(t)和來自CEO方法的誤差ε(t)。FLC的輸出是在特定時間間隔開始時執(zhí)行的沖量類型決策I(t)。因此,輸出被歸結(jié)為三個隸屬函數(shù),橫向、縱向和無沖量。用梯形隸屬函數(shù)對輸入變量進行模糊化,用三角形隸屬函數(shù)對輸出變量進行模糊化。隸屬度邊界如圖4所示。
圖4 輸入和輸出變量的隸屬函數(shù)定義
本文采用的方法是最大值法(Mean of Maximum,MoM)。去模糊化值定義為隸屬度所有值的均值,由式(16)給出:
其中,I(t)為最大值,cj為隸屬函數(shù)最大的點,L為輸出分布達到最大值的次數(shù)。
靜態(tài)仿真測試是通過軟硬件設(shè)計的組件實現(xiàn)的,如圖5所示。電子控制器與led二極管連接,所需的軟件控制輸入是期望的轉(zhuǎn)向角 Δφ∈[8°,18°],相對時間因子τ*以及上述控制方法之一。靜態(tài)沖量模擬器按照時間序列打開二極管,操作員可以為非最佳最終誤差選擇另一個參數(shù)對,同時須在一組預(yù)定義的角速度之間選擇物體角速度。這一可視化程序相當(dāng)于在兩個環(huán)內(nèi)點燃安裝在受控對象上的強大沖量。第一個面向82°側(cè)向,以模擬橫向沖量功,第二個在軸向上以最終的0°方向安裝,呈現(xiàn)縱向沖量。
圖5 軟件/硬件組裝
硬件的設(shè)計和編程可打開所有雙色二極管上的綠燈,以指示系統(tǒng)準(zhǔn)備就緒以及第一階段的持續(xù)時間τ(1)。在打開混合光之前,打開紅燈會持續(xù)Δt時間,以表明沖量不再可用于轉(zhuǎn)向,并且持續(xù)所有剩余的定向時間t2go。
電子輸入包括微控制器單元、Arduino板、能夠與PC機進行USB連接的板以及附加板。人機界面基于字符LCD模塊,配有用于選擇方法和參數(shù)對Δφ和τ*的觸覺開關(guān)。外部EPROM單元能夠存儲和調(diào)用大數(shù)據(jù)集。
沖量執(zhí)行的可視化過程是通過34個LED二極管完成的,其中22個用于橫向沖量,另外12個用于縱向沖量。在應(yīng)用的硬件上,74HCT595串行到并行鏈由外部電源供電,二極管電流受陽極電阻限制。由于74HCT595的整個串行鏈將輸出設(shè)置為存儲寄存器時鐘信號(引腳12)的選通沖量上的并行寄存器,因此串行寄存器中的所有預(yù)定義狀態(tài)會同時出現(xiàn)在輸出端口上。內(nèi)部計時器中斷例程可實現(xiàn)可視化過程的精確計時,選擇1ms的時間分辨率,并且上述硬件的抖動小于62ns,而延遲是恒定且可重復(fù)的。
為了研究所提出的方法產(chǎn)生最小最終誤差的操縱軌跡的能力,利用上述數(shù)學(xué)模型進行了大量的仿真。操縱由三種驅(qū)動沖量來執(zhí)行:1)橫向沖量(Lat),沿物體運動方向產(chǎn)生的橫向速度為ULat=21.8m/s、最佳角度為υ=82°;2)縱向沖量(Lon),沿物體運動方向產(chǎn)生的縱向速度為ULon=20.0m/s;3)無 沖 量(Ni),其 速 度 為UNi=0.0m/s。沖量的執(zhí)行時間和采樣時間分別為300ms和 Δt=320ms。
目標(biāo)C距離物體初始位置的徑向距離為D=36697m。假定物體的初始速度全運動時間τ=86.97s,為了選擇最終誤差,對每個選定的相對時間因子τ*∈[0.5,0.8]和期望的轉(zhuǎn)航角度 Δφ∈[8°,18°]進行重復(fù)模擬。到目標(biāo)的最終誤差距離是通過適當(dāng)數(shù)量和類型的沖量來實現(xiàn)的,仿真結(jié)果如表1所示。
通過比較各種方法的結(jié)果,可以得出結(jié)論:對于每個期望的操縱航向Δφ和時間因子τ*,所有方法都給出了近似的最終誤差距離,其中,模糊邏輯方法的最終誤差距離最小。
表1中出現(xiàn)的最終誤差距離被假定為系統(tǒng)誤差(偏差)。為了確定系統(tǒng)對模型誤差的靈敏度,在每個采樣間隔內(nèi)對系統(tǒng)參數(shù)進行任意擾動。由于目標(biāo)的速度是數(shù)學(xué)模型的本質(zhì),所以期望并選擇將擾動加到目標(biāo)速度的大小上,即ΔV(i)∈[-5,+5]ms-1,約占定向速度幅值的25%,其方向為Δθi∈[-0.25°,+0.25°]。為了模擬三種方法在存在擾動時的有效性,選擇了Δφ=8°和τ*=0.75的情況。在每個采樣間隔中,三種方法的擾動將等量地增加。重復(fù)n次模擬,并且三種方法的最終誤差遵循正態(tài)分布定律,其結(jié)果參數(shù)顯示表2中。參數(shù)包括平均最終誤差距離Edf(m)、標(biāo)準(zhǔn)偏差σ(m)以及最小Edf(m)min和最大誤差距離Edf(m)max。根據(jù)表2的數(shù)據(jù)可知,模糊控制方法的性能最佳,適合作為水平面上受控對象的控制方法。
表1 三種方法的仿真結(jié)果
表2 在擾動情況下的仿真結(jié)果
對目標(biāo)操縱控制的三種決策方法進行了比較分析,給出了在外部擾動存在時,所有方法的提升和收斂結(jié)果。本文提出了一種改進多重打靶法,將直接多重打靶法和單一打靶法相結(jié)合,因此大大簡化了操縱軌跡優(yōu)化,并且比單次打靶方法具有數(shù)值穩(wěn)定性。改進多重打靶方法涉及最小邏輯問題分析,因此被用作初步估計受控對象參數(shù)的參考。這種方法的缺點是它不允許將有關(guān)解決方案的信息顯式地包括到問題解決過程中。CEO方法采用經(jīng)典控制理論,對多輸入單輸出系統(tǒng)應(yīng)用時不變控制律,這種方法提供了操縱的數(shù)學(xué)解決方案,但在實際系統(tǒng)上實施之前需要進行進一步的穩(wěn)定性分析。模糊邏輯方法(FLC)已經(jīng)在許多系統(tǒng)上證明了其有效性,它通過模糊規(guī)則集將解決方案顯式地結(jié)合到問題中。由本研究的仿真數(shù)據(jù)可知,模糊邏輯方法相比于其他兩種控制方法的性能更優(yōu)。