季 偉,吳建靈,吳建友,潘科宇,葉吉超
(1.浙江省麗水市正陽電力建設有限公司 技術部,浙江 麗水 323020;2.國家電網(wǎng)麗水供電公司 技術部,浙江 麗水 323020)
近年來,利用無人機巡檢作業(yè)保證了高空復雜環(huán)境下的電力安全,國家電網(wǎng)公司已將無人機巡檢納入輸電線路精益化考核指標中。航線規(guī)劃[1]作為無人機電力巡檢的基礎和前提,其目的是根據(jù)無人機巡檢任務搜索最優(yōu)路徑。與其它應用領域不同,無人機電力巡檢的航線規(guī)劃在對電力設備位置檢查的同時,還需考慮高空復雜環(huán)境下的干擾因素,現(xiàn)有通過位置制定航線的方法[2]忽略了環(huán)境信息的動態(tài)變化,使規(guī)劃效率較低、航線導航不準,難以解決巡檢精準性問題。動態(tài)環(huán)境下的航線規(guī)劃主要提供了概率路標圖[3](PRM)、擴展隨機樹[4](RRT)、粒子群優(yōu)化[5](PSO)、Voronoi圖[6]、智能學習方法[7,8]等方法,但這些方法應用于電力巡檢的動態(tài)規(guī)劃需要沿特定電力纜線排查和精細化設備巡檢執(zhí)行,其檢測區(qū)域不同于平面搜索區(qū)域,因此較難適用于電力巡檢的軌跡策略。
針對電力巡檢的軌跡規(guī)劃問題,文獻[9]構(gòu)建了一種用于無人機巡檢航線規(guī)劃的智能桿塔連通圖,為智能規(guī)劃提供數(shù)據(jù)支持;文獻[10]利用規(guī)劃區(qū)域內(nèi)電力線走廊激光點云數(shù)據(jù)確定航跡位置點,實現(xiàn)巡檢過程中對障礙物的規(guī)避;文獻[11]研究了一種最小時間搜索的目標監(jiān)測方法,應用于高空電力電纜的監(jiān)測;文獻[12]在研究改進RRT算法的基礎上,提出一種在電力輸電線路中適用于無人機的路徑規(guī)劃算法。但以上方法在實時規(guī)劃線路上無法描述無人機感知器采集的信息,缺乏在線軌跡位置節(jié)點的語義擴展,不能反映在線環(huán)境信息,影響最佳飛行軌跡和巡檢位置。
綜上所述,從信息處理角度,提出一種面向無人機電力巡檢航線規(guī)劃的語義軌跡模式,目的是構(gòu)建具有環(huán)境感知、航跡構(gòu)造和語義策略圖模型的語義服務應用,在netlogo[13,14]仿真平臺上驗證所提方法的有效性。
(1)無人機屬性及飛行參數(shù)
無人機在一定巡檢區(qū)域W×L內(nèi)飛行,不僅需要對巡檢對象上升下降巡檢,還需要對前后線纜的實時檢測,同時受到包括環(huán)境障礙、碰撞規(guī)避、電磁干擾等干擾因素的約束影響。設系統(tǒng)為基于四旋翼的單體無人機,每臺無人機都架構(gòu)了相同的傳感器和觀測系統(tǒng),采用文獻[15]的方法計算飛行參數(shù),通過加速器直接測量機體坐標下的水平移動速度為VU,最大偏角度為ω,有效探測距離為L,考慮無人機動態(tài)飛行時的角度和半徑。
(2)巡檢任務描述
無人機以VU的速度在巡檢區(qū)域的水平和豎直方向飛行,如圖1所示,所有的目標對象信息分布于未知環(huán)境區(qū)域中,設有NI個干擾因素(用圓形表示),巡檢任務是對所在區(qū)域目標對象進行巡檢,覆蓋所有電力對象及對象附屬實體。
圖1 電力巡檢環(huán)境區(qū)域描述
航跡的語義服務是被賦予了語義信息的軌跡結(jié)構(gòu),當無人機在空間位置進行巡檢定位時,形成了大量的關于巡檢位置的空間序列,由Stop序列集和Move序列集組成[16]。其中,Stop序列集表示為Stop_sq={Ωk,Ti,Ti+n}, 它是航跡巡檢停留節(jié)點集合,Ωk表示第Ti至Ti+n時刻巡檢的區(qū)域;而Move序列集Move_sq表示為連接兩個Stop位置點之間的最大子軌跡。由于感知到具體實體對象時,需要根據(jù)環(huán)境感知推理的數(shù)據(jù)交換格式,在Stop序列集和Move序列集形成航跡可重構(gòu)的特征點,以保證規(guī)劃的精準性。其實時航跡特征點表示為
S={si|si∈λ∩?Stopi(i∈[1,n])∩
(Stopi="tower"∩DStopi>d∩DθStopi>ω)}
(1)
式中:ω為偏角度,d為位置偏移距離閾值,對于航跡λ中任意采樣點Stopi, 記DStopi為Stopi的位置偏移距離,DθStopi為Stopi的角度偏移距離。當采樣點位置語義標簽Stopi.label="tower"或DStopi>d或DθStopi>ω, 則Stopi定義為一個特征點si。
針對高空巡檢動態(tài)環(huán)境下航線管控的背景特征和信息的不確定性質(zhì),將巡檢航線規(guī)劃框架分為環(huán)境感知模塊、語義策略圖模型和航跡構(gòu)造模塊。
(1)環(huán)境感知模塊用于計算事件概率,根據(jù)語義模型觸發(fā)航跡位置的語義空間計算為目標線路選擇提供空間搜索方式,其功能主要包括特征點提取、區(qū)域劃分和感知推理。特征點提取用于對大量航跡數(shù)據(jù)的位置點進行語義信息提取,形成Stop序列集和Move序列集;區(qū)域劃分用于劃分當前區(qū)域環(huán)境,形式化表示干擾因素區(qū)域劃分、對象實體劃分以及巡檢關聯(lián)比重計算;感知推理通過Jena[17]推理控件的數(shù)據(jù)交換格式,用于為無人機提供航跡變化所做出的位置、姿態(tài)和引擎等狀態(tài)的服務,提供生成基于位置的語義連接,使特征點序列集加載了語義標簽,包括基于Jena的數(shù)據(jù)交換和位置連接;
(2)語義策略圖模型為基于OWL[18]的知識庫,其用途為存儲語義地圖、環(huán)境及無人機系統(tǒng)狀態(tài),主要由規(guī)則推理、行為更新、功能維護等組成,主要包括環(huán)境態(tài)勢庫、行為控制庫、歷史航線庫;
(3)航跡構(gòu)造模塊用于為無人機巡檢航線提供路線搜索和選擇機制,主要包括語義空間距離計算和強化學習的路徑選擇機制,使學習到的知識遷移至新的相似歷史航跡中,并實時更新語義策略圖模型,為航跡的構(gòu)造提供語義應用服務。圖2顯示了面向巡檢航線規(guī)劃的語義服務框架,它是整個系統(tǒng)的底層架構(gòu)。
圖2 面向電力巡檢的語義服務框架
無人機利用傳感器獲取信息開展巡檢感知任務,進而生成行為規(guī)劃以及關于位置的語義連接,并與語義策略知識庫協(xié)同為規(guī)劃模型,形成語義航跡,提供統(tǒng)一的數(shù)據(jù)規(guī)范。環(huán)境感知和航跡構(gòu)造共同觸發(fā)語義航跡模式,根據(jù)干擾區(qū)域進行語義空間距離計算和最優(yōu)路徑選擇??梢暬缑嫣峁┤藱C交互界面,研判無人機系統(tǒng)狀態(tài)和航線規(guī)劃;語義策略圖模型作為形式化表示模型,為任務提供所需背景知識,刻畫復雜環(huán)境下巡檢航跡位置節(jié)點的因果關系,從而實時提供語義模式的航跡規(guī)劃服務。
語義策略圖模型O_strategy構(gòu)建過程為:首先,獲取傳感器中的原始信息,生成行為控制庫、環(huán)境態(tài)勢庫和歷史航線庫,構(gòu)建相關的概念、屬性以及實例。如圖3所示,在語義策略知識庫中,態(tài)勢環(huán)境庫是由無人機傳感器和地面信息系統(tǒng)獲取的環(huán)境信息數(shù)據(jù),主要針對已構(gòu)建的電力桿塔、線纜、變壓器、閘閥、高壓螺栓等可視化設備,還包括雨雪風等天氣變化情況,并與空間數(shù)據(jù)平臺postGIS[19]進行數(shù)據(jù)接口對接;行為控制庫為無人機系統(tǒng)狀態(tài)及其引擎、位置和姿態(tài)等行為控制,通過實例獲取系統(tǒng)運行的參數(shù),用擴展Move序列集和Stop序列集的語義信息;歷史航線庫用于存儲或搜索歷史巡檢航線所記錄的關鍵位置節(jié)點、障礙物規(guī)避位置節(jié)點以及航線路徑的方向選擇等歷史線路構(gòu)建信息。
圖3 語義策略圖模型設計
(2)
然后,在考慮干擾因素基礎上,根據(jù)關聯(lián)比重對巡檢對象實體進行空間劃分,由式(3)計算得
(3)
區(qū)域劃分根據(jù)特定的巡檢需求和相關事務的特征位置對整個巡檢區(qū)域做了空間劃分,對于航線規(guī)劃而言需根據(jù)已劃分的區(qū)域,按照語義策略圖對路徑及位置進行研判,利用Apache Jena API[17]獲取語義概念、實例,生成可識別的數(shù)據(jù)交換格式,其代碼片段如下所示。
< PositionControl rdf:ID=“PosControl_1”/>
< tower rdf:ID=“tw_1”>
datatype=float”> electromagnetism=0.75
latitude
PositionControl >
< fil2_1 rdf:ID=“flx”>
has_Value_1>
< coll rdf:ID=“flx”>
has_Value_1>
由代碼片段可知,PosContr_1表示當前無人機位置控制狀態(tài)的實例,has_Stop表示Stop序列集中的數(shù)據(jù)系數(shù),根據(jù)序列集的語義推理擴展區(qū)域環(huán)境的“障礙干擾”概念集。從而確定該Stop位置上是否存在“電磁干擾(electromagnetism)”且電磁干擾系數(shù)為0.75時,選擇路徑方向“hasDirection”概念集下的具體經(jīng)緯度位置;ObjContr_1為巡檢對象可達的實例,flx表示卡爾曼濾波觀測數(shù)據(jù),0.67為系統(tǒng)噪聲因素;coll為共位參數(shù),0.54表示位置共位的參數(shù)量值,是對巡檢航線的方位控制。
基于上述數(shù)據(jù)片段,設無人機的位置狀態(tài)桿塔數(shù)據(jù)“tw_1”區(qū)域自定義規(guī)則connect連接關聯(lián)桿塔數(shù)據(jù)“tow_2”區(qū)域,生成事實庫cons_links。
String
rlex=“Constructs{ ?p_1:relates_To:Cryp_tography1}
Where”+”{{:tw_1?p_:tw_2}union{: tower_2?p_: tw_1}}” // 關聯(lián)事件存儲器
reo_1=newSails_Repositorys_1(new Query(new Store(),Query.SPARQL,rlex, “ ”))
代碼中,cons_links描述OWL文件轉(zhuǎn)化單個無人機在某狀態(tài)下的關系,通過Jena遍歷結(jié)點,可以較好保證語義策略本體的完備性和有效性。
通過對巡檢區(qū)域的環(huán)境態(tài)勢進行語義感知推理后,生成了基于位置的語義連接,使特征點序列集加載了語義標簽,而航跡規(guī)劃的語義控制是對巡檢區(qū)域內(nèi)線路進行搜索選擇,并提供連接語義策略知識庫的接口。考慮航跡規(guī)劃的最優(yōu)性和實時性矛盾[20],采用語義空間距離為目標線路選擇提供空間搜索的方式,通引入強化學習[21]的路徑選擇機制提高區(qū)域航跡規(guī)劃的航線代價值,使語義巡檢航跡達到期望最優(yōu)。
所提出的語義空間距離是將當前軌跡與語義策略圖O_strategy 進行航線選擇策略的一個計算方法,取決于語義距離和空間距離兩個部分。其中,語義距離是衡量空間位置節(jié)點與巡檢目標在語義上的距離。而空間距離是衡量O_strategy中空間頂點vCi與當前巡檢位置節(jié)點q的歐式距離。
(1)語義距離。考慮某時刻t巡檢某特征點位置信息q生成的Stop序列集和Move序列集,q的位置信息表示為vq, 可能匹配語義策略圖O_strategy上的多個頂點vCi, 采用與vCi在O_strategy圖上的最近距離來度量vq與vCi之間的語義距離,即為
(4)
其中,disO_strategy(vqi,vCi) 表示頂點vqi與vCi的最短路徑加權(quán)距離,如果vqi與vCi不存在路徑或者O_strategy中無q存在,則disO_strategy(vqt,vCi)=∞。
(2)空間距離。其O_strategy中空間頂點vCi與巡檢位置節(jié)點q的歐式距離表示為
Span(vqi,vCi)=dis(vqi.Coor,vCi.Coor)
(5)
式中:Coor表示當前位置的坐標值。綜合考慮語義距離和空間距離,使用以下公式對空間頂點進行排序
(6)
其中,α∈[0,1] 為平衡兩種距離的權(quán)重參數(shù),可以通過實驗調(diào)整。在式(2)、式(3)計算巡檢實體對象關聯(lián)比重和區(qū)域的基礎上,SemO_stragegy(vqi,v′Ci) 和Span(vqi,v′Ci) 用于對語義距離和空間距離進行特征位置點的k-means聚類[22],從而選擇合適的路徑作為航線規(guī)劃的期望網(wǎng)絡集合。
語義空間距離計算為巡檢航線路徑選擇提供了依據(jù),通過路徑選擇多個區(qū)域內(nèi)特征位置節(jié)點的聚類,生成了一個與語義策略圖網(wǎng)絡相匹配的期望網(wǎng)絡,為使巡檢航線規(guī)劃的信息要素達到最優(yōu),引入強化學習方法對航跡的路徑進行選擇,不斷調(diào)整規(guī)劃航線。采用該方法,可以利用語義空間計算結(jié)果提高較優(yōu)航跡區(qū)域的信息要素濃度,降低較差航跡區(qū)域的信息要素濃度,有利于擴展巡檢航線的語義搜索空間;另一方面,通過信息要素更新過程中的航跡評價作為獎勵信號,對較優(yōu)的路徑進行獎勵,提升航線規(guī)劃的自適應能力。將期望網(wǎng)絡設為S={S1,S2,…,SN}, 通過輸出Q值波爾茲曼分布指導語義策略網(wǎng)絡O={O1,O2,…,ON}, 以獎勵信號π作為對航跡的評價值,其計算如式(7)所示
(7)
其中,τ為影響因子,QQi為指導網(wǎng)絡Oi行動空間,而期望網(wǎng)絡Si的信息要素均加載了語義標簽用于計算語義距離,根據(jù)Si策略和Oi策略的交叉嫡計算信息素濃度系數(shù),提高巡檢的精確性和準確率[23]
(8)
式中:logπAMN(α|S;θ) 用于指導Si,Oi輸出為監(jiān)督信號,指導當前網(wǎng)絡Si的行為向Oi靠攏,在減少航跡構(gòu)造過程中信息要素衰減的同時選擇最優(yōu)路徑。
針對語義空間距離計算和基于強化學習的路徑選擇,為使航跡區(qū)域的信息要素濃度達到最優(yōu),提出了航線構(gòu)造方法,具體算法如下所示:
航跡構(gòu)造算法:
輸入:語義策略圖O_strategy,當前航跡λ及Stop序列集,最大偏角度ω和最大距離偏移閾值d
輸出:結(jié)果構(gòu)造航跡λ*
(1)獲取當前無人機航線λ中位置采樣點并初始化λ*, {}→O_strategy, |λ|→n, {}→λ*;
(2)λ*∪{Stop1}→λ*;
(3)StopiStopi+1→labelMove;//標記第一個采樣點直接作為特征點向量
(4) while i (5) if 滿足式(1)則獲取特征點集合S; (6)S∪{si}→S構(gòu)造特征點集合; (7) 對于特征點Si利用式(5)計算該位置的語義空間距離,即與語義策略圖O_strategy的空間語義計算; (8) 根據(jù)式(7)計算si的航跡評價值; (9) 采用式(8)得出策略回歸值計算信息素濃度稀疏 (10)sisi+1→labelMove用Move序列連接特征點; (11) end if (12)i+1→i (13) end while (14) returnλ* 本文以電力平臺為數(shù)據(jù)背景,將任務區(qū)域設為W×L=1000 km×1000 km,由Voronoi圖分解為600個子區(qū)域,每個子區(qū)域設有中心位置節(jié)點,4臺同構(gòu)四旋翼無人機飛行速度為每秒40 m,最大的偏角度為65°,觀測距離為60 m,在netlogo平臺上進行仿真實驗驗證所提出方法的有效性,采樣周期為5 s。實驗中對語義策略圖中未出現(xiàn)的實例等不平衡現(xiàn)象,采取拉普拉斯平滑方法進行處理,并重復10次實驗消除誤差影響。 初始階段無人機對區(qū)域環(huán)境信息未知,1臺無人機從任務初始位置出發(fā),對區(qū)域內(nèi)擬定的13個電力桿塔進行飛行巡檢,如圖4所示,三角形代表當前桿塔,其通過線纜進行連接,陰影部門表示電磁干擾和樹障干擾等因素,共有①至⑥部分。當機載傳感器接收到任務信號時,當前無人機從001號桿塔開始巡檢,不僅規(guī)劃桿塔的三維特征點線路,還規(guī)劃線纜的巡檢位置。 圖4 基于語義服務的電力巡檢航跡規(guī)劃結(jié)果 圖4(a)為根據(jù)語義策略圖構(gòu)造的歷史航線數(shù)據(jù),其中每條航線均計算了對應航段的語義空間距離和賦予獎勵信號的航跡代價值,為巡檢航跡提供了數(shù)據(jù)基礎;圖4(b)顯示了在該區(qū)域內(nèi)運用本文方法生成的航跡規(guī)劃結(jié)果,有效地規(guī)避了干擾區(qū)域,在飛行航跡規(guī)劃和干擾因素之間取得了良好的平衡。 (1)航線代價分析[23] 對于巡檢航線規(guī)劃的不斷調(diào)整和重構(gòu),使無人機局部線路選擇在強化學習過程中不斷迭代更新,采用航跡代價進一步說明本文方法在電力巡檢航線規(guī)劃的性能。航跡代價反映了無人機巡檢航跡的優(yōu)劣程度,由沿航跡飛行代價分量Wf和受到干擾因素代價分量Wm決定,其評價指標如下 (9) 式中:γ∈[0,1] 為代價分量的權(quán)重系數(shù),L(Route) 為特征點航跡段的航程,d(Sti,Sti+1) 為采樣特征點集任意兩點的距離,航段 (Sti,Sti+1) 與干擾因素的距離越近則干擾代價越大,航段中受到干擾的部分航程越長。而W本質(zhì)上反映了無人機沿航線Route飛行時所消耗代價的大小,W越小則航跡性能越優(yōu),反之則航跡性能下降。 如圖5所示,通過與概率路標圖(PRM)方法[3]和快速隨機擴展樹(RRT)[4]方法比較,本文方法在每代最優(yōu)值會出現(xiàn)小幅度的波動,這樣有利于跳出局部最優(yōu)的情況,在第16次迭代時收斂速度趨于穩(wěn)定,適應值為0.60左右,這種良好的情況受益于基于強化學習的路徑選擇機制,該方法將航跡評價作為獎勵信號對路徑選擇進行獎勵,采用交叉嫡計算輸出了穩(wěn)定的監(jiān)督信號;同時語義空間距離計算為每個特征點位置生成了一個與語義策略圖網(wǎng)絡相匹配的期望網(wǎng)絡,為基于強化學習的路徑選擇提供了有效的信息要素。而PRM方法在第25代時才逐步收斂穩(wěn)定,收斂速度較慢;RRT方法航線代價值變化雖然與本文方法相近,可以解決巡檢航線規(guī)劃的局部優(yōu)化問題,但隨著迭代次數(shù)的增加陷入了不穩(wěn)定狀態(tài)。 圖5 航跡綜合評價曲線 (2)巡檢對象覆蓋率分析[23] 如圖6所示,隨著三維特征采樣點的規(guī)模不斷增加,語義規(guī)劃方法收斂所需時間也逐步增加,同時,語義規(guī)劃方法的覆蓋率也不斷提高,通過比較分析巡檢對象的覆蓋率,當仿真結(jié)束時,PRM方法的巡檢覆蓋率為82.5%,RRT方法的巡檢覆蓋率為86.6%,本文方法的覆蓋率達到92.3%,且優(yōu)于其它方法,這是由于該方法在初始時提取了可重構(gòu)航跡的特征點,并對巡檢區(qū)域進行差異劃分計算關聯(lián)比重,體現(xiàn)了語義策略圖模型對無人機巡檢航跡規(guī)劃的環(huán)境態(tài)勢感知優(yōu)勢,從而提高了電力航線巡檢覆蓋效率。 圖6 巡檢對象覆蓋率比較 結(jié)合研究內(nèi)容研發(fā)設計了一個面向航線規(guī)劃的語義服務模擬演示系統(tǒng),在電力巡檢中初步實驗模擬,圖形控制界面如圖7所示。系統(tǒng)采用Visual Studio 2010和3D utility,地理數(shù)據(jù)源于麗水周邊山區(qū)電力路線數(shù)字地圖,通過protégé 中OWL SPARQL查詢語言返回所有結(jié)果;考慮到安全性所有飛行情景按規(guī)定模式執(zhí)行,實驗環(huán)境下添加了干擾區(qū)域因素等外部環(huán)境狀態(tài)。 圖7 面向航跡規(guī)劃的語義服務模擬演示系統(tǒng) 由圖7可知,設定起始目標塔桿,無人機逐步檢測當前的語義信息,首先劃分區(qū)域獲取特征點,在特征點位置上觸發(fā)語義策略圖并計算機語義空間距離,形成一個策略網(wǎng)絡,將可視化特點上的顯示所有位置信息,為高空電力巡線提供了豐富的可視化語義服務。 無人機電力巡檢的航跡規(guī)劃很大程度上取決于巡檢對象位置的定位及其特征提取,在此基礎上進一步獲取語義分析的能力,與地面搜索方式的航跡規(guī)劃不同,無人機必須在三維空間中進行運行以滿足電力巡檢實體的對象的需求。本文針對巡檢環(huán)境要素需求和條件限制,提出了一種語義服務方法使無人機在滿足航向速率和空速的條件下,通過語義策略圖和強化學習方法可以有效判斷飛行特征點及干擾因素,同時語義規(guī)劃的航跡代價能夠快速收斂并趨于穩(wěn)定,巡檢對象覆蓋率達到90%以上,各項性能比其它方法較優(yōu)。下一步將考慮在時間上減少規(guī)劃時間,研究多無人機的方法解決電力巡檢的語義服務問題,以進一步提高巡檢效率和功能穩(wěn)定性。4 實驗分析
4.1 實驗數(shù)據(jù)
4.2 航線構(gòu)造分析
4.3 性能分析
4.4 可視化控制界面
5 結(jié)束語