金 浩,孫運全,楊海晶
(江蘇大學(xué) 電氣信息工程學(xué)院,江蘇 鎮(zhèn)江 321100)
為了提高井下生產(chǎn)調(diào)度管理的效率以及減少煤礦事故帶來的損失,需要對井下人員定位技術(shù)做進一步研究。目前在煤礦生產(chǎn)中廣泛應(yīng)用的井下人員定位系統(tǒng)大多數(shù)是基于射頻識別(RFID,radio frequency identification)技術(shù)開發(fā)的,這些系統(tǒng)普遍無法達到較高定位精度,只能確定人員所在的大致區(qū)域,而國有大型煤礦在智能化發(fā)展過程中將會把有線無線一體化網(wǎng)絡(luò)作為移動通信系統(tǒng)的主流技術(shù)[1],這就為利用接收信號強度指示(RSSI,received signal strength indication)[2]實現(xiàn)更高精度的井下人員定位奠定了基礎(chǔ)。
基于RSSI的定位算法主要包括兩種,一是直接測距,即根據(jù)RSSI的數(shù)值直接確定目標(biāo)節(jié)點與信標(biāo)節(jié)點之間的距離,得到目標(biāo)節(jié)點的相對位置。二是位置指紋方法,即確立RSSI值與位置的直接映射關(guān)系,而不必確定目標(biāo)節(jié)點與信標(biāo)節(jié)點之間的距離。由于井下環(huán)境復(fù)雜,信號傳播過程中不可避免地受到衰落,陰影以及多徑效應(yīng)的影響,直接測距的方法精度不高,所以位置指紋方法逐漸成為了當(dāng)前研究的主流。
文獻[3]使用模擬退火算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),并將其應(yīng)用于無線定位問題中。文獻[4]使用啟發(fā)式算法優(yōu)化神經(jīng)網(wǎng)絡(luò),建立RSSI值與位置的直接映射關(guān)系。文獻[5]提出基于極限學(xué)習(xí)機的定位算法,通過對比測試,發(fā)現(xiàn)其定位效果好于BP等其他神經(jīng)網(wǎng)絡(luò)定位算法。文獻[6]使用了鯨魚算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),在避免局部最優(yōu)和收斂速度上表現(xiàn)良好。文獻[7]使用遷移學(xué)習(xí)的方式使定位算法適應(yīng)室內(nèi)環(huán)境的變化,將上個時間段提取的特征遷移到下一個時間段使用。這一構(gòu)想還不能適應(yīng)環(huán)境變化更為復(fù)雜的井下。文獻[8]根據(jù)參考基站實時RSSI更新指紋地圖。這種方法可以使用較少的參考基站,降低了對硬件的要求。但由于算法的復(fù)雜度太高,定位的速度慢,無法滿足井下實時定位的要求。
以上研究表明采用智能算法優(yōu)化神經(jīng)網(wǎng)絡(luò)能夠準(zhǔn)確高效地進行在復(fù)雜環(huán)境下的定位,本文提出了改進鯨魚算法優(yōu)化極限學(xué)習(xí)機的井下人員定位模型。
在離線訓(xùn)練階段,將煤礦井下參考節(jié)點接收到的RSSI值作為神經(jīng)網(wǎng)絡(luò)的輸入,將參考節(jié)點的位置坐標(biāo)作為網(wǎng)絡(luò)輸出,以此訓(xùn)練ELM 神經(jīng)網(wǎng)絡(luò),獲得RSSI值與節(jié)點坐標(biāo)之間的網(wǎng)絡(luò)模型。為了提高ELM神經(jīng)網(wǎng)絡(luò)的泛化能力,采用改進鯨魚算法為ELM選取合適的權(quán)值和閾值,構(gòu)建了IWOA-ELM初始定位模型。在線定位階段則引入帶動態(tài)權(quán)值因子的在線連續(xù)學(xué)習(xí)方法,首先接收采集實時位置指紋數(shù)據(jù),代入初始定位模型中,對其進行動態(tài)調(diào)整。然后利用無線信號接收裝置接收目標(biāo)點的RSSI指紋數(shù)據(jù),代入到調(diào)整后的模型中,計算出目標(biāo)節(jié)點的估計位置坐標(biāo)。定位環(huán)境如圖1所示。
圖1 定位環(huán)境示意圖
綜上,本文主要針對ELM神經(jīng)網(wǎng)絡(luò)輸入權(quán)值和隱含層閾值取值難以及環(huán)境時變性影響定位精度等問題,改進定位算法,提高了定位效果。
極限學(xué)習(xí)機(ELM,extreme learning machine) 是由文獻[8]提出的一種單隱含層前饋神經(jīng)網(wǎng)絡(luò)(SLFN,single hidden layer feedforward neural network)。該神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層、輸出層三層結(jié)構(gòu)(如圖2所示)。
圖2 ELM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
ELM不依賴于梯度下降,學(xué)習(xí)速度比 BP(back-propagation) 算法等傳統(tǒng)前饋網(wǎng)絡(luò)快,對于大量及非線性樣本也具有很好的適用性[9-10]。
ELM需要設(shè)置隱含層神經(jīng)元的個數(shù),而輸入層與隱含層之間的權(quán)值和隱含層的閾值則隨機產(chǎn)生,然后利用最小二乘法解方程組得到輸出權(quán)值。
對于訓(xùn)練集中N個位置指紋數(shù)據(jù)(xi,ti),其中輸入向量為xi=[xi1,xi2,…,xim],輸出向量為ti=[ti1,ti2,…,tim]T。設(shè)ELM位置估計模型的輸入層節(jié)點個數(shù)為n,隱含層節(jié)點,個數(shù)為L,輸出層節(jié)點個數(shù)為m,該模型如下所示:
(1)
式中,σ為激活函數(shù),以激活函數(shù)將樣本映射到另一個特征空間,得到矩陣H,
Hβ=T
(2)
在新的特征空間下,利用最小二乘法便可求解出最優(yōu)輸出權(quán)值β:
β*=H+T
(3)
式中,β*為輸出權(quán)重,H+為矩陣H的Moore-Penrose廣義逆。
鯨魚優(yōu)化算法是受到座頭鯨捕食行為啟發(fā)的一種啟發(fā)式算法,鯨魚包圍目標(biāo)獵物的時候,假設(shè)當(dāng)前的最佳候選解是目標(biāo)獵物位置或最靠近獵物的位置。然后會不斷更新其位置[11],這種狩獵行為可以用如下數(shù)學(xué)公式表示:
D=|CX*(t)-X(t)|
(4)
X(t+1)=X*(t)-AD
(5)
其中:D為包圍步長,t表示當(dāng)前迭代次數(shù),X*(t)是是目前得到的最優(yōu)解的位置向量,X(t)為當(dāng)前位置向量,如果在迭代中出現(xiàn)更優(yōu)解,那么位置向量X*(t)也要隨之更新。A和C是系數(shù)向量,由如下公式得出:
(6)
C=2r
(7)
其中:a在迭代過程中從2線性下降到0,tmax是最大迭代次數(shù)。r是區(qū)間內(nèi)的隨機向量。
算法模擬鯨魚通過氣幕襲擊和隨機搜索的捕食過程進行迭代,尋找最優(yōu)鯨魚種群適應(yīng)度值,該階段可以用如下公式表示:
L(t+1)=
(8)
D1=|CL*(t)-L(t)|
D2=|CLrand(t)-L(t)|
D3=|L*(t)-L(t)|
(9)
式中,當(dāng)|A|<1時,鯨魚向獵物發(fā)起攻擊,攻擊方式取決于取值范圍為[0,1]的隨機數(shù)ρ,當(dāng)ρ<0.5時采用收縮包圍機制更新空間位置,當(dāng)ρ≥0.5時則采用螺旋式位置更新機制。當(dāng)|A|>1時鯨魚群則用隨機的方式更新位置進行搜索捕食,這樣可以保證算法對于全局的搜索。
WOA算法簡潔易實現(xiàn)、參數(shù)設(shè)置少、尋優(yōu)性能強, 然而,基本W(wǎng)OA算法仍然存在不足,由相關(guān)文獻[12]分析可知,由于收斂因子a在迭代過程中線性遞減,算法的全局搜索能力也隨之下降,到了迭代后期群體中所有個體均向最優(yōu)個體聚集,導(dǎo)致群體多樣性缺失,易使算法陷入局部最優(yōu)[13-14]。為了解決上述問題,本文引入多樣性變異操作改善WOA算法性能,使算法能避免早熟收斂,得到全局最優(yōu)解。
IWOA算法的基本思想是將多樣性變異操作引入WOA算法中,假設(shè)最優(yōu)個體Xi=(xi1,xi2,…,xid),從個體中隨機選取一個元素xk(k=1,2,…,d),然后進行如下式所示的變異:
(10)
其中:λ為取值范圍[0,1]的隨機數(shù),ui和li分別為變量Xi的上界和下界。
對最優(yōu)鯨魚個體的多樣性變異操作,避免了算法出現(xiàn)早熟收斂,最終收斂到全局最優(yōu)解。
IWOA-ELM算法的基本思想是利用IWOA算法對ELM的權(quán)值和閾值進行優(yōu)化,發(fā)揮IWOA算法的全局尋優(yōu)能力,提高ELM神經(jīng)網(wǎng)絡(luò)的泛化能力。IWOA-ELM算法流程如下。
Step1:設(shè)置IWOA算法的參數(shù),鯨魚種群規(guī)模sizepop,迭代次數(shù)maxgen,鯨魚種群的位置上界和下界ub和lb;
(11)
(12)
對每個個體的適應(yīng)度值進行排序,得到最佳鯨魚個體及位置,并將其記錄;
Step3:根據(jù)收斂因子更新公式計算收斂因子a的值;
Step4:計算其他參數(shù)A,C,l和p,判斷概率P的值是否小于0.5,若是,則轉(zhuǎn)入Step5,否則搜索個體按照公式以螺旋運動的方式向獵物進行攻擊;
Step5:判斷參數(shù)A的值是否小于 1,若是,搜索個體則按照公式對獵物進行收縮包圍,否則搜索代理根據(jù)公式進行全局搜索;
Step6:此時位置更新完畢,再次計算每個搜索個體求解目標(biāo)函數(shù)的適應(yīng)度值,并與先前保留的最佳搜索代理的位置信息X*進行比較,若優(yōu)于X*對X*位置信息進行替換;
Step7:對當(dāng)前最優(yōu)個體進行多樣性變異操作,計算個體的適應(yīng)度值,更新最優(yōu)解;
Step8:比較當(dāng)前迭代次數(shù)與設(shè)定值,若達到設(shè)定值,終止迭代,輸出當(dāng)前最優(yōu)解(即ELM的最優(yōu)權(quán)值和閾值),否則返回 Step3;
Step9:將IWOA算法輸出的最優(yōu)解映射為ELM神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,用訓(xùn)練樣本集訓(xùn)練ELM神經(jīng)網(wǎng)絡(luò),完成井下定位算法模型建立。
為了在井下電磁環(huán)境隨時間變動的情況下,保證定位系統(tǒng)的精度,就需要根據(jù)環(huán)境的變化,及時對定位模型進行校準(zhǔn)。因此,本文在原有IWOA-ELM算法的基礎(chǔ)上,引入在線連續(xù)學(xué)習(xí)方法[15],使得初始定位模型能夠根據(jù)在線階段更新的動態(tài)校準(zhǔn)數(shù)據(jù)得到調(diào)整。
H的Moore-Penrose廣義逆H+為:
H+=(HTH)-1HT
(13)
所以初始定位模型的輸出權(quán)值矩陣如公式所示:
(14)
(15)
(16)
則式(15)可改寫為:
(17)
那么,當(dāng)?shù)趉+1組數(shù)據(jù)輸入時,輸出權(quán)值矩陣為:
(18)
從式(18)中可以看出,當(dāng)定位模型中輸入新的指紋數(shù)據(jù)時,不需要再將此前的數(shù)據(jù)重新納入訓(xùn)練范圍,算法的計算量由此沒有大幅增長。同時定位模型也根據(jù)新增數(shù)據(jù)得到了修正,兼顧了效率和環(huán)境適應(yīng)性。
但是在對式(18)進一步分析后發(fā)現(xiàn),式中舊模型和新增調(diào)整量的權(quán)重系數(shù)是相同的(均為1),而事實上,在井下環(huán)境隨時變動的情況下,就要求定位模型能盡快適應(yīng)這種變化,調(diào)整好舊有模型和新增調(diào)整量的相對重要性[16]。所以本文在式(15)中加入動態(tài)權(quán)值因子,將式(15)改為:
(19)
(20)
式中,E為調(diào)整前后模型的精度之差,由于環(huán)境的變化是連續(xù)且相對穩(wěn)定的,所以選擇平滑性好的arctan作為激活函數(shù),同時通過測試,確定當(dāng)arctan的放大系數(shù)為1/5π時能夠使調(diào)整后的模型達到最高定位精度。
井下定位算法分為離線訓(xùn)練階段和在線定位階段兩個部分。在離線訓(xùn)練階段,首先利用無線信號接收裝置采集初始階段的位置指紋數(shù)據(jù),然后用采集好的數(shù)據(jù)集訓(xùn)練IWOA-ELM神經(jīng)網(wǎng)絡(luò)。建立IWOA-ELM神經(jīng)網(wǎng)絡(luò)定位模型,具體流程如圖3所示。
圖3 在線訓(xùn)練流程
在線定位階段,首先接收采集實時位置指紋數(shù)據(jù),代入初始定位模型中,對其進行動態(tài)調(diào)整。然后利用無線信號接收裝置接收目標(biāo)點的RSSI指紋數(shù)據(jù),代入到調(diào)整后的模型中,計算出目標(biāo)節(jié)點的估計位置坐標(biāo)。具體流程如圖4所示。
圖4 實時定位流程
本文使用MATLAB對井下場景的射線跟蹤進行仿真[17-19],生成用于測試的指紋數(shù)據(jù)庫。實驗的仿真平臺為MATLAB 2016b,電腦配置為 Core i5處理器、8 GB內(nèi)存。該指紋數(shù)據(jù)庫設(shè)定為50 m×4 m的狹長空間,其中分布有6個AP節(jié)點,由 ITU傳播模型[20]來構(gòu)建,其表達式如下:
PL(d)=PL0-10αlog(d)+Xσ
(21)
式中,PL0是路徑損耗系數(shù),Xσ是均值為零的隨機噪聲,α是路徑衰減指數(shù)。構(gòu)建完成的指紋數(shù)據(jù)庫包括10 000組離線訓(xùn)練數(shù)據(jù)、1 000組增量訓(xùn)練數(shù)據(jù)以及90組在線測試數(shù)據(jù),部分訓(xùn)練數(shù)據(jù)如表1所示。
實驗分為兩部分:第一部分是在環(huán)境不變的情況下驗證初始定位模型的性能,而第二部分則是在環(huán)境
表1 部分訓(xùn)練數(shù)據(jù) 信號強度單位:dBm
變化情況下驗證定位模型對環(huán)境變化的適應(yīng)能力。對定位模型性能的評判標(biāo)準(zhǔn)為定位平均誤差和不同誤差距離下的置信概率。
根據(jù)實驗中采集的訓(xùn)練數(shù)據(jù)集,對IWOA-ELM神經(jīng)網(wǎng)絡(luò)的初始參數(shù)進行設(shè)置,由于一組數(shù)據(jù)中包含6個RSSI值,所以輸入層節(jié)點數(shù)為6。分別對sin,hardlim和sigmoid函數(shù)進行測試對比后發(fā)現(xiàn),激活函數(shù)選擇sigmoid函數(shù)時,定位結(jié)果最穩(wěn)定,誤差也相對小。如圖5所示,其他條件相同時,在測試中確定當(dāng)隱含層節(jié)點數(shù)為700,定位誤差最小。
圖5 不同隱含層節(jié)點個數(shù)下的定位誤差
為了能夠直觀地展示本文提出的定位算法性能,使用同樣的訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)代入不同定位模型。并對其結(jié)果進行對比分析,其中包括BP, ELM, WOA-ELM和IWOA-ELM。使用的數(shù)據(jù)為離線階段在同一環(huán)境中采集的同一時段的測量數(shù)據(jù)。部分定位結(jié)果如圖6所示。
圖6 初始定位模型性能對比
表2 各定位模型的定位平均誤差
針對煤礦井下環(huán)境時變特性使定位精度隨時間下降的問題,首先改變式(21)中的參數(shù)σ,獲得在線階段變化后的位置指紋數(shù)據(jù),然后將數(shù)據(jù)代入初始定位模型,利用帶動態(tài)權(quán)值因子的在線序列方法對初始定位模型修正獲得本文模型(IWOA-DOS-ELM),最后分別對初始定位模型(IWOA-ELM)在線序列修正的初始定位模型(IWOA-OS-ELM)以及本文模型進行測試,測試結(jié)果如圖7所示。
圖7 三種算法的性能對比
從圖7可以看出,本文算法在誤差為1.5 m以內(nèi)的置信概率是72%,而IWOA-OS-ELM算法和IWOA-ELM的置信概率分別只有56%和50%,在限定誤差為1.5 m時,IWOA-OS-ELM算法和本文算法的準(zhǔn)確率相對于IWOA-ELM要高6%和22%,這是因為前兩個模型針對環(huán)境變化做出了一些適應(yīng)性的改進,而本文算法比IWOA-OS-ELM算法的準(zhǔn)確率還要高16%,這是因為本文算法加入了動態(tài)權(quán)值因子,使算法模型的改進更能適應(yīng)環(huán)境。
由圖8可知,定位模型經(jīng)動態(tài)調(diào)整后,輸出的定位坐標(biāo)更加接近于實際坐標(biāo),定位精度得以提高。計算校準(zhǔn)前后的定位平均誤差可得,未經(jīng)校準(zhǔn)的IWOA-ELM算法的定位平均誤差為2.25 m,經(jīng)過校準(zhǔn)后的IWOA-ELM算法的定位平均誤差為1.64 m,定位精度提高了,驗證了動態(tài)校準(zhǔn)法更加適應(yīng)隨時間變化的煤礦井下環(huán)境,能夠滿足井下自適應(yīng)定位要求。
圖8 模型校準(zhǔn)性能對比
圖9將三個時間段中IWOA-ELM、IWOA-OS-ELM、IWOA-DOS-ELM三種算法的平均定位誤差進行對比。時間段0、1、2分別代表發(fā)生環(huán)境變化的次數(shù),可以發(fā)現(xiàn)在第一次環(huán)境變化之前,定位精度非常接近。但是在環(huán)境變化之后,可以看出通過本文提出的動態(tài)校準(zhǔn)方法,本文算法的魯棒性最強,定位誤差最小。
圖9 三種算法不同時間段定位誤差變化
1)引入多樣性變異操作優(yōu)化WOA算法,優(yōu)化后的IWOA算法全局尋優(yōu)能力表現(xiàn)更好,利用IWOA算法對ELM的輸入權(quán)值和隱含層閾值進行優(yōu)化,提高了ELM神經(jīng)網(wǎng)絡(luò)的泛化能力。
2)引入帶動態(tài)權(quán)值因子的在線連續(xù)學(xué)習(xí)方法,克服初始定位模型無法適應(yīng)井下環(huán)境時變性的缺點,能夠根據(jù)在線階段更新的動態(tài)校準(zhǔn)數(shù)據(jù)實時調(diào)整定位模型。在環(huán)境發(fā)生變化后仍有較高的定位精度。
3)對實驗結(jié)果分析得出,本文算法在環(huán)境未發(fā)生動態(tài)變化時的定位精度相比于BP、ELM、WOA-ELM算法更高。在環(huán)境發(fā)生動態(tài)變化之后,通過本文提出的動態(tài)校準(zhǔn)方案,定位平均誤差未發(fā)生較大變化,定位穩(wěn)定性最好。
4)下一步工作將研究井下人員的移動模式,根據(jù)人員移動模式的特點找到相鄰時間點人員位置之間的關(guān)聯(lián),對連續(xù)定位的結(jié)果進行修正。預(yù)計可以剔除一些誤差較大的定位結(jié)果,以此進一步提高定位精度。