敖瑞貴,閆曉惠,許士國
(大連理工大學(xué),遼寧 大連 116024)
水質(zhì)探測是水生態(tài)環(huán)境保護工作中的重要環(huán)節(jié),但傳統(tǒng)的野外采樣或傳感器監(jiān)測等方法具有觀測范圍小、人力物力成本高等缺點。遙感技術(shù)具有觀測范圍廣、數(shù)據(jù)獲取速度快和成本低等優(yōu)點,已經(jīng)成為傳統(tǒng)水質(zhì)調(diào)查方法的有力補充,而近年來發(fā)展起來的無人機航測技術(shù)可以提供更高的時間與空間分辨率且受水汽的影響較小,因此有望進一步提高水質(zhì)參數(shù)的調(diào)查效率。之前的學(xué)者已嘗試采用無人機多光譜影像對小微水域的總磷、懸浮物濃度、濁度等水質(zhì)參數(shù)進行反演,證明了該方法在小微水域水質(zhì)調(diào)查中的可行性。但是,無人機飛行高度受限,無法直接獲取整個大面積水域的完整正射影響,而為了獲得較好的拼接質(zhì)量,需要確保無人機飛行的航向重疊度和旁向重疊度,增加了無人機的操控難度。此外,無人機在航測過程中也易受風(fēng)速等影響而發(fā)生傾斜,進一步增大圖像的拼接難度。因此,目前的無人機多光譜技術(shù)尚難以應(yīng)用于較大水域的水質(zhì)探測中。
鑒于此,本文以懸浮物濃度為例,提出并測試一種基于無人機多光譜點云數(shù)據(jù)和MGGP人工智能算法的水質(zhì)探測方法。首先利用無人機搭載多光譜相機在研究區(qū)域上空獲取大量的多光譜數(shù)據(jù),得到懸浮物濃度的點云數(shù)據(jù),再分別利用傳統(tǒng)的克里金空間插值法和MGGP人工智能方法得到驗證點的懸浮物濃度值。結(jié)果表明,基于無人機多光譜點云數(shù)據(jù)和MGGP人工智能算法的方法可有效解決大面積水域的水質(zhì)探測問題,為水質(zhì)參數(shù)的調(diào)查提供新的技術(shù)手段。
研究區(qū)域面積約為76372m2,周長約為1109m。本研究采用的無人機為大疆悟Inspire 2,搭載Mica Sense Red Edge多光譜傳感器獲取數(shù)據(jù)。于2021年5月27日進行無人機航拍作業(yè),得到140組帶有GPS定位的多光譜影像,每一組有Blue(0.450~0.515μm)、Green(0.525~0.605μm)、Red(0.630~0.690μm)、Red edge position(0.670~0.760μm)、NIR(0.770~0.890μm)5個光譜帶的數(shù)據(jù)。根據(jù)已有的研究成果,應(yīng)用紅光波段與近紅外波段之和與綠光波段的比值作為光譜參數(shù),即公式(1)。
(1)
式中,V—用于反演模型的光譜參數(shù);R2、R3、R5—分別為綠光波段、紅光波段和近紅外波段的光譜反射率數(shù)據(jù)。
對所有的多光譜影像進行輻射校正和輻射定標(biāo),在MATLAB軟件中得到每個像元的地物反射率數(shù)據(jù),由反射率得到光譜參數(shù),經(jīng)過數(shù)據(jù)質(zhì)量檢測,應(yīng)用已有的懸浮物濃度模型(公式2)得到140個位置點的懸浮物濃度點云數(shù)據(jù)。點云數(shù)據(jù)的空間位置采取隨機布設(shè)方式以降低其有序性,可更好地驗證MGGP方法的性能,具體的位置點如圖1所示。將點云數(shù)據(jù)隨機劃分為兩組,其中112組數(shù)據(jù)(約80%)用于模型訓(xùn)練,而剩余的數(shù)據(jù)則假設(shè)為未見數(shù)據(jù)以用于算法驗證。
圖1 點云數(shù)據(jù)位置分布圖
本文的研究目的是提出并測試無人機多光譜點云數(shù)據(jù)結(jié)合MGGP方法的可行性而非測試已有懸浮物濃度模型的精確度。模型參數(shù)對濃度絕對值略有影響,但基本不改變濃度的空間分布規(guī)律。因此,在后續(xù)的分析中,將模型的計算值假定為實際值,用于測試MGGP方法的水質(zhì)參數(shù)估算性能。
y=-2582x2-2408x+7473
(2)
式中,y—懸浮物濃度, mg/L;x—光譜參數(shù)。
傳統(tǒng)空間插值法選取克里金空間插值法,利用訓(xùn)練組的112組點云數(shù)據(jù)進行空間插值,得到驗證點位置的預(yù)測值,與真實值比較,分析克里金法的可行性。克里金法以變異函數(shù)理論與結(jié)構(gòu)分析為基礎(chǔ),在區(qū)域化變量間存在空間自相關(guān)性的前提下,根據(jù)未知點和其周圍影響范圍內(nèi)樣本點的距離及空間關(guān)系擬合模型確定權(quán)重,對未知點的取值進行無偏最優(yōu)估計。該方法的計算公式為:
(3)
式中,z(x)—未知點的預(yù)測值;z(xi)—樣本點處懸浮物濃度值;λi—權(quán)重;n—樣本數(shù)。
多基因遺傳規(guī)劃(MGGP)是遺傳規(guī)劃(GP)的發(fā)展,結(jié)合了GP的模型構(gòu)建能力和統(tǒng)計回歸方法的參數(shù)估計能力,能夠通過一系列過程找到輸入和輸出變量之間的關(guān)系。在傳統(tǒng)的遺傳規(guī)劃中,進化模型由單棵樹組成,而在多基因遺傳規(guī)劃中,每一個回歸模型都是多棵樹的加權(quán)線性組合。其工作流程可以概括為:隨機產(chǎn)生初代種群,包含一組由函數(shù)和變量組成的個體;計算種群中每個個體的適應(yīng)度;選擇適應(yīng)度好的優(yōu)良個體為母體;通過突變、交叉、復(fù)制等方式產(chǎn)生新的個體,創(chuàng)造新的一代(子代);重復(fù)第二步和第三步,直到滿足終止準(zhǔn)則。
采用均方根差(RMSE)和R2值來量化方法的精準(zhǔn)度,其中R2越接近1、RMSE越小則表示預(yù)測值與實測值誤差越小。公式分別為:
(4)
(5)
式中,y—預(yù)測值;x—實際值:N—驗證點的個數(shù)。
無人機多光譜的典型影像如圖2所示,對每個目標(biāo)范圍,多光譜相機拍攝5通道影像,通過輻射校正和輻射定標(biāo)后得到光譜反射率,再通過懸浮物濃度反演公式得到每個點的懸浮物濃度。本水域的懸浮物濃度平均值為8.97mg/L,處于較低水平。最小值為0.45mg/L、最大值為16.16mg/L、中間值為9.05mg/L、標(biāo)準(zhǔn)差為4.09mg/L、方差為16.73(mg/L)2、峰態(tài)系數(shù)為2.13、偏態(tài)系數(shù)為-0.12。
圖2 水面多光譜影像
利用篩選出的112個樣本點(訓(xùn)練組)、采用Arc GIS的克里金法進行空間插值,估算了28個驗證點(驗證組)位置的懸浮物濃度值。如圖3所示為克里金法估算值與實際值的對比圖,其中橫坐標(biāo)為實際值,縱坐標(biāo)為克里金估算值,中間線為1∶1等值線。當(dāng)各散點位于等值線上時,表明估算值完全等于實際值;當(dāng)散點位于等值線的左上側(cè)時,表明該方法高估了實際值;當(dāng)散點位于等值線的右下方時,表明該方法偏向于低估實際值。由圖3可知,各散點較為均勻地分布于等值線的兩側(cè),且偏離較小,因此預(yù)測值與實際值相差不大。經(jīng)計算,R2值為0.936,RMSE為1.338mg/L,其中R2值較高而RMSE值較低,則證明了該方法具有一定的可行性。
圖3 基于克里金空間插值法的實際值與估算值
采用與克里金法一致的112個樣本點云數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。MGGP模型的訓(xùn)練演化過程如圖4(a)所示,其中橫坐標(biāo)為進化代數(shù),每代產(chǎn)生500個模型,橫坐標(biāo)代表模型的RMSE值。在進化初期,MGGP算法隨機產(chǎn)生數(shù)學(xué)模型,其誤差較大,但經(jīng)過復(fù)制、突變、交叉等算法處理,模型的誤差迅速下降,在第10代左右模型種群的誤差值變化幅度即已較小,運行更多的進化代數(shù)不再顯著提高種群的精確度,因此將最終的總進化代數(shù)設(shè)置為100即可滿足要求。圖4(b)對比了懸浮物濃度的實際值與MGGP預(yù)測值。由圖可知,相比于克里金空間插值方法,MGGP預(yù)測數(shù)據(jù)與實際數(shù)據(jù)更加接近。其驗證數(shù)據(jù)集的R2值為0.964,高于克里金法的0.936,說明MGGP方法可更為準(zhǔn)確地判斷數(shù)據(jù)的升降變化規(guī)律。RMSE值為0.926mg/L,低于克里金法的1.338mg/L,因此在本案例中,MGGP法可將傳統(tǒng)空間插值法的誤差降低約30%??死锝鸱椒ㄒ呀?jīng)預(yù)設(shè)了基本的模型結(jié)構(gòu)(公式3),而該結(jié)構(gòu)未必精確。MGGP算法則可排除人為預(yù)設(shè)模型結(jié)構(gòu)的誤差且可深度挖掘變量之間的相互影響關(guān)系,因此MGGP方法的估算結(jié)果更為準(zhǔn)確。綜上,基于無人機多光譜點云數(shù)據(jù)結(jié)合MGGP人工智能算法的水質(zhì)探測方法具有較好的可行性。
圖4 基于MGGP的實際值與預(yù)測值
本文提出了基于無人機多光譜與MGGP人工智能算法的水質(zhì)參數(shù)探測方法。結(jié)果證明,采用該方法估算研究范圍內(nèi)未知點的水質(zhì)參數(shù)是可行的。估算值與實際值之間的誤差很小,且相比傳統(tǒng)的克里金空間插值法, 該方法的R2值從0.936提升到0.964,而RMSE值則從1.338mg/L下降到0.926mg/L,表明該方法可將克里金空間插值法的RMSE值降低約30%,具有非常好的推廣價值。采用該方法,可在不進行圖像拼接的情況下準(zhǔn)確地估測大型水體的水質(zhì)參數(shù),大幅度地降低了無人機遙感技術(shù)的探測難度,可成為當(dāng)前水質(zhì)調(diào)查技術(shù)的有力補充。在下一步的研究中,可以進行更多的案例以測試該方法的有效性。同時,也可嘗試采用計算機視覺等技術(shù)對多光譜影像進行處理,以實現(xiàn)大型水體多光譜影像的有效拼接,從另一條途徑解決無人機多光譜水質(zhì)探測中的難題。