孫步陽,呂獻林,張俊鵬
(中國電建集團河南省電力勘測設(shè)計院有限公司,鄭州 450007)
湖泊富營養(yǎng)化是湖泊發(fā)展的自然過程,隨著經(jīng)濟的快速發(fā)展和城市化的加劇以及工農(nóng)業(yè)廢棄物的排放等使湖泊水體逐步由貧營養(yǎng)狀態(tài)向富營養(yǎng)狀態(tài)變化的現(xiàn)象[1]。傳統(tǒng)的富營養(yǎng)化狀態(tài)評價主要包括樣點水樣采集、水質(zhì)參數(shù)指標分析和富營養(yǎng)化狀態(tài)評價。傳統(tǒng)的湖泊水體富營養(yǎng)化評價方法只能評價樣點處的富營養(yǎng)化狀態(tài),無法進行大面積水域的富營養(yǎng)化狀態(tài)評價[2,3]。
由于傳統(tǒng)多光譜傳感器分辨率較低,很難定量分析水質(zhì)參數(shù)的吸收特征。隨著高光譜傳感器的出現(xiàn),傳感器分辨率達到納米級,可以有效提高光譜特性的分辨力,極大地提高了傳感器監(jiān)測精度[4,5]。因此,運用高光譜遙感技術(shù)合理評價大面積水域的富營養(yǎng)化狀態(tài)對水質(zhì)環(huán)境監(jiān)測和防治具有重要意義和理論價值。
極限學(xué)習(xí)機(Extreme learning machine,ELM)是一種單隱含層的前饋神經(jīng)網(wǎng)絡(luò)。ELM 模型由輸入層、隱含層和輸出層組成,其結(jié)構(gòu)如圖1 所示。
圖1 ELM 模型結(jié)構(gòu)
假定有N個訓(xùn)練樣本(Xi,Ti),Xi=[xi1,xi2,…,xin]T∈Rn,Ti=[ti1,ti2,…,tim]T∈Rm,其中輸入變量和輸出變量分別為n和m個。隱含層節(jié)點數(shù)為L的ELM 模型的輸出可表示為式(1)[6]:
式中,Wi=[wi1,wi2,…,win]T和βi分別為ELM 模型的輸入權(quán)重和輸出權(quán)重;bi為第i個隱含層節(jié)點的偏置;g(x)為激勵函數(shù);Wi × Xj為Wi和Xj的內(nèi)積。
ELM 模型訓(xùn)練的目標就是使得式(2)的誤差最小。
由式(1)和式(2)可知,存在一組βi、Wi和bi滿足式(3):
式(3)的矩陣形式為:
式(4)中,H為隱含層節(jié)點的輸出矩陣;β為輸出權(quán)重矩陣。其中H矩陣、β矩陣和T矩陣如式(5)所示:
在ELM 模型的訓(xùn)練過程中,保持Wi與bi不變,β的最小二乘解可以通過求解式(7)獲得:
式(7)的最小二乘解可表示為:
螢火蟲算法(Firefly algorithm,F(xiàn)A)是一種新型的智能優(yōu)化算法[8,9],該算法中將螢火蟲的亮度(I)、吸引度(β)、螢火蟲之間的距離(rij)分別定義為:
式中,I0為最大亮度,β0為最大吸引度。對于螢火蟲i,其位置xi更新公式為:
式中,α和rand均為隨機數(shù)。
湖泊水質(zhì)富營養(yǎng)化狀態(tài)評價本質(zhì)上是一個多分類問題。針對ELM 模型性能受初始輸入權(quán)重Wi和隱含層偏置bi的影響,運用FA 算法對初始輸入權(quán)重Wi和隱含層偏置bi進行優(yōu)化選擇,將分類準確率fT作為目標函數(shù):
式中,Total和right分別為樣本總數(shù)量和正確分類的樣本數(shù)量。
采用FA-ELM 的湖泊水質(zhì)富營養(yǎng)化狀態(tài)評價模型流程如圖2 所示。首先,將采集的湖泊水質(zhì)富營養(yǎng)化狀態(tài)評價數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù);之后,針對訓(xùn)練數(shù)據(jù)集運用FA 優(yōu)化ELM 的參數(shù)組合(W,b)建立基于FA-ELM 的湖泊水質(zhì)富營養(yǎng)化狀態(tài)評價模型;最后,將FA 尋優(yōu)獲取的最佳參數(shù)組合(W,b)代入ELM 進行測試。
圖2 基于FA-ELM 的湖泊水質(zhì)富營養(yǎng)化狀態(tài)評價流程
巢湖是中國五大淡水湖之一,面積約787.4 km2,位于安徽省中部,是中國水污染防治的重點水體[10,11]。巢湖水質(zhì)采樣點分布如圖3 所示。點位3、點位5 和點位6 為巢湖東部湖區(qū),點位7、點位9 和點位10 為巢湖中部湖區(qū),點位12 和點位13 為巢湖西部湖區(qū),點位2 為雙橋河河口,點位4 為柘皋河河口,點位8 為兆河河口,點位11 為杭埠河河口,點位14、點位15、點位16 和點位17 分別為南淝河河口、塘西河河口、派河河口以及十五里河河口。
圖3 巢湖水質(zhì)采樣點分布
為了驗證FA-ELM 算法的優(yōu)越性,選擇200 組不同富營養(yǎng)化狀態(tài)高光譜圖像為研究對象,其中訓(xùn)練集160 組,測試集40 組。圖4a、圖4b、圖4c 和圖4d 分別為重富營養(yǎng)、富營養(yǎng)、中營養(yǎng)和貧營養(yǎng)狀態(tài)下的高光譜圖像。
圖4 不同富營養(yǎng)化狀態(tài)高光譜圖像
分別運用不同算法對水質(zhì)富營養(yǎng)化進行了評價。其中FA 算法參數(shù)設(shè)置為:螢火蟲數(shù)量N=10、最大迭代次數(shù)Tmax=50、初始吸引度β0=1、步長因子α=0.5,搜索區(qū)間[-1,1];ELM 參數(shù)設(shè)置為:隱含層節(jié)點數(shù)hiddennum=16。將FA-ELM 與PSO-ELM、GAELM、DE-ELM 和ELM 進行對比分析。算法通用參數(shù)設(shè)置為:種群規(guī)模10,最大迭代次數(shù)50,搜索區(qū)間[-1,1];粒子群算法(Particle swarm optimization algorithm,PSO)參數(shù)設(shè)置為:學(xué)習(xí)因子c1=c2=2;遺傳算法(Genetic algorithm,GA)參數(shù)設(shè)置為:交叉概率0.7,變異概率0.1;差分進化算法(Differential evolution algorithm,DE)參數(shù)設(shè)置為:交叉概率0.7,縮放因子0.5。由表1 知,F(xiàn)A-ELM 在訓(xùn)練集和測試集上的分類準確率分別為99.38%和98.82%,優(yōu)于PSOELM、GA-ELM、DE-ELM 和ELM;ELM 的水質(zhì)富營養(yǎng)化評價準確率最低,分別為87.66%和86.47%。通過對比發(fā)現(xiàn),算法FA-ELM 可以有效提高水質(zhì)富營養(yǎng)化評價的準確率。由圖5 可知,F(xiàn)A-ELM 具有更快的收斂速度和更小的適應(yīng)度誤差,效果較好。
圖5 收斂曲線對比
表1 水質(zhì)評價結(jié)果
為提高湖泊水質(zhì)富營養(yǎng)化狀態(tài)評價的精度,提出了一種基于高光譜遙感和FA-ELM 的湖泊水質(zhì)富營養(yǎng)化狀態(tài)評價方法。研究結(jié)果表明,與PSOELM、GA-ELM、DE-ELM 和ELM 相比,F(xiàn)A-ELM 算法可以有效提高水質(zhì)富營養(yǎng)化評價的準確率。FA算法通過優(yōu)化ELM 模型初始輸入權(quán)值和隱含層偏置,可以有效提高ELM 模型的預(yù)測能力,因此將FA-ELM 應(yīng)用于湖泊水質(zhì)富營養(yǎng)化狀態(tài)評價具有一定的推廣價值和工程應(yīng)用價值。