劉星宇 程建 牛藝曉 楊春
摘要:葉綠素a質(zhì)量濃度是預(yù)測湖泊水華形成的重要影響因子,但常用的徑向基(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)存在容易陷入局部極值,導(dǎo)致預(yù)測精度欠佳.針對這一問題,采用自適應(yīng)遺傳算法(adaptive genetic algorithm,AGA)對RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,構(gòu)建基于AGA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型,以莆田東圳水庫為應(yīng)用案例,對葉綠素a質(zhì)量濃度進(jìn)行預(yù)測,通過采集到的數(shù)據(jù)對預(yù)測模型進(jìn)行仿真,對比均方根誤差(RMSE)、相對誤差(RE)以及平均相對誤差(MRE),驗證改進(jìn)后的AGA-RBF模型具有更好的預(yù)測精度,以期對葉綠素a質(zhì)量濃度進(jìn)行長期預(yù)測.
關(guān)鍵詞:RBF人工神經(jīng)網(wǎng)絡(luò); 自適應(yīng)遺傳算法; 預(yù)測模型; 葉綠素a質(zhì)量濃度
中圖分類號:TP183? 文獻(xiàn)標(biāo)志碼:A? 文章編號:1001-8395(2024)05-0670-06
doi:10.3969/j.issn.1001-8395.2024.05.012
隨著社會的快速發(fā)展,人類的大規(guī)模開發(fā)和生產(chǎn)行為導(dǎo)致水體富營養(yǎng)化現(xiàn)象劇增,水華的爆發(fā)也越來越頻繁,而水華的爆發(fā)使得水環(huán)境越來越差,長此以往,污染越來越嚴(yán)重,在諸多水質(zhì)環(huán)境監(jiān)測要素中,葉綠素a質(zhì)量濃度能夠很好地反映湖泊藻類生物數(shù)量[1],對葉綠素a質(zhì)量濃度進(jìn)行準(zhǔn)確的預(yù)測能夠為水體提供數(shù)據(jù)支撐,預(yù)防水體富營養(yǎng)化的發(fā)生.目前葉綠素a質(zhì)量濃度預(yù)測主要運用的模型有多元線性回歸模型[2-6]、時間序列模型[7-10]以及神經(jīng)網(wǎng)絡(luò)模型[11-18].多元線性回歸預(yù)測具有計算過程簡單和預(yù)測速度快等優(yōu)勢,但多元回歸預(yù)測模型對于數(shù)據(jù)的代表性和隨機性要求較高;時間序列預(yù)測模型建模相對簡單,短期預(yù)測精度高,但需要長期預(yù)測的數(shù)據(jù),模型預(yù)測精度差;神經(jīng)網(wǎng)絡(luò)作為當(dāng)前最流行的預(yù)測模型,它的預(yù)測能力和非線性擬合能力都十分優(yōu)越,還可以用于中長期預(yù)測.裴洪平等[12]以水溫和葉綠素a質(zhì)量濃度這兩者作為輸入變量建立的BP(back propagation)神經(jīng)網(wǎng)絡(luò),能有效預(yù)測西湖生態(tài)系統(tǒng)中非線性變量葉綠素a質(zhì)量濃度的變化.胡志洋等[13]建立了基于ABC-BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,結(jié)果表明,經(jīng)ABC(artificial bee colony)算法優(yōu)化后,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測梅梁灣葉綠素a質(zhì)量濃度的平均相對誤差從8.83%降低到3.31%,提高了葉綠素a質(zhì)量濃度短期預(yù)測的準(zhǔn)確性.周游等[14]使用遺傳算法對BP神經(jīng)網(wǎng)絡(luò)連接權(quán)值進(jìn)行優(yōu)化,提高了葉綠素a質(zhì)量濃度的預(yù)測精度.Hameed 等[15]構(gòu)建了BP和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型,根據(jù)預(yù)測結(jié)果比較分析模型的預(yù)測性能,預(yù)測效果雖沒有太大差別,但RBF的性能優(yōu)于BP的性能.RBF神經(jīng)網(wǎng)絡(luò)相較于BP神經(jīng)網(wǎng)絡(luò),復(fù)雜度高,結(jié)構(gòu)龐大,運算量也增加不少,但RBF神經(jīng)網(wǎng)絡(luò)具有對函數(shù)逼近性能更高的優(yōu)勢,且對于小樣本數(shù)據(jù)也能有不錯的效果[16].劉載文等[17]研究了RBF網(wǎng)絡(luò)基函數(shù)中心、寬度和權(quán)值的監(jiān)督學(xué)習(xí)算法,提出了基于RBF神經(jīng)網(wǎng)絡(luò)的水華預(yù)測方法,能夠有效預(yù)測葉綠素a的短期變化規(guī)律,但仍存在易陷入局部極值[18]和中長期預(yù)測精度不佳等問題.為了保證模型的預(yù)測精度和中長期預(yù)測效果,本文利用自適應(yīng)遺傳算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)參數(shù),提出一種基于AGA-RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,自適應(yīng)遺傳算法全局優(yōu)化能力十分強大,能有效解決RBF神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)的問題,從而提高葉綠素a質(zhì)量濃度預(yù)測的精準(zhǔn)度,為水質(zhì)管理決策提供數(shù)據(jù)支撐.
1 AGA-RBF神經(jīng)網(wǎng)絡(luò)模型設(shè)計
1.1 RBF神經(jīng)網(wǎng)絡(luò)
RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,x=[x1,x2,...,xn]T為網(wǎng)絡(luò)的n維輸入,本文選用與葉綠素a質(zhì)量濃度有顯著相關(guān)關(guān)系的水質(zhì)影響因子作為輸入,y=[y1,y2,...,ym]T為網(wǎng)絡(luò)的m維輸出,選用葉綠素a質(zhì)量濃度數(shù)據(jù)作為輸出,c=[c1,c2,...,cm]T為隱含層徑向基函數(shù)中心構(gòu)成的矩陣.由于高斯函數(shù)具有徑向?qū)ΨQ,解析性好,并存在任意階導(dǎo)數(shù)等優(yōu)點[19],本文使用高斯函數(shù)作為徑向基函數(shù),則RBF神經(jīng)網(wǎng)絡(luò)的輸出y可表示為
y=∑mi=1Wikexp(-‖x-ci‖22σ2i),i=1,2,…,m,(1)
其中,ci是第i個基函數(shù)的中心,σi是基函數(shù)中心點的寬度,Wik是權(quán)值.
1.2 遺傳算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)參數(shù)
由上述RBF神經(jīng)網(wǎng)絡(luò)的基本原理可知,RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)選取十分重要.目前常用的隨機選取中心法、自組織選取中心法等對樣本數(shù)據(jù)需求較大,且在訓(xùn)練過程中易陷入局部極小值,無法得到最優(yōu)的基函數(shù)中心和隱含層節(jié)點寬度[20].因此,本文將自適應(yīng)遺傳算法(AGA)引入到RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)尋優(yōu)中,建立AGA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測.遺傳算法的全局搜索能力很強,但由于標(biāo)準(zhǔn)遺傳算法僅僅通過適應(yīng)度值的大小判斷解的優(yōu)劣,因此,如果算法前期個體的適應(yīng)度值越大,該個體對于種群的影響就越大,導(dǎo)致種群中個體分布過于集中,種群失去多樣性,難以尋找到全局最優(yōu)值,造成算法早熟;在標(biāo)準(zhǔn)遺傳算法中,選擇操作選出的個體適應(yīng)度值高于原個體,但交叉和變異操作并不能保證這一點,如果新個體不夠優(yōu)良,就會影響遺傳算法的進(jìn)化,減慢算法運行的速度.針對上述標(biāo)準(zhǔn)遺傳算法的2點不足,自適應(yīng)遺傳算法從以下方面對標(biāo)準(zhǔn)遺傳算法進(jìn)行了改進(jìn).
劉星宇,等:基于AGA-RBF神經(jīng)網(wǎng)絡(luò)模型的葉綠素a質(zhì)量濃度預(yù)測研究
1) 改變交叉和變異概率,使得交叉率和變異率根據(jù)個體的適應(yīng)度值以及進(jìn)化代數(shù)進(jìn)行調(diào)節(jié):
pc=pc_max-((pc_max-pc_min)tmax)t, f′>favg,pc_max, f′≤favg,(2)
pm=pm_min-((pm_max-pm_min)tmax)t, f′>favg,pm_min, f′≤favg,?(3)
其中,pc表示交叉概率,pm表示變異概率,t表示進(jìn)化代數(shù),tmax表示進(jìn)化最大代數(shù),f′表示交叉?zhèn)€體之間較大的適應(yīng)度值,f表示變異個體適應(yīng)度值,favg表示種群的平均適應(yīng)度值.
通過調(diào)整交叉概率和變異概率,算法在進(jìn)化早期全局搜索能力較強,能夠快速尋找到最優(yōu)解的取值空間,隨著進(jìn)化代數(shù)的增加,局部搜索能力增強,更易于找到全局最優(yōu)值,防止算法早熟.
2) 針對交叉和變異操作無法保證產(chǎn)生更優(yōu)良個體這一問題,在交叉和變異操作中引入適應(yīng)度函數(shù),如果原個體經(jīng)過交叉或變異后適應(yīng)度值增大,就保留該個體的變化,否則保留原個體,此種改進(jìn)可以保證交叉和變異操作后的個體都是優(yōu)于原個體的,使算法尋到全局最優(yōu)解后快速收斂,加快進(jìn)化速度,縮短了算法運行時間.
2 算法流程
利用AGA對RBF神經(jīng)網(wǎng)絡(luò)的基函數(shù)中心、寬度以及連接權(quán)值進(jìn)行優(yōu)化,從而得到RBF神經(jīng)網(wǎng)絡(luò)的最優(yōu)基函數(shù)中心、寬度和連接權(quán)值,具體流程如圖2所示.
1) 數(shù)據(jù)預(yù)處理.對數(shù)據(jù)進(jìn)行歸一化處理,歸一化處理對后續(xù)的數(shù)據(jù)處理提供便利,而且有助于模型訓(xùn)練結(jié)果更加精準(zhǔn).本文采用min-max標(biāo)準(zhǔn)化,將原始數(shù)據(jù)按照一定比例縮放到[0,1]之間,具體公式如下:
x=-xminxmax-xmin.(4)
2) 編碼.本文使用二進(jìn)制編碼方法,將徑向基函數(shù)的中心、寬度以及權(quán)值編成二進(jìn)制的字符串,用字符串來表示每個個體的染色體,隨機產(chǎn)生n個染色體,組成初始種群P.
3) 選擇適應(yīng)度函數(shù).適應(yīng)度函數(shù)是進(jìn)行評價個體優(yōu)劣的依據(jù),本文選用均方根誤差(RMSE)作為適應(yīng)度函數(shù):
f=σRMSE=1n∑ni=1(i-yi),(5)
其中,n為樣本個數(shù),i為實際值,yi為預(yù)測值.
4) 選擇操作.選擇算子的選取基于概率的輪盤賭法,根據(jù)個體的適應(yīng)度值進(jìn)行選擇復(fù)制操作,形成具有N個體的臨時集合C.
5) 交叉操作.交叉算子采用單點交叉,對臨時集合C進(jìn)行交叉操作,產(chǎn)生新染色體種群集合C′.
6) 變異操作.變異算子采用單點變異,對集合C′中的個體實施變異操作,產(chǎn)生新的個體種群集合C″.
7) 終止條件.一般情況下,達(dá)到最大迭代次數(shù)或計算結(jié)果達(dá)到最小誤差時停止運算,若滿足終止條件,執(zhí)行下一步,不滿足,令P=C″轉(zhuǎn)至操作3).
8) 輸出.將種群集合中最優(yōu)值作為遺傳算法的輸出.
9) 訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò).將AGA的輸出作為RBF神經(jīng)網(wǎng)絡(luò)參數(shù).
3 仿真測試
為驗證算法的有效性,本文使用MATLAB對基于RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型與AGA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型分別進(jìn)行仿真測試.根據(jù)現(xiàn)有的莆田東圳水庫2021年連續(xù)300 d的葉綠素a質(zhì)量濃度數(shù)據(jù),取前240 d數(shù)據(jù)作為訓(xùn)練集樣本,后60 d數(shù)據(jù)作為測試集樣本.在基于AGA-RBF神經(jīng)網(wǎng)絡(luò)的模型中,經(jīng)反復(fù)實驗,主要參數(shù)設(shè)置如下,在AGA中,初始種群規(guī)模n設(shè)為30,最大交叉概率pc_max取0.9,最小交叉概率pc_min取0.1,最大變異概率pm_max取0.4,最小變異概率pm_min取0.01,訓(xùn)練誤差為0.01,最大迭代次數(shù)為100.在RBF中,經(jīng)過相關(guān)性分析,有5個影響因子與葉綠素a質(zhì)量濃度存在顯著性相關(guān)關(guān)系,因此確定輸入節(jié)點個數(shù)為5,分別對應(yīng)5種環(huán)境因子:溶解氧、電導(dǎo)率、濁度、氨氮和葉綠素a質(zhì)量濃度,輸出節(jié)點為1,即將葉綠素a質(zhì)量濃度作為輸出變量,訓(xùn)練終止條件為總體誤差小于或等于0.001.
4 實驗分析
使用RBF神經(jīng)網(wǎng)絡(luò)和AGA-RBF神經(jīng)網(wǎng)絡(luò)對葉綠素a質(zhì)量濃度進(jìn)行預(yù)測,得出優(yōu)化前后RBF神經(jīng)網(wǎng)絡(luò)葉綠素a質(zhì)量濃度預(yù)測值和真實值對比,如圖3所示.本文以預(yù)測結(jié)果的均方根誤差(RMSE)、相對誤差(RE)以及平均相對誤差(MRE)作為預(yù)測模型的評價指標(biāo),其計算公式為:
σRMSE=1n∑ni=1(i-yi),(6)
σRE=i-yii,(7)
σMRE=1n∑ni=1|i-yii|.(8)
(a) 傳統(tǒng)RBF神經(jīng)網(wǎng)絡(luò)預(yù)測值與實際值對比
(b) AGA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測值與實際值對比
圖3是RBF與AGA-RBF預(yù)測結(jié)果趨勢圖對比,其中,星號實線在圖中均代表的是葉綠素a真實質(zhì)量濃度數(shù)據(jù),圓圈虛線在圖中分別代表的是RBF神經(jīng)網(wǎng)絡(luò)模型預(yù)測數(shù)據(jù)和AGA-RBF神經(jīng)網(wǎng)絡(luò)模型預(yù)測數(shù)據(jù).從圖3可以看出,使用RBF神經(jīng)網(wǎng)絡(luò)模型對葉綠素a質(zhì)量濃度進(jìn)行預(yù)測,可以大致預(yù)測出葉綠素a質(zhì)量濃度的變化趨勢,但均方根誤差高達(dá)0.783,而AGA-RBF神經(jīng)網(wǎng)絡(luò)模型,均方根誤差僅為0.166.表1計算了RBF與AGA-RBF預(yù)測值與實際值的相對誤差,RBF預(yù)測值與實際值的平均相對誤差為7.08%,其中,相對誤差最大達(dá)到-12.23%,最小為-2.72%,而AGA-RBF預(yù)測值與實際值的平均相對誤差為1.20%,其中相對誤差最大為-3.81%,最小為-0.07%,可以看出,使用 [10]AGA-RBF神經(jīng)網(wǎng)絡(luò)模型得到的葉綠素a質(zhì)量濃度值與實際值更為接近,雖然仍存在一定誤差,但與RBF神經(jīng)網(wǎng)絡(luò)預(yù)測效果相較,預(yù)測精準(zhǔn)度明顯提高.
5 實驗結(jié)論
針對RBF神經(jīng)網(wǎng)絡(luò)在葉綠素a質(zhì)量濃度預(yù)測中易陷入局部最優(yōu)解的問題,本文利用AGA算法對RBF網(wǎng)絡(luò)的參數(shù)進(jìn)行全局優(yōu)化,提出了基于AGA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型.利用MATLAB進(jìn)行仿真分析,結(jié)果表明,經(jīng)過AGA算法優(yōu)化過的RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型不僅解決了RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練時易陷入局部最優(yōu)值的問題,而且具有更好的預(yù)測精度,在中長期葉綠素a質(zhì)量濃度預(yù)測中也具有更強的適應(yīng)能力,與傳統(tǒng)RBF神經(jīng)網(wǎng)絡(luò)模型相比,預(yù)測均方根誤差降低了0.617 7,平均相對誤差降低了5.88%,有效降低了葉綠素a質(zhì)量濃度的預(yù)測誤差,性能明顯優(yōu)于傳統(tǒng)模型,在水質(zhì)預(yù)測中有著更好的實用性.
參考文獻(xiàn)
[1] 代前程. 基于多源遙感數(shù)據(jù)的南漪湖葉綠素a濃度反演及變化研究[D]. 南京:南京信息工程大學(xué),2022.
[2] 袁健,樹錦. 改進(jìn)多元回歸法與神經(jīng)網(wǎng)絡(luò)應(yīng)用于水質(zhì)預(yù)測[J]. 水資源保護(hù),2008,24(3):46-48.
[3] 梁勇. 基于支持向量回歸的水質(zhì)預(yù)測研究[D]. 武漢:武漢理工大學(xué),2012.
[4] 劉紅梅,徐英嵐,張博,等. 基于最小二乘支持向量回歸的水質(zhì)預(yù)測[J]. 計算機與現(xiàn)代化,2019(9):31-34.
[5] 李修竹,蘇榮國,張傳松,等. 基于支持向量機的長江口及其鄰近海域葉綠素a濃度預(yù)測模型[J]. 中國海洋大學(xué)學(xué)報(自然科學(xué)版),2019,49(1):69-76.
[6] 黃克勤,吳海洋,賈德庚. 基于多元線性回歸模型的水質(zhì)優(yōu)化研究[J]. 四川有色金屬,2021(4):58-60.
[7] 肖金樹. 指數(shù)平滑法在水質(zhì)預(yù)測中的應(yīng)用[J]. 福建環(huán)境,1996(4):34-35.
[8] 王伍軍,鄢貴權(quán),丁堅平,等. 城鎮(zhèn)地區(qū)巖溶地下水污染的水質(zhì)預(yù)測[J]. 貴州工業(yè)大學(xué)學(xué)報,1997,26(2):62-66.
[9] 孫國紅,沈躍,徐應(yīng)明,等. 基于Box-Jenkins方法的黃河水質(zhì)時間序列分析與預(yù)測[J]. 農(nóng)業(yè)環(huán)境科學(xué)學(xué)報,2011,30(9):1888-1895.
[10] 任樹順,高萌,王煦雯,等. 基于3種時間序列模型的九龍江河流庫區(qū)藻華預(yù)測[J]. 環(huán)境科學(xué)學(xué)報,2022,42(11):172-183.
[11] MAIER H R, DANDY G C. The use of artificial neural networks for the prediction of water quality parameters[J]. Water Resources Research,1996,32(4):1013-1022.
[12] 裴洪平,羅妮娜,蔣勇. 利用BP神經(jīng)網(wǎng)絡(luò)方法預(yù)測西湖葉綠素a的濃度[J]. 生態(tài)學(xué)報,2004,24(2):246-251.
[13] 胡志洋,李翠梅,薛天一. 基于灰色關(guān)聯(lián)和ABC-BP神經(jīng)網(wǎng)絡(luò)的葉綠素a濃度預(yù)測[J]. 水電能源科學(xué),2021,39(1):55-58.
[14] 周游,陸安江,劉璇. 基于改進(jìn)遺傳算法的BP神經(jīng)網(wǎng)絡(luò)的水體葉綠素a含量預(yù)測[J]. 電子測試,2022,36(15):37-42.
[15] HAMEED M, SHARQI S S, YASEEN Z M, et al. Application of artificial intelligence (AI) techniques in water quality index prediction: a case study in tropical region, Malaysia[J]. Neural Computing and Applications,2017,28(1):893-905.
[16] 劉永,張立毅. BP 和 RBF 神經(jīng)網(wǎng)絡(luò)的實現(xiàn)及其性能比較[J]. 電子測量技術(shù),2007,30(4):77-80.
[17] 劉載文,崔莉鳳,王小藝,等. 基于RBF神經(jīng)網(wǎng)絡(luò)的河湖水華軟測量方法[C]//第二十六屆中國控制會議論文集.北京:北京航空航天大學(xué)出版社,2007:3446-3449.
[18] 余可春. 基于改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)模型的SOFC性能預(yù)測方法[J]. 計算技術(shù)與自動化,2023,42(2):124-129.
[19] 宋朝鵬. 改進(jìn)遺傳算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)在短期電力負(fù)荷預(yù)測中的應(yīng)用[J]. 電子世界,2021(16):164-165.
[20] 張麗娜. 基于RBF神經(jīng)網(wǎng)絡(luò)的水質(zhì)預(yù)測模型研究[D]. 邯鄲:河北工程大學(xué),2019.
The Study of Chlorophyll-a Mass Concentration Prediction Based on AGA-RBF Neural Network Model
LIU Xingyu1,2, CHENG Jian2,3, NIU Yixiao1,2, YANG Chun1,2
(1. School of Mathematical Sciences, Sichuan Normal University, Chengdu 610066, Sichuan;2. Key Laboratory of the Evaluation and Monitoring of Southwest Land Resources, Chengdu 610066, Sichuan;3. Center of Network and Information, Sichuan Normal University, Chengdu 610066, Sichuan)
Keywords:Abstract:Chlorophyll-a mass concentration plays a crucial role in predicting the formation of lake blooms. However, the traditional radial basis function (RBF) neural network is susceptible to local optimal solutions, resulting in poor prediction accuracy. In this study, we employ an adaptive genetic algorithm (AGA) to optimize the neural network model, and a prediction model based on AGA-RBF neural network is constructed to predict? the concentration of? the chlorophyll a using Putian Dongshen Reservoir as an application case. Through the utilization of collected data to simulate the prediction model, we demonstrate that the improved AGA-RBF model has a good prediction accuracy, which is verified by the comparison of the root-mean-squared error (RMSE), the relative error (δ), and the average relative error (MRE). After the comparison of the root mean square error and the average relative error, it was verified that the improved AGA-RBF model has better prediction accuracy and is highly practical in the medium- and long-term prediction of the mass concentration for chlorophyll a.
radial basis function neural network; adaptive genetic algorithm; prediction model; chlorophyll-a mass concentration2020 MSC:68T07
(編輯 鄭月蓉)
基金項目:國家自然科學(xué)基金(12101438)、中央引導(dǎo)地方科技發(fā)展項目(2022ZYD0011)和四川省自然科學(xué)基金(2022NSFSC1852)
*通信作者簡介:楊 春(1970—),男,博士,教授,研究生導(dǎo)師,主要從事數(shù)學(xué)模型算法、應(yīng)用軟件開發(fā)、機器學(xué)習(xí)與人工智能的研究,E-mail:328341729@qq.com
引用格式:劉星宇,程建,牛藝曉,等.基于AGA-RBF神經(jīng)網(wǎng)絡(luò)模型的葉綠素a質(zhì)量濃度預(yù)測研究[J]. 四川師范大學(xué)學(xué)報(自然科學(xué)版), 2024,47(5):670-675.