任妮 鮑彤 劉楊 荀廣連 蔣永年
摘要:?為準(zhǔn)確預(yù)測(cè)蟹塘溶解氧質(zhì)量濃度,及時(shí)掌握溶解氧質(zhì)量濃度的變化趨勢(shì),提前采取防控措施從而降低河蟹養(yǎng)殖風(fēng)險(xiǎn),提出了一種基于粒子群優(yōu)化算法(PSO)和長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的蟹塘溶解氧質(zhì)量濃度預(yù)測(cè)模型,采用PSO算法優(yōu)化LSTM模型參數(shù)后對(duì)蟹塘溶解氧質(zhì)量濃度進(jìn)行預(yù)測(cè)。結(jié)果表明,PSO-LSTM模型不僅整體優(yōu)于ARIMA模型,相較于其他LSTM模型也有更高的預(yù)測(cè)精度,在連續(xù)10個(gè)時(shí)間點(diǎn)的預(yù)測(cè)中相比于LDO-LSTM、LSTM和ARIMA模型平均百分誤差分別降低了2.55%、1.891%和4.055%。說(shuō)明PSO-LSTM模型在蟹塘溶解氧質(zhì)量濃度預(yù)測(cè)中具有良好的準(zhǔn)確性和穩(wěn)定性,可以為河蟹養(yǎng)殖中水質(zhì)精準(zhǔn)預(yù)測(cè)與調(diào)控提供參考。
關(guān)鍵詞:?溶解氧預(yù)測(cè);河蟹養(yǎng)殖;粒子群優(yōu)化算法;長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
中圖分類(lèi)號(hào):?S126??文獻(xiàn)標(biāo)識(shí)碼:?A??文章編號(hào):?1000-4440(2021)02-0426-09
Abstract:?To predict the mass concentration of dissolved oxygen in Chinese mitten crab ponds accurately, grasp the changing trend of the mass concentration of dissolved oxygen timely and take preventive and control measures in advance to reduce the risk in Chinese mitten crab culturing, a model for predicting the mass concentration of dissolved oxygen in Chinese mitten crab ponds based on particle swarm optimization (PSO) and long short-term memory (LSTM) neural networks was proposed. The mass concentration of dissolved oxygen in Chinese mitten crab ponds was predicted after optimizing LSTM model parameters by PSO algorithm. The results showed that the PSO-LSTM model was not only superior to the ARIMA model, but also had higher prediction accuracy compared with other LSTM models. In the predictions at 10 consecutive time points, the average percentage error of the PSO-LSTM model reduced by 2.55%, 1.891% and 4.055% respectively, compared with the LDO-LSTM, LSTM and ARIMA models. It can be seen that the PSO-LSTM model has good accuracy and stability in the prediction of the mass concentration of dissolved oxygen in Chinese mitten crab ponds, and can provide a reference for accurate prediction and regulation of water quality in Chinese mitten crab culturing.
Key words:?prediction of dissolved oxygen;culturing of Chinese mitten crab;particle swarm optimization algorithm;long short-term memory neural networks
河蟹,學(xué)名中華絨螯蟹,俗稱(chēng)大閘蟹。河蟹養(yǎng)殖是中國(guó)很多地區(qū)實(shí)施精準(zhǔn)扶貧、拉動(dòng)經(jīng)濟(jì)增長(zhǎng)、促進(jìn)農(nóng)民增收的重要突破口。溶解氧(Dissolved oxygen,DO)即溶解于水中的分子態(tài)氧,是集約化河蟹養(yǎng)殖成功與否的關(guān)鍵因素之一,其含量多少關(guān)乎河蟹的生長(zhǎng)速度、發(fā)病率、死亡率,以及蟹塘中飼料的利用率和有害物質(zhì)的產(chǎn)生量等。準(zhǔn)確預(yù)測(cè)蟹塘中溶解氧的含量,有利于及時(shí)掌握溶解氧的變化趨勢(shì),提前采取防控措施,從而降低河蟹養(yǎng)殖風(fēng)險(xiǎn),增加養(yǎng)殖經(jīng)濟(jì)效益,同時(shí)還對(duì)水質(zhì)監(jiān)測(cè)和疾病防控等生態(tài)問(wèn)題具有預(yù)警意義。
近年來(lái),隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù)的發(fā)展,越來(lái)越多的研究者將此類(lèi)方法應(yīng)用于水體溶解氧的預(yù)測(cè)研究中。劉雙印等[1]采用支持向量機(jī)方法構(gòu)建了基于蟻群優(yōu)化的LSSVR溶解氧預(yù)測(cè)模型?;戮甑萚2]提出基于K-means聚類(lèi)和極限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)結(jié)合的溶解氧預(yù)測(cè)模型,降低了不同趨勢(shì)樣本間的干擾,提升了預(yù)測(cè)準(zhǔn)確度。Khan等[3]提出了模糊線性回歸的溶解氧預(yù)測(cè)方法,與貝葉斯方法相比均方誤差更低。吳慧英等[4]提出了主成分分析法(Principal component analysis, PCA)和SVR的池塘溶解氧預(yù)測(cè)模型,提取影響?zhàn)B殖水體溶解氧濃度的關(guān)鍵指標(biāo),降低模型輸入變量的維度,提高了模型的訓(xùn)練速度。以上諸如支持向量機(jī)、K-means聚類(lèi)等淺層的機(jī)器學(xué)習(xí)方法在有限樣本和計(jì)算單元的情況下對(duì)復(fù)雜函數(shù)的表征學(xué)習(xí)能力有限,普遍缺乏長(zhǎng)效性。
深度學(xué)習(xí)方法通過(guò)深層的非線性網(wǎng)絡(luò)結(jié)構(gòu)可以實(shí)現(xiàn)利用少量參數(shù)表示復(fù)雜函數(shù),更有助于挖掘數(shù)據(jù)的內(nèi)在信息,具有強(qiáng)大的數(shù)據(jù)學(xué)習(xí)能力和泛化能力。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network, RNN)作為深度學(xué)習(xí)處理時(shí)間序列任務(wù)的經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu),在時(shí)序數(shù)據(jù)預(yù)測(cè)中表現(xiàn)突出,但是隨著序列長(zhǎng)度的增加存在梯度爆炸或梯度消失風(fēng)險(xiǎn),性能受到制約[5-6]。而基于RNN改進(jìn)的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long short-term memory, LSTM)[7]加入了細(xì)胞狀態(tài)單元,較好地解決了長(zhǎng)時(shí)間序列的依賴(lài)問(wèn)題。有大量學(xué)者利用LSTM模型對(duì)時(shí)間序列進(jìn)行預(yù)測(cè)的研究。溫惠英等[8]利用遺傳算法(GA)對(duì)LSTM的神經(jīng)網(wǎng)絡(luò)隱藏層數(shù)、訓(xùn)練次數(shù)、dropout等參數(shù)進(jìn)行優(yōu)化并利用高速公路交通流的數(shù)據(jù)進(jìn)行驗(yàn)證,闡述了不同參數(shù)對(duì)LSTM模型調(diào)優(yōu)過(guò)程中的影響。白盛楠等[9]在使用灰色關(guān)聯(lián)度分析后搭建了基于LSTM的PM2.5預(yù)測(cè)模型,為空氣污染的預(yù)警和治理提供了新的思路。魏昱洲等[10]利用雙層LSTM網(wǎng)絡(luò)結(jié)構(gòu),對(duì)風(fēng)速數(shù)據(jù)進(jìn)行了預(yù)測(cè),證明超前10 min內(nèi)各時(shí)間段的預(yù)測(cè)準(zhǔn)確率達(dá)到了98.8%以上,具有很好的預(yù)測(cè)精度。也有少數(shù)學(xué)者利用LSTM模型對(duì)水體溶解氧進(jìn)行了預(yù)測(cè)[11-13],取得了一定成果。其中朱南陽(yáng)等[14]在LSTM的基礎(chǔ)上通過(guò)對(duì)低溶解氧權(quán)重的調(diào)節(jié)進(jìn)行預(yù)測(cè),在確保溶解氧趨勢(shì)擬合的前提下提高了低濃度溶解氧的預(yù)測(cè)精度。陳英義等[15]提出主成分分析和LSTM相結(jié)合的溶解氧預(yù)測(cè)方法,試驗(yàn)證明LSTM模型的各項(xiàng)誤差指標(biāo)都優(yōu)于其他淺層模型。
選擇不同模型參數(shù)對(duì)LSTM模型預(yù)測(cè)性能的提升影響巨大。目前模型參數(shù)的選擇往往過(guò)多依賴(lài)于研究者的經(jīng)驗(yàn)和反復(fù)調(diào)試,需要大量的人力和計(jì)算資源。而粒子群優(yōu)化算法(Particle swarm optimization,PSO)可以在保證模型評(píng)價(jià)指標(biāo)最優(yōu)的前提下,通過(guò)不斷迭代尋優(yōu)過(guò)程找到模型的最優(yōu)參數(shù),從而避免了依據(jù)經(jīng)驗(yàn)選取參數(shù)而導(dǎo)致的預(yù)測(cè)精度低、調(diào)參時(shí)間長(zhǎng)的問(wèn)題。近兩年,有少量學(xué)者開(kāi)始嘗試用PSO與LSTM相結(jié)合的方式對(duì)時(shí)間序列進(jìn)行預(yù)測(cè)研究。楊孟達(dá)[16]提出改進(jìn)PSO-LSTM模型對(duì)未來(lái)一天日均溫度進(jìn)行預(yù)測(cè),試驗(yàn)結(jié)果表明PSO-LSTM模型有更好的準(zhǔn)確性。劉可真等[17]利用PSO-LSTM模型對(duì)變壓器中溶解氣體濃度進(jìn)行了預(yù)測(cè),證明相較于傳統(tǒng)預(yù)測(cè)方法,PSO-LSTM模型可以更好地追蹤油中溶解氣體濃度的變化規(guī)律。李萬(wàn)等[18]采用改進(jìn)粒子群算法優(yōu)化LSTM模型并對(duì)鐵路客運(yùn)量進(jìn)行了預(yù)測(cè)。宋剛等[19]基于粒子群優(yōu)化LSTM模型對(duì)各類(lèi)股票的變化曲線進(jìn)行了預(yù)測(cè),證明了該模型具有普遍適用性。
本研究提出一種基于PSO-LSTM模型的蟹塘溶解氧預(yù)測(cè)方法,首先將LSTM模型中樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)等參數(shù)設(shè)為優(yōu)化對(duì)象并給予取值范圍,利用PSO算法根據(jù)參數(shù)范圍初始化各粒子的位置信息并建立初始模型,將模型在驗(yàn)證集的預(yù)測(cè)誤差作為粒子的適應(yīng)度值不斷更新,當(dāng)滿足最大迭代次數(shù)時(shí)停止更新優(yōu)化,利用優(yōu)化后的各類(lèi)參數(shù)搭建LSTM預(yù)測(cè)模型對(duì)溶解氧進(jìn)行預(yù)測(cè)。
1?材料與方法
1.1?數(shù)據(jù)采集
試驗(yàn)數(shù)據(jù)源自江蘇省宜興市高塍鎮(zhèn)河蟹養(yǎng)殖基地,該基地內(nèi)各池塘面積約為37 000 m2,水深約為1.2 m。每個(gè)池塘選取2~3個(gè)位置,每個(gè)位置分別選取距離水底30 cm、60 cm、90 cm處作為數(shù)據(jù)采集點(diǎn)布設(shè)傳感器(圖1)。
每個(gè)數(shù)據(jù)采集點(diǎn)設(shè)有溶解氧質(zhì)量濃度、溫度、濁度、pH、銨態(tài)氮質(zhì)量濃度、電導(dǎo)率等傳感器,傳感器型號(hào)如表1所示。
試驗(yàn)所選取的數(shù)據(jù)為位置1-2(圖1)的中層傳感器采集的數(shù)據(jù),采集時(shí)間為2020年4月11日至2020年5月24日,數(shù)據(jù)采集間隔時(shí)間為10 min,共采集到溶解氧質(zhì)量濃度、溫度、濁度、pH、銨態(tài)氮質(zhì)量濃度、電導(dǎo)率等有效數(shù)據(jù)6 226條。其中5月8日采集的部分?jǐn)?shù)據(jù)如表2所示。
分析長(zhǎng)期監(jiān)測(cè)數(shù)據(jù)后發(fā)現(xiàn),蟹塘養(yǎng)殖水相關(guān)參數(shù)每小時(shí)內(nèi)波動(dòng)范圍較小,其中溶解氧質(zhì)量濃度和溫度隨著時(shí)間呈周期變化。水體溶解氧質(zhì)量濃度在清晨和傍晚較高,而中午隨著水溫升高,盡管水草等植物光合作用增強(qiáng),但是水中好氧因子也多,因此水中溶解氧質(zhì)量濃度降低。除此之外,溶解氧質(zhì)量濃度隨著季節(jié)的不同也呈現(xiàn)明顯的周期變化,而pH、銨態(tài)氮質(zhì)量濃度、濁度、電導(dǎo)率等參數(shù)隨溶解氧質(zhì)量濃度的變化呈振蕩變化特點(diǎn),無(wú)明顯的線性關(guān)系。
1.2?數(shù)據(jù)預(yù)處理與相關(guān)性分析
由于水下環(huán)境、設(shè)備腐蝕和人為干預(yù)等因素的影響,傳感器的原始數(shù)據(jù)存在缺失值或異常值,在預(yù)處理階段對(duì)獲取到的6 226條原始數(shù)據(jù)采用均值法(公式1)對(duì)缺失值進(jìn)行補(bǔ)充和異常值替換。
為了降低數(shù)據(jù)維度,篩選出與溶解氧質(zhì)量濃度相關(guān)性較高的影響因子,采用SPSS工具的皮爾遜相關(guān)系數(shù)法(Pearson correlation coefficient)進(jìn)行相關(guān)性分析。結(jié)果表明,溶解氧質(zhì)量濃度與溫度(相關(guān)系數(shù)-0.150**)、濁度(0.338**)、pH值(0.811**)、銨態(tài)氮質(zhì)量濃度(-0.118**)具有顯著相關(guān)性(P<0.01), 而與電導(dǎo)率(-0.040)的相關(guān)性較低,因此選擇溫度、濁度、pH、銨態(tài)氮質(zhì)量濃度等主要影響因子作為模型輸入?yún)?shù)。
1.3?數(shù)據(jù)歸一化
為了消除奇異樣本數(shù)據(jù),減少模型訓(xùn)練時(shí)間,通過(guò)公式(2)對(duì)數(shù)據(jù)進(jìn)行歸一化,將原數(shù)據(jù)映射到[0,1]之間。并將歸一化后的數(shù)據(jù)按照8∶1∶1劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集。
1.4?模型構(gòu)建
1.4.1?長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)?LSTM是一種特殊的RNN結(jié)構(gòu)。為了解決傳統(tǒng)RNN在長(zhǎng)序列訓(xùn)練過(guò)程中的梯度彌散問(wèn)題,LSTM引入了特殊的“門(mén)”結(jié)構(gòu)。LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,由輸入門(mén)、遺忘門(mén)、輸出門(mén)和細(xì)胞單元組成[7]。
圖2中ft是遺忘門(mén),決定上一時(shí)刻的細(xì)胞中有多少信息需要傳遞到當(dāng)前時(shí)刻;it是輸入門(mén),用來(lái)控制當(dāng)前單元嵌入細(xì)胞狀態(tài)的程度;ot是輸出門(mén),輸出門(mén)結(jié)合了細(xì)胞狀態(tài)用來(lái)輸出;Ct是記憶單元,用來(lái)記錄不同門(mén)結(jié)構(gòu)情況下細(xì)胞的狀態(tài);ht是輸出。各個(gè)門(mén)之間的計(jì)算過(guò)程如下:
其中Wf,Wi,Wc,Wo是各個(gè)門(mén)的權(quán)重,bf,bi,bc,bo是各個(gè)門(mén)的偏置項(xiàng)。通過(guò)上述計(jì)算,LSTM可以利用門(mén)控單元進(jìn)行長(zhǎng)序列的信息傳遞,從而避免長(zhǎng)期依賴(lài)問(wèn)題。
1.4.2?粒子群優(yōu)化算法(PSO)?粒子群優(yōu)化算法的思想源于對(duì)鳥(niǎo)類(lèi)覓食行為的研究,鳥(niǎo)群通過(guò)搜尋目前離食物最近的鳥(niǎo)的周?chē)鷧^(qū)域,利用個(gè)體的飛行經(jīng)驗(yàn)判斷食物所在并不斷向集體共享信息,從而使得整個(gè)群體快速獲得覓食路線的最優(yōu)解[20]。PSO將群體中的個(gè)體看作在空間中進(jìn)行搜索的粒子,每個(gè)粒子隨機(jī)得到一組隨機(jī)解,每個(gè)解都有特定的位置、速度和適應(yīng)度,粒子在空間的搜尋過(guò)程中不斷跟蹤空間內(nèi)最優(yōu)解調(diào)整自身的參數(shù),從而完成從局部最優(yōu)到全局最優(yōu)的搜索過(guò)程。
式中,ω為慣性權(quán)重,控制粒子在局部最優(yōu)和全局最優(yōu)中的權(quán)重分配;c1和c2為加速因子,用以調(diào)整飛行的步長(zhǎng),一般非負(fù);r1和r2為值在[0,1]之間的隨機(jī)數(shù);Xkid,Vkid,Pkgd,Pkid分別對(duì)應(yīng)該時(shí)刻下粒子的位置、速度、局部最優(yōu)解和全局最優(yōu)解。
1.4.3?粒子群優(yōu)化算法優(yōu)化LSTM模型參數(shù)流程?LSTM盡管在一定程度上解決了傳統(tǒng)RNN的梯度彌散問(wèn)題,但是由于門(mén)結(jié)構(gòu)的加入增加了參數(shù)量,需要不斷調(diào)整參數(shù)才能達(dá)到最優(yōu)的效果。本研究利用粒子群優(yōu)化算法對(duì)LSTM模型中樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)等參數(shù)進(jìn)行尋優(yōu),確定溶解氧質(zhì)量濃度預(yù)測(cè)模型的最佳參數(shù)。PSO-LSTM模型結(jié)構(gòu)如圖3所示:
算法流程:步驟1,將LSTM的樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)作為優(yōu)化對(duì)象,根據(jù)預(yù)先設(shè)定的范圍初始化粒子的位置信息。步驟2,初始化粒子群,劃分訓(xùn)練集和測(cè)試集,并將步驟1中初始化參數(shù)輸入LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練,將模型預(yù)測(cè)誤差作為粒子的適應(yīng)度值。步驟3,比較每個(gè)粒子的適應(yīng)度值及其經(jīng)歷過(guò)的最好位置,確定粒子的最優(yōu)位置,并根據(jù)公式9和公式10更新粒子的速度和位置,計(jì)算新一輪粒子適應(yīng)度值。步驟4,當(dāng)搜尋過(guò)程達(dá)到預(yù)先設(shè)定的最大迭代次數(shù),或粒子的適應(yīng)度值不再隨迭代次數(shù)明顯變化時(shí)停止更新,并獲得此時(shí)LSTM模型的樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)值。步驟5,將步驟4獲得的各項(xiàng)數(shù)值輸入LSTM模型進(jìn)行訓(xùn)練和預(yù)測(cè)。
1.4.4?模型評(píng)價(jià)指標(biāo)?為了驗(yàn)證PSO-LSTM模型對(duì)溶解氧質(zhì)量濃度的預(yù)測(cè)性能,選取平均絕對(duì)百分比誤差(MAPE)、均方根誤差(RMSE)、均方誤差(MSE)作為模型評(píng)價(jià)指標(biāo)。各評(píng)價(jià)指標(biāo)計(jì)算公式如下:
式中,N為預(yù)測(cè)的總次數(shù),yi代表真實(shí)值,y^i代表預(yù)測(cè)值,MAPE表示預(yù)測(cè)值與真實(shí)值的百分誤差,MSE反映了預(yù)測(cè)值與真實(shí)值之間偏差的期望值,RMSE是均方誤差的算術(shù)平方根。
1.4.5?PSO-LSTM模型驗(yàn)證對(duì)比模型的選擇?為了驗(yàn)證PSO-LSTM模型的有效性,選擇單一LSTM模型、自回歸移動(dòng)平均模型(ARIMA)和低溶解氧預(yù)測(cè)模型(LDO-LSTM)作為對(duì)比模型。ARIMA模型是研究時(shí)間序列的重要模型,由自回歸模型(AR)與滑動(dòng)平均模型(MA)結(jié)合而成,僅需要對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn)和差分即可搭建模型,具有適用范圍廣、預(yù)測(cè)誤差小的特點(diǎn)。由于蟹塘溶解氧質(zhì)量濃度偏低時(shí)危害更大,有學(xué)者通過(guò)更改損失函數(shù)的權(quán)重建立了LDO-LSTM模型提升低溶解氧時(shí)預(yù)測(cè)精度[10],該模型根據(jù)溶解氧真實(shí)值在反向傳播時(shí)給損失函數(shù)分配不同的權(quán)重,使網(wǎng)絡(luò)更關(guān)注低溶解氧質(zhì)量濃度時(shí)刻的特征,取得了良好的預(yù)測(cè)精度。
1.4.6?PSO-LSTM模型參數(shù)設(shè)置?本試驗(yàn)環(huán)境為Anaconda,編程語(yǔ)言為Python3.6,模型訓(xùn)練框架為基于Keras的Tensorflow1.4。LSTM模型的輸入層神經(jīng)元數(shù)量為4,隱藏層數(shù)量為1,輸出層神經(jīng)元數(shù)量為1,預(yù)測(cè)所需步長(zhǎng)為40。訓(xùn)練過(guò)程中用Adam算法優(yōu)化參數(shù),將樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)設(shè)置為待優(yōu)化參數(shù),具體取值范圍設(shè)置如下:樣本批次取值范圍為[4,128],隱藏層單元數(shù)為[2,20],學(xué)習(xí)率為[0.000 1,0.010 0],迭代次數(shù)為[30,300]。粒子群優(yōu)化算法參數(shù)設(shè)置為:粒子群數(shù)量為20,加速因子c1=c2=2,慣性權(quán)重ω設(shè)置為0.8,最大迭代次數(shù)為300。ARIMA中階層(p)、階數(shù)(q)和差分(d)分別設(shè)置為1、1、2。LSTM模型學(xué)習(xí)率設(shè)置為0.001,樣本批次為32,迭代次數(shù)為100,隱藏層數(shù)量為1,每層神經(jīng)元數(shù)量為10。LDO-LSTM模型的學(xué)習(xí)率為0.001,時(shí)間步長(zhǎng)為10,輸入層節(jié)點(diǎn)數(shù)為4,隱藏層節(jié)點(diǎn)數(shù)為20。
2?結(jié)果
選取不同模型對(duì)蟹塘溶解氧質(zhì)量濃度進(jìn)行預(yù)測(cè),各模型在測(cè)試集上的部分預(yù)測(cè)曲線和百分誤差分別如圖4、圖5所示。
從圖4可以看出,ARIMA模型在平滑區(qū)間的預(yù)測(cè)值與真實(shí)值曲線趨勢(shì)基本擬合,但整體在時(shí)間上具有一定的滯后性,且部分點(diǎn)的預(yù)測(cè)值和真實(shí)值存在較大誤差;LSTM模型相較于ARIMA模型減少了平均誤差,具有更好的擬合曲線,但是在低質(zhì)量濃度溶解氧的預(yù)測(cè)上普遍存在偏大的現(xiàn)象;而LDO-LSTM模型由于調(diào)整了在低溶解氧質(zhì)量濃度時(shí)的權(quán)重分配,因此在繼續(xù)保持了LSTM模型優(yōu)點(diǎn)的基礎(chǔ)上,還在低溶解氧質(zhì)量濃度的預(yù)測(cè)上有較好的表現(xiàn),但仍有部分時(shí)間段在時(shí)間上存在滯后性;PSO-LSTM模型相比較于其他模型在整體上曲線擬合和縮短時(shí)間滯后性上都得到了提升,預(yù)測(cè)值更貼近于真實(shí)值,說(shuō)明PSO-LSTM模型比其他模型有更好的預(yù)測(cè)精度。
從圖5可以看出,ARIMA、LSTM和LDO-LSTM模型部分相鄰點(diǎn)的預(yù)測(cè)誤差會(huì)出現(xiàn)“跳崖”現(xiàn)象,波動(dòng)較大。而PSO-LSTM模型的預(yù)測(cè)誤差曲線更加平滑,誤差波動(dòng)較小,具有很好的穩(wěn)定性。
為了更加直觀地反映各模型的預(yù)測(cè)效果,選擇MSE、RMSE和MAPE 3個(gè)評(píng)價(jià)指標(biāo)對(duì)4種模型進(jìn)行評(píng)價(jià)(表3)。4種模型用于蟹塘溶解氧質(zhì)量濃度預(yù)測(cè)的精度從高到低依次為PSO-LSTM模型、LDO-LSTM模型、LSTM模型和ARIMA模型。其中,PSO-LSTM模型的MSE、RMSE、MAPE值分別是0.013、0.114、0.354,與ARIMA模型相比MSE、RMSE、MAPE值分別降低了0.035、0.106、0.308,與單一的LSTM模型相比MSE、RMSE、MAPE值分別降低了0.016、0.058、0.18,與LDO-LSTM模型相比MSE、RMSE、MAPE值分別降低了0.009、0.035、0.116??梢?jiàn),利用PSO進(jìn)行參數(shù)優(yōu)化后的LSTM模型在溶解氧質(zhì)量濃度預(yù)測(cè)上整體表現(xiàn)突出,預(yù)測(cè)值和真實(shí)值之間的偏差小,準(zhǔn)確性和穩(wěn)定性提升明顯。
為了進(jìn)一步比較不同模型在連續(xù)性預(yù)測(cè)中的表現(xiàn),選取測(cè)試集中未來(lái)連續(xù)10個(gè)時(shí)間點(diǎn)的預(yù)測(cè)值和真實(shí)值進(jìn)行比較分析,結(jié)果如表4所示??梢钥闯觯琍SO-LSTM模型在測(cè)試集連續(xù)10個(gè)時(shí)間點(diǎn)中單值最大誤差為1.496%,而LDO-LSTM、LSTM和ARIMA模型的最大誤差分別為4.959%、3.140%,和7.245%。另外PSO-LSTM模型在10個(gè)采集點(diǎn)的平均絕對(duì)誤差為0.658%,相較于LDO-LSTM、LSTM和ARIMA等模型的誤差分別降低了2.550個(gè)百分點(diǎn)、1.891個(gè)百分點(diǎn)、4.055個(gè)百分點(diǎn),證明PSO-LSTM模型在連續(xù)性、長(zhǎng)期性的蟹塘溶解氧質(zhì)量濃度預(yù)測(cè)方面具有很高的準(zhǔn)確性,對(duì)于溶解氧質(zhì)量濃度變化情況的提前預(yù)警和調(diào)控具有重要意義。
3?討論
本研究針對(duì)采集到的蟹塘水質(zhì)數(shù)據(jù)先進(jìn)行變量間皮爾遜相關(guān)性分析,確定影響溶解氧質(zhì)量濃度的主要變量,再結(jié)合目前主流的時(shí)間序列模型LSTM,利用粒子群優(yōu)化算法優(yōu)化LSTM模型的超參數(shù),根據(jù)優(yōu)化結(jié)果搭建PSO-LSTM模型研究蟹塘溶解氧質(zhì)量濃度變化規(guī)律。通過(guò)試驗(yàn)對(duì)比發(fā)現(xiàn):(1)對(duì)數(shù)據(jù)進(jìn)行相關(guān)性分析可以有效降低訓(xùn)練數(shù)據(jù)的維度,減少訓(xùn)練時(shí)間,提升預(yù)測(cè)精度。(2)LSTM網(wǎng)絡(luò)模型能較好地解決ARIMA模型在溶解氧質(zhì)量濃度預(yù)測(cè)中的滯后性問(wèn)題,并且提高準(zhǔn)確性。(3)PSO-LSTM模型的精度較單一的LSTM有明顯提升,說(shuō)明參數(shù)的優(yōu)化對(duì)模型預(yù)測(cè)精度具有較大影響。(4)相比于ARIMA、LSTM、LDO-LSTM模型,PSO-LSTM模型的預(yù)測(cè)值和真實(shí)值之間的偏差小,準(zhǔn)確性和穩(wěn)定性提升明顯,尤其是PSO-LSTM模型在未來(lái)一個(gè)時(shí)間點(diǎn)和多個(gè)時(shí)間點(diǎn)的預(yù)測(cè)精度優(yōu)于其他模型,能夠較好地應(yīng)用于蟹塘溶解氧質(zhì)量濃度的預(yù)警預(yù)報(bào)。
綜上所述,基于PSO-LSTM模型預(yù)測(cè)蟹塘溶解氧質(zhì)量濃度具有較好的預(yù)測(cè)精度,可以在蟹塘水質(zhì)預(yù)警、水質(zhì)環(huán)境監(jiān)測(cè)、溶解氧質(zhì)量濃度自動(dòng)精準(zhǔn)調(diào)控等方面發(fā)揮作用。但是在試驗(yàn)過(guò)程中僅考慮了水體內(nèi)部不同因子對(duì)溶解氧質(zhì)量濃度的影響,并沒(méi)有考慮氣壓、風(fēng)速等外在環(huán)境因素,在未來(lái)的實(shí)際應(yīng)用中需要對(duì)數(shù)據(jù)進(jìn)行更全面的整合與分析,進(jìn)一步提升預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性。
參考文獻(xiàn):
[1]?劉雙印,徐龍琴,李道亮,等. 基于蟻群優(yōu)化最小二乘支持向量回歸機(jī)的河蟹養(yǎng)殖溶解氧預(yù)測(cè)模型[J].農(nóng)業(yè)工程學(xué)報(bào),2012,28(23):167-175.
[2]?宦?娟,劉星橋. 基于K-means聚類(lèi)和ELM神經(jīng)網(wǎng)絡(luò)的養(yǎng)殖水質(zhì)溶解氧預(yù)測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2016,32(17):174-181.
[3]?KHAN V C. Comparing A Bayesian and fuzzy number approach to uncertainty quantification in short-term dissolved oxygen prediction[J]. Journal of Environmental Informatics, 2017, 30(1):1-16.
[4]?吳慧英,楊日劍,張?穎,等. 基于PCA-SVR的池塘DO預(yù)測(cè)模型[J].安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,40(6):103-108.
[5]?BENGIO Y, SIMARD P, FRASCONI P. Learning long-term dependencies with gradient descent is difficult[J]. IEEE Transactions on Neural Networks, 1994, 5(2): 157-166.
[6]?楊?麗,吳雨茜,王俊麗,等. 循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)應(yīng)用,2018,38(S2):1-6,26.
[7]?HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.
[8]?溫惠英,張東冉,陸思園. GA-LSTM模型在高速公路交通流預(yù)測(cè)中的應(yīng)用[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2019,51(9):81-87,95.
[9]?白盛楠,申曉留. 基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的PM_(2.5)預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2019,36(1):67-70,104.
[10]魏昱洲,許西寧. 基于LSTM長(zhǎng)短期記憶網(wǎng)絡(luò)的超短期風(fēng)速預(yù)測(cè)[J].電子測(cè)量與儀器學(xué)報(bào),2019,33(2):64-71.
[11]LIU S Y, XU L Q, LI D L. Prediction of dissolved oxygen content in river crab culture based on least squares support vector regression optimized by improved particle swarm optimization[J]. Computers and Electronics in Agriculture, 2013, 95:82-91.
[12]TA X X, WEI Y G. Research on a dissolved oxygen prediction method for recirculating aquaculture systems based on a convolution neural network[J]. Computers and Electronics in Agriculture, 2018, 145: 302-310.
[13]LIU Y Q,ZHANG Q,SONG L H. Attention-based recurrent neural networks for accurate short-term and long-term dissolved oxygen prediction[J]. Computers and Electronics in Agriculture,2019,165:1-11.
[14]朱南陽(yáng),吳?昊,尹達(dá)恒,等. 基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)的蟹塘溶解氧估算優(yōu)化方法[J].智慧農(nóng)業(yè),2019,1(3):67-76.
[15]陳英義,程倩倩,方曉敏,等. 主成分分析和長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)水產(chǎn)養(yǎng)殖水體溶解氧[J].農(nóng)業(yè)工程學(xué)報(bào),2018,34(17):183-191.
[16]楊孟達(dá). 基于改進(jìn)PSO-LSTM神經(jīng)網(wǎng)絡(luò)的氣溫預(yù)測(cè)[J].現(xiàn)代信息科技,2020,4(4):110-112.
[17]劉可真,茍家萁,駱?釗,等. 基于PSO-LSTM模型的變壓器油中溶解氣體濃度預(yù)測(cè)方法[J]. 電網(wǎng)技術(shù),2020,44(7):2778-2785.
[18]李?萬(wàn),馮芬玲,蔣琦瑋. 改進(jìn)粒子群算法優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)的鐵路客運(yùn)量預(yù)測(cè)[J].鐵道科學(xué)與工程學(xué)報(bào),2018,15(12):3274-3280.
[19]宋?剛,張?jiān)品澹紕?,? 基于粒子群優(yōu)化LSTM的股票預(yù)測(cè)模型[J].北京航空航天大學(xué)學(xué)報(bào),2019,45(12):2533-2542.
[20]李?lèi)?ài)國(guó),覃?征,鮑復(fù)民,等. 粒子群優(yōu)化算法[J].計(jì)算機(jī)工程與應(yīng)用,2002(21):1-3,17.
(責(zé)任編輯:張震林)