徐龍琴,李乾川,劉雙印※,李道亮(.廣東海洋大學信息學院,湛江 5405; .加州大學洛杉磯分校文理學院,洛杉磯 9004;.中國農(nóng)業(yè)大學北京市農(nóng)業(yè)物聯(lián)網(wǎng)工程技術(shù)研究中心,北京 0008)
?
基于集合經(jīng)驗模態(tài)分解和人工蜂群算法的工廠化養(yǎng)殖pH值預測
徐龍琴1,李乾川2,劉雙印1※,李道亮3
(1.廣東海洋大學信息學院,湛江 524025;2.加州大學洛杉磯分校文理學院,洛杉磯 90024;3.中國農(nóng)業(yè)大學北京市農(nóng)業(yè)物聯(lián)網(wǎng)工程技術(shù)研究中心,北京 100083)
摘要:針對單一預測模型預測養(yǎng)殖pH值精度低等問題,提出集合經(jīng)驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)和改進人工蜂群算法(improve artificial bee colony,IABC)相結(jié)合的南美白對蝦工廠化養(yǎng)殖pH值組合預測模型。在建模過程中,利用EEMD算法對原始pH值時間序列進行多尺度分解,得到一組平穩(wěn)、互不耦合的子序列;根據(jù)各子序列變化特征選擇適宜的單項預測方法并建模,通過改進人工蜂群(IABC)算法優(yōu)化復雜非線性組合預測模型目標函數(shù)權(quán)重系數(shù),構(gòu)建了工廠化養(yǎng)殖pH值非線性組合預測模型。利用該模型對廣東省湛江市2014年9月8日-2014年9月15日期間工廠化養(yǎng)殖pH值進行預測,結(jié)果表明,該預測模型取得了較好的預測效果,與模擬退火優(yōu)化BP神經(jīng)網(wǎng)絡(simulated Annealing-BP neural network,SA-BPNN)和遺傳算法優(yōu)化最小二乘支持向量回歸機(genetic algorithm-least square support vector regression,GA-LSSVR)對比分析,模型評價指標平均絕對百分比誤差MAPE、均方根誤差、平均絕對誤差MAE和相關(guān)系數(shù)R2分別為0.0035、0.0274、0.0224和0.9923,均表明該文提出的組合預測模型具有更高預測精度,能夠滿足實際南美白對蝦工廠化養(yǎng)殖pH值精細化管理需要,也為其他領(lǐng)域pH值預測提供參考。
關(guān)鍵詞:算法;pH值;水產(chǎn)養(yǎng)殖;組合預測;集合經(jīng)驗模態(tài)分解;人工蜂群算法;南美白對蝦
徐龍琴,李乾川,劉雙印,李道亮. 基于集合經(jīng)驗模態(tài)分解和人工蜂群算法的工廠化養(yǎng)殖pH值預測[J]. 農(nóng)業(yè)工程學報,2016,32(3):202-209.doi:10.11975/j.issn.1002-6819.2016.03.029http://www.tcsae.org
Xu Longqin, Li Qianchuan, Liu Shuangyin, Li Daoliang. Prediction of pH value in industrialized aquaculture based on ensemble empirical mode decomposition and improved artificial bee colony algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(3): 202-209. (in Chinese with English abstract)
Email:hdlsyxlq@126.com
在養(yǎng)殖水環(huán)境污染嚴重、陸地資源日益匱乏和食品安全問題等接踵而至的背景下,集工廠化、信息化、設施化和規(guī)模化于一體的新型海水工廠化養(yǎng)殖,是海水養(yǎng)殖業(yè)健康可持續(xù)發(fā)展的必然趨勢[1]。在南美白對蝦海水工廠化養(yǎng)殖過程中,養(yǎng)殖水質(zhì)質(zhì)量直接影響對蝦產(chǎn)量和質(zhì)量,尤其對影響水質(zhì)質(zhì)量的關(guān)鍵因子pH值要求較高,只有pH值在7.5~8.3范圍內(nèi)南美白對蝦才能快速健康生長[2-3],pH值過高或過低都嚴重脅迫對蝦生長,誘導疾病爆發(fā),甚至造成大批量死亡,造成巨額經(jīng)濟損失,同時也影響許多水質(zhì)指標及生物化學的“中和”、“氧化還原”、“硝化和反硝化”等理化反應過程。pH值能綜合反映養(yǎng)殖水質(zhì)質(zhì)量,是水質(zhì)變化的風向標。因此,高精度預測pH值,對制定科學合理的水質(zhì)調(diào)控計劃,確保南美白對蝦在無應激水環(huán)境下健康生長,保障海水工廠化養(yǎng)殖綠色低碳、高產(chǎn)高效、健康安全具有重要理論價值和現(xiàn)實意義。
目前國內(nèi)外學者常采用投影尋蹤回歸[4]、灰色理論[5]、神經(jīng)網(wǎng)絡[6-9]、支持向量機[10]、最小二乘支持向量機[11-13]等單項預測方法對降水酸雨、廢水治理、工業(yè)選礦、地下水、新鮮肉類等領(lǐng)域的pH值進行預測,但對水產(chǎn)養(yǎng)殖領(lǐng)域pH值預測應用較少[12]。尤其在南美白對蝦工廠化養(yǎng)殖中,pH值調(diào)控系統(tǒng)存在結(jié)構(gòu)復雜、多因素交叉耦合,使pH值呈現(xiàn)非線性、大時滯、強干擾、不確定性等特點,若直接采用單項預測方法對pH值進行預測,僅能挖掘和利用該復雜系統(tǒng)的局部信息,對其很難建立精確非線性數(shù)學模型。相反,若將多個優(yōu)勢互補預測方法進行優(yōu)化組合,則可從不同角度提煉出有用信息,達到改善模型擬合能力和提高預測性能。Bates[14]和陳華友[15]等已證明了組合模型預測誤差平方和不大于參與組合的各個單項模型的預測誤差平方和最小值。組合預測方法已成為國內(nèi)外預測界的研究熱點,并在一些領(lǐng)域取得成功應用[16-23]。而組合預測核心問題就是如何確定參與組合預測各單項預測模型的權(quán)重系數(shù)使預測精度更高,但該問題至今尚無成熟的理論和方法。
水產(chǎn)養(yǎng)殖水質(zhì)組合預測模型權(quán)重系數(shù)確定問題具有多變量、非線性、結(jié)構(gòu)復雜等特點,該問題求解是一類復雜的多目標優(yōu)化問題。目前,國內(nèi)外學者對解決此類問題已做了許多研究,提出了遺傳算法(genetic algorithm,GA)[11]、人工魚群優(yōu)化算法(artificial fish school algorithm,AFS)[12]、粒子群優(yōu)化算法(particle swarm optimization,PSO)[24]、蟻群優(yōu)化算法(ant colony optimization,ACO)[25-26]、差異進化算法(differential evolution,DE)[27]等群集智能優(yōu)化算法,并在一些參數(shù)辨識、多目標優(yōu)化等領(lǐng)域得到了成功應用。但這些算法各自有不同的生物學背景,在生物進化過程中各自側(cè)重點不同,使這些算法在應用過程中存在易出現(xiàn)早熟、進化迭代后期,難以保持種群多樣性,難以獲得全局最優(yōu)解,收斂速度慢等不足。人工蜂群算法[28](artificial bee colony,ABC)是模擬自然界蜜蜂尋找蜜源、所采取的信息收集與共享過程的一種新型群集智能優(yōu)化算法,它與傳統(tǒng)群集智能算法相比,具有參數(shù)設置少、操作簡單、魯棒性強、收斂速度快、更好全局尋優(yōu)能力,并成功應用于參數(shù)辨識[29]、圖像處理[30]、預測[31-34]等領(lǐng)域。
結(jié)合南美白對蝦工廠化養(yǎng)殖水體pH值相關(guān)特性,在研究前人成果基礎(chǔ)上,本文提出了基于集合經(jīng)驗模態(tài)(ensemble empirical mode decomposition,EEMD)多尺度分解和改進人工蜂群(improve artificial bee colony,IABC)的工廠化養(yǎng)殖水體pH值組合預測模型。通過聚類經(jīng)驗模態(tài)分解對復雜pH值時間序列進行多尺度分解,得到一系列具有不同特征尺度的本征模態(tài)函數(shù)(intrinsic mode function,IMF),然后據(jù)各IMF分量特點選擇適宜的單項預測方法進行建模,并采用改進人工蜂群算法對組合預測模型參數(shù)進行優(yōu)化,得到優(yōu)化組合預測模型。最后,將該模型應用于廣東省湛江市南美白對蝦工廠化養(yǎng)殖某池塘pH值預測中,取得較好的預測效果。與單項pH預測模型對比分析,研究表明,本文所構(gòu)建的組合預測模型預測精度較高、預測性能均優(yōu)于單項預測模型,能夠為水產(chǎn)養(yǎng)殖領(lǐng)域水質(zhì)科學化調(diào)控管理提供參考依據(jù)。
經(jīng)驗模態(tài)分解的基本思想[35]:根據(jù)時序信號的局部時間特征尺度,通過篩過程(sifting process)自適應地從非平穩(wěn)時序信號中提取反映時序信號內(nèi)在特征的本征模態(tài)函數(shù)IMF,但在應用研究中發(fā)現(xiàn),EMD在分解過程中存在模態(tài)混疊和問題,易造成IMF物理意義缺失[36-37]。
為克服EMD模態(tài)混疊現(xiàn)象的缺陷,Wu等根據(jù)白噪聲信號在整個時頻空間均勻分布的統(tǒng)計特性[36],提出了集合經(jīng)驗模態(tài)分解(EEMD),即在每次分解時給信號加入有限幅值且服從正態(tài)分布的白噪聲信號,使原信號在不同尺度上具有連續(xù)性,且改變信號極值點特性,有效克服EMD存在的模式混疊問題。對一給定復雜的pH值時序信號x(t),EEMD分解主要步驟如下:
1) 在原始信號x(t)中加入服從(0,(αε)2)正態(tài)分布的白噪聲n(t),α和ε分別為噪音強度參數(shù)和信號的標準差,獲得加噪聲后信號X(t),即:
2) 對X(t)進行EMD分解,得到一組IMF分量cj(t)和一個剩余分量RN(t)[36]。
3) 對每次待分解信號x(t)都加上均方根相等的不同白噪聲序列ni(t),i=1,2,…,j,對以上兩步重復執(zhí)行 j次,得到不同的IMF分量和剩余分量RiN(t)[36],即
式中cij(t)表示第j次加入白噪聲序列后分解得到的第i個IMF分量。
4) 依據(jù)不相關(guān)的隨機序列統(tǒng)計均值為0的原理,整體平均計算各分量cij(t)的值,以消除因多次添加白噪聲信號對實際IMF的干擾,獲得pH時序信號x(t)的EEMD最終多尺度分解結(jié)果為
在人工蜂群算法(artificial bee colony,ABC)ABC算法中,食物源的位置代表優(yōu)化問題的可行解,食物源質(zhì)量代表優(yōu)化問題的適應度值[29];雇傭蜂引導算法進化方向,跟隨蜂提高算法收斂速度,偵察蜂協(xié)助算法跳出局部極值。對于一個D維的全局優(yōu)化問題可以表示為
式中f(X)表示目標函數(shù),D表示組合優(yōu)化參數(shù)的數(shù)量,[li,ui]表示可行解空間,食物源位置X代表優(yōu)化問題的解,其第i個食物源表示為Xi=( xi1, xi2,..., xiD)。
在尋優(yōu)迭代過程中,雇傭蜂根據(jù)記憶中食物源位置進行鄰域搜索附近更好的食物源,即由記憶解Xij產(chǎn)生一個候選解,其搜尋新食物源的位置表達式為
式中Vij、Xij和Xkj分別表示新食物源位置、當前食物源位置和隨機選擇的一個鄰域食物源位置,rand(?1,1)為尺度調(diào)節(jié)因子,用來控制從當前食物源位置到新食物源位置的移動尺度,N為食物源數(shù)量,k∈(1,2,…,N),j∈(1,2,…,N);
根據(jù)雇傭蜂共享的信息,觀察蜂采用輪盤賭法在雇傭蜂搜索到的食物源Xi中選擇食物源,其選擇食物源概率表達式為
式中Pi為第i個食物源被選擇的概率,τi為第i個食物源;fit(τi)為τi食物源的適應度值,適應度越大食物源被選擇的概率也越大。然后根據(jù)式(7)更新食物源位置。
由ABC算法基本原理中食物源位置更新公式(7)研究發(fā)現(xiàn),式(7)第二項表示鄰近食物源與原食物源間的差異信息,但隨機選擇的Xkj沒有考慮當前食物源與鄰域個體食物源之間的關(guān)系,尤其是進化后期蜂群具有強烈的趨同性,使蜂群基本喪失了群體多樣性,該搜索和選擇機制都容易造成ABC算法陷入局部極值,嚴重制約ABC算法的廣泛應用。
為彌補標準ABC算法存在的易陷入局部極值的缺陷,本文借鑒文獻[38]粒子群算法PSO速度更新策略和文獻[39]差分進化策略,通過引入全局最優(yōu)引導因子和動態(tài)位移尺度調(diào)節(jié)因子改進雇傭蜂和觀察蜂搜索食物源的策略,平衡了ABC算法局部搜索和全局搜索的性能,使改進的ABC算法實現(xiàn)了自適應動態(tài)搜索,有利于加快算法收斂速度。其新食物源位置更新改進公式如下:
其中,
式中Xbestj表示當前最優(yōu)解的第j維分量,參數(shù)λ、γ、?max和?min一般為常數(shù),t和Tmax分別為當前迭代次數(shù)和最大迭代次數(shù),ηij隨機取值為?1或1,fi為被優(yōu)化問題的當前目標函數(shù)值,fbest為當前最優(yōu)目標函數(shù)值。
在改進的ABC算法中,全局最優(yōu)引導因子?ij引導蜂群對食物源的搜索趨勢,?ij在迭代尋優(yōu)初期取值較小,有利于降低全局最優(yōu)解引導作用,提高算法全局搜索能力;在迭代后期取值較大,有利于加速算法向全局最優(yōu)解的收斂速度。動態(tài)位移尺度調(diào)節(jié)因子ρij具有較大的取值范圍,在尋優(yōu)迭代初期賦予較大位移步長有利于擴展算法搜索空間,在迭代后期fi越接近fbest,ρij取值愈趨近于0,此時步長較小越有利于算法局部尋優(yōu)。?ij和ρij使改進的ABC算法在算法迭代初期具有較強的全局搜索能力,以盡可能多地發(fā)現(xiàn)全局最優(yōu)可行解,在迭代后期具有較強的局部搜索性能,大大提高算法的計算精度和收斂速度,克服傳統(tǒng)ABC算法易陷入局部極值的缺陷。
南美白對蝦工廠化養(yǎng)殖水體pH值變化受南美白對蝦新陳代謝、人為作業(yè)活動、游離態(tài)CO2、溶解氧、溫度、硫化氫、氨氮、亞硝酸鹽等眾多因素交叉影響,作用機理復雜,使原始pH值時間序列具有較強的非平穩(wěn)性、大時滯和非線性等特征,如果在預測時把全部影響因素考慮在內(nèi)直接進行建模,不僅增加預測模型的復雜度,也難以取得較好的預測性能。為此,本文采用EEMD -IABC構(gòu)建南美白對蝦工廠化養(yǎng)殖水體pH值組合預測模型,其組合預測流程圖如圖1所示,建模步驟如下:
圖1 基于EEMD-IABC的養(yǎng)殖pH值組合預測流程圖Fig.1 Flowchart of pH value combination forecasting based on EEMD-IABC
1)數(shù)據(jù)預處理。對在線采集的南美白對蝦工廠化養(yǎng)殖水體pH值時間序列數(shù)據(jù)修復預處理。
2)原始pH值序列多尺度分解。采用EEMD算法對已修復處理pH值時間序列進行多尺度分解,得到n個不同波動頻率的本征模態(tài)分量(IMF1~IMFn)和一個殘差項Rn。
3)基本預測方法的選擇與建模。以單項預測方法的成熟度、預測性能和適用范圍為準則,結(jié)合各分量和殘差項的特征,選擇比較成熟且廣泛使用、預測精度高的單項預測方法作為組合預測的基礎(chǔ)。
4)單項預測方法預測和預測結(jié)果融合。記第i個分量在t時刻的實測值為yit(i=1,2,…,k),并輸入到第i個單項預測模型中得到預測值為?it(i=1,2,…,k),則由k種單項預測模型構(gòu)建的組合預測模型在t時刻的預測值為式中ωi表示各單項預測模型權(quán)重系數(shù)。
5)組合預測模型權(quán)重系數(shù)優(yōu)化。以誤差平方和最小為目標,則問題轉(zhuǎn)化為
6)人工蜂群初始化。隨機產(chǎn)生T個食物源位置,確定蜂群大小Nc,最大迭代次數(shù)Tmax,限制條件Limit,以及參數(shù)λ、γ、?max和?min等。
7)雇傭蜂尋找新食物源。雇傭蜂依式(9)在目標函數(shù)定義域內(nèi)尋找新的食物源,計算每個食物源的適應度值,并標記食物源位置和全局最優(yōu)值食物源。
8)跟隨蜂對食物源的選擇。跟隨蜂根據(jù)雇傭蜂分享的信息,根據(jù)式(8)輪盤賭法選擇較優(yōu)食物源,計算該食物源的適應度值,并與原食物源適應度值比較,若適應度值大于原食物源適應度值,則標記該食物源為全局最優(yōu)解,跟隨蜂根據(jù)式(9)產(chǎn)生新的食物源,否則拋棄該食物源。
9)若某食物源經(jīng)過Limit次迭代,不能被改進,則丟棄該食物源,此食物源的雇傭蜂變成偵察蜂,并根據(jù)式(14)隨機搜尋新食物源。
10)迭代終止條件判斷。若迭代循環(huán)次數(shù)達到Tmax,則停止迭代,輸出組合預測模型最優(yōu)參數(shù)組合,代入組合模型,加權(quán)疊加計算得到組合模型最終預測值。否則,跳轉(zhuǎn)至步驟7),繼續(xù)迭代搜索最優(yōu)食物源。
4.1數(shù)據(jù)樣本選擇與處理
以廣東省湛江市南美白對蝦工廠化養(yǎng)殖某池塘的pH值為研究對象,采用廣東海洋大學與北京市農(nóng)業(yè)物聯(lián)網(wǎng)工程技術(shù)研究中心聯(lián)合研制的水產(chǎn)養(yǎng)殖物聯(lián)網(wǎng)平臺,每隔30 min對南美白對蝦工廠化養(yǎng)殖水體溶解氧濃度、水溫、電導率、水位、pH值等水質(zhì)參數(shù)數(shù)據(jù)采樣1次,采樣時間周期為2014年9月8至9月15日,共采集336個樣本,以pH值前6天的288個樣本作為訓練集,后一天的48個樣本作為測試集,對提前30 min的養(yǎng)殖水體pH值進行定量預測。監(jiān)測期間南美白對蝦工廠化養(yǎng)殖水體pH值范圍為6.7~8.1,其pH值原始數(shù)據(jù)如圖2所示。由圖2可知,每天的養(yǎng)殖水體pH值具有周期性變化趨勢,且波峰波谷的變化比較顯著,使得工廠化養(yǎng)殖水體pH值時間序列呈現(xiàn)出較強的非線性、非平穩(wěn)和周期性等特征。
圖2 pH值原始數(shù)據(jù)變化曲線圖Fig.2 Variation curve of original pH value data
4.2基于EEMD的pH值時間序列數(shù)據(jù)多尺度分解
為了得到較好的預測效果,獲得高質(zhì)量的時序數(shù)據(jù)分量,根據(jù)第1節(jié)集合經(jīng)驗模態(tài)分解EEMD對非線性、非平穩(wěn)數(shù)據(jù)序列的分解步驟,對在線獲取的南美白對蝦工廠化養(yǎng)殖水體pH值序列數(shù)據(jù)進行多尺度分解。由文獻[36]可知,當N=100,白噪音強度參數(shù)α∈[0.1,0.3]時,EEMD算法分解效果較好。因此,本文設置α=0.2,N=100,標準差ε=0.25。經(jīng)EEMD分解得到了8個IMF分量和一個剩余分量R8(t),養(yǎng)殖pH值分解結(jié)果如圖3所示。
從圖3中可以看出養(yǎng)殖pH值時序數(shù)據(jù)呈現(xiàn)出明顯的多尺度特征。8個IMF分量反映出不同影響因素在不同尺度上對pH值時序數(shù)據(jù)的影響;剩余分量R8(t)反映出pH值序列長期的變化趨勢,這表明南美白對蝦養(yǎng)殖后期成蝦新陳代謝旺盛,導致養(yǎng)殖池塘水質(zhì)pH值有整體降低趨勢。
圖3 基于EEMD的原始pH值分解結(jié)果Fig.3 Results of original pH value based on of EEMD
4.3不同尺度序列的單項預測方法選擇及組合權(quán)重確定
根據(jù)第3節(jié)組合預測構(gòu)建過程中單項預測方法選擇準則與不同尺度分量的變化特征相結(jié)合,選擇適宜的單項預測方法共同構(gòu)建組合預測模型。從圖3可知,針對本征模態(tài)函數(shù)IMF1~IMF3波動較大且較復雜的特點,本文選擇具有適應能力較強、擬合精度高、適宜于小樣本預測的最小二乘支持向量回歸機(least square support vector regression,LSSVR)方法對其進行擬合回歸[40]。對于周期性較明顯的IMF4~IMF5,本文選擇常用于非線性預測、泛化性能較好的BP神經(jīng)網(wǎng)絡對其進行建模。對波動性相對較小IMF6~IMF7,選擇適宜于“貧信息”和小樣本預測的灰色系統(tǒng)理論(grey system theory,GST)對其預測;對比較平緩的IMF8和剩余分量R8(t)選擇非線性回歸方法(nonlinear regression method,NRM)進行建模。
在組合預測中,組合權(quán)重系數(shù)選擇的是否恰當,決定著每個單項預測方法輸出信息占最終預測結(jié)果的比例,且嚴重制約組合模型的最終預測精度和性能。為此,本文采用Matlab 8.3編寫仿真程序,以EEMD分解后不同尺度的pH值各分量作為訓練集和測試集,通過第3節(jié)改進人工蜂群算法,對各單項預測方法權(quán)重組合進行自適應訓練優(yōu)化。IABC算法初始化:蜂群規(guī)模為Nc=30,雇傭蜂和觀察蜂的數(shù)量Ne=Na=15,Limit=100,Tmax=500。經(jīng)過多次試驗,當參數(shù)?max=1,?min=0.001,λ=30,γ=4時,改進人工蜂群取得較好的尋優(yōu)性能,最終獲得了如表1所示8種不同IMF和剩余量R8(t)的預測子模型的最優(yōu)組合權(quán)重系數(shù)。
表1 各模型的權(quán)重系數(shù)Table 1 Weight of each forecasting models
4.4模型驗證及對比分析
將表1獲得的最佳權(quán)重系數(shù)構(gòu)建組合預測模型,對南美白對蝦工廠化養(yǎng)殖水體pH值進行預測,其實測值與預測值對比結(jié)果如圖4a所示,pH值殘差卡方檢驗值曲線如圖4b所示。
圖5 pH預測值與pH實測值比較及殘差卡方檢驗值Fig.5 Comparison of pH forecasting values and actual pH values and its Chi-square inspection value of residual error
由圖4可知,基于EEMD-IABC的組合預測方法能夠較好擬合pH值時間序列非線性變化關(guān)系,且絕對誤差百分比小于0.75%的樣本達到93.75%,最大絕對誤差百分比為0.893%,有效說明本文所提出基于EEMD-IABC的組合模型具有較高的預測精度;EEMD-IABC組合預測模型也通過了卡方檢驗,進一步表明EEMD-IABC組合預測方法是一種適宜于工廠化養(yǎng)殖pH值預測的新方法。
為進一步驗證本文所提出的組合模型的預測性能,選擇文獻[7]的模擬退火優(yōu)化BP神經(jīng)網(wǎng)絡(simulated annealing-BP neural network,SA-BPNN)預測法、文獻[11]的遺傳算法優(yōu)化最小二乘支持向量回歸機(genetic algorithm-least square support vector regression,GA-LSSVR)方法分別對南美白對蝦工廠化養(yǎng)殖水體pH值時序數(shù)據(jù)進行預測,并選用平均絕對百分比誤差MAPE、均方根誤差RMSE、平均絕對誤差MAE和相關(guān)系數(shù)R2等評價指標全面評價各模型預測性能[40]。在同種條件下,其各種模型的預測精度統(tǒng)計結(jié)果如表2所示。
表2 三種模型預測結(jié)果精度分析Table 2 Precision analysis of forecast results for three model
通過表2可知,本文所提出的基于EEMD-IABC的組合模型預測值曲線比GA-LSSVR和SA-BPNN的預測值曲線更逼近實測值變化曲線,GA-LSSVR預測效果次之,SA-BPNN預測方法擬合度最差。在前提條件基本相同的條件下,本文EEMD-IABC組合模型與文獻[11]的GA-LSSVR相比,評價指標MAPE、RMSE、MAE分別下降了14.6%、28.6%、27%,R2提高了1.1%;EEMD-IABC組合預測模型與文獻[7]的SA-BPNN相比,評價指標MAPE、RMSE、MAE分別下降了56.8%、61.4%和62.8%,R2提高了6.16%。通過上述分析可知:1)采用EEMD算法對pH值時序數(shù)據(jù)進行分解,多尺度提取pH值的時頻特征信息,能夠促進提高組合模型的預測精度;2)改進的人工蜂群算法能夠自適應獲取較好的組合預測模型權(quán)重系數(shù),將優(yōu)勢互補的各單項預測方法有機融合,進一步提高了組合預測模型的整體預測性能,使基于EEMD-IABC的pH值組合預測方法能夠較好地描述南美白對蝦工廠化養(yǎng)殖pH的不同波動頻率的本征模態(tài)分量和剩余分量之間復雜的非線性關(guān)系,且預測曲線與實測值擬合效果明顯高于GA-LSSVR和SA-BPNN模型的擬合結(jié)果,預測結(jié)果符合實際情況。3)對于所有模型性能評價指標,本文提出的EEMD-IABC組合模型都遠遠優(yōu)于GA-LSSVR和SA-BPNN的單項預測模型,具有更高的預測精度;4)驗證了將多尺度特征提取方法與組合預測方法相結(jié)合的組合模型對復雜非線性的時序數(shù)據(jù)預測的有效性,為南美白對蝦工廠化養(yǎng)殖水質(zhì)科學化調(diào)控管理提供決策依據(jù)。
1)為提高工廠化養(yǎng)殖水體pH值預測精度,科學化調(diào)控養(yǎng)殖水質(zhì),降低pH值急劇變化對南美白對蝦的脅迫危害。本文采用集合經(jīng)驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)和改進人工蜂群算法(improve artificial bee colony,IABC),構(gòu)建了基于EEMD-IABC的南美白對蝦工廠化養(yǎng)殖pH值組合預測模型,并對廣東省湛江市南美白對蝦工廠化養(yǎng)殖某池塘pH值進行預測。結(jié)果表明,該組合預測模型能自動獲取最佳的組合模型權(quán)重系數(shù),并將優(yōu)勢互補的各單項預測方法有機融合,提高了組合模型的整體預測性能,取得較好的預測效果,可直接應用于實際的南美白對蝦工廠化養(yǎng)殖pH值預測工作中。
2)采用集合經(jīng)驗模態(tài)分解(EEMD)對復雜非線性和非平穩(wěn)性的養(yǎng)殖pH值時序數(shù)據(jù)進行多尺度分解,降低了不同趨勢信息之間的互相干擾和非平穩(wěn)性,有利于深入挖掘pH值時序數(shù)據(jù)的物理特征和結(jié)構(gòu)信息,提高組合預測性能。
3)將改進人工蜂群算法應用到組合預測模型中,合理解決了組合預測建模過程中組合權(quán)重系數(shù)優(yōu)化選擇問題,克服了組合權(quán)重確定過程中人為因素的影響,試驗結(jié)果表明,改進人工蜂群算法具有較好的組合權(quán)重自適應尋優(yōu)能力,是一種有效的組合模型權(quán)重優(yōu)化算法。
4)在相同試驗環(huán)境條件下,基于EEMD-IABC的南美白對蝦工廠養(yǎng)殖pH值組合預測模型各項精度評價指標遠遠優(yōu)于SA-BPNN,略高于GA-LSSVR模型。從整體上看,本文所提出基于EEMD-IABC的組合預測模型均優(yōu)于SA-BPNN和GA-LSSVR單項預測模型,具有預測精度高、魯棒性強,能更好地擬合南美白對蝦工廠化養(yǎng)殖pH值各分量之間的非線性關(guān)系。
對蝦成長過程中,其養(yǎng)殖水環(huán)境復雜,本文選擇對蝦養(yǎng)殖后期pH值為研究對象,旨在探索一種復雜環(huán)境下pH值預測模型,結(jié)果表明本文選擇的預測方法在較復雜的環(huán)境下能夠滿足水質(zhì)管理需要,那么在其他條件也具有實用性,可為南美白對蝦工廠化養(yǎng)殖水質(zhì)調(diào)控管理、養(yǎng)殖規(guī)劃提供參考依據(jù)。
[參考文獻]
[1] 劉鷹,劉寶良. 我國海水工業(yè)化養(yǎng)殖面臨的機遇和挑戰(zhàn)[J].漁業(yè)現(xiàn)代化,2012,39(6):1-4. Liu Ying, Liu Baoliang. Opportunities and challenges for marine industrialized aquaculture in China[J]. Fishery Modernization, 2012, 39(6): 1-4. (in Chinese with English abstract)
[2] 祁真. 對蝦生態(tài)工程化養(yǎng)殖系統(tǒng)水環(huán)境變化及影響因子研究[D]. 杭州:浙江大學,2004. Qi Zhen. Study on Water Environment Variation and Influencing Factor of Shrimp Ecological Engineering Cultivation System[D]. Hangzhou: Zhejiang University, 2004. (in Chinese with English abstract)
[3] 馬真. 凡納濱對蝦集約化養(yǎng)殖水質(zhì)預警模型的研究[D].青島:中國海洋大學,2010. Ma Zhen. Study on Pre-alarming Water Quality System for Intensively Cultured Litopenaeus vannamei[D]. Qingdao: Ocean University of China, 2010. (in Chinese with English abstract)
[4] 姜微,羅曉虹,姜林,等. IEA-PPR用于降水的pH值預測模型構(gòu)建[J].化學研究與應用,2005,17(4):545-547. Jiang Wei, Luo Xiaohong, Jiang Lin. Application of IEA-PPR to the prediction of pH value in precipitation[J]. Chemical Research and Application, 2005, 17(4): 545-547. (in Chinese with English abstract)
[5] Chung C C, Chen H H, Ting C H. Grey prediction fuzzy control for pH processes in the food industry[J]. Journal of Food Engineering, 2010, 96: 575-582.
[6] 尹玉. 基于BP神經(jīng)網(wǎng)絡的脫硫系統(tǒng)pH值預測[D]. 北京:華北電力大學,2013. Yin Yu. The Prediction of PH Value in Desulfurization System Based on BP Neural Network[D]. Beijing:North China Electric Power University, 2013. (in Chinese with English abstract)
[7] 尤麗華,吳靜靜,王瑤,等. 基于模擬退火優(yōu)化BP神經(jīng)網(wǎng)絡的pH值預測[J]. 傳感技術(shù)學報,2014,27(12):1643-1648. You Lihua, Wu Jingjing, Wang Yao, et al. Optimized BP neural network based on simulated annealing algorithm for pH value prediction[J]. Chinese Journal of Sensors and Actuators, 2014, 27(12): 1643-1648. (in Chinese with English abstract)
[8] 唐朝暉,劉金平,陳青,等. 基于預測模型的浮選過程pH值控制[J].控制理論與應用,2013,30(7):865-890. Tang Zhaohui, Liu Jinping, Chen Qing, et al. pH control in flotation process based on prediction model[J]. Control Theory & Applications, 2013, 30(7): 865-890. (in Chinese with English abstract)
[9] 周秀平,王文圣,曾懷金. 偏最小二乘與人工神經(jīng)網(wǎng)絡耦合模型在酸雨pH值預測中的應用[J]. 水利水電科技進展,2006,26(4):50-52. Zhou Xiuping, Wang Wensheng, Zeng Huaijin. Partial least square method and BP neural network coupled model and its application to prediction of pH value of acid rains[J]. Advances in Science and Technology of Water Resources, 2006, 26(4): 50-52. (in Chinese with English abstract)
[10] 印家健,姜微,戴松林,等. 降水pH值的支持向量回歸預測模型構(gòu)建[J]. 環(huán)境化學,2006,25(2):211-214. Yin Jiajian, Jiang Wei, Dai Songlin, et al. Application of support vector regression to the prediction of pH value in prediction[J]. Environmental Chemistry, 2006, 25(2): 211-214. (in Chinese with English abstract)
[11] Mohammad G, Matheus P F, Wu C H, et al. pKa modeling and prediction of a series of pH indicators through genetic algorithm-least square support vector regression[J]. Chemometrics and Intelligent Laboratory Systems, 2010, 101: 102-109.
[12] 劉雙印,徐龍琴,李振波,等. 基于PCA-MCAFA-LSSVM的養(yǎng)殖水質(zhì)pH值預測模型[J]. 農(nóng)業(yè)機械學報,2014,45(5):239-246. Liu Shuangyin, Xu Longqin, Li Zhenbo, et al. Forecasting model for pH value of aquaculture water quality based on PCA-MCAFA-LSSVM[J]. Transactions of the Chinese Society for Agricultural Machinery, 2014, 45(5): 239-246. (in Chinese with English abstract)
[13] 任世錦,呂俊懷,王小林. 基于自適應最小二乘支持向量機的預測函數(shù)控制[J]. 江南大學學報:自然科學版,2009,8(6):699-702.Ren Shijin, Lü Junhuai, Wang Xiaolin. Adaptive Least Square Support Vector Machines-Based Predictive Functional Control[J]. Journal of Jiangnan University: Natural Science Edition, 2009, 8(6): 699-702. (in Chinese with English abstract)
[14] Bates J M, Granger C W J. Combination of forecasts[J] Operations Research Quarterly, 1969, 20(4): 451-468.
[15] 陳華友. 組合預測方法有效性理論及其應用[M]. 北京:科學出版社,2008.
[16] Cheng H, Shui K W. Is there an optimal forecast combination?[J]. Journal of Econometrics, 2014, 178(2): 294-309.
[17] Wu J L, Wang Y C. Fundamentals, forecast combinations and nominal exchange-rate predictability[J]. International Review of Economics & Finance, 2013, 25: 129-145.
[18] Rodrigues B D, Stevenson M J. Takeover prediction using forecast combinations[J]. International Journal of Forecasting, 2013, 29(4): 628-641.
[19] Lau H C W, Ho G T S, Zhao Y. A demand forecast model using a combination of surrogate data analysis and optimal neural network approach[J]. Decision Support Systems, 2013, 54(3): 1404-1416.
[20] 呂孫云,許銀山,熊瑩,等. 組合預測方法在需水預測中的應用[J]. 武漢大學學報:工學版,2011,44(5):565-570. Lu Sunyun, Xu Yinshan, Xiong Ying, et al. Combined forecasting method for forecasting water demand[J]. Engineering Journal of Wuhan University, 2011, 44(5): 565-570. (in Chinese with English abstract)
[21] 劉輝,龐佑霞,唐勇,等. 基于灰色蟻群組合預測的生物質(zhì)氣化爐雙閉環(huán)控制[J]. 農(nóng)業(yè)機械學報,2012,43(1):94-100. Liu Hui, Pang Youxia, Tangy Yon, et al. Double-loop intelligent control based on gray ant combination prediction algorithm for biomass gasifies[J]. Transactions of the Chinese Society for Agricultural Machinery, 2012, 43(1): 94-100. (in Chinese with English abstract)
[22] 劉東君,鄒志紅. 最優(yōu)加權(quán)組合預測法在水質(zhì)預測中的應用研究[J]. 環(huán)境科學學報,2012,32(12):3128-3132. Liu Dongjun, Zou Zhihon. Application of weighted combination model on forecasting water quality[J]. Acta Scientiae Circumstantiae, 2012, 32(12):3128-3132. (in Chinese with English abstract)
[23] Chen H Y, Zhou L G. An approach to group decision making with interval fuzzy preference relations based on induced generalized continuous ordered weighted averaging operator[J]. Expert Systems with Applications, 2011, 38(10): 13432-13440.
[24] 陳述,邵東國,李浩鑫,等. 基于粒子群人工蜂群算法的灌區(qū)渠-塘-田優(yōu)化調(diào)配藕合模型[J]. 農(nóng)業(yè)工程學報,2014,30(20):90-97. Chen Shu, Shao Dongguo, Li Haoxin, et al. Coupled allocation model for optimizing water in canal-pond-field based on artificial bee colony and particle swarm algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(20): 90-97. (in Chinese with English abstract)
[25] 趙學華,李道亮,楊文柱,等. 基于改進蟻群算法的棉花異性纖維目標特征選擇方法[J]. 農(nóng)業(yè)機械學報,2011,42(4):168-173. Zhao Xuehua, Li Daoliang, Yang Wenzhu, et al. Feature selection for cotton foreign fiber objects based on improved ant colony algorithm[J]. Transactions of the Chinese Society for Agricultural Machinery, 2011, 42(4): 168-173. (in Chinese with English abstract)
[26] 袁堯,劉超. 基于蟻群算法的泵站運行優(yōu)化及投影尋蹤選優(yōu)策略[J]. 農(nóng)業(yè)機械學報,2011,44(3):38-44. Yuan Yao, Liu Chao. Pump operation optimization and projection pursuit evaluation strategy based on ant colony optimization[J]. Transactions of the Chinese Society for Agricultural Machinery, 2011, 44(3): 38-44. (in Chinese with English abstract)
[27] 劉星寶,殷建平,胡春華,等. 解決動態(tài)多中心問題的自學習差異進化算法[J]. 通信學報,2015,36(7):166-175. Liu Xingbao, Yin Jianping, Hu Chunhua, et al. Self-learning differential evolution algorithm for dynamic polycentric problems[J]. Journal on communications, 2015, 36(7): 166-175. (in Chinese with English abstract)
[28] Morteza S, Zahra R, Behrooz R. A novel model predictive control scheme based on bees algorithm in a class of nonlinear systems: Application to a three tank system[J]. Neurocomputing, 2015, 152: 294-304.
[29] Karaboga D. An Idea Based on Honey Bee Swarm for Numerical Optimization[R]. Technical Reporttr06, Erciyes University, Engineering Faculty, Computer Engineering Department, 2005.
[30] 高明松,李素明,周衛(wèi)東. 應用人工蜂群算法辨識潛器參數(shù)[J]. 哈爾濱工程大學學報,2013,34(8):1023-1027. Gao Mingsong, Li Suming, Zhou Weidong. Identification on hydrodynamic coefficients of underwater vehicle with the ABC algorithm[J]. Journal of Harbin Engineering University, 2013, 34(8): 1023-1027. (in Chinese with English abstract)
[31] 吳一全,殷駿,戴一冕. 基于人工蜂群優(yōu)化的NSCT域圖像模糊集增強方法[J]. 華南理工大學學報:自然科學版,2015,43(1):59-65. Yin Yiquan, Yin Jung, Dai Yimian. Image enhancement in NSCT domain based on fuzzy sets and artificial bee colony optimization[J]. Journal of South China University of Technology: Natural Science Edition, 2015, 43(1):59-65. (in Chinese with English abstract)
[32] 陳強,金小明,姚建剛,等. 基于改進ABC算法的中長期電力負荷組合預測[J]. 電力系統(tǒng)保護與控制,2014,42(23):113-117. Chen Qiang, Jin Xiaoming, Yao Jiangang, et al. Improved artificial bee colony algorithm applied to medium and long-term load combination forecasting[J]. Power System Protection and Control, 2014, 42(23): 113-117. (in Chinese with English abstract)
[33] Fei S W, He Y. Wind speed prediction using the hybrid model of wavelet decomposition and artificial bee colony algorithm-based relevance vector machine[J]. International Journal of Electrical Power & Energy Systems, 2015, 73: 625-631.
[34] Mustaffa Z, Yusof Y, Kamaruddin S S. Enhanced artificial bee colony for training least squares support vector machines in commodity price forecasting[J]. Journal of Computational Science, 2014, 5(2): 196-205.
[35] Fei S W. Kurtosis forecasting of bearing vibration signal based on the hybrid model of empirical mode decomposition and RVM with artificial bee colony algorithm[J]. Expert Systems with Applications, 2015, 42(11): 5011-5018.
[36] Huang N E, Shen Z, Long S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings of the Royal Society of London A, 1998, 454: 903-995.
[37] Wu Z H, Huang N E. Ensemble empirical mode decomposition: a noise-assisted data analysis method[J]. Advances in Adaptive Data Analysis, 2009, 1(1): 1-41.
[38] 王志堅,韓振南,劉邱祖,等. 基于MED-EEMD的滾動軸承微弱故障特征提取[J]. 農(nóng)業(yè)工程學報,2014,30(23):70-78. Wang Zhijian, Han Zhennan, Liu Qiuzu, et al. Weak fault diagnosis for rolling element bearing based on MED-EEMD[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(23): 70-78. (in Chinese with English abstract)
[39] Liu S Y, Xu L Q, Li D L, et al. Prediction of dissolved oxygen content in river crab culture based on least squares support vector regression optimized by improved particle swarm optimization[J]. Computers and Electronics in Agriculture, 2013, 95: 82-91.
[40] Rakshit P, Konar A. Differential evolution for noisy multiobjective optimization[J]. Artificial Intelligence, 2015, 227: 165-189.
[41] 劉雙印,徐龍琴,李道亮,等. 基于蟻群優(yōu)化最小二乘支持向量回歸機的河蟹養(yǎng)殖溶解氧預測模型[J]. 農(nóng)業(yè)工程學報,2012,28(23):167-175. Liu Shuangyin, Xu Longqin, Li Daoliang, et al. Dissolved least squares support vector regression optimized by ant oxygen prediction model of eriocheir sinensis culture based on colony algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(23): 167-175. (in Chinese with English abstract)
Prediction of pH value in industrialized aquaculture based on ensemble empirical mode decomposition and improved artificial bee colony algorithm
Xu Longqin1, Li Qianchuan2, Liu Shuangyin1※, Li Daoliang3
(1. College of Information, Guangdong Ocean University, Zhanjiang 524025, China; 2. College of Letters and Science, University of California, Los Angeles, 90024, USA; 3. Beijing ERC for Internet of Things in Agriculture, China Agricultural University, Beijing 100083, China)
Abstract:The pH value in industrialized cultivation ponds is crucial to the survival of Litopenaeus Vannamei. Grasping the trend of the pH value timely and accurately is the key for the high-density healthy Litopenaeus Vannamei culture. Therefore, in order to solve the low prediction accuracy of the single model in pH value prediction, this paper proposes a pH value combination forecasting model in Litopenaeus Vannamei industrialized cultivation based on ensemble empirical mode decomposition (EEMD) and improved artificial bee colony (IABC) algorithm. In the modeling process, the non-linear time sequences of the original pH value are de-noised and decomposed into a series of stable and uncoupling sequences by the EEMD. Based on the changed characteristics of each sequence, the appropriate forecasting method is selected and a new independent prediction model is established. The independent prediction values are reconstructed to obtain the ultimate prediction results. But whether the weight of the combined forecasting model is appropriate restricts the prediction accuracy and performance seriously. Therefore, we choose the IABC optimized method to seek the optimal weight of the combined forecasting model, which overcomes the blindness and the impact of human factors in parameter selection of the combined forecasting model in order to accelerate its convergence rate and forecast accuracy. The combinations of the best weights are obtained automatically after the optimization, and in the process the nonlinear combination prediction model of pH value in industrialized cultivation is constructed. With this model, the pH value change has been predicted for industrialized cultivation pond from September 8 to September 15 in 2014 in Zhanjiang City, Guangdong Province. The experimental results show that the proposed combination prediction model of EEMD-IABC has better prediction effect than the optimized back propagation neural network based on simulated annealing algorithm (SA-BPNN) and genetic algorithm-least square support vector regression (GA-LSSVR) method. And the relative mean absolute percent error (MAPE), root mean square error (RMSE), mean absolute error (MAE) and determination coefficient (R2) for the pH values between the EEMD-IABC and GA-LSSVR models are 14.6%, 28.6%, 27% and 1.1% respectively under the same experimental conditions. The relative MAPE, RMSE, MAE and R2for the pH values between the EEMD-IABC and SA-BPNN models are 56.8%, 61.4%, 62.8% and 6.16% respectively. It is obvious that the EEMD-IABC has high forecast accuracy and generalization ability. It can meet the actual demand for the pH value controlling in the Litopenaeus Vannamei industrialized cultivation and also provide a reference for water quality predictions in other fields.
Keywords:algorithms; pH; aquaculture; combination prediction; ensemble empirical mode decomposition; artificial bee colony; Litopenaeus Vannamei
通信作者:※劉雙印,男,山東單縣人,教授,博士,主要從事智能信息系統(tǒng)和農(nóng)業(yè)信息化技術(shù)研究,湛江廣東海洋大學信息學院,524025。
作者簡介:徐龍琴,女,陜西西鄉(xiāng)人,副教授,碩士,主要從事智能計算、智能信息系統(tǒng)、農(nóng)業(yè)信息化技術(shù)等研究,湛江廣東海洋大學信息學院,524025。Email:xlqlw@126.com
基金項目:國家自然科學基金項目(61471133,61473331);國家科技支撐計劃項目(2012BAD35B07);廣東省科技計劃項目(2013B090500127,2013B021600014,2015A070709015,2015A020209171);廣東海洋大學創(chuàng)新強校工程項目(GDOU2014050227)
收稿日期:2015-09-01
修訂日期:2015-12-20
中圖分類號:TP391
文獻標志碼:A
文章編號:1002-6819(2016)-03-0202-08
doi:10.11975/j.issn.1002-6819.2016.03.029 10.11975/j.issn.1002-6819.2016.03.029http://www.tcsae.org