金 武,何 奇,杜興偉,朱新艷,聞海波,馬學(xué)艷,何義進(jìn),邴旭文
(1中國水產(chǎn)科學(xué)研究院淡水漁業(yè)研究中心,江蘇無錫 214081;2常熟市水產(chǎn)技術(shù)推廣站,江蘇常熟 215500)
中國河蟹養(yǎng)殖主要集中在長江中下游、黃河口、遼河口等地區(qū),目前中國河蟹養(yǎng)殖總面積在4.67×104hm2左右,其中江蘇的養(yǎng)殖面積約2.47×104hm2[1]。由于養(yǎng)殖技術(shù)[2-4]和養(yǎng)殖模式[5-7]的不斷突破創(chuàng)新,在河蟹總產(chǎn)量穩(wěn)中有升的形勢下,河蟹的品質(zhì)不斷提高。近年來,全國河蟹總體產(chǎn)量平均在7×108kg左右,但由于受到氣候等因素的影響,各地河蟹產(chǎn)量常常有起伏波動[1]。
作為河蟹養(yǎng)殖主要方式之一的池塘生態(tài)系統(tǒng)是一個多因素耦合的復(fù)雜生態(tài)系統(tǒng),生態(tài)要素間的關(guān)系錯綜復(fù)雜表現(xiàn)出極大的隨機(jī)性、不確定性和非線性,這與湖泊生態(tài)系統(tǒng)的特點(diǎn)類似[8-9]。在這些生態(tài)要素中,氣象因子在其中起到了重要作用,特別是氣溫、光照、降水等與河蟹產(chǎn)量之間存在顯著的相關(guān)性[10-13]。BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Networks)是基于誤差反傳算法的多層前饋神經(jīng)網(wǎng)絡(luò),與傳統(tǒng)的線性回歸模型相比,具有自學(xué)習(xí)和自適應(yīng)、非線性、魯棒性和容錯性等特點(diǎn)[14],對于提高河蟹產(chǎn)區(qū)多個氣象因子與產(chǎn)量之間非線性數(shù)學(xué)模型的精確性有顯著優(yōu)勢。本研究利用2013—2017 年江蘇省河蟹主產(chǎn)區(qū)的氣象數(shù)據(jù)和產(chǎn)量數(shù)據(jù)建立數(shù)學(xué)模型并開展河蟹產(chǎn)量預(yù)測,以期為河蟹生產(chǎn)流通、制定江蘇省河蟹發(fā)展方向及極端氣象條件下的應(yīng)急處理提供參考。
氣象數(shù)據(jù)來自中國氣象數(shù)據(jù)網(wǎng)在河蟹主產(chǎn)區(qū)附近設(shè)立的7個觀測臺站,氣象數(shù)據(jù)包括極大風(fēng)速、最低氣壓、最低氣溫、最高氣壓、最高氣溫、8:00—20:00 時降水量、平均氣壓、平均2 min風(fēng)速、平均氣溫、平均水氣壓、平均相對濕度、平均最低氣溫、平均最高氣溫、日降水量≥0.1 mm 日數(shù)、月日照百分率、日照時數(shù)、最大風(fēng)速、最大日降水量18個氣象因子。江蘇省河蟹主產(chǎn)區(qū)產(chǎn)量數(shù)據(jù)(2013—2017 年)來自原江蘇省海洋與漁業(yè)局計劃財務(wù)處。
1.2.1 數(shù)據(jù)標(biāo)準(zhǔn)化 對原始數(shù)據(jù)做的標(biāo)準(zhǔn)化處理以消除各項(xiàng)指標(biāo)數(shù)據(jù)量綱和數(shù)量級對算法的影響,見公式(1)。
式中,Y表示得到的標(biāo)準(zhǔn)化矩陣,yij為標(biāo)準(zhǔn)化后的數(shù)值,xij為各項(xiàng)指標(biāo)的數(shù)值,各項(xiàng)指標(biāo)的均值與標(biāo)準(zhǔn)差分別表示為和sj。
1.2.2 PCA 主成分分析 通過主成分分析對數(shù)據(jù)進(jìn)行降維處理,將原始數(shù)據(jù)中線性相關(guān)的變量轉(zhuǎn)化為少數(shù)幾個線性不相關(guān)的主成份,使得處理之后的數(shù)據(jù)既能包含原始數(shù)據(jù)的絕大部分信息,又能降低維度,簡化算法。按照主成份的選定規(guī)則,通常情況下最終選定的主成份,其特征值大于1,并且累計貢獻(xiàn)率達(dá)在85%以上。
1.2.3 BP 神經(jīng)網(wǎng)絡(luò)分析 神經(jīng)網(wǎng)絡(luò)處理的都是非線性問題,為了達(dá)到BP神經(jīng)網(wǎng)絡(luò)處理非線性問題的效果,隱含層與輸出層還需要用到激活函數(shù)。為使神經(jīng)網(wǎng)絡(luò)在處理非線性數(shù)據(jù)時更能把握隱藏在數(shù)據(jù)中的抽象邏輯關(guān)系,激活函數(shù)一般選取非線性函數(shù),比較常用的有Sigmoid 函數(shù)、tan 函數(shù)等。本研究中采用Sigmoid 函數(shù)進(jìn)行神經(jīng)網(wǎng)絡(luò)分析,計算見公式(2)。
2013—2015 年的氣象數(shù)據(jù)和產(chǎn)量數(shù)據(jù)用于訓(xùn)練數(shù)據(jù),2016 年數(shù)據(jù)用于測試模型,2017 年數(shù)據(jù)用于檢驗(yàn)預(yù)測結(jié)果。該神經(jīng)網(wǎng)絡(luò)有1 個隱含層,神經(jīng)元個數(shù)為12個,輸出層為1個。對神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)設(shè)置并代入樣本進(jìn)行訓(xùn)練,并將訓(xùn)練好的神經(jīng)模型進(jìn)行數(shù)據(jù)計算與預(yù)測。
通過對標(biāo)準(zhǔn)化之后的極大風(fēng)速、最低氣壓等18個指標(biāo)數(shù)據(jù)和產(chǎn)量數(shù)據(jù)做主成分分析,取累計貢獻(xiàn)率達(dá)到85%的主成份。共選取5 個主成份,累計貢獻(xiàn)率為87.128%,分析結(jié)果顯著減少了原始數(shù)據(jù)之間的相關(guān)性,又充分概括了原始數(shù)據(jù)的主要特性。
2.2.1 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果BP神經(jīng)網(wǎng)絡(luò)的性能圖如圖1,隨著神經(jīng)網(wǎng)絡(luò)迭代次數(shù)的增加,均方誤差在逐漸減小,最終均方誤差穩(wěn)定在0.0248左右,得到了一個穩(wěn)定的BP神經(jīng)網(wǎng)絡(luò)。
圖1 BP神經(jīng)網(wǎng)絡(luò)的性能圖
從圖2可以看出,第7~21個數(shù)據(jù)之間的曲線貼合得比較緊密,說明神經(jīng)網(wǎng)絡(luò)對這部分?jǐn)?shù)據(jù)之間的關(guān)系,擬合得比較準(zhǔn)確,而其他數(shù)據(jù)之間的曲線貼合得不是很緊密,說明神經(jīng)網(wǎng)絡(luò)對其余數(shù)據(jù)之間的關(guān)系擬合還有一定誤差。
圖2 訓(xùn)練數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)預(yù)測效果對比
2.2.2 BP 神經(jīng)網(wǎng)絡(luò) 從圖3 可以看出,第5~8 組之間的曲線,貼合的較為緊密,有一致地增減關(guān)系,而兩邊的數(shù)據(jù),曲線貼合得不夠緊密,有一定的誤差,這一特點(diǎn)和訓(xùn)練數(shù)據(jù)曲線相一致,均是中間數(shù)據(jù)擬合預(yù)測較為準(zhǔn)確,兩側(cè)數(shù)據(jù)具有相對大些的誤差。
圖3 測試數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)預(yù)測效果對比
從圖4 以看出,在訓(xùn)練數(shù)據(jù)中,數(shù)據(jù)落在y=x這條線兩側(cè)。結(jié)果說明大部分?jǐn)?shù)據(jù)距離這條回歸線較近,個別數(shù)據(jù)距離回歸線較遠(yuǎn),相關(guān)系數(shù)為0.82267,說明BP神經(jīng)網(wǎng)絡(luò)學(xué)到了大部分?jǐn)?shù)據(jù)的特點(diǎn),能在一定誤差上模擬氣象因子數(shù)據(jù)與產(chǎn)量之間的關(guān)系。
圖4 神經(jīng)網(wǎng)絡(luò)輸出數(shù)據(jù)與實(shí)際值回歸圖
氣象因子與河蟹產(chǎn)量的關(guān)系主要表現(xiàn)在對河蟹生長、成活率[15]的影響,起主要作用的因子包括:降水、溫度、日照、蒸發(fā)、風(fēng)速、氣壓、生長期高溫天數(shù)、自然生長期間積溫、生長關(guān)鍵期降水[10-11,13,15-17]。高溫(>35℃)天數(shù)、自然生長期間積溫和關(guān)鍵期降水的年際變化分別與河蟹個體品質(zhì)、成熟期、河蟹產(chǎn)量的波動密切相關(guān)[13]。水溫升至15℃時,攝食開始增加。20~26℃時攝食最旺盛[18]。氣溫達(dá)到35℃時,河蟹基本進(jìn)入休眠狀態(tài),攝食停止,持續(xù)高溫3~4 天,河蟹出現(xiàn)死亡。自然生長期積溫和氣溫顯著相關(guān),氣溫高的年份一般對應(yīng)成熟期較早的年份,生長期積溫低的年份一般對應(yīng)成熟期較晚的年份。過于集中的降水容易造成湖水上漲,河蟹逃逸,且持續(xù)降水期間的陰雨寡照易引發(fā)河蟹病害,甚至死亡,從而直接影響收獲量[13,19]。
河蟹養(yǎng)殖過程中,水草可為中華絨螯蟹提供天然餌料、凈化水質(zhì)、增加溶氧,并營造良好的生態(tài)環(huán)境,同時也可起到夏季降溫遮光的作用,是提高中華絨螯蟹品質(zhì)和產(chǎn)量的重要因子[20]。在水草的培育和生長過程中,日照起決定性作用[18]。
BP 神經(jīng)網(wǎng)絡(luò)在水產(chǎn)中的應(yīng)用目前多集中在工廠化養(yǎng)殖系統(tǒng)水質(zhì)指標(biāo)方面,包括溶氧[21]、溫度[22]、pH[23]、氨氮[24]等,在宏觀尺度利用氣象數(shù)據(jù)預(yù)測池塘河蟹產(chǎn)量的報道仍較少。采用逐步回歸法也可以進(jìn)行河蟹產(chǎn)量的預(yù)測,但僅能包括2~3個氣象因,因此模型的預(yù)測準(zhǔn)確性仍較低[15]。養(yǎng)成后期平均氣溫(影響池塘水溫)及同期雨量這2 個因子也可用于河蟹氣象產(chǎn)量預(yù)報[15,25-26]。以生長期高溫天數(shù)、自然生長期間積溫、生長關(guān)鍵期降水3個因子對江西軍山湖區(qū)河蟹產(chǎn)量進(jìn)行擬合也取得了不錯的效果[13]。但與中華絨螯蟹生長相關(guān)的氣象因素遠(yuǎn)遠(yuǎn)不止溫度[27]、日照和降水,氣壓、風(fēng)4項(xiàng)[10],氣壓的高低和風(fēng)的大小都會改變水體中的溶解氧含量等[28],而溶解氧含量又是影響水產(chǎn)動物生長的一個重要因素[29]。各氣象因素之間是相互依存的,存在復(fù)雜的非線性關(guān)系,因此單純用2~3 個因子來預(yù)測河蟹產(chǎn)量很難達(dá)到對生產(chǎn)過程中的所有氣象信息準(zhǔn)確描述并提高模型預(yù)測準(zhǔn)確性的目的。本研究中對氣象觀測站采集的絕大多數(shù)因子和光照因子與河蟹主產(chǎn)區(qū)產(chǎn)量進(jìn)行了建模,盡最大可能反應(yīng)河蟹養(yǎng)殖環(huán)境系統(tǒng)的復(fù)雜性。今后仍可以繼續(xù)積累氣象、產(chǎn)量、水環(huán)境等方面的數(shù)據(jù),改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法等角度進(jìn)一步提高模型的精度。
本研究中BP 神經(jīng)網(wǎng)絡(luò)在訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)分析中表現(xiàn)出相似的規(guī)律,BP神經(jīng)網(wǎng)絡(luò)對兩側(cè)的部分?jǐn)?shù)據(jù)的擬合存在一定的誤差。BP 神經(jīng)網(wǎng)絡(luò)能夠?qū)W到了大部分?jǐn)?shù)據(jù)的特點(diǎn),神經(jīng)網(wǎng)絡(luò)輸出值和真實(shí)值之間的相關(guān)系數(shù)R=0.82267。對河蟹主產(chǎn)區(qū)的氣象因子、光照數(shù)據(jù)利用該神經(jīng)網(wǎng)絡(luò)能夠較準(zhǔn)確地預(yù)測江蘇省河蟹主產(chǎn)區(qū)的產(chǎn)量。