吳 斌 王偉萍 王慶萍 陶毅力 王海華
(江西省水產(chǎn)科學(xué)研究所 江西南昌 330039)
長江江豚(Neophocaena asiaeorientalis)是江豚的3 個亞種之一,也是最瀕危的一個亞種,僅生活在長江中下游和大型通江湖泊鄱陽湖和洞庭湖中?;诮喾N群基因組學(xué)最新研究結(jié)果顯示,極度瀕危的長江江豚種群應(yīng)被作為一個獨立的物種[1]。長江江豚不僅是全世界唯一一種生存于淡水環(huán)境的鼠海豚科動物,也是長江流域極可能唯一現(xiàn)存的的水生哺乳動物(2007年白鱀豚功能性滅絕)。自20世紀90年代以來,長江江豚的數(shù)量呈現(xiàn)出持續(xù)性的衰減趨勢[2-5],2018年7月正式發(fā)布的《2017 長江江豚生態(tài)科學(xué)考察報告》是目前最新的長江江豚科考成果。江豚種群數(shù)量大幅下降的趨勢得到遏制,估算長江江豚數(shù)量約為1 012 頭,考慮其嚴峻的受威脅程度,長江江豚已被按照國家一級保護動物進行保護[6]。2018年,中國科學(xué)院深海所海洋哺乳動物研究團隊對長江江豚進行了全基因組測序,組裝得到了2.22 Gb的基因組草圖,為江豚基因組的研究奠定了基礎(chǔ)[7]。本研究通過查閱微信公眾號“水野保護者”發(fā)布的全長江流域已登記死亡長江江豚統(tǒng)計數(shù)據(jù),分析其年際周期性變動規(guī)律,以期為長江江豚精準保護提供基礎(chǔ)數(shù)據(jù)支撐。
1.1 數(shù)據(jù)來源與指標(biāo)選取 研究所用數(shù)據(jù)來源于微信公眾號“水野保護者”發(fā)布的統(tǒng)計數(shù)據(jù)。2008—2018年,全長江流域已登記死亡長江江豚數(shù)量為329 頭,年均死亡數(shù)量為29.9 頭。每年3、4、10、11月是長江江豚的生產(chǎn)、哺乳的高峰期,而這一時間段同樣也是死亡的高峰期?;疑A(yù)測模型的原理是離散累加求導(dǎo)[8],在數(shù)據(jù)量較少時進行中、短期預(yù)測精度更高,因此,本研究中灰色預(yù)測部分選用聚類分群數(shù)據(jù)及連續(xù)5年的數(shù)據(jù)對未來1年的數(shù)據(jù)進行預(yù)測,并通過歷史數(shù)據(jù)評估模型的有效性及2 種數(shù)據(jù)選取的相對誤差大小,同時采用近5年的數(shù)據(jù)對2019—2020年,全長江流域已登記死亡長江江豚數(shù)量進行預(yù)測。
1.2 模型選取 考慮到影響長江江豚死亡的因子多而復(fù)雜,且全長江流域死亡長江江豚數(shù)量相對較少,是灰色系統(tǒng)理論中典型的灰因白果律事件,因此本研究采用灰色模型GM(1,1)對全長江流域死亡長江江豚進行短期預(yù)測。GM(1,1)是我國學(xué)者鄧聚龍首次提出的,指的是以灰色系統(tǒng)理論為基礎(chǔ)建立(行為)時軸上現(xiàn)在與未來的定量關(guān)系從而預(yù)測事物的發(fā)展,以微分擬合法建立模型,將離散數(shù)據(jù)視為連續(xù)變量在其變化過程中所取的離散值,從而利用微分方程處理數(shù)據(jù),具有少數(shù)據(jù)預(yù)測、允許對灰因果律事件進行預(yù)測和可檢驗性的特點[8-9]。
2.1 全長江流域已登記死亡長江江豚數(shù)量 Kmean 是聚類算法的一種,其目的是找到樣本數(shù)據(jù)潛在的類別。該方法的基本思想是:首先,隨機選取k個聚類中心,并計算各個樣本點與k個聚類中心的距離,確定各樣本的分群c;然后,根據(jù)類書并計算新的聚類中心,重復(fù)前一步驟直至收斂為止,并最終確定各樣本的類別。將2008—2018年全長江流域已登記死亡長江江豚數(shù)量(表1),通過聚類分析,不難發(fā)現(xiàn),可分成2 類,聚類中心之間絕對差值大致為40(表2)。
表1 2008—2018年全長江流域已登記死亡長江江豚數(shù)量(單位:頭)
表2 全長江流域已登記死亡長江江豚數(shù)量(頭)聚類分析(二類)結(jié)果
2.2 全長江流域已登記死亡長江江豚數(shù)量2008—2018年全長江流域已登記死亡長江江豚數(shù)量(頭)結(jié)果,分群類別為1 和2,樣本個數(shù)分別為2 個和9 個,因此推測,長江江豚死亡數(shù)量存在“峰谷”的年際周期性變動,為此,選取其中4 個時間段進行預(yù)測,分別代表谷+谷+谷+谷+峰、谷+谷+峰+谷+谷、峰+谷+谷+谷+谷、谷+谷+谷+谷+谷 即2008—2012年、2010—2014年、2012—2016年、2013—2017年4 組數(shù)據(jù),分別預(yù)測2013年、2015年、2017年、2018年;同時,用前10年 數(shù)據(jù)進行2018年(高峰年)灰色預(yù)測(表3)。
表3 全長江流域死亡長江江豚數(shù)量灰色預(yù)測結(jié)果
聚類分析被用作描述數(shù)據(jù),衡量不同數(shù)據(jù)源間的相似性,以及將數(shù)據(jù)源分類到不同的簇中。本研究對2008—2018年全長江流域已登記死亡長江江豚數(shù)量數(shù)據(jù)進行聚類分析,發(fā)現(xiàn)全長江流域已登記死亡長江江豚數(shù)量存在“峰谷”的年際周期性變動,即2012年和2018年為長江江豚死亡高峰年,因此,聚類分析是探討長江江豚死亡年際周期性變動,研判未來發(fā)展趨勢的可靠方法。本研究揭示:全長江流域死亡長江江豚數(shù)量可能存在以6年為一個周期的變動規(guī)律。已有文獻表明,長江江豚與魚群分布有顯著相關(guān)性,長江江豚可能具有隨魚群遷徙的行為特征。而魚類的生命周期一般在3~4年,中華鱘等物種則要17 或18年。因此推測,餌料魚類等生境因子的規(guī)律性波動可能導(dǎo)致死亡長江江豚數(shù)量年際周期性變動。
灰色理論認為數(shù)據(jù)是復(fù)雜的,但是有序且有整體功能的。同時,灰色理論建立的是生成數(shù)據(jù)模型,不是原始數(shù)據(jù)模型,因此,灰色預(yù)測的數(shù)據(jù)是通過生成數(shù)據(jù)的GM(1,1)模型所得到的預(yù)測值的逆處理結(jié)果。本研究結(jié)合聚類分析,對全長江流域死亡長江江豚數(shù)量灰色預(yù)測相對誤差進行了理論探討,不難發(fā)現(xiàn),全長江流域死亡長江江豚數(shù)量“高峰年”作為灰色預(yù)測原始數(shù)據(jù)起始年份或末端年份,無法進行有效預(yù)測或效果相對較差,而全長江流域死亡長江江豚數(shù)量“高峰年”作為灰色預(yù)測原始數(shù)據(jù)中間年份,則預(yù)測效果相對較理想,但也存在10%左右的誤差。該結(jié)果提示,影響全長江流域死亡長江江豚數(shù)量變動的原因多樣且相對較復(fù)雜,亟需全面準確長期系統(tǒng)收集相關(guān)資料。本研究以期為長江江豚精準保護提供基礎(chǔ)數(shù)據(jù)支撐。在聚類分析的基礎(chǔ)上,灰色預(yù)測模型可相對較好地對全長江流域死亡長江江豚數(shù)量進行預(yù)測,但對于其年際周期性變動的判斷是重要基礎(chǔ),對于“高峰年”處于起始年份或末端年份的預(yù)測需采取審慎的態(tài)度。