孫霄,張云雷,劉笑笑,程遠(yuǎn),紀(jì)毓鵬,4,任一平,2,4,薛瑩,4*
( 1. 中國海洋大學(xué) 水產(chǎn)學(xué)院,山東 青島 266003;2. 青島海洋科學(xué)與技術(shù)試點國家實驗室 海洋漁業(yè)科學(xué)與食物產(chǎn)出過程功能實驗室,山東 青島 266237;3. 近海(大連)生態(tài)發(fā)展有限公司,遼寧 大連 116023;4. 海州灣漁業(yè)生態(tài)系統(tǒng)教育部野外科學(xué)觀測研究站,山東 青島 266003)
短吻紅舌鰨(Cynoglossus joyneri)屬于鰈形目(Pleuronectiformes)、舌鰨科(Cynoglossidae)、舌鰨屬(Cynoglossus),又稱焦氏舌鰨、駒舌、喬氏龍舌魚等,是亞熱帶及暖溫帶淺海底層魚類,廣泛分布于黃海、渤海、東海和南海(南至珠江口附近),日本及朝鮮近海也有分布[1]。近年來由于過度捕撈等因素的影響,導(dǎo)致一些重要經(jīng)濟(jì)漁業(yè)資源衰退[2],短吻紅舌鰨成為目前海州灣的優(yōu)勢魚種之一,它既是魚類群落中的優(yōu)勢種[3-6],同時也是海州灣食物網(wǎng)中的關(guān)鍵種類[7]。
GAM模型(Generalized Additive Model, GAM)是研究生物資源量分布的常用方法之一,但是由于解釋變量之間常存在較高的相關(guān)性,因此會導(dǎo)致這些變量存在較高的多重共線性,從而降低GAM模型的預(yù)測性能[8]。主成分分析(Principal Component Analysis,PCA)利用降維的方法,將多個相關(guān)變量轉(zhuǎn)換成若干個主成分(Principal Component,PCs),并根據(jù)需要選擇若干主成分能反映大多數(shù)原始信息的統(tǒng)計方法[9]。因此,基于PCA分析得到的PCs,將其作為GAM模型的解釋變量,可以消除變量間的共線性,同時能夠均衡考慮到所有的重要環(huán)境變量。此外,以往的研究多側(cè)重于研究非生物環(huán)境因子對物種分布的影響,而忽視了生物因子的重要性。有研究表明,將餌料生物加入解釋變量中會提高GAM模型的預(yù)測能力[10]。然而,目前將餌料因子加入解釋變量,評估GAM模型預(yù)測性能的研究較少。
本研究基于2011年及2013-2018年春、秋季在海州灣及其鄰近海域的底拖網(wǎng)調(diào)查數(shù)據(jù),研究該海域短吻紅舌鰨的資源分布特征,并將時空、環(huán)境、餌料因子作為解釋變量,比較了兩種GAM模型(普通GAM模型和PCA-GAM模型)對其資源分布的預(yù)測效果,以期為今后開展?jié)O業(yè)生物空間分布的研究提供新的方法,也為海州灣短吻紅舌鰨的科學(xué)管理及資源養(yǎng)護(hù)提供基礎(chǔ)資料。
樣品采自2011年及2013-2018年春、秋季在海州灣及其鄰近海域進(jìn)行的底拖網(wǎng)調(diào)查,采用分層隨機(jī)取樣的方法設(shè)計調(diào)查站位,調(diào)查海域為34°20′~35°40′N,119°20′~121°10′E,根據(jù)水深、緯度等因素的差異將調(diào)查海域分為5個區(qū)域(圖1),每個航次隨機(jī)選取一定的站位進(jìn)行調(diào)查(每10′×10′的方格內(nèi)設(shè)置1個站位)。其中,2011年各航次分別選取24個調(diào)查站位,其他年份各航次分別選取18個調(diào)查站位。調(diào)查船為220 kW單拖漁船,拖速2~3 kn,拖曳時間約1 h,囊網(wǎng)網(wǎng)目為17 mm。在每個調(diào)查站位使用CTD同步測量底層溫度(Sea Bottom Temperature,SBT)、底層鹽度(Sea Bottom Salinity, SBS)、水深等環(huán)境數(shù)據(jù)。樣品的采集、處理和分析按照《海洋調(diào)查規(guī)范》進(jìn)行。在進(jìn)行數(shù)據(jù)分析前對調(diào)查數(shù)據(jù)進(jìn)行拖速2 kn,拖網(wǎng)時間1 h的標(biāo)準(zhǔn)化處理,采用單位面積內(nèi)的漁獲尾數(shù)(ind./km2)作為相對資源豐度。
GAM模型是廣義線性模型的半?yún)?shù)化擴(kuò)展形式,可同時針對不同的變量采取不同的策略建模,例如:可對部分預(yù)測因子進(jìn)行線性擬和,而對其他因子通過光滑函數(shù)進(jìn)行擬和,使得變量間的線性和非線性關(guān)系得以很好的展現(xiàn)[11]。普通GAM的構(gòu)建公式如下:
式中,g為關(guān)聯(lián)函數(shù),s為自然立方樣條平滑,?為誤差項,Y = ln(y+1),其中y為相對資源豐度,Lat為緯度,Lon為經(jīng)度,SBT為底層溫度,SBS為底層鹽度,depth為水深,Xi為餌料因子。根據(jù)短吻紅舌鰨攝食生態(tài)的研究結(jié)果[12-16],春季選擇戴氏赤蝦(Metapenaeopsis dalei)、葛氏長臂蝦(Palaemon graviera)和日本鼓蝦(Alpheus japonicus)3種優(yōu)勢餌料因子,秋季選擇葛氏長臂蝦和日本鼓蝦兩種優(yōu)勢餌料因子。
將原始解釋變量數(shù)據(jù)進(jìn)行PCA處理后得到主成分,并選取特征值大于1的主成分作為PCA-GAM模型的解釋變量,新變量間不存在相關(guān)性,PCA-GAM模型的構(gòu)建如下:
式中,PCi為選取的主成分。
圖1 海州灣及鄰近海域調(diào)查區(qū)域Fig.1 Survey areas in Haizhou Bay and adjacent waters
應(yīng)用方差膨脹因子(Variance Inflation Factor,VIF)篩選加入模型的解釋變量,一般認(rèn)為>2即存在多重共線性。利用逐步回歸法進(jìn)行因子篩選,最適模型評估利用赤池信息準(zhǔn)則(Akaike Information Criterion, AIC)、方差解釋率(Percentage of Variance Explained)、殘差偏差(Residual)等指標(biāo)[17]。AIC 的計算公式如下:
式中,K為模型中參數(shù)的數(shù)量;L為模型中極大似然函數(shù)值。
采用交叉驗證法對兩種GAM模型的預(yù)測性能進(jìn)行比較。即在總數(shù)據(jù)中隨機(jī)選取80%的數(shù)據(jù)作為訓(xùn)練集,剩余的20%做為驗證集,來驗證模型的預(yù)測效果,該過程重復(fù)100次。利用線性回歸分析法來描述使用訓(xùn)練集模型的觀測值(Oi)與預(yù)測值(Pi)之間的線性關(guān)系[18],回歸方程如下:
式中:Oi為實際觀測值;Pi為模型預(yù)測值;a為斜率,當(dāng)a越接近1 時,表明模型在預(yù)測中的系統(tǒng)偏差越小;b 為截距,當(dāng)b越接近0 時,表明預(yù)測值與觀測值有相似的空間特征[19];R2為決定系數(shù),當(dāng)R2越接近1時,表示回歸方程的擬合優(yōu)度越高。
此外還計算了觀測值與預(yù)測值之間的均方根誤差 (Root Mean Squared Error,RMSE)[17],該公式的表達(dá)形式如下:
基于2011年與2013-2017年數(shù)據(jù)建立模型,然后應(yīng)用該模型對2018年海州灣短吻紅舌鰨的相對資源密度進(jìn)行預(yù)測,利用Surfer軟件進(jìn)行繪圖,根據(jù)預(yù)測結(jié)果比較兩種GAM模型預(yù)測值與實際調(diào)查結(jié)果的吻合程度。
上述主成分析、模型的擬合預(yù)測及相關(guān)交叉驗證均由R3.2.5軟件完成,其中PCA利用psych包實現(xiàn),兩種GAM均由gam包構(gòu)建。
對海州灣春、秋兩季各解釋變量進(jìn)行皮爾遜相關(guān)性檢驗(表1,表2),可知春季溫度與鹽度和水深之間及秋季日本鼓蝦與葛氏長臂蝦之間都存在極顯著的相關(guān)性(p<0.01)。利用 VIF檢驗的結(jié)果均在 1~3之間(表3),即春、秋兩季所選解釋變量均可以加入模型。
PCA分析結(jié)果表明,海州灣春、秋兩季均保留前3個主成分,平均累計方差貢獻(xiàn)率分別為65%和67%;春季各主成分的方差貢獻(xiàn)率分別31%、19%和15%;秋季各主成分的方差貢獻(xiàn)率分別為29%、24%和14%。春季PC1中,經(jīng)度與水深存在很高的正載荷,而水溫有很高的負(fù)載荷;PC2中戴氏赤蝦與葛氏長臂蝦存在很高的正載荷;PC3中緯度有很高的正載荷,而經(jīng)度有很高的負(fù)載荷(表4)。
秋季,PC1中緯度、水深存在很高的負(fù)載荷,而葛氏長臂蝦及日本鼓蝦存在很高的正載荷;PC2中經(jīng)度與水深存在很高的正載荷,而水溫有較高的負(fù)載荷;PC3中鹽度存在很高的負(fù)載荷(表4)。
根據(jù)變量篩選結(jié)果,春季普通GAM最適模型為ln(y+1)=s(P. gravieri)+s(Lon)+s(Lat)+?,模型中葛氏長臂蝦的貢獻(xiàn)率最大為45.039%,其次是經(jīng)度和緯度,分別為10.155%和8.062%(表5)。春季PCA-GAM最適模型為 ln(y+1)=s(PC2)+?,模型中 PC2貢獻(xiàn)率為37.287%(表 5)。
表1 海州灣春季各解釋變量之間的皮爾遜相關(guān)性檢驗Table1 Pearson correlation test among the interpreted variables in the Haizhou Bay during spring
表2 海州灣秋季各解釋變量之間的皮爾遜相關(guān)性檢驗Table2 Pearson correlation test among the interpreted variables during autumn in the Haizhou Bay
表4 海州灣春季和秋季各解釋變量的主成分載荷Table4 Main component loads of various explanatory variables during spring and autumn in the Haizhou Bay
秋季普通GAM最適模型為ln(y+1)=s(Lat)+s(P.gravieri)+s(Lon)+s(SBS)+?,模型中緯度有最大的貢獻(xiàn)率,為35.034%,其次為經(jīng)度、鹽度和葛氏長臂蝦,分別為16.395%、15.170%和11.156%(表5)。PCA-GAM最適模型為ln(y+1)=s(PC1)+s(PC2)+s(PC3)+?,模型中PC1的貢獻(xiàn)率最高為39.252%,其次為PC2和PC3,分別為12.585% 和12.449%(表5)。
春、秋兩季普通GAM模型的最終累計解釋率分別為63.256%、77.755%;PCA-GAM模型的最終累計解釋率分別為37.287%、64.286%。
春季,短吻紅舌鰨相對資源量隨緯度的增加呈現(xiàn)先增加后降低的趨勢(圖2a);秋季,相對資源量的變化總體隨緯度的增加呈現(xiàn)下降趨勢(圖2A)。春季相對資源量隨經(jīng)度的變化趨勢與秋季相似,均隨經(jīng)度的增加先下降,到120.5°E后又繼續(xù)上升(圖2b, 圖2B)。
表5 海州灣春季和秋季兩種GAM模型擬合結(jié)果及各解釋變量的重要性Table5 The fitting results of two GAMs and the importance of each explanatory variable
底層鹽度是影響秋季短吻紅舌鰨相對資源量分布的重要因素,相對資源量隨鹽度的增加先下降后上升,在鹽度達(dá)到28之后,又急劇下降(圖2C)。
餌料因子中,葛氏長臂蝦餌料對春、秋季短吻紅舌鰨的相對資源量均有重要影響(圖2)。春季,短吻紅舌鰨的相對資源量隨葛氏長臂蝦生物量的增加先上升隨后又小幅下降,在生物量達(dá)到65 g/km2之后又繼續(xù)上升(圖2c)。秋季,其相對資源量隨葛氏長臂蝦的增加上升幅度較大,在生物量達(dá)到10 g/km2之后變化較平緩(圖2D)。
兩種GAM模型交叉驗證的結(jié)果表明,春季和秋季PCA-GAM模型的均方根誤差分別為2.214、2.216,小于普通GAM模型(2.401和3.171),其斜率及決定系數(shù)也都更接近1,截距更接近于 0(圖 3,表 6)。同時,春、秋季PCA-GAM模型交叉驗證的決定系數(shù)R2分別為0.521和0.634,高于普通GAM模型(0.451和0.549)。上述結(jié)果均表明,PCA-GAM模型比普通GAM模型具有更優(yōu)的擬合效果。
圖2 海州灣春季和秋季各影響因子與短吻紅舌鰨相對資源量之間的關(guān)系(a-c. 春季;A-D. 秋季)Fig.2 Effects of factors on C. joyneri relative abundance in regular GAM in Haizhou Bay (a-c. spring; A-D. autumn)
圖3 海州灣春季和秋季短吻紅舌鰨相對資源豐度預(yù)測值與觀測值的交叉驗證Fig.3 Cross validation between predicted and observed abundance of C. joyneri during spring and autumn in the Haizhou Bay
表6 海州灣春季和秋季兩種GAM模型交叉驗證結(jié)果Table6 Cross-validation results of two GAM models during spring and autumn in the Haizhou Bay
兩種GAM模型對2018年春季和秋季海州灣短吻紅舌鰨相對資源豐度的預(yù)測結(jié)果如圖4所示。秋季相對資源豐度整體高于春季,且春、秋兩季海州灣短吻紅舌鰨的分布都呈南高北低的趨勢,并與海州灣短吻紅舌鰨資源豐度的實際分布大致相符,而且春、秋兩季PCA-GAM模型預(yù)測的資源豐度與觀測值更加吻合(圖 4)。
圖4 2018年海州灣春、秋季基于普通GAM模型和PCA-GAM模型的短吻紅舌鰨相對資源豐度預(yù)測值與觀測值的疊加圖Fig.4 Overlapping maps of prediction and observations of relative abundance of C. joyneri in Haizhou Bay based on regular GAM model and PCA-GAM model during spring and autumn in 2018
本研究發(fā)現(xiàn)春、秋兩季海州灣短吻紅舌鰨資源的分布均呈南高北低、近岸淺水區(qū)大于深水區(qū)的特征,該分布特征與短吻紅舌鰨產(chǎn)卵洄游密切相關(guān)。短吻紅舌鰨每年1-3月份在深水區(qū)越冬,4-10月為繁殖產(chǎn)卵時間[20],春末夏初當(dāng)海水表層溫度水溫回升至20℃以上時,開始在近岸10 m以淺海域進(jìn)行產(chǎn)卵,生殖期其親魚適宜水溫為24.0~28.0℃,鹽度為24.0~29.0,魚卵與仔魚的適宜溫、鹽范圍分別為20~29℃和20.0~33.0[21-22]。本研究的調(diào)查數(shù)據(jù)顯示,海州灣春、秋季南部近岸水域表層溫度范圍分別為14.0~18.0℃和18.3~22.1℃,鹽度范圍分別為29.4~31.8和27.9~30.7,較高的水溫利于暖溫性魚類性腺和魚卵及仔魚的發(fā)育,縮短其發(fā)育周期,提高卵子孵化率及仔魚成活率。春季海州灣南部海域水溫回暖較北部早且持續(xù)時間長,近岸水域受地表徑流、降雨及水團(tuán)影響大,因此鹽度低于北部深水區(qū);此外,其餌料生物,如葛氏長臂蝦、日本鼓蝦和戴氏赤蝦,在近岸淺海水域均有大量分布[23-25],為產(chǎn)卵后的親魚提供充足的食物資源。因此,南部近岸水域的生境條件更適宜春季短吻紅舌鰨的繁殖。秋季短吻紅舌鰨的資源量分布總體也呈現(xiàn)南高北低的趨勢,但相較于春季來說,有向北移動的趨勢,一方面由于產(chǎn)卵后的親體陸續(xù)進(jìn)入產(chǎn)卵場附近的深水區(qū)索餌,另一方面短吻紅舌鰨的仔稚魚也有向近岸較深水域育幼場索餌洄游的特征[20]。綜上所述,海州灣短吻紅舌鰨產(chǎn)卵洄游的習(xí)性對其分布及集群影響較大。
本研究比較分析了兩種GAM模型在研究短吻紅舌鰨相對資源量與環(huán)境及餌料因子關(guān)系方面的效果。研究表明,PCA-GAM模型的表現(xiàn)要優(yōu)于普通GAM模型,說明PCA降低了解釋變量間的相關(guān)性,提高了模型的穩(wěn)定性和預(yù)測精度;另一方面,在PCA-GAM模型的解釋變量中均包含了具有高正載荷的生物因子主成分,表明餌料因子的加入可以提高模型的預(yù)測性能。另外,交叉驗證結(jié)果顯示,加入餌料因子的普通GAM模型預(yù)測效果優(yōu)于僅以環(huán)境因子作為變量的普通GAM模型[17],進(jìn)一步佐證了模型預(yù)測精度的提高與餌料因子的加入有關(guān)。
由于本研究的資源調(diào)查受一定的空間及采樣點的限制,模型中響應(yīng)變量和預(yù)測因子之間的關(guān)系及物種潛在分布估計可能受到影響[26-27]。普通GAM模型的擬合程度不高,反映出春季的某些重要因子沒有被選擇在原始解釋變量中,在今后研究中應(yīng)考慮更多與魚類資源分布關(guān)系密切的影響因子。
綜上所述,本研究比較了兩種GAM模型對海州灣短吻紅舌鰨資源分布的預(yù)測效果,當(dāng)解釋變量之間存在較高的相關(guān)性時,建議使用PCA-GAM模型對物種分布進(jìn)行預(yù)測,但在實際應(yīng)用中,還應(yīng)根據(jù)數(shù)據(jù)可獲得性、研究對象及實驗?zāi)康牡牟煌x擇合適的模型。同時,生物因子的加入有助于提高模型的預(yù)測性能,因此,在以后的研究中建議考慮相關(guān)生物因素[10,27-28],旨在深入揭示物種分布與影響因子之間的內(nèi)在機(jī)制。