圣倩倩,王 晨,王立飛,劉彥辰,耿興敏,祝遵凌
(南京林業(yè)大學(xué) a.風(fēng)景園林學(xué)院;b.南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心;c.藝術(shù)設(shè)計(jì)學(xué)院,江蘇 南京 210037)
植物物種的地理分布受氣候制約,而氣候影響植物分布的主要因素則是溫度和降水[1-2]。通過(guò)對(duì)植物物種所需溫度與降水量的統(tǒng)計(jì)和模型的建立,可以有效預(yù)測(cè)其可能存在的地理區(qū)位。隨著電腦技術(shù)的發(fā)展和地理信息系統(tǒng)的應(yīng)用,各種生態(tài)位模型(如BIOCLIM、DOMAIN、MaxEnt、GARP 等)[3-5]都被逐漸開(kāi)發(fā)并應(yīng)用到植物物種適生區(qū)的預(yù)測(cè)之中。
牡丹是我國(guó)四大傳統(tǒng)名花之一,東漢時(shí)期已被用作中藥,而其作為觀賞植物的栽培歷史則可追溯至南北朝。牡丹花姿綽約,氣味清香,自有“花王”之相,其觀賞價(jià)值很高。中國(guó)是牡丹培育生產(chǎn)大國(guó),牡丹種質(zhì)資源多樣,品質(zhì)優(yōu)異,且在其種質(zhì)利用和產(chǎn)品加工等方面均有相應(yīng)的產(chǎn)出。近年來(lái),牡丹除了作為傳統(tǒng)的藥用、觀賞植物得以開(kāi)發(fā)利用外,還陸續(xù)涌現(xiàn)出一些新興的牡丹產(chǎn)業(yè),這些產(chǎn)業(yè)主要涉及食品、化妝品、醫(yī)藥保健品及牡丹文化、藝術(shù)、服飾等領(lǐng)域[6-8]。為了促進(jìn)牡丹產(chǎn)業(yè)的科學(xué)發(fā)展,運(yùn)用地理信息系統(tǒng)軟件DIVAGIS 模擬牡丹最可能分布的適生區(qū)域,以期為未來(lái)牡丹的保護(hù)、引種與推廣提供科學(xué)依據(jù)[9]。
本研究通過(guò)查看標(biāo)本庫(kù)獲得牡丹分布點(diǎn)數(shù)據(jù)。從中國(guó)國(guó)家標(biāo)本資源平臺(tái)(http://www.nsii.org.cn/2017/home.php)獲得了827 份標(biāo)本信息,篩選并保留具體到鄉(xiāng)鎮(zhèn)一級(jí)的標(biāo)本數(shù)據(jù),應(yīng)用百度地圖對(duì)標(biāo)本記錄進(jìn)行定位,確定經(jīng)度與緯度[10],最終獲得259個(gè)分布點(diǎn)的經(jīng)緯度數(shù)據(jù),并將分布點(diǎn)數(shù)據(jù)保存為Excel 文件以備用[11]。
選擇19個(gè)和物種分布有關(guān)的生物氣候變量[12],其中、英文名稱見(jiàn)表1。所有數(shù)據(jù)均從世界氣候數(shù)據(jù)庫(kù)(https://www.worldclim.org)中獲得,未來(lái)的氣候數(shù)據(jù)則選用CMIP6 計(jì)劃下SSP1-2.6 情景中的2081—2100年氣候預(yù)測(cè)數(shù)據(jù)和SSP5-8.5 情景中的2081—2100年氣候預(yù)測(cè)數(shù)據(jù)。利用ArcGIS 軟件處理從數(shù)據(jù)庫(kù)中下載的生物氣候變量數(shù)據(jù),保存為相應(yīng)格式以備用。
表1 19個(gè)生物氣候變量Table 1 19 bioclimatic variables
DOMAIN 模型和BIOCLIM 模型的預(yù)測(cè)都是利用DIVA-GIS 軟件進(jìn)行的,即將收集到的牡丹分布點(diǎn)位的坐標(biāo)輸入到Excel 工作表中,以DBF 文件格式保存。對(duì)參與建模的已知的牡丹分布點(diǎn)位數(shù)據(jù),按照75%的比例進(jìn)行隨機(jī)分割[13],以隨機(jī)選取的75%的“存在點(diǎn)”作為訓(xùn)練子集,以其余25%的“存在點(diǎn)”與數(shù)倍于“存在點(diǎn)”的“不存在點(diǎn)”作為驗(yàn)證子集,在DIVA-GIS 軟件平臺(tái)上依次加載隨機(jī)生成的不同訓(xùn)練子集文件。使用之前生成的生物氣候變量數(shù)據(jù)集參與模型運(yùn)算,得到多個(gè)分布預(yù)測(cè)圖,將多個(gè)預(yù)測(cè)值進(jìn)行平均,獲取基于兩種模型的牡丹在中國(guó)的分布圖,然后將得到的分布圖導(dǎo)入ArcGIS 軟件中進(jìn)行可視化處理。
DOMAIN 模型的輸出值不是牡丹適生可能性的估算值,而是分類置信度[14]。根據(jù)DOMAIN 模型運(yùn)算的結(jié)果,需以人為定義的閾值來(lái)確定其適生區(qū)范圍。將DIVA-GIS 軟件平臺(tái)中輸出的grd 格式文件轉(zhuǎn)換成ArcGIS 相應(yīng)格式文件,利用ArcGIS軟件使用重分類(Reclassify),對(duì)DOMAIN 模型的結(jié)果進(jìn)行可視化處理,參照張海濤等[15]對(duì)DOMAIN 模型適生區(qū)的分類標(biāo)準(zhǔn)對(duì)預(yù)測(cè)的牡丹適生區(qū)進(jìn)行劃分,即以評(píng)價(jià)指數(shù)為100 的區(qū)域作為最佳適生區(qū),以評(píng)價(jià)指數(shù)為97 ~99 的區(qū)域作為高適生區(qū),以評(píng)價(jià)指數(shù)為96 ~97 的區(qū)域作為適生區(qū),以評(píng)價(jià)指數(shù)為95 ~96 的區(qū)域作為低適生區(qū),以評(píng)價(jià)指數(shù)為91 ~95 的區(qū)域作為邊緣適生區(qū),以評(píng)價(jià)指數(shù)為0 ~91 的區(qū)域作為非適生區(qū)。以BIOCLIM 模型對(duì)當(dāng)前氣候條件下牡丹的適生區(qū)進(jìn)行預(yù)測(cè),根據(jù)系統(tǒng)默認(rèn)的適生度,可將牡丹的地理適生區(qū)分別劃分為非適生區(qū)、邊緣適生區(qū)、低適生區(qū)、適生區(qū)、高適生區(qū)、最佳適生區(qū)這6個(gè)等級(jí),其指數(shù)分別為0 ~2.5%、2.5%~5.0%、5% ~10%、10% ~20%、20% ~42%。利用ArcGIS 軟件對(duì)預(yù)測(cè)出的不同等級(jí)適生區(qū)的地理范圍進(jìn)行最小幾何邊界處理,以WGS1984 坐標(biāo)系為標(biāo)準(zhǔn),計(jì)算出各等級(jí)分布區(qū)的經(jīng)緯度范圍。
提取259個(gè)標(biāo)本分布點(diǎn)所對(duì)應(yīng)的19個(gè)生物氣候變量數(shù)據(jù),利用SPSS 軟件對(duì)提取出的數(shù)據(jù)進(jìn)行主成分分析(Principal component analysis,PCA)[16-18],以篩選出當(dāng)前氣候條件下與牡丹適生區(qū)關(guān)聯(lián)度最大的氣候因素。
模型預(yù)測(cè)結(jié)果數(shù)據(jù)可以分為如下幾類[19]。
1)模型預(yù)測(cè)結(jié)果中顯示物種存在的數(shù)據(jù):以預(yù)測(cè)結(jié)果顯示存在而事實(shí)上也存在的數(shù)據(jù)為真陽(yáng)性數(shù)據(jù),用a來(lái)表示;以模型預(yù)測(cè)結(jié)果顯示存在而事實(shí)上不存在的數(shù)據(jù)為假陽(yáng)性數(shù)據(jù),則用b來(lái)表示。
2)模型預(yù)測(cè)結(jié)果中顯示物種不存在的數(shù)據(jù):以預(yù)測(cè)結(jié)果顯示不存在而事實(shí)上也不存在的數(shù)據(jù)為真陰性數(shù)據(jù),用d來(lái)表示;以模型預(yù)測(cè)結(jié)果顯示不存在而事實(shí)上存在的數(shù)據(jù)為假陰性數(shù)據(jù),則用c來(lái)表示。
研究中涉及的評(píng)價(jià)指標(biāo)包括靈敏度(真陽(yáng)性率)、特異度(真陰性率)、準(zhǔn)確度與AUC 值和Kappa 值。靈敏度是指預(yù)測(cè)出的真陽(yáng)性數(shù)據(jù)在所有實(shí)際存在數(shù)據(jù)中的比例,特異度是指真陰性數(shù)據(jù)在所有實(shí)際不存在的數(shù)據(jù)中的比例,準(zhǔn)確度是指真陽(yáng)性結(jié)果和真陰性結(jié)果在總目標(biāo)區(qū)所占的百分比。以特異度為X坐標(biāo),以靈敏度為Y坐標(biāo)繪制受試者工作特征曲線(Receiver operation characteristic,ROC),受試者工作特征曲線下面積(Area under ROC curve,AUC)是指ROC 曲線下的面積,Kappa 統(tǒng)計(jì)值(Kappa statistic,K)是根據(jù)靈敏度(Sensitivity,Se)、特異度(Specificity,Sp)、準(zhǔn)確度(Accuracy,A)這3個(gè)指標(biāo)值綜合計(jì)算后得到的評(píng)價(jià)指標(biāo)值,其計(jì)算公式分別如下:
利用預(yù)測(cè)環(huán)節(jié)隨機(jī)分割步驟中得到的驗(yàn)證子集來(lái)檢驗(yàn)?zāi)P皖A(yù)測(cè)的精度,同時(shí)利用DIVA-GIS 軟件中的ROC 曲線和Kappa 統(tǒng)計(jì)值對(duì)模型預(yù)測(cè)精確度進(jìn)行檢驗(yàn)[20]。以AUC 值為評(píng)判依據(jù),不受診斷閾值的影響,且對(duì)物種發(fā)生率不敏感,AUC 值目前被公認(rèn)為最佳的評(píng)價(jià)指標(biāo),在生態(tài)位模型精確度檢驗(yàn)評(píng)價(jià)中得到了廣泛的應(yīng)用[21]。其評(píng)價(jià)模型對(duì)適生區(qū)的模擬效果分為如下6個(gè)等級(jí):極好(0.90~1.00)、好(0.80~0.90)、一般(0.70~0.80)、差(0.60 ~0.70)、失敗(0.50 ~0.60)。Kappa值也是被認(rèn)可的評(píng)價(jià)指標(biāo),其同樣有如下6個(gè)評(píng)價(jià)等級(jí):極好(1.00 ~0.85)、很好(0.70 ~0.85)、好(0.55 ~0.70)、一般(0.40 ~0.55)、失?。ǎ?.40)。
運(yùn)用Domain 模型預(yù)測(cè)出的牡丹不同等級(jí)適生區(qū)的分布情況見(jiàn)表2。由表2 可知,等級(jí)較高的牡丹適生區(qū)主要分布于北京、天津的大部分地區(qū),河北部分地區(qū),山東大部分地區(qū),河南大部分地區(qū),陜西中南部與甘肅東部地區(qū),四川山地區(qū)域與四川盆地交界處以東地區(qū),重慶全境,湖北與重慶、湖南交界地區(qū),湖北西部和東部地區(qū),江蘇部分地區(qū),上海全境,浙江北部地區(qū),貴州大部分地區(qū),江西部分地區(qū)等區(qū)域。
表2 DOMAIN 模型的預(yù)測(cè)結(jié)果?Table 2 The results of the DOMAIN model
運(yùn)用BIOCLIM 模型預(yù)測(cè)出的牡丹不同等級(jí)適生區(qū)的分布情況見(jiàn)表3。由表3 可知,等級(jí)較高的牡丹適生區(qū)主要分布于甘肅南部和陜西的中部、南部地區(qū),山西南部地區(qū),河南除東南部外的大部分地區(qū),江蘇中北部地區(qū),山東南部與東部地區(qū),四川和重慶東部地區(qū),貴州東部的大部分地區(qū),湖北大部分地區(qū)等區(qū)域。
表3 BIOLCIM 模型的預(yù)測(cè)結(jié)果Table 3 The results of the BIOCLIM model
比較分析兩個(gè)模型的預(yù)測(cè)結(jié)果可知,以DOMAIN 模型預(yù)測(cè)出的高適生區(qū)更為分散,而以BIOCLIM 模型預(yù)測(cè)出的高適生區(qū)更為集中;以DOMAIN 模型預(yù)測(cè)出的最佳適生區(qū)的面積比以BIOCLIM 模型預(yù)測(cè)出的最佳適生區(qū)面積要小,且這些最佳適生區(qū)域集中于已知的牡丹標(biāo)本分布點(diǎn)附近;而以DOMAIN 模型預(yù)測(cè)出的最佳適生區(qū)、高適生區(qū)和適生區(qū)面積之和大于以BIOCLIM 模型預(yù)測(cè)的結(jié)果。但是,兩個(gè)模型預(yù)測(cè)的結(jié)果都表明,中國(guó)中部以陜西和貴州為中心的兩個(gè)適生區(qū)的面積均較大,牡丹適生的程度均較高。
提取標(biāo)本點(diǎn)的19個(gè)生物氣候變量數(shù)據(jù),利用SPSS 軟件對(duì)提取出的19個(gè)生物氣候變量數(shù)據(jù)進(jìn)行主成分分析,結(jié)果見(jiàn)表4。在19個(gè)主成分中,第1、第2、第3、第4個(gè)主成分的方差貢獻(xiàn)率分別為61.820%、18.526%、7.605%、6.245%,其累計(jì)貢獻(xiàn)率達(dá)94.196%,說(shuō)明這4個(gè)主成分可以反映出大部分生物氣候變量的信息。各個(gè)生物氣候變量在前4個(gè)主成分中的得分系數(shù)見(jiàn)表5。由表5 可知,在第1 主成分中,極端最低氣溫(bio6)、最干燥季度的平均溫度(bio9)、最冷季的平均溫度(bio11)、年降水量(bio12)的得分系數(shù)都較高,分別為0.081、0.081、0.080、0.080;在第2 主成分中,溫度季節(jié)性變化方差(bio4)、最濕季平均溫度(bio8)、極端最高溫(bio5)的得分系數(shù)都較高,分別為0.231、0.217、0.206;在第3 主成分中,季節(jié)降水量變異系數(shù)(bio15)、最熱季降雨量(bio18)、最濕月降雨量(bio13)的得分系數(shù)都較高,分別為0.281、0.265、0.198;在第4 主成分中,最濕月降雨量(bio13)、濕季降水(bio16)、平均日溫差(bio2)、最熱季的降水(bio18)的得分系數(shù)都較高,分別為0.374、0.277、0.275、0.275。可見(jiàn),各個(gè)環(huán)境因素作用的效果順序?yàn)椋簻囟纫蛩卮笥跐穸纫蛩亍T?9個(gè)生物氣候變量中,對(duì)牡丹適生區(qū)分布起到主要影響作用的氣候變量分別是極端最低溫度(bio6)、溫度季節(jié)性變化方差(bio4)、季節(jié)降水量變異系數(shù)(bio15)、最濕月降水量(bio13)。
表4 前4個(gè)主成分的方差貢獻(xiàn)率Table 4 Variance contribution rate of the first four principal components
表5 旋轉(zhuǎn)后的因素荷載矩陣Table 5 Rotated factor loading matrix
對(duì)DOMAIN 模型預(yù)測(cè)精度進(jìn)行檢驗(yàn),結(jié)果得到的評(píng)價(jià)指數(shù)AUC 值與Kappa 值分別為0.887(圖1)和0.633(圖2)。參考前文所述的模型評(píng)價(jià)標(biāo)準(zhǔn)可知,DOMAIN 模型對(duì)牡丹適生區(qū)的預(yù)測(cè)結(jié)果的精度高、模擬效果好。而對(duì)BIOCLIM 模型預(yù)測(cè)精度進(jìn)行檢驗(yàn),結(jié)果得到的評(píng)價(jià)指數(shù)AUC值與Kappa 值分別為0.842(圖3)和0.594(圖4),說(shuō)明以DOMAIN 模型對(duì)牡丹適生區(qū)預(yù)測(cè)的精度與模擬的效果要高于和優(yōu)于以BIOCLIM 模型對(duì)其預(yù)測(cè)的精度與模擬的效果。
圖1 DOMAIN 模型的ROC 曲線Fig.1 ROC curve of DOMAIN model
圖2 DOMAIN 模型的Kappa 統(tǒng)計(jì)值Fig.2 Kappa statistic of DOMAIN model
圖3 BOCLIM 模型的ROC 曲線Fig.3 ROC curve of BIOCLIM model
圖4 BIOCLIM 模型的Kappa 統(tǒng)計(jì)值Fig.4 Kappa statistic of BIOCLIM model
使用SSP 1-2.6 情景下的19個(gè)生物氣候變量和DOMAIN 模型對(duì)牡丹在未來(lái)氣候條件下的適生區(qū)進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表6。SSP 1-2.6 情景是在SSP1的基礎(chǔ)上對(duì)RCP 2.6 情景的更新[22]。同理,使用SSP 5-8.5 情景下的19個(gè)生物變量和DOMAIN 模型對(duì)牡丹在未來(lái)氣候條件下的適生區(qū)進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表7。SSP 5-8.5 情景是在SSP5 的基礎(chǔ)上對(duì)RCP8.5 情景的更新。在這兩種氣候情景下,牡丹適生區(qū)僅在小區(qū)域內(nèi)稍有變化,但沒(méi)有大面積的變化,說(shuō)明其適生區(qū)的分布狀態(tài)穩(wěn)定。
表6 SSP 1-2.6 情景下DOMAIN 模型的預(yù)測(cè)結(jié)果Table 6 The results of BOCLIM model under the SSP 1-2.6 scenario
表7 SSP 5-8.5 情景下DOMAIN 模型的預(yù)測(cè)結(jié)果Table 7 The results of BOCLIM model under the SSP 5-8.5 scenario
生態(tài)位模型理論在物種保護(hù)研究中得到了有效的應(yīng)用。例如,針對(duì)目標(biāo)物種基于生態(tài)位模型的模擬結(jié)果,可以從宏觀角度了解物種適生區(qū)的分布情況,對(duì)物種的發(fā)現(xiàn)和保護(hù)都有積極意義。與GARP、MAXENT、BIOCLIM 這些生態(tài)位模型有所不同的是,在參與的變量較少的情況下,DOMAIN 模型對(duì)物種適生區(qū)的模擬仍有較高的精度。將DOMAIN 和 Neural Ensembles 模型配合起來(lái)運(yùn)用,能有效預(yù)測(cè)中國(guó)毛竹的潛在分布區(qū)域[14],DOMAIN 模型在對(duì)天麻的適生區(qū)的預(yù)測(cè)中也表現(xiàn)出優(yōu)異的效果[22]。在未來(lái)氣候情景下,牡丹的適生區(qū)范圍將有可能碎片化地增加或減少,但不會(huì)出現(xiàn)大范圍的變化。
主成分分析結(jié)果表明,在前4個(gè)主成分中得分系數(shù)最高的變量里,溫度因素占據(jù)主導(dǎo)地位,極端最低氣溫(bio6)與溫度季節(jié)性變化方差(bio4)這2個(gè)變量為影響牡丹適生區(qū)分布的主要?dú)夂蛞蛩?。?duì)前4個(gè)主成分中得分系數(shù)最高的生物氣候變量數(shù)據(jù)進(jìn)行處理,得到牡丹適生區(qū)的氣候特征(表8),由極端最低氣溫的變化范圍值可知,牡丹適生區(qū)的溫度最低值為-21 ~5 ℃,因?yàn)槟档び猩疃刃菝叩奶匦?,需要? ~10 ℃的環(huán)境下通過(guò)冷處理來(lái)解除深休眠。一般情況下,牡丹能耐受的最低溫度為-30 ℃,因此適于牡丹分布的區(qū)域需要有明顯的季節(jié)性溫度變化特性和適宜的最低溫,而不適宜的溫度條件會(huì)導(dǎo)致牡丹生長(zhǎng)停滯。有關(guān)研究結(jié)果[23-25]表明,溫度對(duì)牡丹的影響最大,是影響牡丹生長(zhǎng)的關(guān)鍵氣候因素。結(jié)合主成分分析結(jié)果來(lái)看,溫度是需要首先考慮的氣候因素,相對(duì)于溫度而言,牡丹對(duì)水分的需求具有更高的普適性。
表8 牡丹適生區(qū)的氣候特征Table 8 Climatic characters in the suitable habitat of P.suffruticosa Andr.
在全國(guó)范圍內(nèi),牡丹適生區(qū)等級(jí)較高的區(qū)域主要分布于北京和天津的大部分地區(qū)、河北部分地區(qū)、山東大部分地區(qū)、河南大部分地區(qū)、陜西中南部地區(qū)、甘肅東部地區(qū)、四川東部地區(qū)、重慶大部分地區(qū)、湖北部分地區(qū)、湖南部分地區(qū)、江蘇部分地區(qū)、安徽部分地區(qū)、上海大部分地區(qū)、浙江北部地區(qū)、貴州大部分地區(qū)、江西部分地區(qū)等區(qū)域。南部地區(qū)適生區(qū)的分布形狀與大山脈、江河走勢(shì)基本一致,這是因?yàn)闅鉁啬贻^差等溫度因素與地形、海拔等因素密切相關(guān),依據(jù)農(nóng)業(yè)氣候相似性理論,模型預(yù)測(cè)出的適生區(qū)的氣候環(huán)境條件與采樣點(diǎn)的氣候環(huán)境條件相似,因此,這些氣候環(huán)境條件基本可以滿足牡丹生存所需。但是,植物的生長(zhǎng)除了受到溫度、水分條件的制約之外,人類活動(dòng)、土壤條件等都會(huì)影響植物的生長(zhǎng),例如都市化和工業(yè)化過(guò)程中產(chǎn)生的二氧化氮(NO2)會(huì)對(duì)植物生長(zhǎng)產(chǎn)生影響[26],土壤堿化會(huì)影響植物的生理代謝[27]。因此,未能結(jié)合人類活動(dòng)和土壤條件等環(huán)境變量來(lái)預(yù)測(cè)牡丹適生區(qū)也是本研究的不足之處,今后需對(duì)此問(wèn)題進(jìn)行更加深入的研究。