朱 妮
(1.安康學(xué)院旅游與資源環(huán)境學(xué)院,陜西安康 725000;2.秦巴國(guó)土資源利用與環(huán)境保護(hù)協(xié)同創(chuàng)新中心,陜西安康 725000;3.安康市漢江水資源保護(hù)與利用工程技術(shù)研究中心,陜西安康 725000)
厚樸(Magnolia officinalis Rehd.et Wils)為木蘭科落葉喬木,在我國(guó)主要分布于南方各省[1-2]。該物種是中醫(yī)藥體系常用藥,主要藥用部位為其樹(shù)皮,藥用價(jià)值極高。厚樸在我國(guó)的藥用歷史已有兩千余年,現(xiàn)代藥理學(xué)研究證實(shí),該藥材具有抗菌、抗病毒、抗過(guò)敏等功效,同時(shí)對(duì)于胃潰瘍,應(yīng)激性胃功能障礙等癥狀有一定治療和緩解作用[3-4]。同時(shí)實(shí)驗(yàn)表明厚樸的主要藥用成分厚樸酚、和厚樸酚等對(duì)癌細(xì)胞具有抑制作用[5]。厚樸經(jīng)濟(jì)價(jià)值高,但是由于藥用厚樸的生長(zhǎng)周期較長(zhǎng),一般需要15年其樹(shù)皮才能達(dá)到藥用標(biāo)準(zhǔn),由于不可持續(xù)的采收方式以及森林的砍伐,目前該物種野生資源急劇減少,生境破碎度較高[6]。另一方面,厚樸在地區(qū)生態(tài)恢復(fù)以及生態(tài)建設(shè)方面也有優(yōu)勢(shì),該樹(shù)種根系較為發(fā)達(dá),生長(zhǎng)速度快,且具有一定觀賞價(jià)值,可以在一定區(qū)域進(jìn)行推廣。鑒于此,預(yù)測(cè)厚樸適宜生境分布,可以為厚樸的人工種植,野生資源保護(hù)等提供理論依據(jù)。物種分布模型(species distribution model,SDM)即生態(tài)位模型,是利用統(tǒng)計(jì)學(xué)算法在多維環(huán)境空間中模擬物種生態(tài)位范圍,并將物種生態(tài)位范圍抽象成統(tǒng)計(jì)學(xué)規(guī)則,模擬物種在不同時(shí)空環(huán)境下的適宜生境潛在分布的數(shù)學(xué)算法集合[7-8]。近年來(lái),隨著統(tǒng)計(jì)技術(shù)與生態(tài)位理論的發(fā)展,物種分布模型在生態(tài)學(xué)中的應(yīng)用迅速增加,目前此類模型已經(jīng)廣泛地用于生物地理學(xué)、保護(hù)生物學(xué)、全球變化生物學(xué)與生境或物種管理等方面[9-13]。目前已有大量的統(tǒng)計(jì)算法被用于物種分布模型構(gòu)建,在建模過(guò)程中針對(duì)不同的建模目的,物種生態(tài)位特征以及建模數(shù)據(jù)基礎(chǔ),研究者需要選擇不同模型算法[14]。目前這一選擇主要是靠一種或幾種(如:kappa 系數(shù)、TSS 值、ROC 等)統(tǒng)計(jì)學(xué)評(píng)價(jià)指標(biāo)來(lái)確定,但是最優(yōu)的模型算法不一定能在所有建模條件下統(tǒng)計(jì)學(xué)精度能達(dá)到最優(yōu)[15],克服模型應(yīng)用的不確定性是亟待解決的問(wèn)題[16]。研究表明組合物種分布模型(ensemble model)能夠在一定程度上解決這一問(wèn)題。該模型可以將模型的主要趨勢(shì)(即平均值、中位數(shù)或其他百分位數(shù))和所有模型的總體變化(以及不確定性)映射起來(lái);也可以集成不同模型的其他方面,如變量的重要性或模型響應(yīng)曲線[17-18]。
BIOMOD 是目前最為流行的物種分布單模型集合預(yù)報(bào)平臺(tái),2003年W.Thuiller[19]提出了一個(gè)新型計(jì)算機(jī)平臺(tái)框架BIOMOD(BIOMOD:BIOdiversity MODelling),其目的是利用不同類型的統(tǒng)計(jì)建模方法最大化當(dāng)前物種分布的預(yù)測(cè)精度和增強(qiáng)物種未來(lái)潛在分布預(yù)測(cè)的可靠性。但是早期BIOMOD只集成了4 種單模型算法即廣義線性模型(GLM)、廣義相加模型(GAM)、分類與回歸樹(shù)模型(CART)以及人工神經(jīng)網(wǎng)絡(luò)模型(ANN)。2009年,W.Thuiller[20]進(jìn)一步完善了BIOMOD 的計(jì)算框架,同時(shí)也發(fā)布了R 環(huán)境下免費(fèi)且開(kāi)源的BIOMOD2 程序包,目前BIOMOD 中集成在原有的4 種算法上又增加了5種算法即:表面分布區(qū)分室模型(SRE)、多元適應(yīng)回歸樣條函數(shù)(MARS)、柔性判別分析(FDA)、推進(jìn)式回歸樹(shù)(BRT)、隨機(jī)森林(RF),同時(shí)該平臺(tái)還集成了不同模型初始條件的設(shè)置,不同的模型參數(shù)化條件,例如:回歸算法中設(shè)置不同階數(shù)的多項(xiàng)式和光滑樣條,在分類算法中設(shè)置分類樹(shù)中的節(jié)點(diǎn),以及在神經(jīng)網(wǎng)絡(luò)算法中設(shè)置隱藏層的數(shù)目以及公式等[20]。
本文基于大量文獻(xiàn)確定物種分布記錄,同時(shí)收集并篩選相關(guān)環(huán)境因子,采用組合物種分布模型,模擬我國(guó)南方厚樸的潛在適宜生境分布。組合分布模型要求使用較多的單模型算法構(gòu)造以尋求物種分布模擬的最佳解決方案,減少模型不確定性,因此在本文中我們使用BIOMOD2 建模平臺(tái),構(gòu)建其支持的全部9 個(gè)單模型算法(表面分布區(qū)分室模型、分類樹(shù)分析、柔性判別分析、廣義線性模型、廣義加性模型、多元適應(yīng)回歸樣條函數(shù)、人工神經(jīng)網(wǎng)絡(luò)、推進(jìn)式回歸樹(shù)以及隨機(jī)森林),依照模型TSS 值進(jìn)行模型結(jié)果篩選與定權(quán),構(gòu)造組合物種分布模型(ensemble model)探究厚樸的分布規(guī)律,并比較不同物種分布模型的精度以及空間表現(xiàn)。
精確的物種分布數(shù)據(jù)是物種分布模型構(gòu)建的基礎(chǔ),本研究中為了保證物種分布數(shù)據(jù)的數(shù)據(jù)真實(shí)可靠,所有的厚樸樣點(diǎn)數(shù)據(jù)都來(lái)源于公開(kāi)發(fā)表的文獻(xiàn)[1-2,21-23],同時(shí)為了保證厚樸地理位置的精確度及模型構(gòu)建的科學(xué)性,本研究對(duì)獲得的厚樸采樣點(diǎn)數(shù)據(jù)按照以下條件進(jìn)行了篩選:①只選取2000年之后的精確位置信息的數(shù)據(jù);②刪除經(jīng)緯度重復(fù)的數(shù)據(jù),并且樣點(diǎn)間的距離大于10 km。經(jīng)篩選處理后參與建模的厚樸采樣點(diǎn)數(shù)據(jù)共143 個(gè)(圖1)。
圖1 研究區(qū)和種群分布點(diǎn)的地理位置Figure 1 Study area and geographic locations of populations
完備且準(zhǔn)確的環(huán)境因子是物種分布模型構(gòu)建的基本要求,建模時(shí)關(guān)鍵因子的缺失會(huì)造成無(wú)法解釋的方差,同時(shí)也可能導(dǎo)致建模過(guò)程中對(duì)物種生態(tài)位的量化產(chǎn)生偏差。在本文中我們采用物種分布模型構(gòu)建最為常用的Bio(bioclimatic variables)數(shù)據(jù)系列,該數(shù)據(jù)系列一共包括19 個(gè)具有生態(tài)學(xué)意義的氣候變量[24-25]。數(shù)據(jù)來(lái)源于自世界氣候數(shù)據(jù)庫(kù)(WOR LDCLIM version 2.0,http://www.worldclim.org)。該數(shù)據(jù)由世界各地氣象站1970—2000年記錄的氣溫降水等信息結(jié)合地形信息插值生成。同時(shí)本文收集了研究區(qū)的高程數(shù)據(jù),數(shù)據(jù)源于中國(guó)科學(xué)院地理科學(xué)與資源研究所資源環(huán)境數(shù)據(jù)云平臺(tái)(http://www.resdc.cn/data.aspx?DATAID=200),利用 ARCGIS 10.3 空間分析功能我們得到了坡度,坡向2 個(gè)環(huán)境因子。另外,為了進(jìn)一步體現(xiàn)厚樸潛在分布的實(shí)際區(qū)域,本試驗(yàn)下載了中國(guó)1∶100 萬(wàn)植被類型數(shù)據(jù)圖,數(shù)據(jù)同樣源于資源環(huán)境數(shù)據(jù)云平臺(tái)。本研究采用的環(huán)境因子空間分辨率均為30″(1 km2)。
前人研究表明,如BIO 數(shù)據(jù)系列存在較強(qiáng)的數(shù)據(jù)共線性,環(huán)境因子的相關(guān)性會(huì)造成建模時(shí)的統(tǒng)計(jì)信息的冗余,同時(shí)也會(huì)對(duì)建模的結(jié)果產(chǎn)生不利的影響[26]。因此必須對(duì)環(huán)境因子進(jìn)行篩選,本文采用相關(guān)分析法[26-28]以及厚樸生境特征分析篩選參與建模的環(huán)境因子。首先對(duì)于收集到的22 個(gè)環(huán)境因子(19 個(gè)氣候變量和3 個(gè)地形變量)求取相關(guān)系數(shù),對(duì)于相關(guān)系數(shù)>±0.7 的多組環(huán)境變量進(jìn)行篩選,每組環(huán)境變量只選取一個(gè)與厚樸生境特征關(guān)系最為密切的變量,參與模型構(gòu)建,同時(shí)檢查隨后篩選得到的環(huán)境變量的相關(guān)系數(shù),確保其小于0.7[27-28]。最后本文選?。耗昶骄鶜鉁兀╞io1)、平均日較差(bio2)、溫度年較差(bio7)、年降水量(bio12)、降水量的季節(jié)性變化(bio15)、最冷季降水量(bio19)、坡度(slope)、坡向(aspect)共8 個(gè)環(huán)境變量參與本文模型構(gòu)建(表1)。
表1 厚樸潛在地理分布評(píng)價(jià)所需的地理環(huán)境變量Table 1 Geographical elements index used for predicting potential geographic distribution of M.officinalis
在BIOMOD2 運(yùn)行時(shí)候需要物種的存在點(diǎn)位數(shù)據(jù),也需要物種的不分布點(diǎn)位數(shù)據(jù)(偽存在點(diǎn)數(shù)據(jù))。在本文中BIOMOD2 的設(shè)置如下:首先根據(jù)厚樸存在點(diǎn)位數(shù)據(jù)與背景點(diǎn)位(研究區(qū)范圍內(nèi)沒(méi)有存在點(diǎn)位的柵格)數(shù)據(jù)隨機(jī)生成3 組偽存在點(diǎn)數(shù)據(jù),每組偽存在點(diǎn)數(shù)目均為500。然后將參與建模的樣點(diǎn)數(shù)據(jù)(包括存在點(diǎn)與偽存在點(diǎn))隨機(jī)分為2 個(gè)部分,70%的數(shù)據(jù)用為訓(xùn)練集,剩余數(shù)據(jù)為測(cè)試集,同時(shí)我們?cè)O(shè)置在模型運(yùn)行以及模型評(píng)價(jià)時(shí),采樣點(diǎn)的總權(quán)重與偽采樣點(diǎn)權(quán)重相等。然后將數(shù)據(jù)輸入并運(yùn)行9 個(gè)單模型算法,每個(gè)模型算法重復(fù)10 次,本研究將一共產(chǎn)生270 個(gè)單模型運(yùn)算結(jié)果(3 組樣點(diǎn)數(shù)據(jù)*9 個(gè)模型算法*10 次重復(fù))。最后,采用TSS 和AUC 值對(duì)模型進(jìn)行評(píng)價(jià),TSS 的值是指模型正確預(yù)測(cè)存在點(diǎn)的百分比與正確預(yù)測(cè)偽存在點(diǎn)百分比之和減去1,TSS 值域范圍均為[-1-1],取值越接近1,模型精度較高,一般情況下,取值>0.8,表示模型結(jié)果較為理想,取值0.5 以下表示模型結(jié)果較差[27]。受試者工作特征曲線(receiver operating characteristic curve,ROC 曲線)是目前物種分布模擬結(jié)果驗(yàn)證使用最為廣泛的指標(biāo)。AUC(area 大于0.8 時(shí),表示模型結(jié)果較為精確[28]。
為了減少模型本身以及數(shù)據(jù)生成(主要是偽采樣點(diǎn))過(guò)程中的不確定性,本研究采用組合物種分布模型來(lái)預(yù)測(cè)厚樸適宜生境的空間分布。綜合考慮本文中所構(gòu)建的所有270 個(gè)單模型運(yùn)算結(jié)果,本文中采用TSS 值進(jìn)行篩選構(gòu)成最終數(shù)和模型的單模型結(jié)果,只保留TSS>0.8 的單模型運(yùn)算結(jié)果采用加權(quán)平均法構(gòu)建組合物種分布模型,單模型運(yùn)算結(jié)果權(quán)重由其TSS 值決定,公式如下(1):
其中,wj為第j 個(gè)單模型結(jié)果的權(quán)重,rj表示第j 個(gè)單模型的 TSS 值,h 表示 TSS>0.8 的單模型結(jié)果數(shù)目。
最后將單個(gè)模型歸一化后的結(jié)果與對(duì)應(yīng)權(quán)重相乘,然后求和,以此構(gòu)建組合模型并計(jì)算研究區(qū)厚樸潛在適宜生境指數(shù)yi,計(jì)算公式為(2):
式中:yi是第i 個(gè)柵格的厚樸適宜生境指數(shù);wj為第j 個(gè)模型的權(quán)重;xij為第j 個(gè)模型中的第i 個(gè)柵格的數(shù)值。yi的取值范圍[0,1],yi越接近 1,表明該柵格單元的環(huán)境條件條件越適宜厚樸生長(zhǎng)。
為了更直觀地顯示物種分布預(yù)測(cè)結(jié)果,需要將本文連續(xù)型的適宜性指數(shù)分布結(jié)果通過(guò)定義閾值轉(zhuǎn)換為布爾型結(jié)果,即超過(guò)閾值為1,低于閾值為0,本文中采用最大TSS 值法進(jìn)行閾值設(shè)定,TSS 值的計(jì)算依賴于閾值的設(shè)定,不同的閾值對(duì)應(yīng)不同的TSS 值,本文中采用使得組合模型TSS 值為最大的分類閾值對(duì)建模結(jié)果進(jìn)行分類。
同時(shí)本文提取中國(guó)1∶100 萬(wàn)植被類型數(shù)據(jù)圖中的闊葉林、針闊葉混交林、落葉果樹(shù)園以及亞熱帶經(jīng)濟(jì)林等植被類型作為厚樸分布限制范圍與組合模型的二值化運(yùn)算結(jié)果求交集,以確定厚樸實(shí)際潛在分布區(qū)的位置以及面積。
本文采用TSS 和ROC 這2 個(gè)模型評(píng)價(jià)指標(biāo)對(duì)參與建模的9 個(gè)單模型算法進(jìn)行精度檢驗(yàn)(圖2),結(jié)果表明,對(duì)于不同的評(píng)價(jià)指標(biāo),最優(yōu)模型不同,就ROC 而言,最優(yōu)模型為RF,其平均 AUC 值為0.95,而9 個(gè)模型平均TSS 最大的模型為MARS 其平均TSS 值為0.87,這在一定程度上說(shuō)明了單模型統(tǒng)計(jì)精度的不確定性,不同的統(tǒng)計(jì)精度指標(biāo)給出了不同的結(jié)果。綜合2 個(gè)評(píng)價(jià)指標(biāo)來(lái)看,本研究中性能最優(yōu)的模型為RF 與MARS,預(yù)測(cè)性能較優(yōu)的模型為:GAM、GBM、FDA 以及 GLM。相比以上模型,ANN 的精度較差,其平均TSS 值為0.82,模型精度最低的是SRE 與CTA,其TSS 值均為超過(guò)0.8,這表明這兩個(gè)模型并未參與組合模型的構(gòu)建。同時(shí)圖2 中每個(gè)模型在不同評(píng)價(jià)指標(biāo)數(shù)據(jù)軸上延伸的范圍代表其多次建模精度評(píng)價(jià)的穩(wěn)定性,我們可以看出9 種模型算法中精度穩(wěn)定性最好的是ANN,其次為RF、MARS 與CTA,模型精度評(píng)價(jià)穩(wěn)定性最差的是SRE與GLM,這也在一定程度上說(shuō)明了模型結(jié)果的不確定性。我們計(jì)算了組合物種分布模型的TSS 與AUC值,結(jié)果表明,組合模型能夠在一定程度上提高模型精度,其 TSS 值為 0.905、AUC 值為 0.975。
本研究中為了展現(xiàn)不同算法的空間表現(xiàn),將所有單模型算法的結(jié)果分別相加,然后歸一化處理,得到不同單模型對(duì)厚樸適宜性指數(shù)的空間分布(圖3)。由圖中我們可以看出,模型結(jié)果具有很高的一致性,所有的模型結(jié)果都顯示厚樸高適宜指數(shù)分布區(qū)位于四川東部、甘肅南部、陜西南部、湖北西部同時(shí)在貴州、湖南、江西、福建、浙江等省份也有大量的分布區(qū)存在。但是在細(xì)節(jié)上,模型結(jié)果也有較大差異,由高適宜指數(shù)區(qū)域分布面積大小來(lái)看,SRE的模型結(jié)果最為保守,由于其模型結(jié)果為二值化結(jié)果,所以其分布區(qū)面積較為集中,而GLM 的結(jié)果高適宜指數(shù)分布區(qū)面積最大,幾乎包括了研究區(qū)的大部分區(qū)域,其分布北界達(dá)到陜西中部、甘肅中南部,分布西界延伸到了四川西部以及云南省,分布南界到達(dá)廣東南部,甚至在臺(tái)灣南部也出現(xiàn)了一定面積的高適宜生境指數(shù)分布區(qū)域。
從算法分類上看回歸模型(GLM、GAM、MARS)的中GLM 與MARS 結(jié)果較其他模型的結(jié)果都較大,回歸模型的結(jié)果不同適宜性指數(shù)分布區(qū)的分布細(xì)節(jié)較為豐富。分類模型(CTA、FDA、RF)中 FDA 的空間模擬結(jié)果最差,高適宜生境區(qū)域被明顯的分為兩個(gè)隔離的區(qū)域,分類模型的結(jié)果中高適宜指數(shù)分布區(qū)集中分布,游離于主要集中分布區(qū)的小板塊狀的高適宜分布區(qū)較少。而復(fù)雜的機(jī)器學(xué)習(xí)算法如:ANN、GBM、RF 等空間模擬結(jié)果比較收斂,提供了生境分布的細(xì)節(jié),具有較好的空間表現(xiàn),同時(shí)依據(jù)模型性能評(píng)價(jià)(圖2)大多數(shù)此類模型具有較高的模型精度。因此我們可以初步得出結(jié)論:在相同的數(shù)據(jù)基礎(chǔ)上,復(fù)雜的機(jī)器學(xué)習(xí)模型有著較好的統(tǒng)計(jì)學(xué)模擬精度,同時(shí)其空間表現(xiàn)也優(yōu)于簡(jiǎn)單的傳統(tǒng)統(tǒng)計(jì)模型。綜上所述我們可以得出結(jié)論:基于同組數(shù)據(jù),同樣的模型設(shè)置,不同模型的結(jié)果在模型精度以及空間表現(xiàn)上具有一定的差異,因此模型空間表現(xiàn)的不確定性無(wú)法避免。
圖2 不同模型預(yù)測(cè)結(jié)果精度Figure 2 Accuracy of prediction results of different models
由組合模型閾值二分類結(jié)果可知(圖4-A),厚樸適宜生境面積較大,主要分布在陜西南部,甘肅東南南部以及河南部分地區(qū)的秦嶺山地,還包括與秦嶺地區(qū)毗鄰的四川東部、重慶以及湖北西部、其分布區(qū)向東南延伸還包括貴州大部、廣西北部、湖南西部、南部、江西大部、福建中部、北部,以及浙江南部。
當(dāng)考慮植被類型限制的時(shí),厚樸的適宜生境面積急劇減少,經(jīng)過(guò)計(jì)算,我們得出適宜生境的面積為0.53×106km2。由圖4-B 可知,厚樸適宜生境集中分布區(qū)主要位于秦嶺地區(qū)以及四川西部,重慶市等濕潤(rùn)的溫帶山區(qū),范圍包括甘肅天水南部、隴南市南部;陜西漢中,安康以及商洛市;四川廣元、巴中、綿陽(yáng)、德陽(yáng)、南充、達(dá)川、成都、廣安、雅安、仁壽、宜賓等地區(qū);重慶大部分地區(qū)。該區(qū)域應(yīng)該作為厚樸原生產(chǎn)地保護(hù)以及人工種植的重點(diǎn)區(qū)域。
圖3 不同模型算法的結(jié)果Figure 3 Results of different model algorithms
成功物種分布預(yù)測(cè)一般需要如下條件:恰當(dāng)數(shù)量的種群采樣點(diǎn)數(shù)據(jù);準(zhǔn)確、可靠、能夠描述適宜目標(biāo)物種生境環(huán)境特征的環(huán)境因子數(shù)據(jù),合理且能夠描述物種生境特征的模型策略[31]。在物種分布研究中,最常用的物種分布數(shù)據(jù)來(lái)源于各種網(wǎng)絡(luò)標(biāo)本館,這些數(shù)據(jù)容易獲得且較為全面,但是此類數(shù)據(jù)往往缺乏精確的地理定位信息,同時(shí)分標(biāo)本館物種采樣點(diǎn)數(shù)據(jù)采集自于二三十年前,其時(shí)效性難以保證,這些都會(huì)導(dǎo)致物種分布模型結(jié)果的不確定性。而本文采用了2000年之后具有精確地理定位信息的物種采樣點(diǎn)數(shù)據(jù),同時(shí)我們對(duì)原始數(shù)據(jù)進(jìn)行了篩選,最大限度地避免了分布數(shù)據(jù)空間自相關(guān)的影響,保證了本文中參與建模的厚樸點(diǎn)位數(shù)據(jù)的準(zhǔn)確性與代表性。植物生長(zhǎng)和繁殖需要適宜的溫度條件和充足的水分,因此環(huán)境因子的適宜性也是保證物種分布研究結(jié)果合理性的關(guān)鍵之一[9,18,31]。前人研究表明,19 個(gè)bio 生物氣候變量對(duì)物種分布研究是有用的,并且是應(yīng)用最為廣泛的數(shù)據(jù)之一[31]。在本文中我們采用相關(guān)系數(shù)對(duì)19 個(gè)生物氣候變量、3 個(gè)地形變量共22 個(gè)環(huán)境因子進(jìn)行篩選,以避免因子相關(guān)性的影響。同時(shí)以上過(guò)程中我們發(fā)現(xiàn)年平均氣溫與海拔的相關(guān)性較高大于0.7,因此必須要對(duì)這兩個(gè)因子進(jìn)行篩選,這兩個(gè)因子中海拔屬于間接變量,此類變量與物種生存不具有直接生理相關(guān)性,只是通過(guò)影響其他因子間接的影響物種分布。對(duì)于海拔而言,他不直接作用于物種分布,而是通過(guò)影響區(qū)域水熱的再分配來(lái)影響物種分布,在不同的時(shí)空尺度下,海拔與氣溫降水因子的關(guān)系不是恒定的,因此其與物種分布的關(guān)系也是變化的。因此我們選擇能夠更加直觀表達(dá)區(qū)域熱量情形的平均氣溫作為構(gòu)建模型的候選因子之一[32]。目前已有大量的文獻(xiàn)闡述了物種分布模型構(gòu)建中不同模型算法的優(yōu)劣,但是沒(méi)有任何一種或者一類模型算法在所有物種分布研究中都能獲得最高的統(tǒng)計(jì)精度,適合于所有生態(tài)位特征的最優(yōu)模型算法并不存在[9]。組合物種分布模型提供了一個(gè)更加合理的模型建模方案。其理論基礎(chǔ)是:?jiǎn)我荒P退惴ú荒茉谒星闆r下都能夠得到最優(yōu)結(jié)果,所有的模型算法都有缺陷,但可以提供有用信息。大多數(shù)現(xiàn)有研究已經(jīng)表明,通過(guò)集合模型,物種分布預(yù)測(cè)的準(zhǔn)確性可以顯著提高[33]。
圖4 組合模型結(jié)果Figure 4 Results of Ensemble Mode
本研究綜合考慮地形、氣候和植被因素等環(huán)境條件對(duì)重要藥材樹(shù)種厚樸適宜生境的影響,研究結(jié)果表明影響厚樸適宜性分布的主要因子是溫度年較差(Bio 7),年平均氣溫(Bio 1),年降水量(Bio 12)以及平均日較差(Bio 2),在本研究中根據(jù)環(huán)境因子響應(yīng)曲線,我們可以得出厚樸適宜生境的Bio7 范圍為 25~30 ℃,Bio1 的范圍為 10~21 ℃,Bio12 的范圍為 1 000~2 000 mm,Bio2 的范圍為 Bio2<9 ℃,這些因子范圍描述了溫暖濕潤(rùn),且氣溫具有季節(jié)性變化特征的溫帶以及亞熱帶氣候條件。前人研究表明,厚樸喜光,性喜涼爽、潮濕的氣候,宜生于霧氣重,相對(duì)濕度較大的地方。分布區(qū)年平均溫度10~20 ℃,1月平均溫度3~9 ℃,年降雨量800~1 800 mm 最優(yōu)為1 400 mm[15-16],本研究的有結(jié)果與前人研究相符,也說(shuō)明了模型的合理性。
本研究基于BIOMOD 平臺(tái)構(gòu)建了9 種單物種分布模型,但是基于模型的統(tǒng)計(jì)學(xué)精度以及空間表現(xiàn)我們可以看出,模型的不確定性確實(shí)存在,統(tǒng)計(jì)學(xué)精度較高的模型空間表現(xiàn)不一定最好,如在本研究中的MARS 模型的統(tǒng)計(jì)學(xué)精度較高,但是空間表現(xiàn)都一般??梢源_切的得出結(jié)論的是:傳統(tǒng)的包絡(luò)模型SRE 模型效果最差,模型結(jié)果無(wú)法給出分布細(xì)節(jié),精度較低。以GLM 和CTA 為代表的傳統(tǒng)回歸模型和分類模型在厚樸適宜生境分布時(shí)效果一般,而以GBM、RF 為代表的復(fù)雜機(jī)器學(xué)習(xí)模型能帶來(lái)更好的模擬效果。本研究再一次證實(shí)了不存在適應(yīng)于所有建模條件的最優(yōu)模型,集成多模型結(jié)果的組合物種分布模型能夠在一定程度了減少模型的不確定性,增加模型的精度。
四川農(nóng)業(yè)大學(xué)學(xué)報(bào)2019年4期