潘雅楠,張虹,2,章鵬飛,裴蘇婷,范建友,劉守金,2
1.安徽中醫(yī)藥大學(xué)藥學(xué)院,安徽 合肥 230013; 2.安徽省中醫(yī)藥科學(xué)院中藥資源保護(hù)與開發(fā)研究所,安徽 合肥 230013; 3.霍邱縣中醫(yī)院,安徽 霍邱 237400
杠板歸為蓼科蓼屬植物杠板歸Polygonum perfoliatumL.的干燥地上部分,具有清熱解毒、利水消腫、止咳功效,用于咽喉腫痛、肺熱咳嗽、小兒頓咳、水腫尿少、濕熱瀉痢、濕疹、癤腫和蛇蟲咬傷[1]。杠板歸生長對土壤要求不高,且分布廣泛,野生資源豐富,但隨著市場需求增加,僅靠野生自然資源已難以滿足市場需求[2-3]。
近幾年,物種分布模型在國內(nèi)外物種分布預(yù)測中應(yīng)用廣泛,其利用物種分布數(shù)據(jù)和相關(guān)環(huán)境變量,根據(jù)一定的算法可預(yù)測物種潛在分布區(qū)。物種分布模型種類眾多,在通過已知分布位點(diǎn)預(yù)測潛在分布區(qū)方面,最大熵(MaxEnt)模型較其他模型有更好的性能表現(xiàn)[4]。本研究采用MaxEnt模型篩選影響杠板歸分布的主要環(huán)境變量,通過杠板歸樣點(diǎn)分布數(shù)據(jù)和主要環(huán)境因子找出其概率分布的MaxEnt,預(yù)測適宜分布區(qū),旨在為科學(xué)利用杠板歸野生資源,以及合理布局杠板歸栽培用地提供理論依據(jù)。
1.1.1 地理分布信息
用于模型構(gòu)建的杠板歸地理分布數(shù)據(jù)主要來自中國數(shù)字植物標(biāo)本館(http://www.cvh.org.cn/),包括全國第四次中藥資源普查的部分野外調(diào)查數(shù)據(jù),共計(jì)2 976條相關(guān)信息。
1.1.2 環(huán)境因子
選取氣候、土壤、地形和植被類型四大類共55個(gè)變量作為影響杠板歸地理分布的環(huán)境因子。環(huán)境因子數(shù)據(jù)來源于“中藥資源空間信息網(wǎng)格數(shù)據(jù)庫”(http://www.tcm-resources.com/)。氣候類型數(shù)據(jù)43個(gè),包括12個(gè)月的月降水量和月平均氣溫,以及19個(gè)綜合氣候因子;土壤類型數(shù)據(jù)8個(gè),包括酸堿度(pH值)、土壤的陽離子交換能力、土壤含沙量、土壤含黏土量、土壤亞類、土壤有效水含量等級、土壤質(zhì)地分類和有機(jī)碳含量;地形數(shù)據(jù)3個(gè),包括海拔、坡度、坡向;植被類型數(shù)據(jù)1個(gè),為植被亞類。將環(huán)境因子數(shù)據(jù)導(dǎo)入ArcGIS軟件進(jìn)行預(yù)處理,并利用conversion工具轉(zhuǎn)換為ASCII格式備用。
1.1.3 分析軟件
利用MaxEnt3.3.3軟件(www.cs.princeton.edu/~ schapire/MaxEnt)構(gòu)建杠板歸地理分布與環(huán)境因子關(guān)系的模型,在ArcGIS軟件中加載模型運(yùn)算結(jié)果,利用ArcMap10.2制圖。
1.1.4 地圖數(shù)據(jù)
本研究所用中國地圖國界矢量圖及中國行政區(qū)劃圖來源于國家基礎(chǔ)地理信息系統(tǒng)網(wǎng)站(http://nfgis. nsdi.gov.cn/),分辨率1∶400萬。
1.2.1 地理分布信息預(yù)處理
篩選重復(fù)分布信息,去除只到區(qū)或鄉(xiāng)的不具體信息及不準(zhǔn)確地名,相近地理分布信息(位于相同區(qū)/鄉(xiāng)的數(shù)個(gè)地理分布信息)只保留1個(gè),最終獲得用于軟件分析的地理分布信息476條,地理分布情況見圖1。將分布點(diǎn)的經(jīng)緯度信息按照MaxEnt軟件格式要求轉(zhuǎn)換成植物名、經(jīng)度和緯度三列表并保存為.csv格式備用。
圖1 杠板歸全國樣點(diǎn)分布
1.2.2 模型建立和環(huán)境因子篩選
建立MaxEnt模型構(gòu)建杠板歸地理分布與環(huán)境因子之間的關(guān)系。設(shè)置模型參數(shù),選擇響應(yīng)曲線用于反映環(huán)境因子適宜度范圍,刀切法用于評價(jià)環(huán)境因子的重要性,隨機(jī)選取用于測試集的杠板歸分布數(shù)據(jù)占25%,訓(xùn)練集的數(shù)據(jù)占75%,最大迭代次數(shù)為106,其他參數(shù)為軟件默認(rèn)值。將ASCII格式的55個(gè)環(huán)境因子及.csv格式的杠板歸地理分布數(shù)據(jù)導(dǎo)入MaxEnt軟件進(jìn)行運(yùn)算,輸出類型為Logistic。根據(jù)模型運(yùn)算結(jié)果,去除貢獻(xiàn)率為0的環(huán)境因子,多次運(yùn)算直至結(jié)果中無貢獻(xiàn)率為0的變量。由于氣候變量之間存在交叉或潛在相關(guān)等不同程度相關(guān)性,最終需綜合考慮刀切法和貢獻(xiàn)率結(jié)果,篩選出影響杠板歸地理分布的主導(dǎo)環(huán)境因子。
1.2.3 模型精確度評價(jià)
采用受試者工作特征(ROC)曲線驗(yàn)證模型靈敏度和特異率,以曲線下面積(AUC)為精確度評價(jià)指標(biāo)。0.5≤AUC<0.6表明模型結(jié)果失敗,0.6≤AUC<0.7結(jié)果較差,0.7≤AUC<0.8結(jié)果一般,0.8≤AUC< 0.9結(jié)果良好,0.9≤AUC<1.0結(jié)果極好。
1.2.4 適宜分布區(qū)預(yù)測
根據(jù)MaxEnt模型模擬運(yùn)算杠板歸分布最終結(jié)果,將該結(jié)果ASCⅡ格式文件導(dǎo)入ArcGIS軟件與中國地圖疊加,用conversion工具完成格式轉(zhuǎn)換,再對轉(zhuǎn)換并加載的圖層進(jìn)行切割處理,最終獲得杠板歸分布概率區(qū)劃圖。杠板歸適宜分布區(qū)根據(jù)適生指數(shù)(P值)分為4個(gè)等級:P<0.05為非適生區(qū),0.05≤P<0.25為低度適生區(qū),0.25≤P<0.5為中度適生區(qū),0.5≤P< 1.0為高度適生區(qū)。
經(jīng)多次運(yùn)算,杠板歸生態(tài)分布模型均AUC>0.9,篩選貢獻(xiàn)率為0的變量后,得到最終ROC曲線(見圖2)。訓(xùn)練集AUC=0.955,測試集AUC=0.931,結(jié)果表明模型精確度極好,可信度高。
圖2 杠板歸分布預(yù)測模型ROC曲線
將55個(gè)環(huán)境因子導(dǎo)入模型,依次運(yùn)算7次去除貢獻(xiàn)率為0的變量后,最終剩余25個(gè)環(huán)境因子。各環(huán)境因子貢獻(xiàn)率從高到低排序見表1,選取貢獻(xiàn)率≥2%的環(huán)境因子;刀切圖結(jié)果見圖3,選取各變量獨(dú)立訓(xùn)練增益>1.4的變量。綜合取兩者都較高的環(huán)境因子作為影響杠板歸地理分布的主導(dǎo)環(huán)境因子:最濕月降水量、年均降水量、6月份降水量、11月份降水量、最濕季降水量、9月份平均氣溫、植被亞類。7個(gè)主導(dǎo)環(huán)境因子的貢獻(xiàn)率之和為77.6%。
表1 影響杠板歸分布各環(huán)境因子的貢獻(xiàn)率
圖3 杠板歸分布預(yù)測模型刀切圖
ArcGIS軟件加載MaxEnt模型預(yù)測結(jié)果顯示,杠板歸潛在分布區(qū)橫縱跨度均較大,氣候類型包括溫帶季風(fēng)氣候、亞熱帶季風(fēng)氣候及熱帶季風(fēng)氣候,適宜分布區(qū)主要在東北平原、華北平原、長江中下游平原和四川盆地,高度適生區(qū)主要為福建、浙江、江西、重慶、廣東(除南部)、湖南(除東部)、廣西北部、貴州北部、湖北西部、安徽南部、陜西南部、江蘇南部,中度適生區(qū)主要為廣東南部、廣西中部和西部、云南中部、貴州中部和南部、四川西部、湖南東部、湖北北部、河南南部、安徽中部、山東南部和東部、河北東北部、遼寧南部和東部、西藏東南部。高度適生區(qū)及中度適生區(qū)均適宜開展杠板歸的高產(chǎn)、高效栽培。分布區(qū)劃見圖4。
圖4 杠板歸適宜分布區(qū)劃
本研究采用MaxEnt軟件構(gòu)建杠板歸地理分布模型,ROC曲線訓(xùn)練集AUC值為0.955,顯示模型預(yù)測結(jié)果極好,可以較準(zhǔn)確反映杠板歸適宜分布情況。但預(yù)測結(jié)果不代表實(shí)際分布,首先,模型運(yùn)算隨機(jī)選取測試集可能存在誤差,ROC曲線只能在一定程度上反映模型精確度;其次,本研究收集的樣點(diǎn)分布信息不完全準(zhǔn)確,部分地理分布信息非近年更新,可能已發(fā)生變動。另外,物種生態(tài)分布除受環(huán)境因子影響外,還包括生物因子和人為因素,如田間及果園內(nèi)的杠板歸常作為惡性雜草被根除。因此,本研究模型預(yù)測結(jié)果僅為實(shí)際分布提供參考。
對比《中國植物志》[5]、樣本分布位點(diǎn)與模型預(yù)測結(jié)果,三者的杠板歸地理分布范圍高度吻合,然而,《中國植物志》記載的黑龍江、吉林、遼寧、河北、山東、河南、甘肅、四川、臺灣、海南等地雖有分布,但并非其適宜分布區(qū)。預(yù)測結(jié)果中,貴州適宜分布區(qū)范圍與譚濟(jì)蒼等[2]研究結(jié)果一致,但預(yù)測位置更廣,除黔東北及黔北區(qū)域,還包括黔東、黔西北及黔中部分地區(qū)。另外,《中國植物志》及樣本分布位點(diǎn)未涉及區(qū)域(如西藏、山西),模型預(yù)測結(jié)果中也有分布,說明該分布模型可在已知分布基礎(chǔ)上預(yù)測潛在分布。
本研究結(jié)果表明,影響杠板歸生態(tài)分布的關(guān)鍵因子主要為氣候因子而非地形或土壤因子,推測與杠板歸分布范圍廣、海拔跨度大、對土壤要求不高等有關(guān)。本研究最終選取主導(dǎo)環(huán)境因子均為降水量、氣溫和植被類型,可能緣于杠板歸的生物學(xué)特性——適宜光照、水分充足的溫暖環(huán)境,年均溫度12~16.5 ℃,年均降水量775~1 400 mm,生長范圍內(nèi)植被類型單一,植被豐富的原始森林或茂密的次生林少有分布[2-3]。有研究表明,杠板歸種植最適宜區(qū)年均降水量為843.4~954 mm[2],低于杠板歸生長的平均水平,說明降水量過多不利于杠板歸生長。杠板歸花期6-8月,多數(shù)種子于9月下旬至10月成熟落地,6月份降水量和9月份平均氣溫對杠板歸種子發(fā)育和成熟有至關(guān)重要的影響,11月份降水量則決定種子存活率。 基于上述研究結(jié)果,為促進(jìn)杠板歸高產(chǎn)、高效栽培,建議選擇高度適生的福建等地,栽培應(yīng)注意幼苗期除草,保證結(jié)實(shí)期陽光及水分充足,做好排水工作,避免積水。另據(jù)何瑾等[6]研究結(jié)果,杠板歸藥材質(zhì)量與產(chǎn)地有關(guān),應(yīng)當(dāng)注意環(huán)境因子與藥材質(zhì)量關(guān)系。本研究結(jié)果所得杠板歸的適宜分布區(qū)是否能同時(shí)保證杠板歸藥材質(zhì)量,可結(jié)合不同產(chǎn)地栽培杠板歸的有效成分含量開展進(jìn)一步研究。