李宇宸,張 軍**,張 萍,薛宇飛,李 雁,陳 晨
(1.云南大學(xué) 地球科學(xué)學(xué)院,云南 昆明 650500;2.高分辨率對地觀測系統(tǒng)云南數(shù)據(jù)與應(yīng)用中心,云南 昆明 650118)
三七(Panax notoginseng),又名血參、金不換等,是五加科人參屬(Panax)多年生草本植物,有“南方人參”之稱[1].其化學(xué)成分中含有三萜皂苷、黃酮、多糖、氨基酸等重要生物活性成分[2],主要藥理作用包括抗腫瘤、提高免疫力、治療心血管疾病等[3].隨著國內(nèi)外市場對中藥材產(chǎn)品認(rèn)可度的不斷增加,中藥材特色產(chǎn)業(yè)得到長足發(fā)展.但傳統(tǒng)中藥資源調(diào)查的手段多以卷尺、PDA 實地踏查為主,這些方法效率低、統(tǒng)計途徑粗糙、時效性較差.蒙麥俠等[4]應(yīng)用3S 技術(shù)調(diào)查了陜西省宜川縣野生中藥資源,僅針對所存野生中藥資源的種類、位置,不包含具體分布、面積和產(chǎn)量信息.遙感技術(shù)通過觀測地表反射或地物自身輻射的電磁波信號,從而進行分析、判讀地表的目標(biāo)和多種地學(xué)現(xiàn)象,具有快速、方便、經(jīng)濟等特點且已廣泛的應(yīng)用于林牧業(yè)[5-6].高文文等[7]應(yīng)用遙感技術(shù)對2000—2015 年南水北調(diào)中線水源區(qū)的森林動態(tài)變化情況進行監(jiān)測,發(fā)現(xiàn)森林面積與森林植被覆蓋度顯著增加,同時森林面積的增加也對水源區(qū)的空氣凈化、森林保護及生物多樣性的保護等方面起到促進作用.但是,遙感技術(shù)針對草本中草藥種植信息方面應(yīng)用卻很少.森巴提·巴合都拉[8]應(yīng)用多源遙感衛(wèi)星數(shù)據(jù)對比分析了新疆特色中草藥的遙感解譯效果,發(fā)現(xiàn)傳統(tǒng)分類算法在草本藥材分類提取過程精度較低.李煜[9]應(yīng)用GF-6 號基于光譜信息針對中草藥與小麥做了鑒別,發(fā)現(xiàn)實地踏勘數(shù)據(jù)對草本藥材的分類結(jié)果影像較大.史婷婷等[10]應(yīng)用國產(chǎn)GF-1 衛(wèi)星作為數(shù)據(jù)源,估測云南省文山州三七種植面積,發(fā)現(xiàn)文山州三七種植面積的提取精度直接受限于遙感影像的分類精度,提取精度有待提高.戴晨曦等[11]應(yīng)用多時相Landsat 系列數(shù)據(jù),針對文山州分析了三七種植的空間分布及面積變化情況.但是,數(shù)據(jù)源精度以及數(shù)據(jù)陰影問題影響了三七種植面積的提取精度.后續(xù)學(xué)者張飛等[12]基于無人機影像及衛(wèi)星遙感影像對洛寧縣丹參和艾草種植面積估算的研究,受限于混合象元及分類算法問題,在艾草的提取方面仍存在較大誤差.
由于以上應(yīng)用遙感技術(shù)提取草本中草藥信息數(shù)據(jù)源本身及提取算法等問題,均在數(shù)據(jù)提取過程造成了不可避免的誤差.此外,與遙感影像監(jiān)督分類方法不同,因卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)不需要過度人為參與特征選擇,僅通過算法自動學(xué)習(xí)、總結(jié)逐層提取海量特征參數(shù),這類特征在分類識別中起到至關(guān)重要的作用[13],CNN 作為新的信息提取算法已在大規(guī)模圖像識別任務(wù)中表現(xiàn)出色[14-15].因此,為實現(xiàn)大范圍、高精度提取草本中藥三七的集中種植面積,本文選擇基于Sentinel-2 衛(wèi)星遙感影像數(shù)據(jù)及實地調(diào)查走訪提取三七種植面積,并結(jié)合CNN 探究其分布規(guī)律,可為當(dāng)?shù)氐闹兴庂Y源保護和利用提供決策支持,對于合理開發(fā)和利用中藥資源具有重要意義,有望為當(dāng)?shù)刂兴庂Y源產(chǎn)業(yè)扶貧政策提供科學(xué)依據(jù).今后應(yīng)積極開展基于多源多時相高分辨率遙感影像的中藥材遙感分類研究,探索更有效的中藥材信息的提取方法.
1.1 數(shù)據(jù)源Sentinel-2 衛(wèi)星發(fā)射于2015 年6 月,攜帶一個多光譜成像儀(Multispectral Image,MSI),擁有13 個光譜波段,光譜范圍覆蓋可見光、近紅外及短波紅外波段,其輻射分辨率為12 bit,空間分辨率為最高可達10 m.因其重訪周期僅為5 d,可在較短時期內(nèi)獲取研究區(qū)完整無云影像,避免因人為引起的地表覆被改變[16],本文所選擇Sentinel-2影像均為L2A 級別的產(chǎn)品.此外,應(yīng)用于海拔、坡度、坡向的數(shù)字高程模型選自地理空間數(shù)據(jù)云文山州區(qū)域數(shù)據(jù).
野外踏勘數(shù)據(jù)質(zhì)量情況直接關(guān)系到三七種植面積的提取精度,因此在實地樣本信息采集時應(yīng)選擇具有典型性、代表性的純凈像元作為樣本.一般情況下,三七于12 月中下旬至次年1 月中下旬移栽(表1).因此,可在1 月之后進行實地考察,采樣信息包括實地采樣的時間、位置及土地利用類型等信息,本研究文山州種植區(qū)實地采樣時間為2020 年6 月.因為三七喜陰,是一種生態(tài)幅較窄的亞熱帶高山藥用植物,種植對環(huán)境要求具有特殊性,需要比較濕潤的環(huán)境[17],且對光敏感[18],大棚透光需在7%~12%間為宜,否則影響三七產(chǎn)量和質(zhì)量,甚至導(dǎo)致三七死亡[19],因此人工栽培三七栽培多在大棚內(nèi),棚高一般在1.5~1.8 m,覆以黑色薄膜以達到遮光、控制透光率的效果.因此,數(shù)據(jù)采集過程即應(yīng)用GPS 進行三七種植大棚區(qū)域點、線、面進行采樣,共計樣本200 個.然后,對數(shù)據(jù)進行室內(nèi)核驗、可視化并將其位置可視化(圖1).此外,所有研究樣本數(shù)據(jù)將隨機選取70%的典型樣本作為訓(xùn)練樣本,其余30%作為精度驗證樣本.
圖1 研究區(qū)概況Fig.1 Geographic situation of study region
表1 三七提取應(yīng)用數(shù)據(jù)Tab.1 The Sentinel-2 data used in this study
1.2 研究區(qū)概況文山州位于中國西南邊陲的云南省東南部,云貴高原邊緣地帶,地處東經(jīng)103°35′~106°12′,北緯22°40′~24°48′之間,面積31 731.69 km2[20].屬低中山喀斯特地貌.地勢大致為西部、西北部高,向東部、南部傾斜過渡,其氣候變化情況復(fù)雜,因光、溫、水等條件差異大,立體氣候特征明顯.大部地區(qū)冬無嚴(yán)寒,夏無酷暑,春秋長,冬夏短,四季氣候宜人[21].據(jù)統(tǒng)計,文山州境內(nèi)共分布著738 種藥用植物,占云南省藥用植物總種數(shù)的36.16%,其中有41 種藥用植物為文山州所特有[22].其中,因其地理特征的特殊性有利于三七的栽培和種植,文山州成為了中國三七的主要生產(chǎn)區(qū),占全國總產(chǎn)量的90%以上[23].
卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為一類模擬生物神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的網(wǎng)絡(luò),近年來廣泛應(yīng)用于分類信息提取領(lǐng)域.其模型結(jié)構(gòu)主要包括輸入層、卷積層、池化層、全連接層以及輸出層等[24].由于其方法可從原始影像中挖掘出抽象的特征參數(shù),而這些參數(shù)具有泛化應(yīng)用能力,可以克服了遙感分類領(lǐng)域中的一些混合像元、同譜異物的問題,所以可在典型地物識別和提取等任務(wù)中取得較好效果[25].本文基于使用ENVI5.5 中的深度學(xué)習(xí)模塊進行三七種植空間信息提取,整體分類流程如圖2.基于Tensor-Flow 深度學(xué)習(xí)框架下,應(yīng)用CNN 分類算法的UNet 網(wǎng)絡(luò)結(jié)構(gòu)對三七種植大棚信息進行提取,輸入?yún)?shù)定義為R、G、B、NIR 以及3 個紅邊波段(B5、B6、B7),總共7 個波段構(gòu)成的輸入數(shù)據(jù)集[26].首先,根據(jù)需要將選擇的網(wǎng)絡(luò)模型為模型定義為輸入層、4 個卷積層、2 個池化層、全連接層以及最終的輸出層,此外連接卷積層和池化層的激活函數(shù)選擇為ReLU,使得模型的收斂速度維持在一個穩(wěn)定狀態(tài),避免過擬合問題.其次,加入訓(xùn)練樣本和驗證數(shù)據(jù)進行模型訓(xùn)練,訓(xùn)練過程batch 為120,每個batch的patches 為20,共迭代次數(shù)為25 次,其訓(xùn)練過程每個batch 的ACC 在25 次后就達到0.994,LOSS在訓(xùn)練80 次后在0.2 附近波動(圖3).圖4 的結(jié)果表明整個訓(xùn)練數(shù)據(jù)集迭代7 次時ACC 已收斂于0.995,保持著較高的精度,LOSS 收斂于0.201,說明三七大棚信息提取模型訓(xùn)練效果較好,可進一步應(yīng)用于整個研究區(qū)的三七大棚提取.最后,應(yīng)用完成訓(xùn)練的模型進行影像分類,并結(jié)合哨兵數(shù)據(jù)像元為10 m 分辨率數(shù)據(jù),計算提取結(jié)果的面積,根據(jù)野外采樣樣本數(shù)據(jù)集計算混淆矩陣,評價最終分類結(jié)果精度.
圖2 三七種植大棚提取技術(shù)流程圖Fig.2 Flow chart ofpanax pseudoginseng cultivation greenhouse extraction technology
圖3 每組切片的訓(xùn)練值Fig.3 The training value of each group of slices
圖4 訓(xùn)練數(shù)據(jù)集迭代過程Fig.4 The iterative process of training data set
由于三七采用的是人工大棚栽培,整個生長階段均被蔭棚覆蓋,識別三七種植大棚過程中,研究區(qū)范圍影像上呈現(xiàn)局部區(qū)域密集分布的情況[22].
3.1 精度評價應(yīng)用CNN 深度學(xué)習(xí)算法,針對云南文山州三七種植大棚進行高精度提取,其提取結(jié)果局部見圖5.對比實際提取情況發(fā)現(xiàn),在一些細碎的陰影區(qū)域,存在一定程度的混淆,但是面積相對較小.為了定量說明該CNN 分類方法的優(yōu)勢,將野外調(diào)查采集的GPS 數(shù)據(jù)作為分類的真實值.此外,對采用上述分類方法的分類結(jié)果應(yīng)用混淆矩陣的方法進行精度評價,混淆矩陣見表2,驗證結(jié)果見表3.
表2 三七種植提取結(jié)果精度評價混淆矩陣Tab.2 Confusion matrix for evaluating the precision ofPanax notoginseng
表3 三七種植提取精度驗證結(jié)果Tab.3 Validation results ofPanax notoginseng extraction accuracy %
圖5 文山州丘北縣三七蔭棚提取結(jié)果局部區(qū)域?qū)Ρ菷ig.5 Comparison of the local region of the extraction results ofPanax notoginseng shade shed in Qiubei County,Wenshan Prefecture
另外,有研究表明當(dāng)Kappa 系數(shù)小于0.40 時,表明一致性較不理想;當(dāng)Kappa 系數(shù)位于0.40~0.60 時,說明二者一致性效果較一般;當(dāng)Kappa 系數(shù)大于0.60 時,說明參考分類結(jié)果與三七大棚提取結(jié)果二者間一致性較強,分類精度較高.史婷婷等[10]基于決策樹的方法提取三七種植總體精度(Overall Accuracy,OA)為92.24%,對比精度發(fā)現(xiàn)CNN 的提取方式要優(yōu)于決策樹.張飛等[12]基于無人機影像提取中草藥種植的總體精度為86.66%,用戶精度高達97.99%,無人機影像其分辨率較高但僅適宜應(yīng)用于較小研究區(qū).本文提取三七種植總體精度(OA)為95.57%,Kappa 系數(shù)為0.91,說明參考分類結(jié)果與三七大棚提取結(jié)果二者間的一致性較強,提取精度較高,且符合后續(xù)空間分布的分析要求[27-29].具體計算方式如下公式:
式中,xii為第i個類別中分類正確的樣本,x為所有樣本的個數(shù),k為總的分類類別數(shù)目,xi+和x+i分別為混淆矩陣的各行各列的和.
3.2 三七種植空間分布情況
3.2.1 三七種植與海拔的關(guān)系 基于2020 年的三七空間分布數(shù)據(jù)以及30 m 的DEM 數(shù)據(jù),以500 m為海拔梯度間隔,統(tǒng)計三七的空間分布變化與海拔的關(guān)系(表4).結(jié)果表明,文山州三七種植主要分布于海拔1 500~2000 m 和1 000~1 500 m 的范圍內(nèi),分別占三七種植總面積的58.22%和33.97%.有研究表明[30]海拔1 000~2000 m 間最適宜三七生長,2000~2 500 m 和600~1 000 m 為次適宜三七種植區(qū)域.文山州1 000 m 以下有236.61 hm2,占三七種植總面積的2.30%;2000 m 以上有567.18 hm2,占三七種植總面積的5.51%,海拔超過2 500 m 很少有三七分布.
表4 文山州不同海拔等級三七種植面積Tab.4 Planting area ofPanax notoginseng at different altitudes in Wenshan Prefecture
3.2.2 三七種植與坡度的關(guān)系 依據(jù)實地調(diào)研情況并結(jié)合水利部頒發(fā)的中華人民共和國行業(yè)執(zhí)行標(biāo)準(zhǔn)《土壤侵蝕分類分級標(biāo)準(zhǔn)》(SL190—2007)[31],將坡度分為6 個等級(表5).統(tǒng)計分析文山州三七在不同坡度上的種植情況,由表5 可知93.57%的三七種植于坡度25°以下的斜坡上,其余6.43%分布于坡度25°以上的斜坡,原因是三七對土壤水分有特殊要求,喜濕而又怕積水[31],而坡度25°的斜坡排水良好,即可以保證種植區(qū)不會產(chǎn)生積水,同時也方便于三七的種植和管理.
表5 不同坡度等級三七種植面積Tab.5 Planting area ofPanax notoginseng at different slope
3.2.3 三七種植與坡向的關(guān)系 坡向是影響局地小氣候的重要因素,正如降水、光照,坡度對土壤水分含量有重要影響一樣.一般地,由于在北半球非熱帶地區(qū)太陽的位置偏南,南坡所接受的光照要比平地多,其輻射總量和溫度均高于北坡,所以其濕度明顯低于北坡,因此我們常將南坡稱之為“陽坡”.相反的,北坡所接受的輻射量相對較少,溫度均低于南坡,而濕度明顯高于南坡,我們常將北坡稱之為“陰坡”.東坡和西坡的環(huán)境因子介于南、北坡之間,西坡由于一天之內(nèi)接收日照的時間稍微長于東坡,較接近南坡,因此人們常稱西坡為“半陽坡”;反之東坡較接近北坡而被稱為“半陰坡”.據(jù)此,實驗分析過程按照輻射時長,以正北為0°方向,將東、東北、西北坡稱為半陰坡,西、西南、東南坡稱為半陽坡[32].統(tǒng)計不同坡向三七種植面積(表6),發(fā)現(xiàn)平坡很少有三七種植,僅占三七種植總面積的0.82%,之后為陰坡和陽坡,三七種植面積分別為13.61%和15.16%.最多的為半陰坡和半陽坡總共有70.40%.分析其原因發(fā)現(xiàn),光照強度是影響三七皂苷含量的主導(dǎo)生態(tài)因子,10%~15%的光照強度是三七生長適宜光照范圍,而30%的光照強度是三七承受極限,因此選擇半陰坡和半陽坡,可以在保證光照時長的同時,利用坡向避免高強度光照強度導(dǎo)致的三七常見的病癥黑斑病、根腐病進而導(dǎo)致高死苗率[14].
表6 不同坡向三七種植面積Tab.6 Planting area ofPanax notoginseng at different aspect
3.2.4 三七種植與空間分布的關(guān)系 從研究區(qū)內(nèi)三七種植面積上分析其空間分布情況(圖6).2020 年文山州三七種植總面積為10 288.5 hm2,文山州西北部各縣,即丘北縣、硯山縣、文山市、廣南縣分別擁有3 379.62、2 769.65、1 779.72 hm2和912.00 hm2.此區(qū)域的三七種植面積分布明顯多于文山州其它區(qū)域,馬關(guān)縣、西疇縣、富寧縣、麻栗坡縣等縣境內(nèi)分別分布有441.6、313.25、96.14 hm2和596.52 hm2.分析其分布原因發(fā)現(xiàn),西北部各縣地勢平坦,海拔介于1 400~2 000 m 之間.此海拔范圍為三七的最適種植區(qū)域以及生產(chǎn)基地[33].因為文山州地處北回歸線附近地區(qū).太陽輻射量的年際變化小,因而年溫差變化不顯著.有學(xué)者研究表明夏季氣溫不超過35 ℃,文山州西北部地區(qū)夏季溫度波動在13~22 ℃之間,冬季溫度則在0~15 ℃之間波動.因海拔高導(dǎo)致該地區(qū)大氣層厚度相對較薄,大氣保溫性差,造成日溫差變幅大的特點,所以形成了年溫差小而日溫差大的雙重特點,有利于三七主要成分多糖的積累,因此1 400~2 000 m 海拔范圍對產(chǎn)出優(yōu)質(zhì)三七形成十分有利的地理條件[30].綜上,文山州的西北部在溫度、海拔以及地勢方面適宜三七生長,因此三七種植較為集中.而在文山州東南部,此區(qū)域地勢起伏,難以發(fā)展大規(guī)模種植,因此種植區(qū)分布較少且零散.
圖6 文山州各縣空間分布情況Fig.6 Spatial distribution of counties in Wenshan Prefecture
(1)本文應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)算法針對三七種植蔭棚進行提取,提取的總體精度為95.57%,Kappa系數(shù)為0.91.雖然本文的方法對地表細碎陰影區(qū)域與三七種植蔭棚存在少部分的混淆,但總體提取方法的應(yīng)用效果較好,具有較高的實際應(yīng)用價值.
(2)2020 年文山州三七種植面積為1.03×104hm2.依據(jù)行政區(qū)劃分析,85.93%分布于文山州西北部,14.07%分布于文山州東南部分;依據(jù)坡度分析,93.57%的三七種植于25°以下的斜坡上;依據(jù)坡向分析,70.40%的三七分布于半陽坡和半陰坡.
由于三七栽培對環(huán)境要求較高,需隔8 年才能在同一地塊上栽培,而公眾日益增長的健康要求以及中藥材品質(zhì)升級無公害行動計劃的提出,三七產(chǎn)量目前還遠遠滿足不了產(chǎn)業(yè)的需求.因此,合理規(guī)劃三七科技產(chǎn)業(yè)發(fā)展成為行業(yè)的需要,同時也為三七生產(chǎn)優(yōu)質(zhì)藥材奠定基礎(chǔ).所以,本文所得結(jié)果對中國相關(guān)中草藥監(jiān)管部門對三七種植及相關(guān)產(chǎn)業(yè)未來政策的制定、規(guī)劃及實施具有重要指導(dǎo)意義,同時也可為類似中藥材相關(guān)信息提取提供依據(jù).