亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于高光譜數(shù)據(jù)的高寒草甸主要毒草分類技術研究

        2022-01-24 07:17:38董瑞周睿唐莊生周建偉葉國輝楚彬花立民
        草原與草坪 2021年6期
        關鍵詞:分類植物模型

        董瑞,周睿,唐莊生,周建偉,葉國輝,楚彬,花立民

        (甘肅農(nóng)業(yè)大學草業(yè)學院,草業(yè)生態(tài)系統(tǒng)教育部重點實驗室,甘肅省草業(yè)工程實驗室,中-美草地畜牧業(yè)可持續(xù)發(fā)展研究中心,甘肅 蘭州 730070)

        草地毒草化是天然草地典型的草地退化現(xiàn)象[1],不僅加劇了草畜矛盾,而且嚴重威脅草地生物多樣性[2-3]。近年來,由于全球氣候變暖、過度放牧等因素的多重影響,我國天然草地毒草化日益嚴重。據(jù)統(tǒng)計,目前我國毒草化天然草地面積約4.504×107hm2,約占天然草地總面積的11.3%[4],僅青藏高原毒草分布面積就占毒草總面積的77%[5]。2007-2009年,全國每年因毒草中毒的牲畜為2.109×106頭(只)、死亡8.404×105頭(只),經(jīng)濟損失6.723×108元[1]。因此,積極開展天然草原毒草防治是提高草地生產(chǎn)力、維護畜牧業(yè)經(jīng)濟健康發(fā)展的重要任務之一。

        快速、準確地獲取毒草種類、分布及面積是毒草防治的前提和關鍵。目前天然草地毒草調(diào)查方法常采用人工實地調(diào)查。人工調(diào)查具有較高的準確率,但是存在調(diào)查點少,代表性差,以及需要較多的人力投入等問題[6-7]。與地面調(diào)查技術相比,衛(wèi)星遙感技術具有覆蓋范圍廣、速度快和時效高等特點,特別是高光譜技術的出現(xiàn)和快速發(fā)展,為地物識別、植被類型劃分乃至植物物種識別提供了一種高效快速和大面積應用的新途徑[8-9]。盡管高光譜具有分辨率高、信息豐富、圖譜合一等特點[10],但是,衛(wèi)星高光譜遙感由于傳感器分辨率低、空間位置高、解譯困難等因素,很難實現(xiàn)復雜背景下植物識別與分類。近年來,利用實地近距離獲取植物高光譜數(shù)據(jù)并分析植物高光譜反射特征,不但可以為無人機低空遙感識別植物物種提供技術支撐,也可為衛(wèi)星遙感監(jiān)測毒草種類、分布等提供基礎數(shù)據(jù)。因此,實地近距離高光譜植物物種識別技術是當前遙感學、生態(tài)學等研究的熱點之一。

        基于高光譜的植物識別與分類模型建立主要有兩個關鍵的步驟,1)高光譜數(shù)據(jù)的降維,即光譜特征參數(shù)的篩選;2)分類識別算法的選擇。高光譜數(shù)據(jù)降維的方法主要有主成分分析(Principal Component Analysis,PCA)、線性判別分析(Linear Discriminant Analysis,LDA)、局部線性嵌入(Locally linear embedding,LLE)等。相比其他方法,PCA具有緩解維度災難、壓縮數(shù)據(jù)、降低數(shù)據(jù)結構等特點[11],是目前常用的降維方法。篩選適宜的分類算法對于物種識別的準確性、效率具有重要意義。目前,分類識別算法很多,在農(nóng)田雜草、森林樹種和濕地植物等方面各具特色和優(yōu)點[12-14]。祖琴等[15]采用簇類的獨立軟模式(SIMCA)方法對甘藍與雜草進行分類,識別率高達98.6%。臧卓等[16]運用3種數(shù)學變換方法對原始數(shù)據(jù)預處理,選擇基于徑向基核函數(shù)(SVM-RBF)和線性核函數(shù)的支持向量機(SVM-Linear)、BP神經(jīng)網(wǎng)絡、Fisher分類法等4種算法對喬木樹種進行分類,識別精度能夠達到98.33%。但是目前利用高光譜成像技術,針對高寒草甸毒草的分類識別方法研究相對較少。

        本研究以高寒草甸主要毒草為研究對象,野外采集青藏高原高寒草甸主要毒草光譜數(shù)據(jù),利用機器學習方法建模分類,篩選適用于高寒草甸主要毒草識別分類的模型,以期快速、準確了解草地植物群落中各物種組成變化,為實現(xiàn)草地健康狀況評價、監(jiān)測草地退化與防治恢復提供一種新的研究方法[17]。

        1 材料和方法

        1.1 研究區(qū)概況

        本研究選擇祁連山東緣天祝藏族自治縣抓喜秀龍鄉(xiāng)和青藏高原東部瑪曲縣為研究區(qū)。天祝藏族自治縣抓喜秀龍鄉(xiāng)地理位置為E 102°07′~103°46′,N 36°31′~37°55′ N,海拔2 878~3 425 m,年均溫-0.1 ℃,降水量416 mm。植被類型為高寒草甸,以莎草科、禾本科植物為優(yōu)勢種,伴生種以闊葉類雜草與毒草為主,主要植物有垂穗披堿草(Elymusnutans)、冷地早熟禾(Poacrymophlia)、矮嵩草(Kobresiahumilis)、珠芽蓼(Polygonumviviparum)、鵝絨委陵菜(Potentillaanserina)、黃花棘豆(Oxytropisochrocephala)、露蕊烏頭(Aconitumgymnandrum)、瑞香狼毒(Stellerachamaejasme)、碎米蕨葉馬先蒿(Pedicularischeilanrthifolia)等?,斍h地理位置為E 104°45′45″~102°29′00″,N 33°06′30″~34°30′15″,年均溫1.2 ℃,無霜期20 d,年均日照時數(shù)2 631.9 h。同樣以莎草科、禾本科植物為優(yōu)勢種,伴生種以闊葉類雜類草與毒草為主,主要植物有垂穗披堿草、紫花針茅(Stipapurpurea)、早熟禾(P.annua)、鵝絨委陵菜、黃帚橐吾(Ligulariavirgaurea)、長毛鳳毛菊(Saussureahieracioides)等。

        1.2 光譜圖像采集

        光譜數(shù)據(jù)采集使用高光譜成像光譜儀SOC710VP(美國SOC公司),光譜在400~1 000 nm,分辨率4.68 nm,采樣間隔為1.4 nm,波段數(shù)為128個。高光譜數(shù)據(jù)野外采集時間為2020年7月10-12日11∶00-14∶00(太陽高度角>45°)。選擇晴朗無云、無風或者少風(風力<4級)時進行數(shù)據(jù)采集。每隔20 min進行一次白板優(yōu)化校正。測量時鏡頭垂直向下,距離植物冠層垂直高度為0.5 m。為保證采集植物數(shù)據(jù)的準確性,每種植物采集不少于20幅影像,共獲取11種毒草光譜數(shù)據(jù)。野外調(diào)查毒草信息詳見表1,毒草選擇主要依據(jù)《中國西部天然草地毒害草的主要種類及分布》[1]。

        表1 主要有毒草植物類型

        1.3 原始光譜反射值提取

        使用儀器自帶軟件SRAnal710進行反射率轉換。從每張光譜圖像中分別提取3個植物純凈像元光譜數(shù)據(jù)作為原始數(shù)據(jù)(圖1)。

        圖1 11種毒草原始平均光譜反射曲線

        1.4 數(shù)據(jù)處理方法

        1.4.1 預處理 為尋找光譜數(shù)據(jù)分類11種毒草的最佳數(shù)學變換方法,本研究采用多項式卷積平滑法[Savitzky-Golay Smoothing,SG(R)]濾波對原始數(shù)據(jù)進行平滑降噪處理[18],后進行一階微分導數(shù)[First order differential reflectance,FDR(dr1)]變換、二階微分導數(shù)[Second order differential reflectance,SDR(dr2)]變換、歸一化[Normalized,Nr(R)]變換、均值中心化[Mean centralization,MC(R)]變換、對數(shù)log(R)變換對樣本數(shù)據(jù)進行預處理[14]。為比較不同預處理方法的光譜特征變化情況,對11種毒草原始光譜數(shù)據(jù)取其平均值進行分析。

        1.4.2 降維 采用PCA對6種數(shù)學變換光譜數(shù)據(jù)降維[19]。主成分是原始數(shù)據(jù)的多個變量經(jīng)線性組合得到。由于各個主成分之間是正交,需要根據(jù)方差大小進行排序,即方差最大的為第一主成分(PC1),次之的為第二主成分(PC2),以此類推[20]。

        1.4.3 機器學習分類 以主成分個數(shù)為自變量,分類精度為因變量。選擇5種統(tǒng)計分類方法隨機森林(Random Forest,RF)、支持向量機-徑向基核函數(shù)(Support Vector Machine-Radial Basis Function,SVM-RBF)、K臨近分類(K-nearest neighbor,Knn)、樸素貝葉斯(Naive Bayesian,NB)和決策樹(Decision Tree,DT)進行分類識別效果對比研究[21-23]。樣本數(shù)據(jù)按照2/3和1/3的比例劃分為建模集和預測集,其中建模數(shù)據(jù)和預測數(shù)據(jù)隨機從樣本數(shù)據(jù)中抽取,數(shù)據(jù)劃分情況詳見表2。

        表2 分類數(shù)據(jù)集劃分

        1.4.4 精度評價方法 使用混淆矩陣對分類精度計算,對角線上的元素值為正確分類數(shù),值越大表示分類結果的可靠性越高,反之則分類錯誤的現(xiàn)象嚴重[24]?;诨煜仃嚇嫿ㄖ械目傮w精度定義如下:

        (1)

        式中:n為總的預測數(shù)據(jù)個數(shù);xii為i類別正確分類物種個數(shù)。

        1.4.5 分析軟件 數(shù)據(jù)數(shù)學變換在Matlab R2018b中完成,使用R進行PCA降維及模型訓練與精度評價,以Graphpad軟件完成數(shù)據(jù)分析。

        2 結果與分析

        2.1 原始光譜數(shù)據(jù)不同數(shù)學方法變換

        對原始光譜數(shù)據(jù)進行平滑處理后,發(fā)現(xiàn)對數(shù)變換在400~650 nm波段11種毒草光譜特征區(qū)分度最大(圖2),其中在400~490 nm波段,只有3種毒草(葵花大薊,露蕊烏頭和乳白香青)反射值差異較大。而在660 nm波段附近,11種毒草光譜反射值在波谷區(qū)分度較大。歸一化變換處理的曲線與平滑光譜曲線走勢基本一致,但歸一化變換處理在540、745 nm波段附近,毒草光譜反射值區(qū)分度較平滑光譜反射值大,而在780~1 000 nm波段,平滑反射值比歸一化變換反射值大。一階微分和二階微分變換11種毒草光譜反射值區(qū)分度較小,但波峰、波谷個數(shù)增加。均值中心化變換雖然增大了光譜反射值區(qū)分度,但反射曲線變得無規(guī)律。

        圖2 數(shù)學變換處理后的11種毒草平均光譜反射曲線

        2.2 PCA降維

        經(jīng)數(shù)學變換處理后對數(shù)據(jù)進行主成分降維處理。選取前36個主成分進行分析(第36個主成分的累計方差貢獻率接近于100%),以主成分累計方差貢獻率(圖3)作為降維效果。log(R)、SG(R)、Nr(R)、dr1(R)、dr2(R)、MC(R)PC1和PC2累計方差貢獻率分別為92.61%、91.81%、75.67%、52.52%、40.74%、88.39%,其中l(wèi)og(R)、SG(R)、MC(R)PC1和PC2累計方差貢獻率大于85%,包含11種植物主要分類特征信息。

        圖3 PCA降維后的累計方差貢獻率

        2.3 基于機器學習方法的5種分類模型的植物分類精度比較

        經(jīng)PCA降維后使用5種機器學習分類算法進行精度評價,以混淆矩陣計算主成分疊加總體精度繪制分類精度曲線(圖4)。對數(shù)變換處理5種分類模型分類精度最高,總體分類精度SVM-RBF>RF>NB>Knn>DT,SVM-RBF最高分類精度達到99.35%。主成分個數(shù)累積到8個時,分類精度基本達到最大,說明使用前8個主成分對所研究11種植物具有較好的分類效果。二階微分變換5種模型分類精度最低,其他3種數(shù)學變換分類精度為一階微分>歸一化>均值中心化。其中,在所有數(shù)學變換處理中,DT分類模型精度最低,Knn分類模型穩(wěn)定性最差。

        圖4 主成分個數(shù)與分類精度關系

        3 討論

        3.1 數(shù)學變換對植物光譜曲線的影響

        高寒草甸是青藏高原最主要的草地類型,其草地物種多樣性、生產(chǎn)力波動都極大地受到毒草種類和數(shù)量的影響[5,25]。理論上講,可利用植物光譜的不同反射值進行毒草物種分類。但是,綠色植物光譜反射曲線走勢、高低基本一致[26]。因此必須對原始光譜數(shù)據(jù)進行預處理。本研究對原始光譜數(shù)據(jù)進行數(shù)學變換,一方面可消除外界因素的影響,另一方面可增大植物反射光譜曲線間的差異[27]。使用便攜式野外高光譜成像儀,在圖像采集時因外界噪聲影響導致光譜曲線出現(xiàn)抖動現(xiàn)象,而SG(R)可以明顯減少抖動現(xiàn)象[17],保留了11種毒草原始光譜曲線特征。光譜圖像采集的準確性受到光照強度、土壤背景、大氣和植物生長環(huán)境影響。本文采樣區(qū)位于高海拔地區(qū),因采樣不是同時完成,光照強度、大氣環(huán)境導致光譜數(shù)據(jù)產(chǎn)生差異,而dr1(R)處理可消除部分光照、土壤背景和大氣的影響,使得光譜曲線最大、最小位置特征凸顯出來[28]。拍攝毒草生長在草地中和裸地上,因復雜的生長環(huán)境,導致圖像采集過程中,受到附近植物光線遮擋和裸地背景的影響,光譜圖像出現(xiàn)過暗、過亮問題。安如等[29]采用log(R)、dr2(R)處理消除了這些影響,同時增加了光譜曲線間峰谷特征差異,使得植物光譜反射曲線在log(R)處理下可進行分類[30]。另外,高海拔地區(qū)可能空氣中存在氣溶膠,光透過會產(chǎn)生不均勻現(xiàn)象,造成同一地物反射率產(chǎn)生差異,通過Nr(R)可減少光譜不均勻造成的影響。植物葉片生長方向?qū)е鹿庹障铝炼炔痪鶆颍霈F(xiàn)同向亮度較亮反向較暗的情況,造成同一植物器官在同一幅圖像中光譜反射值存在差異,MC(R)處理可對整幅圖像亮度進行均勻化,使得同一植物器官光譜反射值一致。

        3.2 數(shù)學變換對PCA降維后累計方差貢獻率的影響

        高光譜數(shù)據(jù)是實現(xiàn)植物識別與分類的有效數(shù)據(jù)源之一,其特征提取是植物識別與分類的關鍵一步[31]。在植物識別與分類過程中,PCA降維能夠有效提取植物光譜特征,使得數(shù)據(jù)從高維空間映射到低維空間,減少數(shù)據(jù)冗余[32]。本研究中對原始光譜數(shù)據(jù)進行了6種數(shù)學變換及PCA降維,累計方差貢獻率受到原始數(shù)據(jù)的影響,其中l(wèi)og(R)、SG(R)和MC(R)的PC1與PC2累計方差貢獻率大于85%,是上述3種變換處理后,各樣本之間數(shù)據(jù)差異增大,在協(xié)方差矩陣運算過程中,提取的特征值較大所致。dr1(R)、dr2(R)、Nr(R)在數(shù)學變換后各樣本光譜值之間差異較小,這是因為變換處理后數(shù)據(jù)較為集中,故PC1與PC2累計方差貢獻率較小。不同數(shù)學變換方法影響了各樣本光譜數(shù)據(jù)間反射值差異性大小。因而PCA降維后,原始數(shù)據(jù)樣本離散大小對PC1與PC2累計方差貢獻率有非常重要的作用。

        3.3 機器學習分類模型精度與數(shù)學變換的關系

        通過光譜反射率預測毒草種類是高光譜技術的重要應用,在構建模型時,對原始數(shù)據(jù)進行各種數(shù)學變換以及選取合適的建模方法是研究此類問題的關鍵。目前,相關研究表明,進行相應的數(shù)學變換可以提高模型的精度[14,16]。李世波等[33]將log(R)應用到濕地植被分類建模中時分類精度達到最高。本研究選取了相同數(shù)學變換,發(fā)現(xiàn)結果一致。由此可見,在利用植物光譜數(shù)據(jù)分類時,log(R)處理具有一定的普適性。但結合分類結果來看,SG(R)處理保留了更多原始光譜信息,在多種模型中的建模精度相比于其他數(shù)學變換方法都高,更適合預測高寒草甸毒草種類。從建模的方法來看,SVM-RBF、RF和NB模型效果都較好,其中SVM-RBF算法在所有變換處理中分類精度最高,這是因為SVM算法使用了RBF函數(shù),通過設定損失函數(shù)cost與gamma值后使用tune函數(shù)自動從數(shù)據(jù)集中選取得分值最優(yōu)組合進行建模預測[34]。本研究設定cost值為10~102,gamma值為10-1~10-6。RF模型是以樹模型為基評估器的集成評估器,有著能夠處理高維數(shù)據(jù)、抗過擬合和泛化能力較強的優(yōu)點[35]。NB模型是以數(shù)據(jù)集屬性獨立特點進行概率預測,在屬性關系獨立時有較好的分類效果[36]。DT和Knn模型是分類精度及穩(wěn)定性最差的模型,Knn模型是以預測點與所用樣本點進行距離預測,K值的設定是模型精度高低與穩(wěn)定的關鍵。本研究中,K值逐漸增大時錯誤率會先降低后逐漸增大,這與路郭利等[37]的研究結果一致。同時,分類精度與累計方差貢獻率大小存在一定關系。本研究中是以主成分累計方差貢獻率為自變量進行模型訓練和預測分類,在log(R)處理中,PCs達到8個時5種分類算法分類精度基本達到最大值,而累計方差貢獻率接近100%,包含了11種毒草全部特征信息,說明在高寒草甸主要毒草分類中使用8個PCs基本可以使分類精度達到最大。

        本研究的不足之處在于樣本各毒草光譜數(shù)據(jù)存在不均衡問題。但在實際采集過程中很難保證樣本絕對均衡性和代表性。因此,為提高建模精度,可以發(fā)掘更好的數(shù)學變換方法,使用更好的模型,如當前最熱門的深度學習模型,同時還可以考慮其他降維方法結合分類模型分類,這些也是今后需要進一步深入研究的方向。

        4 結論

        通過對研究區(qū)高寒草甸主要毒草光譜數(shù)據(jù)先進行數(shù)學變換,再使用主成分分析降維,利用機器學習算法進行了不同處理下分類方法的研究,結果發(fā)現(xiàn),log(R)-PCA降維與SVM-RBF分類算法是高寒草甸主要毒草分類識別的最優(yōu)組合方式,且模型穩(wěn)定性較好,最高分類精度達到99.92%。

        猜你喜歡
        分類植物模型
        一半模型
        分類算一算
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        分類討論求坐標
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        哦,不怕,不怕
        將植物穿身上
        3D打印中的模型分割與打包
        中文字幕乱码无码人妻系列蜜桃| 日韩伦理av一区二区三区| 国产精品一区av在线| 成人精品天堂一区二区三区| 又爆又大又粗又硬又黄的a片| www.日本一区| 国产精品夜色视频久久| 天天做天天爱夜夜爽| 黄色视频免费在线观看| 美女高潮流白浆视频在线观看| 国产精品一区二区三区三| 亚洲av色影在线| 欧美性猛交xxxx黑人猛交| 国产成人亚洲欧美三区综合| 99蜜桃在线观看免费视频| 精品国产免费一区二区三区香蕉| 国产乱妇乱子视频在播放| 国产成人精品aaaa视频一区| 国产一区二区三免费视频| 人妻体内射精一区二区三四| 免费一级特黄欧美大片久久网| 日本一区二区三区四区在线看| 美利坚日韩av手机在线| 天天躁日日躁狠狠很躁| 免费观看一区二区| 亚洲国产精品久久性色av| 国产99视频精品免视看7| 婷婷综合缴情亚洲| 日本一区二区三区在线 | 尤物国产一区二区三区在线观看| 女女女女女裸体处开bbb| 亚洲一级毛片免费在线观看| 琪琪av一区二区三区| 国产精品亚洲精品日韩已方| 久久午夜无码鲁丝片直播午夜精品| 极品av在线播放| 国产女同va一区二区三区| 欧洲freexxxx性少妇播放| 午夜影院91| 亚洲视频专区一区二区三区| 国自产精品手机在线观看视频|