梁海紅
(三和數(shù)碼測繪地理信息技術(shù)有限公司,甘肅 天水 741000)
及時獲取和了解農(nóng)作物種類、生長情況、種植面積等信息是我國智慧農(nóng)業(yè)發(fā)展過程中需要實現(xiàn)的重要任務(wù)。傳統(tǒng)農(nóng)作物分類方法依賴于生物和形態(tài)學調(diào)查法,在財力和物力方面投入較多,無法滿足智慧農(nóng)業(yè)的發(fā)展需求。無人機高光譜遙感影像技術(shù)具有波段數(shù)目多、波段長、信息量大等特點,不但能夠?qū)r(nóng)作物進行有效的分類,而且也能夠節(jié)省人力和財力,對助推智慧農(nóng)業(yè)發(fā)展具有重要意義[1]。
研究區(qū)位于某市農(nóng)業(yè)生態(tài)圈內(nèi),地理坐標位置為125°35′E,43°88′N。該地區(qū)為溫帶季風氣候,雨熱同期,夏季雨水較多且溫度較高,適合農(nóng)作物的生長。該地區(qū)農(nóng)作物主要包括大豆、玉米、水稻等。
1)多光譜數(shù)據(jù)。多光譜數(shù)據(jù)主要利用搭載2 000萬像素傳感器的無人機獲取,共獲取研究區(qū)影像700幅。多光譜數(shù)據(jù)預(yù)處理工作主要利用Pix4Dmapper對影像進行拼接并生成正射影像。由于多光譜數(shù)據(jù)具有分辨率高的特點,可以通過影像直觀地觀察到研究區(qū)域的各種物體,主要用于農(nóng)作物分類精度評價和檢驗[2]。
2)高光譜遙感影像數(shù)據(jù)。高光譜影像主要利用搭載了高光譜成像儀的無人機獲取,高光譜成像儀分辨率為10 nm,工作波長為500 nm~900 nm,無人機飛行高度超過100 m時分辨率為6.5 cm,最高像素分辨率為1 010×1 010。實驗數(shù)據(jù)主要包括56個波段,數(shù)據(jù)獲取時天氣晴朗,沒有云層遮擋,無人機航攝高度為120 m,航速為5 m/s,獲取的影像數(shù)據(jù)均利用高光譜成像儀進行處理。遙感影像選擇農(nóng)作物生長狀態(tài)不同的無人機影像a和高光譜影像b。
3)提取訓練樣本。首先,通過對研究區(qū)域進行實地調(diào)查并結(jié)合遙感影像資料,確定了遙感影像中的地物主要包括芋頭、水稻、玉米、大豆、裸地、水泥路和雜草等。其次,本研究在遙感影像中隨機選取了像素大小為2×2的ROI(Region of Interest)。在選擇ROI過程中對大豆、玉米等種植間距大的農(nóng)作物影像利用真彩色和假彩色以及紅外波段進行混合選取,針對無法判斷的波段的影像,主要利用光譜影像進行輔助識別[3]。最后,將訓練區(qū)按照3∶2的比例進行劃分,其中60%的ROI為訓練樣本、40%的ROI作為農(nóng)作物分類精度試驗樣區(qū)。然后對每幅影像進行訓練并繪制光譜曲線,以作為研究區(qū)地區(qū)波譜曲線。
1)數(shù)據(jù)降維。高光譜具有數(shù)據(jù)維度高的特點,相比于普通光譜信息更加豐富、數(shù)據(jù)量更大,而這也導致高光譜數(shù)據(jù)冗余、數(shù)據(jù)存儲難和處理效率低等。為提高高光譜影像分類精度和分類效率,在對高光譜進行分析前需要利用降維方法對數(shù)據(jù)進行處理,以降低高光譜維度數(shù),同時盡量保留高光譜數(shù)據(jù)。高光譜降維處理主要采用MNF(Minimum Noise Fraction Rotation)方法,MNF降維方法主要是將數(shù)據(jù)空間劃分為特征不同的兩個部分,第一部分為相干特征和最大特征值影像,第二部分為噪聲較強和特征值接近1的影像[4]。
2)一階微分方程變換。光譜導數(shù)是提取光譜影像特征的主要方法,該方法首先需要對反射光譜構(gòu)建數(shù)學模型,其次求取反射光譜的一階導數(shù)。一階導數(shù)能夠直接反映和體現(xiàn)光譜中無法識別的細微變換,同時也可以提取出具有不同特征的參數(shù),如作物紅邊位置、吸收峰位置等。
本研究主要采用支持向量機(Support Vector Machine, SVM)分類方法和隨機森林(Random Forest, RF)分類法。利用這兩種分類方法分別對遙感影像中的農(nóng)作物構(gòu)建識別模型,同時對分類經(jīng)過進行評價,并對SVM和RF分類方法進行比較。
SVM分類方法是一種基于統(tǒng)計學理論的機器學習算法。SVM能夠自動尋找遙感影像中的最后分類平面,同時構(gòu)建出分類器。此外,SVM分類方法也能夠?qū)ν愞r(nóng)作物之間的間隔進行縮小,對不同農(nóng)作物之間的間隔進行擴大。與傳統(tǒng)的分類方法相比,SVM分類結(jié)構(gòu)更加準確,并且泛化能力強,能夠緩解高光譜影像Hughes現(xiàn)象,適用于高光譜影像維數(shù)高和樣本數(shù)量少的影像分類[5]。
RF分類法屬于預(yù)測分類模型,是一種基于決策樹的分類算法。RF算法分類結(jié)構(gòu)穩(wěn)定,對參數(shù)選擇要求較低,并且訓練和學習速度較快,在解決分類問題方面具有較大的優(yōu)勢,RF算法計算公式為:
RF算法在對高光譜影像中的農(nóng)作物進行分類時,其分類結(jié)果主要采取投票的方式?jīng)Q定,并且RF算法只需要明確特征數(shù)量和樹木數(shù)量參數(shù),即可預(yù)測分類結(jié)果。
本研究選取兩幅高光譜影像并對其中的農(nóng)作物進行分類,在對高光譜影像進行研究時首先采取降維方法對其進行處理,其次求取一階導數(shù),最后利用SVM和RF分類方法對高光譜影像、一階導數(shù)影像、降維后的影像進行分析,研究高光譜影像農(nóng)作物的分類結(jié)果。
本研究主要采用總體精度、生產(chǎn)者精度、Kappa系數(shù)和用戶精度四個指標對分類結(jié)果精度進行綜合評價。在評價前,首先需要構(gòu)建評價樣本,在選取評價樣本時,不能出現(xiàn)重復(fù)樣本。本研究共選取了水稻評價樣本130個、玉米評價樣本260個、大豆樣本156個、芋頭樣本75個、雜草樣本65個。在評價過程中利用Kappa系數(shù)構(gòu)建混淆矩陣,如果混淆矩陣對角線中的元素值越大,分類結(jié)果準確性越高;非對角線元素值越大,分類結(jié)果準確性越低。
1)農(nóng)作物光譜分析。高光譜數(shù)據(jù)波段為56個,通過對樣本進行訓練獲得農(nóng)作物波段曲線,在紅光波段、綠光波段和藍光波段中不同的農(nóng)作物反射率不同。其中,大豆近紅外波段反射率與其他農(nóng)作物相比較高;雜草、水稻和芋頭反射率基本相近;近紅外波段反射率相對較低的農(nóng)作物為玉米,這主要是因為在高光譜影像獲取過程中大豆作物正處于成長旺盛期,水稻為灌漿期,而玉米已經(jīng)成熟,部分玉米作物已經(jīng)被收割,因此玉米近紅外波段反射率與其他農(nóng)作物相比較低[6]。
2)數(shù)據(jù)降維分析。通過MNF降維方法對原始高光譜影像和一階導數(shù)影像進行處理,降維前后的分量信息如表1所示。從表中可以看出,原始影像在降維前和降維后的10個信息分量數(shù)據(jù)約為91%,一階導數(shù)影像降維前后10個信息分量數(shù)據(jù)約為73%。由此可知MNF降維方法對原始影像降維效果較好。
表1 高光譜影像降維前后分量信息
1)SVM分類結(jié)果。利用SVM分類方法對經(jīng)過降維和一階導數(shù)變換后的影像進行分析,對影像中的農(nóng)作物進行分類。為降低其他參數(shù)對SVM分類結(jié)果的影響,所有的高光譜影像均采用同一SVM,表2為分類精度。從表2中可以得出,SVM對高光譜影像中的農(nóng)作物分類結(jié)果精度超過81%,利用降維方法對高光譜影像處理后,分類精度有了一定程度的提升,并且減少了數(shù)據(jù)處理量,進一步提高了分類速度。而經(jīng)過一階導數(shù)變換后的高光譜影像分類結(jié)果準確性出現(xiàn)一定程度的下降,這主要是因為一階導數(shù)變換后的高光譜影像具有更高的可分性,因此部分光譜信息更加突出,而這也提高了農(nóng)作物光譜信息相似度,導致農(nóng)作物之間的可分性下降[7]。
2)RF分類結(jié)果分析。本研究共選取決策樹500棵,每個節(jié)點均利用GINI系數(shù)對不純度進行求解。利用RF對高光譜影像進行分類,分類精度如表2所示。從表中可以得知RF分類精度均超過88%,利用降維方法處理高光譜影像后,分類精度有了一定程度的提升,并且一階導數(shù)高光譜影像也存在分類精度降低的情況。
表2 高光譜影像分類精度
3)分類結(jié)果對比分析。在利用SVM對高光譜影像農(nóng)作物進行分類時,會存在SVM將玉米識別為水稻的情況,而利用RF分類方法則可以避免這一問題。此外,利用SVM分類法對大豆進行分類時,也會存在長勢相對較差的大豆被識別為水稻的問題,在利用RF分類方法后,大豆分類用戶精度和生產(chǎn)精度有顯著的提升。由此表明,RF分類方法比SVM分類方法精度高[8]。
在對高光譜影像農(nóng)作物進行分類的過程中,玉米作物分類精度較差,無論是利用SVM分類法還是RF分類法獲得的分類精度均較低。與其他農(nóng)作物分類結(jié)果相比,玉米農(nóng)作物在分類過程中會出現(xiàn)漏分、錯分的問題。出現(xiàn)這種問題的原因可能是玉米農(nóng)作物分布較散,并且生長狀態(tài)不統(tǒng)一,部分玉米處于生長期,而部分玉米已經(jīng)枯萎;不同玉米的生長期波譜曲線變化幅度較大,并且存在同物異譜的情況。由于處于生長期的玉米波段與大豆和水稻波段曲線相似,因此出現(xiàn)了玉米作物錯分的問題[9-10]。
在研究區(qū)內(nèi),由于大豆為生長期,因此其近紅外波段反射率相對較高,有利于高光譜影像分類。在SVM影像分類中,大豆作物中會出現(xiàn)少量水稻的情況,通過分析高光譜影像和原始影像后發(fā)現(xiàn),農(nóng)作物間隙邊緣種植的大豆長勢相對較差,因此存在分類不準確的情況。
從高光譜影像中可以看出,芋頭作物分類結(jié)果相對穩(wěn)定,可以對芋頭作物進行有效提取。通過對高光譜影像農(nóng)作物進行分類,利用RF分類法獲得的分類結(jié)果精度較高,可以實現(xiàn)對農(nóng)作物的有效提取,能夠為我國農(nóng)作物生長情況監(jiān)測、產(chǎn)量估計和病蟲害防治提供參考。
本研究通過對無人機高光譜影像進行MNF降維處理和FD變換,分別采用RF分類方法和SVM分類方法對處理后高光譜影像農(nóng)作物分類進行了研究。研究發(fā)現(xiàn),農(nóng)作物生長周期對高光譜影像農(nóng)作物分類精度具有一定影響,并且采用RF分類方法對高光譜影像農(nóng)作物分類的效果較好,能夠有效識別農(nóng)作物的種類,為我國農(nóng)作物監(jiān)測提供參考。