王國重,李中原,張繼宇,程煥玲,李佳紅
(1.黃河水文水資源科學研究院,鄭州 450004;2.河南省水文水資源局,鄭州 450003;3.河南黃河河務局,鄭州 450003;4.河南省水土保持監(jiān)測總站,鄭州 450008;5.河南省焦作水文水資源勘測局,河南 焦作 454002)
區(qū)域土地利用/覆蓋變化與其環(huán)境生態(tài)和經濟社會可持續(xù)發(fā)展息息相關,自然過程與人類活動是導致土地利用改變的主要因素。近年來,隨著科技和經濟的快速發(fā)展,尤其是第三產業(yè)的異軍突起,土地利用類型也在發(fā)生顯著變化,表現(xiàn)為建筑用地、工礦用地增加迅速,耕地、林地、草地等面積被擠占,使得土地資源開發(fā)利用問題突出,嚴重制約著糧食安全、人與自然的和諧相處[1-3]。
利用遙感技術獲取土地利用/覆蓋信息首先需要對地物進行分類,隨著計算機技術的不斷革新、眾多學者的潛心鉆研,各種影像分類方法不斷涌現(xiàn),如隨機森林(RF)、K近鄰(KNN)、支持向量機(SVM)、最大似然法(ML)、決策樹(DT)、稀疏表達分類器(SRC)、人工神經網絡(ANN)等,國內外學者基于不同遙感數(shù)據(jù)嘗試相應的分類方法取得了許多有價值的成果[4-8],但對這些分類方法的時效性與精度比較研究的報道還不多。上述分類方法中,SVM和最大似然法是最為常用的2種分類方法。SVM通過學習算法,能夠自動搜尋對分類有較好辨識能力的支持向量,因準確率較高,在模式識別、故障檢測、分類和回歸分析等方面應用廣泛[9-11];最大似然法是將多波段遙感數(shù)據(jù)視作多維正態(tài)分布來構造分類函數(shù),再據(jù)此函數(shù)與最大值原則判斷類別的歸屬,因參數(shù)解釋能力較強、易于與先驗知識融合、算法簡單易于實施,得到許多研究者的青睞[12-15]。
采用支持向量機和最大似然法,并借助Landsat8影像對偃師市耕地、林地、草地、水域、建設用地5種用地類型進行分類和精度評估,為后續(xù)進一步研究、開發(fā)新的評估方法提供依據(jù)。
偃師市位于河南省中西部地區(qū),屬洛陽市管轄,地處東經112°26′15″—113°00′00″、北緯34°27′30″—34°50′00″。南屏嵩岳、北臨黃河,地勢自西向東傾斜,南北高,中間低,地貌景觀略呈槽形,地表形態(tài)復雜多樣,大體可分為山地、丘陵、坡地、平原4種類型[16]。屬暖溫帶大陸性季風氣候,年均氣溫14.2℃,無霜期211 d,年均降水量500~600 mm,全年日照時數(shù)2 248.3 h。
遙感影像采用的是Landsat8衛(wèi)星數(shù)據(jù),該衛(wèi)星2013年2月11日由美國航空航天局(NASA)成功發(fā)射,共11個波段,波段1~7、9~11的空間分辨率為30 m,波段8為15 m分辨率的全色波段,衛(wèi)星每16 d可以實現(xiàn)一次全球覆蓋。由于所研究的區(qū)域屬于陸地,故選取Landsat8影像的前7個波段進行研究。
以偃師市2016年9月云量為2.36%的影像數(shù)據(jù)為主,采用90 m分辨率的SRTM數(shù)字高程數(shù)據(jù),用以裁剪遙感影像。通過ENVI軟件對Landsat8影像進行輻射定標、大氣校正,再根據(jù)研究區(qū)矢量數(shù)據(jù)裁剪經此處理后的遙感影像,以便后續(xù)的處理與分析。
1.3.1 支持向量機 支持向量機(Support vector machine,SVM)是基于統(tǒng)計學習理論發(fā)展起來的新的機器學習方法,與傳統(tǒng)學習方法相比,該方法以結構風險最小化為準則,實現(xiàn)樣本誤差最小化、縮小模型泛化誤差,具有較高的精度、泛化能力強、運算速度較快的優(yōu)點。SVM的關鍵在于核函數(shù),采用不同的核函數(shù)將導致不同的SVM算法[17]。其常見的核函數(shù)主要有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)、Sigmoid核函數(shù)、字符串核函數(shù)、傅立葉核函數(shù)、樣條核函數(shù)等。作為一種局部性較強的核函數(shù),徑向基函數(shù)(又稱高斯核函數(shù))能夠將一個樣本映射到一個更高維度的空間內,不論樣本多少均有較好的性能,且參數(shù)較多項式核函數(shù)少,因此大多數(shù)情況下優(yōu)先使用高斯核函數(shù)[18]。
1.3.2 最大似然法 最大似然法是一種應用最為廣泛的監(jiān)督分類方法,它以統(tǒng)計學理論和貝葉斯準則為基礎,假定訓練區(qū)地物的光譜特征近似服從正態(tài)分布,可求出各類別的均值、方差以及協(xié)方差等特征參數(shù),從而求出總體的條件概率密度函數(shù),再根據(jù)貝葉斯函數(shù)和最大值規(guī)則確定類別的歸屬。具體做法如下[19]:
1)根據(jù)訓練區(qū)得到各類別的均值、方差等特征參數(shù),假設各類別服從多維正態(tài)分布,其條件概率密度為:
式中,n為波段數(shù);μi表示wi類的均值向量;Σi是wi類的協(xié)方差矩陣。
式中,p(wi)為wi類的先驗概率;p(x)表示與類別無關的公共項。
3)由判別規(guī)則確定類別的歸屬。
實際過程中,主要通過改變概率閾值來生成分類影像。
對經過預處理的Landsat8影像分別采用SVM方法、最大似然法進行分類。選取相同的訓練樣本以便分類結果的精度比較。樣本間的可分離度是評價樣本質量的最直接標準,所選各類訓練樣本間的可分離度詳見表1。由表1可知,各類樣本之間的可分離度均大于1.90,表明所選訓練樣本質量很好,屬于合格樣本。
表1 各樣本間的分離度
根據(jù)2種方法對偃師市遙感影像進行分類,結果如圖1所示。通過Google earth軟件選取100個樣點對2種分類結果進行精度評價,結果如表2所示。由表2可知,ML法的平均分類精度比SVM法高1.15個百分點,總精度高0.24個百分點、Kappa系數(shù)也略高0.003 8。
表2 2種方法的分類精度比較
圖1 偃師市2016年土地利用分類
王明偉等[20]認為,SVM和最大似然法對Landsat5的分類精度相當;對于Landsat7,則SVM的分類精度高于最大似然法。楊艷青等[21]認為SVM的分類精度優(yōu)于最大似然法。高鑫等[12]指出,最大似然法對居民地、水田、天然草地有較高的劃分精度。奉國和[22]、劉大寧等[23]的研究表明,SVM的分類精度受核函數(shù)及參數(shù)的影響較大。趙慧等[24]認為,訓練樣本量、輔助數(shù)據(jù)和分類法是影響土地利用/覆蓋分類精度的3個主要因素??赡苁怯捎谒x取的樣本區(qū)域與數(shù)量、核函數(shù)及其參數(shù)的影響導致SVM法的分類精度和Kappa系數(shù)略低于最大似然法,需要進一步深入研究。
本研究以Landsat8影像為信息源,采用SVM與ML法,以系統(tǒng)默認的參數(shù)對偃師市進行土地利用分類,結果顯示,2種方法都具有很高的分類精度,但ML法的精度略高于SVM法,這可能與所選參數(shù)、核函數(shù)及訓練樣本的影響有關。