趙艷敏,南洪濤,董 超*,孫 波,
(1.山東農(nóng)業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,山東 泰安 271018;2.中國(guó)空間技術(shù)研究院 載人航天總體部,北京 100094)
內(nèi)陸水資源在人類(lèi)的生活和生產(chǎn)活動(dòng)中扮演著重要角色,對(duì)內(nèi)陸水體進(jìn)行動(dòng)態(tài)監(jiān)測(cè)有利于研究水資源循環(huán)和預(yù)警洪澇災(zāi)害。衛(wèi)星遙感是水體監(jiān)測(cè)的一種方法,主要分為光學(xué)遙感[1-2]和微波遙感[3-4]兩種。然而,光學(xué)遙感易受云層和地表植被遮蔽,而微波遙感則具有波長(zhǎng)較長(zhǎng)(相對(duì)于可見(jiàn)光和紅外)、空間分辨率低和載荷昂貴等缺點(diǎn)[5]。因此,尋找一種既能以較低成本長(zhǎng)時(shí)間精準(zhǔn)識(shí)別水體,同時(shí)又能避免云層等遮蓋影響的方法具有十分重要的實(shí)踐價(jià)值。
全球?qū)Ш叫l(wèi)星系統(tǒng)反射(GNSS-R)技術(shù)是利用導(dǎo)航衛(wèi)星的反射信號(hào)進(jìn)行遙感探測(cè)的一種新型微波遙感技術(shù)。與傳統(tǒng)微波遙感手段相比,GNSS-R技術(shù)擁有大量免費(fèi)的L波段信號(hào)源,具有不需要單獨(dú)發(fā)射機(jī),接收機(jī)體積、質(zhì)量和成本都較低,搭載平臺(tái)靈活等優(yōu)點(diǎn)[6-7]。學(xué)者們[8-10]利用TechDemoSat-1數(shù)據(jù)表明了星載GNSS-R觀測(cè)數(shù)據(jù)進(jìn)行水體監(jiān)測(cè)的可行性,但因TechDemoSat-1衛(wèi)星本身是一顆技術(shù)驗(yàn)證衛(wèi)星,其有限的數(shù)據(jù)量限制了對(duì)利用星載GNSS-R技術(shù)進(jìn)行水體監(jiān)測(cè)的進(jìn)一步研究。在此基礎(chǔ)上,文獻(xiàn)[11]利用CYGNSS信噪比(Signal to Noise Ratio, SNR)的方法對(duì)濕地動(dòng)態(tài)進(jìn)行了監(jiān)測(cè)。文獻(xiàn)[12-15]利用CYGNSS地表反射率數(shù)據(jù)進(jìn)行了水體分布探測(cè),識(shí)別內(nèi)陸水體的位置及其變化。文獻(xiàn)[13,16-17]利用延遲多普勒?qǐng)D(DDM)的功率比數(shù)據(jù)進(jìn)行了水體探測(cè),水體識(shí)別準(zhǔn)確率達(dá)到93.16%,展現(xiàn)了進(jìn)行動(dòng)態(tài)內(nèi)陸水體測(cè)繪的潛力。
由此可見(jiàn),目前國(guó)內(nèi)外對(duì)星載GNSS-R水體探測(cè)進(jìn)行了大量研究,但是水體識(shí)別的準(zhǔn)確率仍然存在可以進(jìn)步的空間。隨著人工智能技術(shù)的不斷發(fā)展,機(jī)器學(xué)習(xí)方法在提高觀測(cè)精度方面有很大的潛力。支持向量機(jī)(Support Vector Machine, SVM)在非線(xiàn)性分類(lèi)問(wèn)題上表現(xiàn)優(yōu)秀,因此本文提出一種基于SVM的星載GNSS-R內(nèi)陸水體識(shí)別方法,以剛果河流域?yàn)槔?驗(yàn)證了方法的有效性并分析了其精度。
剛果河長(zhǎng)4 374 km,年平均流量為每秒4.1萬(wàn)m3,流域面積約370萬(wàn)km2,流量和流域面積都居于非洲前列[18]。剛果河流域有世界第二大熱帶雨林,地表植被茂密。本文研究范圍為3°0′N(xiāo)~ 1°0′S,17°0′E~21°0′E。該流域河流主干水流量大,有密集的支流、副支流,有利于做水體研究。
CYGNSS是美國(guó)宇航局(NASA)為監(jiān)測(cè)熱帶氣旋演變過(guò)程而發(fā)射并運(yùn)行的LEO GNSS-R星座。該星座由8顆微型衛(wèi)星組成,可以覆蓋地球南北緯38°之間的區(qū)域。本文使用的是3.0版CYGNSS L1級(jí)別2020年整年的數(shù)據(jù)產(chǎn)品(https:∥podaac.jpl.nasa.gov/dataset/CYGNSS_L1_V3.1)。其標(biāo)準(zhǔn)DDM產(chǎn)品由17個(gè)延遲點(diǎn)和11個(gè)多普勒點(diǎn)組成,延遲維度分辨率為0.25 GPS C/A碼碼片,多普勒維度分辨率為500 Hz,每個(gè)DDM通過(guò)0.5 ms相干積分和1 000次非相干累加得到。陸地、平靜內(nèi)陸水體相對(duì)光滑,反射信號(hào)主要為相干散射部分,其分辨率理論最高可達(dá)0.6 km×3 km。
MOD44W第6版數(shù)據(jù)產(chǎn)品提供了250 m空間分辨率的全球地表水體數(shù)據(jù)(https:∥lpdaac.usgs.gov/products/mod44wv006/),其中包含了水體掩膜和質(zhì)量保證2個(gè)圖層。水體掩膜數(shù)據(jù)中0代表陸地,1代表水體;質(zhì)量保證圖層中包含10個(gè)等級(jí)指標(biāo)。本文采用2015年整年的掩膜數(shù)據(jù)。
1.3.1 數(shù)據(jù)處理
1.3.1.1 星載GNSS-R特征觀測(cè)量分析
GNSS-R的SNR是水體和陸地最敏感的特征之一。由于地表粗糙,GNSS-R接收到的反射信號(hào)功率由相干散射分量和非相干散射分量構(gòu)成。其中,相干散射分量的功率表達(dá)式為[19]:
(1)
式中:Г為表面的反射率,Pt為GNSS衛(wèi)星發(fā)射功率,Gt為GNSS衛(wèi)星發(fā)射天線(xiàn)增益,Gr為GNSS-R信號(hào)接收天線(xiàn)增益,λ為GNSS信號(hào)的載波波長(zhǎng),Rt、Rr分別為發(fā)射機(jī)到地面和地面到接收機(jī)的距離。求解Г,得到:
Γ=20lg 4π-10lgPtGt-10lgGr+
20lg(Rt+Rr)-20lgλ+10lgPcoh。
(2)
相干散射分量的功率還受到其他變量的影響,如天線(xiàn)增益等。通過(guò)計(jì)算SNR來(lái)減輕這些因素。SNR計(jì)算如下:
(3)
式中:Navg為每個(gè)頻段的平均原始噪聲計(jì)數(shù)。SNR和Г之間關(guān)系的函數(shù)如下所示:
SNR∝10lgΓ。
(4)
根據(jù)GNSS衛(wèi)星發(fā)射功率、GNSS衛(wèi)星發(fā)射天線(xiàn)增益、GNSS-R信號(hào)接收天線(xiàn)增益等主要參數(shù)對(duì)SNR進(jìn)行校正,得到SNRC的公式如下所示:
SNRC=20lg 4π-10lgPtGt-10lgGr+
20lg(Rt+Rr)-20lgλ+SNR。
(5)
CYGNSS衛(wèi)星數(shù)據(jù)處理基本過(guò)程主要包括特征值的選擇、數(shù)據(jù)預(yù)處理等。特征值的選擇是根據(jù)GNSS-R模型來(lái)從基礎(chǔ)觀測(cè)變量中提取可能影響內(nèi)陸水的參數(shù),本文使用由CYGNSS衛(wèi)星獲取的SNRC進(jìn)行內(nèi)陸水提取。
1.3.1.2 數(shù)據(jù)質(zhì)量控制
CYGNSS數(shù)據(jù)中存在天線(xiàn)增益的影響,需要對(duì) SNR進(jìn)行修正,得到合適的SNR值進(jìn)行數(shù)據(jù)處理。故本文將SNR大于1.5 dB和接收機(jī)天線(xiàn)增益大于0 dB的觀測(cè)數(shù)據(jù)進(jìn)行刪除。
1.3.2 內(nèi)陸水體識(shí)別
為探索CYGNSS衛(wèi)星數(shù)據(jù)在水體識(shí)別領(lǐng)域的能力,本文提出一種基于SVM模型并結(jié)合SMOTE算法的數(shù)據(jù)處理方法。該方法分為數(shù)據(jù)預(yù)處理、SMOTE算法數(shù)據(jù)處理、SVM模型3個(gè)步驟,最終得到修正數(shù)據(jù)SNRC的SVM模型結(jié)果及準(zhǔn)確率,具體數(shù)據(jù)處理總流程如圖1所示。
圖1 數(shù)據(jù)處理總流程Fig.1 General flowchart of data processing
1.3.2.1 CYGNSS和MODIS水體掩膜數(shù)據(jù)處理和空間匹配
本文使用SNRC數(shù)據(jù),將數(shù)據(jù)按照0.02°×0.02°的空間分辨率劃分網(wǎng)格,利用區(qū)域均值算法重新計(jì)算各個(gè)格網(wǎng)單元的數(shù)據(jù),并將結(jié)果作為研究對(duì)象,形成地表SNR圖像。
因?yàn)橹蟹直媛食上窆庾V儀(MODIS)數(shù)據(jù)投影系統(tǒng)不同,先進(jìn)行預(yù)處理。預(yù)處理過(guò)程包括:數(shù)據(jù)合并、轉(zhuǎn)換為T(mén)IFF數(shù)據(jù)、掩膜處理。TIFF數(shù)據(jù)中包含經(jīng)緯度信息,將TIFF數(shù)據(jù)的經(jīng)緯度與SNR數(shù)據(jù)的經(jīng)緯度一一對(duì)應(yīng),同樣將格網(wǎng)單元中的數(shù)據(jù)進(jìn)行區(qū)域均值算法處理,將大于0的元素標(biāo)記為水體,得到MODIS水體掩膜網(wǎng)格數(shù)據(jù)。
1.3.2.2 SMOTE算法
在機(jī)器學(xué)習(xí)領(lǐng)域,處理數(shù)據(jù)時(shí)會(huì)出現(xiàn)某一類(lèi)的樣本數(shù)量遠(yuǎn)遠(yuǎn)低于另一類(lèi)的情況——類(lèi)不均衡問(wèn)題。解決類(lèi)不均衡問(wèn)題的方法有隨機(jī)增大少數(shù)類(lèi)的樣本數(shù)量、隨機(jī)減少多數(shù)類(lèi)的樣本數(shù)量以及修改代價(jià)函數(shù)等。本文采用SMOTE算法來(lái)解決數(shù)據(jù)不均衡問(wèn)題。
SMOTE算法是一種隨機(jī)增大少數(shù)類(lèi)數(shù)量的方法。SMOTE算法過(guò)程[20]如下:① 對(duì)于少數(shù)類(lèi)中每一個(gè)樣本x,以歐氏距離為標(biāo)準(zhǔn)計(jì)算它到少數(shù)類(lèi)樣本集中所有樣本的距離,得到其k近鄰。② 根據(jù)樣本不平衡比例設(shè)置一個(gè)采樣比例以確定采樣倍率N,對(duì)于每一個(gè)少數(shù)類(lèi)樣本x,從其k近鄰中隨機(jī)選擇若干個(gè)樣本,假設(shè)選擇的近鄰為xn。③ 對(duì)于每一個(gè)隨機(jī)選出的近鄰xn,分別與原樣本構(gòu)建新的樣本。
1.3.2.3 SVM模型
機(jī)器學(xué)習(xí)模型在地表探測(cè)[21-22]、云檢測(cè)[23]等方面有諸多應(yīng)用。機(jī)器學(xué)習(xí)模型可以不斷提高檢測(cè)精度,所以本文選用機(jī)器學(xué)習(xí)SVM進(jìn)行數(shù)據(jù)處理。
SVM是一種結(jié)合了統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的模式識(shí)別方法,在有限的訓(xùn)練樣本中尋求學(xué)習(xí)能力與模型復(fù)雜度融合后的最佳折中結(jié)果,從而得到最小誤差分類(lèi)器[24]。也是一類(lèi)按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二分類(lèi)的廣義線(xiàn)性分類(lèi)器。
給定數(shù)據(jù)集{(x1,y1),(x2,y2),…,(xm,ym)},m為樣本數(shù)量,ym∈{0,1}。SVM定義的模型為:
(6)
式中:ω=(ω1,ω2,…,ωd)為法向量,b為位移項(xiàng),ξi為松弛因子,C為常數(shù)。
根據(jù)1.3節(jié)的討論,選擇x=(SNRC)作為SVM的輸入變量。將使用MODIS水體掩膜作為SVM的輸出變量y。
輸入變量x與y的關(guān)系是非線(xiàn)性關(guān)系。引入核函數(shù)解決SVM模型非線(xiàn)性問(wèn)題[25]。有3種核函數(shù)可以訓(xùn)練SVM模型[26],核函數(shù)公式如表1所示,線(xiàn)性核函數(shù)是徑向基核函數(shù)的一種形式。多項(xiàng)式核函數(shù)需要確定的參數(shù)多,從而導(dǎo)致函數(shù)復(fù)雜化,造成程序計(jì)算困難。綜合考慮本文選擇徑向基核函數(shù),無(wú)論是小樣本還是大樣本,高維還是低維等情況,徑向基核函數(shù)均適用。
表1 SVM核函數(shù)
1.3.2.4 SVM模型構(gòu)建
SVM模型的訓(xùn)練一般步驟包括:準(zhǔn)備數(shù)據(jù)集、統(tǒng)一數(shù)據(jù)格式、選用徑向基核函數(shù)、采用交叉驗(yàn)證獲取參數(shù)C與g、采用參數(shù)C與g對(duì)整個(gè)訓(xùn)練集進(jìn)行訓(xùn)練獲取SVM模型、利用獲取的模型進(jìn)行測(cè)試與預(yù)測(cè)[27]。
本文研究模型所使用的特征較少、參數(shù)空間小,網(wǎng)格搜索算法數(shù)據(jù)處理簡(jiǎn)單且易于實(shí)現(xiàn)。本文采用網(wǎng)格搜索算法獲取徑向基核函數(shù)需要的參數(shù)C與g。網(wǎng)格搜索算法的原理是將待搜索的內(nèi)容在一定的空間范圍內(nèi)劃分成網(wǎng)格,網(wǎng)格中的每個(gè)點(diǎn)代表一種參數(shù)組合方案,遍歷網(wǎng)格內(nèi)所有點(diǎn),可找出性能最優(yōu)的參數(shù)組合。
經(jīng)過(guò)數(shù)據(jù)處理,將SNRC的隨機(jī)訓(xùn)練集樣本輸入到SVM算法中以建立二分類(lèi)模型,然后利用二分類(lèi)模型完成對(duì)內(nèi)陸水提取準(zhǔn)確率估計(jì),綜合分析內(nèi)陸水的準(zhǔn)確率和混淆矩陣。
1.3.3 數(shù)據(jù)驗(yàn)證
評(píng)估SVM模型最簡(jiǎn)單、最直接的標(biāo)準(zhǔn)就是分類(lèi)準(zhǔn)確率(Accuracy),但單純用準(zhǔn)確率來(lái)評(píng)估SVM模型的性能不夠嚴(yán)謹(jǐn),還需要借助由混淆矩陣形成的查全率、查準(zhǔn)率來(lái)更為細(xì)致地評(píng)估性能。
根據(jù)真實(shí)類(lèi)別和預(yù)測(cè)類(lèi)別的不同組合,將樣本劃分為如下4類(lèi):真正類(lèi)(TP)、假正類(lèi)(FP)、真負(fù)類(lèi)(TN)、假負(fù)類(lèi)(FN),如表2所示。本文以MODIS水體為真實(shí)值正類(lèi),MODIS陸地為真實(shí)值負(fù)類(lèi),SNRC水體為預(yù)測(cè)值正類(lèi),SNRC陸地為預(yù)測(cè)值負(fù)類(lèi)。MODIS影像產(chǎn)品是光學(xué)遙感數(shù)據(jù),其觀測(cè)會(huì)被云層或植被阻擋,造成一定的數(shù)據(jù)錯(cuò)誤。
表2 SVM混淆矩陣
準(zhǔn)確率的具體數(shù)學(xué)表達(dá)為:
Accuracy=(TN+TP)/(TN+TP+FN+FP)。
(7)
查全率(Recall)又稱(chēng)召回率,表示分類(lèi)準(zhǔn)確的正類(lèi)樣本數(shù)占全部正類(lèi)樣本總數(shù)的比例。具體數(shù)學(xué)表達(dá)為:
Recall=TP/(TP+FN)。
(8)
查全率是指檢索出來(lái)的相關(guān)數(shù)據(jù)占總數(shù)據(jù)中全部相關(guān)數(shù)據(jù)的比例,反映的是檢索的全面性。
查準(zhǔn)率(Precision)表示被預(yù)測(cè)正確的正類(lèi)樣本數(shù)占分類(lèi)器判定為正類(lèi)樣本總數(shù)的比例。具體數(shù)學(xué)表達(dá)為:
Precision=TP/(TP+FP)。
(9)
查準(zhǔn)率反映的是檢索的準(zhǔn)確性,即真正相關(guān)頁(yè)面數(shù)占全部檢索出的相關(guān)頁(yè)面數(shù)的比例。
對(duì)2020年7月的CYGNSS的網(wǎng)格化SNRC數(shù)據(jù)進(jìn)行直方圖統(tǒng)計(jì),如圖2所示。可以明顯看出,陸地與水體在159~160附近有明顯的分界線(xiàn),表明SNRC可以進(jìn)行水體提取。
圖2 陸地與水體SNRC強(qiáng)度直方圖Fig.2 Intensity histogram of SNRC of land and water body
CYGNSS和MODIS 水體掩膜數(shù)據(jù)匹配過(guò)程中產(chǎn)生了4幅圖像,圖3(a)是通過(guò)MODIS數(shù)據(jù)獲得的研究區(qū)域水體掩膜圖;圖(b)是圖3(a)網(wǎng)格化獲得的數(shù)據(jù);圖3(c)是圖3(b)經(jīng)過(guò)1.3.2.1節(jié)判斷原則得到的二值化MODIS數(shù)據(jù);圖(d)是CYGNSS SNRC網(wǎng)格化數(shù)據(jù)。對(duì)比剛果河SNRC數(shù)據(jù)和剛果河MODIS水體掩膜數(shù)據(jù),如圖3所示。MODIS水體掩膜數(shù)據(jù)捕捉到的河流有更為清晰,而SNRC數(shù)據(jù)結(jié)果則相對(duì)比較粗糙,分辨率不高,但能夠識(shí)別出更多的河流支流。大部分的河流主干都可以互相對(duì)應(yīng),MODIS數(shù)據(jù)可以作為輔助數(shù)據(jù)來(lái)驗(yàn)證SVM模型的準(zhǔn)確度。
(a)研究區(qū)域GeoTIFF數(shù)據(jù)
(d)剛果河MODIS 水體掩膜圖像
獲得的C、g組合的交叉驗(yàn)證過(guò)程如下:把總的訓(xùn)練集分成3個(gè)子集,每次選出一個(gè)作為測(cè)試集,其余的作為訓(xùn)練集進(jìn)行訓(xùn)練,然后用測(cè)試集測(cè)試得到的訓(xùn)練模型,得出一個(gè)正確率。當(dāng)3個(gè)子集都做過(guò)測(cè)試集后,即執(zhí)行過(guò)3次這樣的訓(xùn)練與測(cè)試后,取3次正確率的平均值作為最終正確率。通過(guò)交叉驗(yàn)證來(lái)評(píng)估該訓(xùn)練模型的預(yù)測(cè)正確率,以取得最高正確率的參數(shù)組合作為最終結(jié)果。結(jié)果C為11.313 7,g為16,準(zhǔn)確率為94.40%,如圖4所示。
圖4 SVM參數(shù)選擇等高線(xiàn)圖Fig.4 Contour map of SVM parameter selection
經(jīng)過(guò)訓(xùn)練集和測(cè)試集訓(xùn)練出的SVM模型對(duì)剛果河SNRC數(shù)據(jù)進(jìn)行測(cè)試,剛果河二值化SNRC數(shù)據(jù)表明河流主干及其部分河流支流識(shí)別正確,如圖5所示。淺藍(lán)色部分是MODIS數(shù)據(jù)中未存在河流,如圖6所示,其部分原因是剛果河處于熱帶雨林區(qū),茂密的植被對(duì)實(shí)驗(yàn)數(shù)據(jù)造成了遮擋和誤判,但是通過(guò)SVM模型正確識(shí)別出細(xì)小支流,提高了水體提取的準(zhǔn)確度。
圖5 SVM預(yù)測(cè)二值結(jié)果Fig.5 Binary result diagram of SVM prediction
剛果河未均衡化SNRC的SVM模型結(jié)果,如圖7、圖8所示,訓(xùn)練集混淆矩陣的結(jié)果:水體正類(lèi)查準(zhǔn)率為21.78%;陸地負(fù)類(lèi)查準(zhǔn)率為97.88%。測(cè)試集混淆矩陣的結(jié)果:水體正類(lèi)查準(zhǔn)率為5.39%;陸地負(fù)類(lèi)查準(zhǔn)率為97.76%。水體與陸地的準(zhǔn)確率相差非常大,未均衡化數(shù)據(jù)模型訓(xùn)練集查全率為72.59%;測(cè)試集查全率為56.83%,說(shuō)明檢索數(shù)據(jù)非常不全面。
圖7 剛果河未均衡化訓(xùn)練集混淆矩陣Fig.7 Confusion matrix of Congo River unbalanced training set
圖8 剛果河未均衡化測(cè)試集混淆矩陣Fig.8 Confusion matrix of Congo River unbalanced test set
剛果河均衡化SNRC的SVM模型結(jié)果,如圖9和圖10所示。訓(xùn)練集混淆矩陣的結(jié)果:水體正類(lèi)查準(zhǔn)率為96.42%;陸地負(fù)類(lèi)查準(zhǔn)率為96.99%。測(cè)試集混淆矩陣的結(jié)果:水體正類(lèi)查準(zhǔn)率為96.32%;陸地負(fù)類(lèi)查準(zhǔn)率為99.80%。均衡化訓(xùn)練集查全率為99.56%;測(cè)試集查全率為100.00%,檢索數(shù)據(jù)的全面性都高達(dá)99%以上。對(duì)比2種數(shù)據(jù)發(fā)現(xiàn),準(zhǔn)確率與水體查全率都得到很高的提升,表明:① 數(shù)據(jù)的不均衡會(huì)導(dǎo)致模型的準(zhǔn)確率降低;② SMOTE算法可以有效地提高水體查準(zhǔn)率。
圖9 剛果河均衡化訓(xùn)練集混淆矩陣Fig.9 Confusion matrix of Congo River equalization training set
圖10 剛果河均衡化測(cè)試集混淆矩陣Fig.10 Confusion matrix of Congo River equalization test set
剛果河2種數(shù)據(jù)SVM模型的準(zhǔn)確率對(duì)比如表3所示,表明了SMOTE算法數(shù)據(jù)均衡化后進(jìn)一步提高了內(nèi)陸水提取的準(zhǔn)確率。
表3 剛果河均衡化 SVM模型的準(zhǔn)確率
現(xiàn)有的水體提取準(zhǔn)確率如表4所示。水體提取準(zhǔn)確率最高為95.4%,最低為92%,與表格中水體提取準(zhǔn)確率相比,使用SVM模型提取數(shù)據(jù)的準(zhǔn)確率有了進(jìn)一步的提高。
表4 水體提取準(zhǔn)確率
本文通過(guò)使用SVM模型結(jié)合SMOTE算法提出了一種有效的內(nèi)陸水體提取方法。利用CYGNSS校正后的SNRC數(shù)據(jù),經(jīng)過(guò)SMOTE算法處理,數(shù)據(jù)得到了均衡化。通過(guò)將數(shù)據(jù)輸入SVM模型進(jìn)行訓(xùn)練與測(cè)試,最后獲得準(zhǔn)確率為96.49%、水體查準(zhǔn)率為96.32%的結(jié)果。因此,本文研究成果表明: ① CYNGNSSSNRC數(shù)據(jù)可以用于內(nèi)陸水體的提取;② SVM模型可以進(jìn)一步提高內(nèi)陸水體提取準(zhǔn)確率;③ SMOTE算法可以用于處理數(shù)據(jù)不均衡問(wèn)題,提高了內(nèi)陸水體識(shí)別的準(zhǔn)確率,為未來(lái)的研究提供了可行的方法。