翟涌光,屈忠義
?
基于非線性降維時(shí)序遙感影像的作物分類
翟涌光1,2,屈忠義1※
(1. 內(nèi)蒙古農(nóng)業(yè)大學(xué)水利與土木建筑工程學(xué)院,呼和浩特 010018; 2. 中國科學(xué)院遙感與數(shù)字地球研究所,北京 100101)
當(dāng)前基于時(shí)序遙感數(shù)據(jù)的作物分類方法大都需要較多專家知識及人工干預(yù),難以自動(dòng)化,也難以移植到其他地區(qū)。將光譜降維技術(shù)用于時(shí)序遙感影像分析可以很好地解決這一問題。其中,非線性降維方法已經(jīng)成功應(yīng)用于高光譜數(shù)據(jù),并且獲得了比線性降維方法更好的結(jié)果。但是,直接將非線性降維方法用于時(shí)序遙感影像無法充分利用其時(shí)相維度的信息。該文改進(jìn)了一種非線性降維算法——Laplacian Eigenmaps(LE)用于時(shí)序遙感影像的作物分類,該方法更加關(guān)注相同時(shí)相下不同作物生長季的物候特征差異,而不再僅依賴于整個(gè)生長季的物候曲線輪廓。改進(jìn)的LE算法被應(yīng)用于美國伊利諾伊州覆蓋作物全生長季的Landsat 8時(shí)間序列影像。降維后保留的波段結(jié)合隨機(jī)森林分類器基于美國農(nóng)業(yè)部Cropland Data Layer(CDL)提供的訓(xùn)練數(shù)據(jù)完成了一系列的分類試驗(yàn),并與傳統(tǒng)插值未降維的方法進(jìn)行對比。試驗(yàn)結(jié)果表明,改進(jìn)的LE降維方法完成了更高的整體及各個(gè)類別的分類精度,其中整體分類精度達(dá)到85.37%,該方法作為一種自動(dòng)化的方法,不需要人工干預(yù),可直接移植到其他研究區(qū),并且只需要較少的訓(xùn)練樣本就可以完成一個(gè)較高的分類精度,為日后不同尺度的作物識別和提取研究提供了有效的方法。
遙感;數(shù)據(jù)處理;作物;分類;非線性光譜降維;時(shí)間序列;動(dòng)態(tài)時(shí)間彎曲
近年來,全球人口數(shù)量持續(xù)增長,預(yù)計(jì)到2030年將達(dá)到87億[1]。由于全球土地總量有限,因此人口增長將帶來嚴(yán)重的糧食安全問題。為了更好地解決糧食短缺引起的經(jīng)濟(jì)和社會(huì)問題,急需提升農(nóng)業(yè)用地的管理和監(jiān)測水平[2-3]。精確、及時(shí)的作物種植結(jié)構(gòu)信息對于各級政府制定相應(yīng)農(nóng)業(yè)政策和經(jīng)濟(jì)發(fā)展計(jì)劃、確保國家糧食安全和社會(huì)穩(wěn)定具有重要意義。遙感技術(shù)憑借其觀測范圍大、監(jiān)測周期短等優(yōu)點(diǎn),已經(jīng)成為農(nóng)情監(jiān)測最主要的手段之一,廣泛應(yīng)用于作物種植結(jié)構(gòu)識別及面積估算等方面[4]。
當(dāng)前,已有很多研究人員使用遙感數(shù)據(jù),結(jié)合監(jiān)督或非監(jiān)督分類算法,完成作物種植結(jié)構(gòu)制圖[5-7]。由于作物類型復(fù)雜多樣,不同作物間的“異物同譜”現(xiàn)象使得僅利用單一時(shí)相遙感數(shù)據(jù)進(jìn)行作物類型識別存在明顯不足,而基于時(shí)間序列遙感影像的制圖方法已經(jīng)被證明可以完成更高的分類精度[8-12]。盡管時(shí)間序列遙感數(shù)據(jù)已經(jīng)廣泛應(yīng)用于作物種植結(jié)構(gòu)識別,但是要建立高精度、自動(dòng)化的分類模型,仍然面臨著一些挑戰(zhàn)。首先,對于一定時(shí)期內(nèi),土地覆蓋類型沒有發(fā)生變化的區(qū)域,其相應(yīng)時(shí)間序列數(shù)據(jù)之間存在高度相關(guān)性,這一特點(diǎn)已經(jīng)在遙感影像變化監(jiān)測研究中被廣泛使用,換言之,高度相關(guān)性意味著時(shí)間序列遙感數(shù)據(jù)也存在著數(shù)據(jù)冗余問題[13-15]。因此,為了提高分類精度,時(shí)間序列遙感影像在分類前有必要進(jìn)行降維處理。其次,遙感影像在成像過程中,觀測到的場景分量貢獻(xiàn)與其表面積不成線性關(guān)系,這一點(diǎn)對植被類型尤其明顯。加之,遙感影像成像過程會(huì)經(jīng)歷不同場景分量之間的多次散射,這種散射受波長、觀測角度和光照條件、及場景分量三維結(jié)構(gòu)等多種因素影響,因此,使得遙感影像有著內(nèi)在的非線性特征,所以非線性降維技術(shù)更適合用于遙感影像[16-18]。其次,時(shí)間序列影像在成像過程中易受云覆蓋的影響,導(dǎo)致部分時(shí)相數(shù)據(jù)無效,這使得時(shí)間序列數(shù)據(jù)使用前往往需要較多的人工預(yù)處理操作,例如可用數(shù)據(jù)篩選、時(shí)相插值或者時(shí)間序列曲線濾波等,這顯然降低了分類模型的自動(dòng)化程度,難以移植到其他地區(qū)。為了解決上述問題,Zhai等將非線性降維方法LE(laplacian eigenmaps)與DTW(dynamic time warping)度量相結(jié)合,提出了一種自動(dòng)化的時(shí)間序列土地覆蓋分類方法——LE-DTW[19]。選擇LE降維算法的原因包含以下3個(gè)方面。第一,LE是一種非線性降維方法,當(dāng)應(yīng)用于高光譜遙感數(shù)據(jù)時(shí)已經(jīng)被證明比線性降維方法效果更好[20-21]。第二,LE是一種局部流形學(xué)習(xí)方法。局部流形學(xué)習(xí)方法的優(yōu)點(diǎn)是通過構(gòu)建近鄰圖可以保留原始數(shù)據(jù)的局部特征,與全局方法(例如,ISOMAP方法[22])相比,近鄰圖構(gòu)建時(shí)更強(qiáng)調(diào)數(shù)據(jù)的自然聚類屬性[16]。第三,LE是一種基于圖理論的方法,降維只依賴于數(shù)據(jù)點(diǎn)間的相似性程度,因此與其他局部保留方法相比,更容易結(jié)合不同的相似性度量。LE-DTW方法不僅利用了時(shí)間序列影像中全部可用的數(shù)據(jù),而且不需要進(jìn)行時(shí)間序列重構(gòu)等人工預(yù)處理操作,就能完成高精度的土地覆蓋制圖。
然而,當(dāng)將LE-DTW方法用于作物種植結(jié)構(gòu)識別時(shí),也存在著不足。這主要是因?yàn)長E-DTW方法對時(shí)間序列影像中的每一個(gè)時(shí)相數(shù)據(jù)都賦予了相同的權(quán)重。而識別作物種植結(jié)構(gòu)主要依賴于作物生長的物候特征差異,這種物候特征差異往往只體現(xiàn)在作物生長的幾個(gè)關(guān)鍵時(shí)期。因此,要提升作物種植結(jié)構(gòu)識別精度,需要充分利用作物生長季的關(guān)鍵物候特征。本研究為實(shí)現(xiàn)高精度、自動(dòng)化的作物種植結(jié)構(gòu)識別,提出一種基于時(shí)相加權(quán)改進(jìn)的LE-DTW方法——LE-wDTW(LE-weighted DTW)。該方法可用于任意傳感器的時(shí)間序列數(shù)據(jù),本文以Landsat 8數(shù)據(jù)為例。
本文以美國中部的主要農(nóng)業(yè)種植區(qū)伊利諾伊州為研究區(qū)(圖1)。該州屬溫帶氣候,80%的土地為農(nóng)業(yè)用地,夏季炎熱,冬季多雪。其地理位置位于:36°58¢N—42°30¢N、87°30¢W—91°30¢W。年平均降水,北部為800~1 200 mm,南部為1 200~1 600 mm。北部作物生長期為160 d,南部為210 d,主要種植作物為玉米和大豆等。
圖1 研究區(qū)位置示意圖(2017年6月27日Landsat8數(shù)據(jù))
1.2.1 Landsat 8數(shù)據(jù)
本研究所用的Landsat 8 OLI(operational land imager)數(shù)據(jù)從美國地質(zhì)勘探局網(wǎng)站下載(http:// earthexplorer.usgs.gov/)。Landsat 8的重訪周期是16 d,每年可獲取22或23景影像。本研究中,下載使用了條帶號為Path 23/Row 32對應(yīng)區(qū)域的2017年4月—10月Landsat 8 OLI L1T全部13景影像,每景影像的獲取日期及云覆蓋比例如圖2所示,不同時(shí)相影像包含不同程度的云覆蓋現(xiàn)象,影像大小為7 686×7 880 pixels。本研究使用空間分辨率為30 m的反射率波段1-7(包括海岸、藍(lán)、綠、紅、近紅外、短波紅外1和短波紅外2波段)和2個(gè)云掩膜文件。波段9由于對水汽吸收較敏感,故沒有使用[23]。所有影像數(shù)據(jù)通過系統(tǒng)的幾何校正和輻射校正,采用UTM-WGS84投影坐標(biāo)系。
圖2 研究區(qū)2017年影像的獲取日期及云覆蓋比例
1.2.2 驗(yàn)證數(shù)據(jù)
本研究選擇由美國農(nóng)業(yè)部國家農(nóng)業(yè)統(tǒng)計(jì)服務(wù)中心發(fā)布的2017年CDL(Cropland Data Layer)數(shù)據(jù)作為參考驗(yàn)證數(shù)據(jù),該數(shù)據(jù)可從CDL網(wǎng)站下載(http:// nassgeodata.gmu.edu/CropScape/)[24-26]。每年的CDL數(shù)據(jù)均采用中高分辨率遙感影像結(jié)合大量地面數(shù)據(jù)通過無參監(jiān)督分類方法來完成,該數(shù)據(jù)對于主要作物類型的分類精度高達(dá)95%,已在很多研究中被用作監(jiān)督分類方法的訓(xùn)練和驗(yàn)證數(shù)據(jù)[16, 27]。CDL數(shù)據(jù)的空間分辨率為30 m,定義了110個(gè)土地覆蓋及作物類型,研究區(qū)主要土地覆蓋及作物類型(覆蓋面積大于2%)如下:玉米占41.92%,大豆占35.06%,建設(shè)用地占8.77%,落葉林占6.1%,草地占5.57%。
LE降維算法[22]起源于圖譜理論,通過保留局部流形結(jié)構(gòu)來尋找高維數(shù)據(jù)的低維表達(dá)。對于遙感影像而言,其波段數(shù)量就是每個(gè)像元所在的原始特征空間維度。特征空間中的流形結(jié)構(gòu)可以用近鄰圖來表達(dá),每個(gè)像元都是一個(gè)圖結(jié)點(diǎn),將它與特征空間中距離(通常是歐氏距離)最近的個(gè)結(jié)點(diǎn)連接起來,這種連接表達(dá)了像元間的相似性程度。LE算法通過圖拉普拉斯矩陣計(jì)算其特征向量作為原始數(shù)據(jù)降維后的結(jié)果。
LE-DTW方法是在原始特征空間中,用DTW度量[28]代替歐氏距離來為每個(gè)樣本尋找其個(gè)最近鄰點(diǎn)。對于時(shí)間序列遙感影像,在原始特征空間中,如果某像元的某個(gè)時(shí)相維度數(shù)據(jù)是無效的(例如,被云覆蓋),那么在降維前構(gòu)建時(shí)間序列輸入數(shù)據(jù)時(shí)直接剔除即可,將其他全部有效數(shù)據(jù)保留。這就使得所構(gòu)建的時(shí)間序列數(shù)據(jù)是不等長的,而DTW度量可以尋找到2個(gè)不等長時(shí)間序列間的最優(yōu)彎曲路徑,從而衡量出2個(gè)不等長時(shí)間序列的相似性程度。
標(biāo)準(zhǔn)的DTW度量在尋找2個(gè)時(shí)間序列間的最優(yōu)彎曲路徑時(shí),對每個(gè)時(shí)相都賦予相同的權(quán)重,而不考慮路徑中每一步所對應(yīng)2個(gè)時(shí)間序列在時(shí)相上的差異。對于作物分類而言,所依賴的物候特征與時(shí)相有密切的關(guān)系,相同時(shí)相下的物候差異才是用來區(qū)別不同類型作物的主要特征。因此,在用DTW計(jì)算2個(gè)時(shí)間序列間路徑的最小累積距離時(shí),如果路徑對應(yīng)的兩個(gè)時(shí)相一致或相近時(shí),應(yīng)賦予更小的權(quán)重,而當(dāng)路徑對應(yīng)兩個(gè)時(shí)相距離較遠(yuǎn)時(shí),則應(yīng)賦予更大的權(quán)重。據(jù)此,本文提出一種加權(quán)版的LE-DTW算法(LE-wDTW)。
在LE-wDTW算法中,用加權(quán)DTW(wDTW)度量代替原始DTW距離來為每個(gè)樣本尋找其個(gè)最近鄰點(diǎn)。設(shè)時(shí)間序列和的時(shí)相長度分別為和:
時(shí)間序列和可以按序構(gòu)成一個(gè)′的路徑矩陣,矩陣的每個(gè)元素()對應(yīng)于點(diǎn)t和s的排列。計(jì)算wDTW距離時(shí),在′的路徑矩陣中,t與s的距離如下計(jì)算:
式中(t,s)代表t與s的時(shí)相間隔,是一個(gè)經(jīng)驗(yàn)常數(shù),其取值范圍為[0, +μ],為時(shí)間序列中點(diǎn),即作物整個(gè)生育期覆蓋天數(shù)的一半,本研究區(qū)作物整個(gè)生育期約為190天,故應(yīng)為95 d。
其中用來控制函數(shù)曲率(斜率),通過試驗(yàn)發(fā)現(xiàn),不同的值對函數(shù)曲率的影響包含以下4種情況:1)當(dāng)=0時(shí),所有時(shí)相的權(quán)重值相等,此時(shí),LE-wDTW即為LE-DTW;2)當(dāng)=0.03左右時(shí),權(quán)重與時(shí)相間隔成正比,即Logistic model接近線性模型;3)當(dāng)=0.10左右時(shí),不同時(shí)相間隔對應(yīng)“S”型權(quán)重模型,不同的值代表不同的“S”型彎曲程度,這也是本研究主要采用的權(quán)重計(jì)算模型;4)當(dāng) >3時(shí),權(quán)重模型接近二值模型,即前一半時(shí)相間隔權(quán)值一致,后一半時(shí)相間隔權(quán)值一致。本研究中,不同值的權(quán)重計(jì)算模型如圖3所示。
在對原始數(shù)據(jù)完成降維之后,可以將降維后的數(shù)據(jù)直接輸入任意分類器完成最終作物種植結(jié)構(gòu)提取。為了驗(yàn)證LE-wDTW方法的效果,進(jìn)行了一組定量分類試驗(yàn)。為了更好體現(xiàn)出作物物候特征,將時(shí)間序列數(shù)據(jù)按波段-時(shí)相進(jìn)行排列,即同一波段的所有時(shí)相數(shù)據(jù)排列在一起。試驗(yàn)共選擇3種數(shù)據(jù)處理方法進(jìn)行對比,分別為TI(Temporal Interpolation)、LE-DTW和LE-wDTW方法。其中,TI法,是直接對原始時(shí)間序列數(shù)據(jù)進(jìn)行插值而不進(jìn)行數(shù)據(jù)降維操作,將被云覆蓋的無效數(shù)據(jù)用前后相近時(shí)相的有效數(shù)據(jù)來代替,然后直接輸入分類器完成分類。LE-DTW和LE-wDTW方法則直接將原始時(shí)間序列數(shù)據(jù)中的無效數(shù)據(jù)剔除,保留全部有效數(shù)據(jù)進(jìn)行降維,將降維后的數(shù)據(jù)輸入分類器完成分類。本試驗(yàn)采用隨機(jī)森林分類器[29],樹分類器數(shù)量設(shè)置為500。
圖3 不同經(jīng)驗(yàn)值a下的Logistic model權(quán)重(時(shí)間序列中點(diǎn)b=95)
2.3.1 分類方法對比
所有試驗(yàn)均采用相同的參數(shù)設(shè)置,訓(xùn)練和測試數(shù)據(jù)分別從2017CDL數(shù)據(jù)中獲取。從各個(gè)類別中隨機(jī)選擇1%的CDL像素作為訓(xùn)練數(shù)據(jù),其余數(shù)據(jù)進(jìn)行測試。LE-DTW和LE-wDTW有2個(gè)共同參數(shù)需要設(shè)置:一個(gè)是為每個(gè)像元選擇最近鄰的數(shù)量,本試驗(yàn)采用“圖生長”策略來自適應(yīng)選擇,無需人工設(shè)置[30-31];另一個(gè)參數(shù)是降維后保留的波段數(shù)量,本試驗(yàn)中降維后所有方法均保留10個(gè)波段,事實(shí)上,保留的波段數(shù)量大于類別數(shù)(本試驗(yàn)類別數(shù)為5)就可以確保保留了足夠的有效信息[16]。對于LE-wDTW方法中計(jì)算權(quán)重所需的參數(shù),通過預(yù)試驗(yàn)發(fā)現(xiàn),當(dāng)=0.1和=95天時(shí),有最好的全局精度,故分類試驗(yàn)中按此參數(shù)設(shè)置。最后,計(jì)算每種方法分類結(jié)果的混淆矩陣,用總體分類精度、各類別分類精度和Kappa系數(shù)評價(jià)各方法的表現(xiàn)。
2.3.2 訓(xùn)練數(shù)據(jù)敏感性分析
此外,為了驗(yàn)證LE-wDTW方法對不同比例訓(xùn)練數(shù)據(jù)的敏感程度,隨機(jī)選擇0.1%、0.3%、0.5%、0.7%,0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%和10%的CDL像素作為訓(xùn)練數(shù)據(jù)分別進(jìn)行試驗(yàn)。為了確保結(jié)果的可靠性,所有試驗(yàn)重復(fù)10次。
LE-wDTW方法應(yīng)用于研究區(qū)的分類結(jié)果(訓(xùn)練樣本比例為1%)如圖4b所示,對于分類結(jié)果分別用定性和定量的方法對其進(jìn)行評價(jià)。
圖4 研究區(qū)3種數(shù)據(jù)處理方法結(jié)合隨機(jī)森林分類器的分類結(jié)果
3.1.1 局部分類圖對比
由于研究區(qū)覆蓋范圍較大,為了更好地對比分類結(jié)果,選擇2個(gè)局部區(qū)域進(jìn)行展示。從圖4c、4d和4e可以看到該局部區(qū)域內(nèi),3種方法對于2種主要作物玉米和大豆的分類情況。通過目視分析,顯然,TI方法的分類結(jié)果中,玉米和大豆之間存在著較多的錯(cuò)分和漏分情況,“椒鹽現(xiàn)象”明顯。LE-DTW方法的分類結(jié)果比TI方法要好,“椒鹽現(xiàn)象”有所改善。效果最好的是LE-wDTW方法,玉米和大豆交叉種植的塊狀特征明顯,符合實(shí)際種植情況。
從圖4f、4g和4h的分類對比圖可以看出,該局部區(qū)域除了主要作物玉米和大豆外,還分布有建設(shè)用地、牧草地和落葉林。通過目視判讀發(fā)現(xiàn),TI方法對于2種主要作物與牧草地和落葉林的區(qū)分程度較差,甚至于將部分牧草地和落葉林劃分到了建設(shè)用地類別中,出現(xiàn)明顯錯(cuò)誤。而LE-DTW方法對于作物與牧草地和落葉林的區(qū)分效果較好,但是對于牧草地與落葉林二者之間的分類結(jié)果不如LE-wDTW方法。
3.1.2 分類精度對比
3種方法應(yīng)用于整個(gè)研究區(qū)的總體分類精度、Kappa系數(shù)及各個(gè)類別的生產(chǎn)者精度和用戶精度如表1所示。從表中可以看到,整體分類精度最高的是LE-DTW方法,比TI和LE-DTW方法分別提高了9.05個(gè)百分點(diǎn)和3.45個(gè)百分點(diǎn)。不僅如此,與TI和LE-DTW相比,LE-wDTW方法在各個(gè)單一類別的分類精度上也是最高的。對于2種主要作物玉米和大豆而言,LE-wDTW方法的生產(chǎn)者精度比TI方法和LE-DTW方法分別提升8.61個(gè)百分點(diǎn)和3.44個(gè)百分點(diǎn),用戶精度分別提升了6.19個(gè)百分點(diǎn)和3.02個(gè)百分點(diǎn)。對于其他占比較小的土地覆蓋類型而言,LE-wDTW方法分類精度的提升更加明顯,例如,建設(shè)用地類別的生產(chǎn)者精度比TI方法提高了15.94個(gè)百分點(diǎn),比LE-DTW方法提高了6.30個(gè)百分點(diǎn);所有占比較小類別中提升最低的是落葉林類別,其生產(chǎn)者精度提升了8.04個(gè)百分點(diǎn)和4.79個(gè)百分點(diǎn),用戶精度提升幅度與生產(chǎn)者精度類似。
表1 三種數(shù)據(jù)處理方法結(jié)合隨機(jī)森林分類的總體分類精度和Kappa系數(shù)
Note: PA, Producer’s accuracy; UA, User’s accuracy.
分類精度通常與訓(xùn)練數(shù)據(jù)集大小成正比,通過仔細(xì)選擇訓(xùn)練樣本可以在不損失監(jiān)督分類精度的前提下減小訓(xùn)練數(shù)據(jù)集的大小。由于光譜降維技術(shù)在變換高維數(shù)據(jù)到低維空間的過程中,會(huì)最大化保留有用信息并且最小化噪聲,因此,一種理想的降維方法應(yīng)該是使用較少的訓(xùn)練數(shù)據(jù)就能完成較高的分類精度。
圖5展示了LE-DTW方法和LE-wDTW方法應(yīng)用于Landsat時(shí)間序列數(shù)據(jù)時(shí),選擇不同比例訓(xùn)練樣本完成的整體分類精度情況。從圖5可以看到,LE-wDTW方法的整體分類精度均值始終高于LE-DTW方法。并且,當(dāng)LE-DTW和LE-wDTW方法在訓(xùn)練樣本比例分別達(dá)到3%和2%時(shí),整體分類精度趨于穩(wěn)定,這一點(diǎn)上,LE-wDTW優(yōu)于LE-DTW。此外,每個(gè)訓(xùn)練樣本比例分類試驗(yàn)重復(fù)10次,通過其標(biāo)準(zhǔn)差可以看到,當(dāng)訓(xùn)練樣本比例高于1%時(shí),2種方法的正負(fù)標(biāo)準(zhǔn)差均在1%以下,最大標(biāo)準(zhǔn)差出現(xiàn)在訓(xùn)練樣本比例最低(0.1%)時(shí),LE-DTW方法的負(fù)標(biāo)準(zhǔn)差為2.8%。結(jié)果表明,LE-wDTW方法應(yīng)用于時(shí)間序列遙感影像的作物分類時(shí),比LE-DTW方法表現(xiàn)更好。
圖5 不同比例訓(xùn)練樣本的分類精度
本文提出了一種加權(quán)LE-DTW方法,稱為LE-wDTW,用于作物種植結(jié)構(gòu)提取,并與時(shí)相插值法和原始LE-DTW法進(jìn)行對比試驗(yàn)。結(jié)果表明,2種基于非線性光譜降維的作物分類方法,其精度均高于未降維的時(shí)相插值法,這與以往的研究結(jié)果一致[16,19],可能的原因如下:1)時(shí)間序列數(shù)據(jù)存在數(shù)據(jù)冗余,降維技術(shù)可以有效避免“休斯現(xiàn)象”[32]。2)時(shí)相插值法并不能增加有效的數(shù)據(jù)信息,反而會(huì)因?yàn)檫@種“預(yù)測”而帶來新的誤差。3)衛(wèi)星影像時(shí)間序列數(shù)據(jù)存在內(nèi)在的非線性特征,使用非線性降維方法可以在減少數(shù)據(jù)冗余的同時(shí)保留適合于分類的屬性特征。
與LE-DTW方法相比,LE-wDTW方法完成了更高的分類精度。這說明在充分利用時(shí)間序列遙感影像中全部有效數(shù)據(jù)的前提下,LE-wDTW方法更好地挖掘并使用了作物的物候特征。一方面,適合用于分類的物候特征應(yīng)該是在相同時(shí)相下,不同作物生長狀態(tài)的差異特征,尋找這種差異特征往往需要依賴較多的人工干預(yù),這意味著所建立的分類模型不僅難以自動(dòng)化,而且也難以移植到其他地區(qū)。LE-wDTW方法是基于統(tǒng)計(jì)學(xué)理論結(jié)合機(jī)器學(xué)習(xí)方法而建立的自動(dòng)化作物種植結(jié)構(gòu)提取模型,使用wDTW度量可以更好地強(qiáng)化這種相同時(shí)相下的物候特征差異,該方法不需要人工干預(yù),就可以完成高精度的作物分類制圖。另一方面,除了研究區(qū)主要作物玉米和大豆外,還有占比較小的落葉林、建設(shè)用地和牧草地等土地覆蓋類型,通過試驗(yàn)可以發(fā)現(xiàn),對于這些占比較小的類型,LE-wDTW方法也獲得較高的精度,這說明該方法對于小樣本類別也有較好的適用性,這符合機(jī)器學(xué)習(xí)方法的特點(diǎn)。此外,算法對訓(xùn)練樣本的敏感性試驗(yàn)表明,LE-wDTW算法只需要較少的訓(xùn)練樣本就能獲得穩(wěn)定的分類精度,這對于作物分類研究意義重大,因?yàn)楂@取較多的訓(xùn)練樣本是一項(xiàng)需要消耗大量人力和物力的工作。
本研究也存在一些不足之處,在今后研究中有待加以改進(jìn)。LE-wDTW算法的復(fù)雜度較高,尤其是隨著空間維度的增加,計(jì)算量會(huì)迅速增長。因此,當(dāng)將本文方法用于更大尺度研究,例如全球尺度作物分類時(shí),如何提升計(jì)算效率是一個(gè)待解決的問題。事實(shí)上,這個(gè)問題存在于大部分的流形學(xué)習(xí)降維算法中,已經(jīng)成為流形學(xué)習(xí)的一個(gè)研究方向。雖然已經(jīng)有研究者提出多種解決方案,例如使用Landmark points策略[33],或者增強(qiáng)Graphics Processing Unit (GPU)的運(yùn)算能力[34]等,但是如何與本文方法相結(jié)合,仍有待進(jìn)一步研究。
本文以作物全生育期Landsat 8時(shí)間序列遙感影像為數(shù)據(jù)源,改進(jìn)了基于流形學(xué)習(xí)的特征提取方法,形成了一種結(jié)合物候特征的時(shí)間序列光譜降維算法——LE-wDTW,結(jié)合隨機(jī)森林分類器,提取了美國伊利諾伊州主要作物的種植結(jié)構(gòu)信息。
1)采用2種非線性光譜降維方法對研究區(qū)作物分類,取得了較高的分類精度,總體精度都優(yōu)于81.92%,其中LE-wDTW方法總體精度達(dá)到85.37%,比傳統(tǒng)的時(shí)相插值法提升9.05個(gè)百分點(diǎn)。這說明時(shí)間序列遙感數(shù)據(jù)存在著數(shù)據(jù)冗余,在進(jìn)行分類前需要進(jìn)行光譜降維處理。
2)LE-wDTW方法在度量時(shí)間序列數(shù)據(jù)點(diǎn)間的相似性時(shí),對于時(shí)相上相近的物候特征賦予了不同權(quán)重,獲得了比賦予相同權(quán)重的LE-DTW方法更高的分類精度。這表明對于作物分類而言,相同時(shí)相的物候差異特征對于區(qū)分不同作物起著至關(guān)重要的作用。因此,LE-wDTW方法更適合于作物分類。
3)LE-wDTW方法不需要人工干預(yù),只需要較少的訓(xùn)練樣本,就可以獲得較高并且穩(wěn)定的分類精度,將其應(yīng)用于不同尺度的作物分類有很大的潛力。
[1] United Nations. World Population Prospects: The 2017 Revision. Key Findings and Advance Tables[R]. 2017.
[2] Gong Peng, Wang Jie, Yu Le, et al. Finer resolution observation and monitoring of global land cover: First mapping results with Landsat TM and ETM+ data[J]. International Journal of Remote Sensing, 2013, 34(7): 2607-2654.
[3] 陳仲新,任建強(qiáng),唐華俊,等. 農(nóng)業(yè)遙感研究應(yīng)用進(jìn)展與展望[J]. 遙感學(xué)報(bào),2016,20(5):748-767. Chen Zhongxin, Ren Jianqiang, Tang Huajun, et al. Progress and perspectives on agricultural remote sensing research and applications in China[J]. Journal of Remote Sensing, 2016, 20(5): 748-767. (in Chinese with English abstract)
[4] Maxwell A E, Warner T A, Fang F. Implementation of machine-learning classification in remote sensing: an applied review[J]. International Journal of Remote Sensing, 2018, 39(9): 2784-2817.
[5] Xiong J, ThenkabailP S, Gumma M K, et al. Automated cropland mapping of continental Africa using Google Earth Engine cloud computing[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 126: 225-244.
[6] Yan Li, Roy D P. Automated crop field extraction from multi-temporal Web Enabled Landsat Data[J]. Remote Sensing of Environment, 2014, 144: 42-64.
[7] 郝鵬宇,牛錚,王力,等. 基于歷史時(shí)序植被指數(shù)庫的多源數(shù)據(jù)作物面積自動(dòng)提取方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(23):123-131. Hao Pengyu, Niu Zheng, Wang Li, et al. Multi-source automatic crop pattern mapping based on historical vegetation index profiles[J]. Transactions of the Chinese Society of Agricultral Engineering (Transactions of the CSAE), 2012,28(23): 123-131. (in Chinese with English abstract)
[8] Gómez C, White J C, WulderM A. Optical remotely sensed time series data for land cover classification: A review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2016, 116: 55-72.
[9] Victor Maus, Gilberto Camara, Ricardo Cartaxo, et al. A time-weighted dynamic time warping method for land-use and land-cover mapping[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2016, 9(8): 3729-3739.
[10] Cornelius Senf, Pedro J Leit?o, Dirk Pflugmacher, et al. Mapping land cover in complex Mediterranean landscapes using Landsat: Improved classification accuracies from integrating multi-seasonal and synthetic imagery[J]. Remote Sensing of Environment, 2015, 156: 527-536.
[11] Hannes Müller, Philippe Rufin, Patrick Griffiths, et al. Mining dense Landsat time series for separating cropland and pasture in a heterogeneous Brazilian savanna landscape[J]. Remote Sensing of Environment, 2015, 156: 490-499.
[12] Fran?ois Waldner, Guadalupe Sepulcre Canto, Pierre Defourny. Automated annual cropland mapping using knowledge-based temporal features[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2015, 110: 1-13.
[13] Andrew P Tewkesbury, Alexis J Comber, Nicholas J Tate, et al. A critical synthesis of remotely sensed optical image change detection techniques[J]. Remote Sensing of Environment, 2015, 160: 1-14.
[14] L?w F, Michel U, Dech S, et al. Impact of feature selection on the accuracy and spatial uncertainty of per-field crop classification using support vector machines[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 85: 102-119.
[15] Ludmila I Kuncheva, William J Faithfull. PCA feature extraction for change detection in multidimensional unlabeled data[J]. IEEE Transactions on Neural Networks and Learning Systems, 2014, 25(1): 69-80.
[16] Yan Li, Roy D P. Improved time series land cover classification by missing-observation-adaptive nonlinear dimensionality reduction[J]. Remote Sensing of Environment, 2015, 158: 478-491.
[17] Crystal Schaaf, Feng Gao, Alan H Strahler, et al. First operational BRDF, albedo nadir reflectance products from MODIS[J]. Remote Sensing of Environment, 2002, 83(1): 135-148.
[18] Ben Somers, Kenneth Cools, Stephanie Delalieux, et al. Nonlinear hyperspectral mixture analysis for tree cover estimates in orchards[J]. Remote Sensing of Environment, 2009, 113(6): 1183-1193.
[19] Zhai Yongguang, Qu Zhongyi, Hao Lei. Land cover classification using integrated spectral, temporal, and spatial features derived from remotely sensed images[J]. Remote Sensing, 2018, 10(3): 383.
[20] Bachmann C M, Ainsworth T L, Fusina R A. Exploiting manifold geometry in hyperspectral imagery[J]. IEEE Transactions on Geoscience & Remote Sensing, 2005, 43(3): 441-454.
[21] Zhang Liangpei, Zhang Lefei, Tao Dacheng, et al. Tensor discriminative locality alignment for hyperspectral image spectral–spatial feature extraction[J]. IEEE Transactions on Geoscience & Remote Sensing, 2012, 51(1): 242-256.
[22] Tenenbaum J B, Silva V De, Langford J C. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290(5500): 2319-2323.
[23] Roy D P, Wulder M A, Loveland T R, et al. Landsat-8: Science and product vision for terrestrial global change research[J]. Remote Sensing of Environment, 2014, 145(145): 154-172.
[24] ClaireBoryan, Yang Zhengwei, RickMueller, et al. Monitoring US agriculture: The US Department of Agriculture, National Agricultural Statistics Service, Cropland Data Layer Program[J]. Geocarto International, 2011, 26(5): 341-358.
[25] Hansen M C, Egorov Alexey, Potapov P V, et al. Monitoring conterminous United States (CONUS) land cover change with web-enabled Landsat data (WELD)[J]. Remote sensing of Environment, 2014, 140: 466-484.
[26] Han Weiguo, Yang Zhengwei, Di Liping, et al. CropScape: A Web service based application for exploring and disseminating US conterminous geospatial cropland data products for decision support[J]. Computers & Electronics in Agriculture, 2012, 84(11): 111-123.
[27] David Johnson. A 2010 map estimate of annually tilled cropland within the conterminous United States[J]. Agricultural Systems, 2013, 114(114): 95-105.
[28] Berndt D J. Using dynamic time warping to find patterns in time series[C]// in KDD Workshop, 1994:359-370.
[29] Leo Breiman. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[30] Zhai Yongguang, Zhang Lifu, Wang Nan, et al. A modified locality-preserving projection approach for hyperspectral image classification[J]. IEEE Geoscience & Remote Sensing Letters, 2017, 13(8): 1059-1063.
[31] 翟涌光. 綜合時(shí)空譜多維遙感特征的作物精細(xì)分類方法研究[D]. 北京:中國科學(xué)院大學(xué),2017. Zhai Yongguang. Detailed Crop Classification using Integrated Spectral, Temporal and Spatial Features Derived from Remotely Sensed Images[D]. Beijing: University of Chinese Academy of Sciences, 2017. (in Chinese with English abstract)
[32] Gordon Hughes. On the mean accuracy of statistical pattern recognizers[J]. IEEE Transactions on Information Theory, 1968, 14(1): 55-63.
[33] Silva V D, Tenenbaum J B. Global versus local methods in nonlinear dimensionality reduction[C]// in International Conference on Neural Information Processing Systems, 2002: 721-728.
[34] Bachmann C M, Ainsworth T L, Fusina R A, et al. Manifold coordinate representations of hyperspectral imagery: Improvements in algorithm performance and computational efficiency[C]// in Geoscience and Remote Sensing Symposium, 2010: 4244-4247.
Crop classification based on nonlinear dimensionality reduction using time series remote sensing images
Zhai Yongguang1,2, Qu Zhongyi1※
(1.010018,; 2.100101,)
Compared with the traditional method of ground statistics, remote sensing technology has the unique advantages of high efficiency, fast speed and high precision. It is suitable for agricultural monitoring, especially the time series remote sensing data can provide spectral information covering the whole growing season of crops. At present, most of the crop classification methods based on time series remote sensing data need many expert knowledge and manual intervention, which are difficult to automate and transplant to other areas. The application of dimensionality reduction (DR) technique to time series remote sensing image analysis can solve this problem efficiently. The imaging process of remote sensing image will experience multiple scattering between different scene components. This scattering is influenced by many factors such as wavelength, observation angle, illumination condition, and three-dimensional structure of scene component. Therefore, the remote sensing image has inherent nonlinear characteristics, and the nonlinear DR technology is more suitable for remote sensing images. The nonlinear spectral DR method has been successfully applied to hyperspectral data and obtained better results than linear DR methods. However, the nonlinear DR method cannot make full use of the temporal information in time series remote sensing images. In this study, a nonlinear DR algorithm, Laplacian Eigenmaps (LE), is refined for crop classification in time series remote sensing images. This method emphasizes the phenological characteristics difference of different crop growing seasons. In the refined LE algorithm, the dynamic time warping (DTW) measurement with different weight value is used to calculate the similarity between the time series. If the two phases of the calculated path are consistent or close, a smaller weight should be given, and a greater weight should be given when the two phases correspond to the path are far away. In addition, the refined LE method can be applied to time series data with unequal length and reduce the preprocessing operation of time series data. Moreover, the proposed method is simple to run and only requires two input parameters. One is the midpoint of time series, and the other is the number of retained bands after DR. Both two parameters are easily to obtain. The refined LE algorithm is applied to the Landsat time series images of the whole growing season of crops in Illinois, USA. A series of classification experiments based on the training data provided by the United States Department of Agriculture National Agricultural Statistics Services Cropland Data Layer (CDL) are completed and compared with the traditional interpolation method without DR and the LE-DTW method proposed for land cover classification. The experimental results show that the refined LE DR method has completed a higher classification accuracy and per-class accuracy than other methods. And the overall classification accuracy of the proposed method reaches 85.37%, which is 9.05 and 3.45 percentage points higher than that of temporal interpolation (TI) method and LE-DTW method respectively. And the method can achieve a given degree of classification accuracy with only a small number of training samples. When the proportion of training samples is higher than 1%, the positive and negative standard deviations of the proposed method is below 1%. The overall classification accuracy of the proposed method tends to be stable when the proportion of training samples reaches 2%. The refined LE dimensionality reduction method is an automatic method and can be directly applied to other research areas without manual intervention. It provides an effective method for crop identification and extraction on different scales in the future.
remote sensing; data processing; crops; classification; nonlinear spectral dimensionality reduction; time series; dynamic time warping
10.11975/j.issn.1002-6819.2018.19.023
TP79
A
1002-6819(2018)-19-0177-07
2018-05-17
2018-07-21
內(nèi)蒙古農(nóng)業(yè)大學(xué)高層次人才科研啟動(dòng)金項(xiàng)目(NDYBH2017-2);內(nèi)蒙古自然科學(xué)基金項(xiàng)目(2018BS04001);“十三五”國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2016YFC0501301);國家自然科學(xué)基金項(xiàng)目(51779117)資助
翟涌光,內(nèi)蒙古呼倫貝爾人,講師,博士,研究方向:農(nóng)業(yè)遙感。Email: ychia@imau.edu.cn
屈忠義,內(nèi)蒙古巴彥淖爾人,教授,博導(dǎo),研究方向:區(qū)域灌溉排水。Email: quzhongyi@imau.edu.cn
翟涌光,屈忠義. 基于非線性降維時(shí)序遙感影像的作物分類[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(19):177-183. doi:10.11975/j.issn.1002-6819.2018.19.023 http://www.tcsae.org
Zhai Yongguang, Qu Zhongyi. Crop classification based on nonlinear dimensionality reduction using time series remote sensing images[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(19): 177-183. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2018.19.023 http://www.tcsae.org