張鳳,張錦水,4,段雅鳴,楊志
1.北京師范大學(xué) 遙感科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,北京 100875;
2.北京師范大學(xué) 地理科學(xué)學(xué)部 北京市陸表遙感數(shù)據(jù)產(chǎn)品工程技術(shù)研究中心,北京 100875;
3.北京師范大學(xué) 地理科學(xué)學(xué)部 遙感科學(xué)與工程研究院,北京 100875;
4.青海師范大學(xué) 高原科學(xué)與可持續(xù)發(fā)展研究院,西寧 810016
準(zhǔn)確、快速地獲取秋糧作物種植空間分布和面積對于糧食安全和地區(qū)農(nóng)業(yè)政策制定意義重大(謝登峰等,2015)。遙感具有覆蓋范圍大、視點(diǎn)高、現(xiàn)勢性強(qiáng)的優(yōu)勢,是當(dāng)前進(jìn)行農(nóng)作物提取的最重要技術(shù)手段之一(胡瓊等,2015)。因此,利用遙感技術(shù)進(jìn)行作物面積測量一直是農(nóng)業(yè)遙感的熱點(diǎn)領(lǐng)域。
自對地觀測遙感技術(shù)發(fā)展以來,國內(nèi)外專家學(xué)者注重發(fā)展模式識別的模型方法進(jìn)行秋糧作物類型識別(劉佳等,2018;許淇等,2019;Yang等,2011;馬麗等,2008),也有研究利用多源遙感特征進(jìn)行作物識別(Zhang等,2018;Phalke等,2020;You 和Dong,2020)。然而,迄今為止秋糧作物遙感分類依然存在一些不足,主要體現(xiàn)在傳統(tǒng)分類方法多利用較為單一的遙感響應(yīng)特征,無法提取深層次特征,分類模型能力不足,這種人為選擇特征訓(xùn)練出的模型一般要求訓(xùn)練區(qū)域和測試區(qū)域遙感特征要嚴(yán)格一致,因此一般模型適應(yīng)特定區(qū)域,難以大范圍推廣應(yīng)用(Zhong等,2020)。
深度學(xué)習(xí)通過學(xué)習(xí)淺層細(xì)節(jié)特征,隨著模型層數(shù)的加深不斷提取更為復(fù)雜的特征,在不需要人為干預(yù)的情況下不斷改進(jìn)預(yù)測,在很大程度上能夠克服傳統(tǒng)分類器的不足,自動、高效地提取出大量的深層特征,實(shí)現(xiàn)端到端的自動化分類,已被廣泛引入到遙感應(yīng)用中(宋德娟,2019;Jiang等,2018;Zhong等,2019),在農(nóng)作物遙感分類中也得到了廣泛應(yīng)用(Zhong等,2020;Sun等,2020)。然而,深度卷積神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確分類的前提是需要大量高質(zhì)量的作物類型標(biāo)簽數(shù)據(jù),但這種作物標(biāo)簽數(shù)據(jù)的獲取需要耗費(fèi)大量的人力物力(Xu等,2020;許晴等,2022),這是深度學(xué)習(xí)面向?qū)嶋H應(yīng)用最大的瓶頸之一。
美國農(nóng)業(yè)部統(tǒng)計署(National Agricultural Statistics Service)每年定期發(fā)布基于CLU(Common Land Unit)和時間序列遙感數(shù)據(jù)生產(chǎn)的作物類型數(shù)據(jù)CDL(Cropland Data Layer)(https://www.nass.usda.gov/Research_and_Science/Cropland/SARS1a.php[2021-05-31],主要農(nóng)作物的制圖精度在85%—95%(Egli,2008)。已有相關(guān)研究將CDL 數(shù)據(jù)作為標(biāo)簽數(shù)據(jù)構(gòu)建深度學(xué)習(xí)模型進(jìn)行作物分類,取得了理想的結(jié)果,如Cai等(2018)利用CDL作為標(biāo)簽樣本進(jìn)行縣級尺度的模型訓(xùn)練,測試了多個年份、不同區(qū)域的模型遷移應(yīng)用,驗(yàn)證了該分類模式的適用性;Xu 等(2020)利用Landsat ARD(Landsat Analysis Ready Data)和CDL 數(shù)據(jù)構(gòu)建訓(xùn)練數(shù)據(jù)集構(gòu)建DCM(Deep Crop Mapping)模型實(shí)現(xiàn)了位于美國6個實(shí)驗(yàn)站點(diǎn)玉米、大豆的空間泛化實(shí)驗(yàn),試驗(yàn)站點(diǎn)平均Kappa為85.8%,泛化區(qū)域的平均Kappa為82.0%。Konduri等(2020)采用可擴(kuò)展的聚類—標(biāo)簽?zāi)P?,利用多年MODIS NDVI和CDL構(gòu)建數(shù)據(jù)集進(jìn)行訓(xùn)練,構(gòu)建相似物候區(qū)域,基于物候區(qū)和作物類別之間的空間一致性,利用作物曲線將作物標(biāo)簽類型分配到每一個物候區(qū),在玉米、大豆和冬小麥的主產(chǎn)區(qū),8種主要作物分類精度達(dá)到了70%。
已有研究證實(shí)了CDL 能夠作為作物標(biāo)簽數(shù)據(jù)構(gòu)建小區(qū)域分類模型應(yīng)用到其他區(qū)域或年份,本文利用CDL 構(gòu)建標(biāo)簽樣本進(jìn)行深度學(xué)習(xí)模型訓(xùn)練,驗(yàn)證模型在更大空間和時間尺度上的遷移泛化能力,提高秋糧遙感識別效率。本研究以美國的CDL 作為標(biāo)簽數(shù)據(jù)訓(xùn)練深度學(xué)習(xí)模型,遷移模型到美國其他區(qū)域和中國東北地區(qū),驗(yàn)證模型在不同農(nóng)業(yè)景觀、不同年份的時空遷移能力,解釋CDL 作為標(biāo)簽數(shù)據(jù)訓(xùn)練模型在大范圍進(jìn)行農(nóng)作物分類的適用性,為大尺度農(nóng)作物自動、高效的分類提供理論依據(jù)。
本研究選擇美國中西部玉米、大豆主產(chǎn)區(qū)的CDL 作為訓(xùn)練樣本。為驗(yàn)證模型跨越時間、空間尺度上的泛化能力,選取美國玉米和大豆種植較為集中的印第安納州和伊利諾伊州作為訓(xùn)練區(qū),跨度范圍36°58′N—42°30′N、84°46′W—94°31′W,共約24 萬km2,玉米和大豆占到作物種植面積的55%以上,位于平原地區(qū),田塊比較規(guī)則,面積大小約33.33—66.67 hm2;模型遷移泛化區(qū)是美國大豆、玉米種植比較集中的區(qū)域,分別位于明尼蘇達(dá)州南部、愛荷華州中西部和俄亥俄州東北部(分別記為A1、A2、A3,范圍分別為44°35′N—44°40′N、99°47′W—99°52′W、41°50′N—41°55′N、96° 32′W—96° 37′W,40° 22′N—40° 27′N 和83°02′W—83°07′W),每個區(qū)域平均面積為3500 km2,測試區(qū)中心點(diǎn)之間的南北緯度相差3°,東西經(jīng)度相差10°。
為研究洲際跨度的模型遷移能力,本文選擇了中國黑龍江省黑河市(47°42′N—51°03′N,124°45′E—129°18′E),該地區(qū)地處嫩江平原的東部,大興安嶺的東端,境內(nèi)水系發(fā)達(dá),東部為山區(qū),西部耕地較集中,山地交錯分布;氣候類型屬于寒溫帶大陸性季風(fēng)氣候,春夏濕潤,適宜種植玉米、大豆,該地區(qū)的田塊相對規(guī)則,大小平均在1—1.6 hm2,玉米和大豆種植面積之和達(dá)到了95%以上,二者比例約為3∶7。本文利用CDL 訓(xùn)練的模型遷移黑河市進(jìn)行作物提取,實(shí)現(xiàn)空間尺度的泛化,目的是測試秋糧深度學(xué)習(xí)分類模型的空間泛化能力,從更大地域空間尺度分析不同農(nóng)業(yè)景觀和不同年份的時空遷移能力,驗(yàn)證基于CDL 訓(xùn)練深度學(xué)習(xí)模型的泛化能力。
2.2.1 訓(xùn)練數(shù)據(jù)集構(gòu)建
本研究所采用的遙影像數(shù)據(jù)是2016年—2020年作物生長關(guān)鍵物候期(播種期和生長旺盛期)的Landsat 8 OLI地表反射率,空間分辨率為30 m,波段選取藍(lán)、綠、紅、近紅外、短波紅外1和短波紅外2(Xu等,2020)。GEE(Google Earth Engine)平臺提供了大量存檔的Landsat 影像和CDL 數(shù)據(jù)。本文選擇作物的播種期和生長旺盛期兩個時期作為識別關(guān)鍵期,考慮到遙感影像受到云的影響,需要對一定時間窗口內(nèi)的遙感影像進(jìn)行晴空影像合成處理,具體流程見圖1:首先利用GEE 提供的Fmask 算法計算出云分?jǐn)?shù),使用QA 波段和按位與運(yùn)算逐像元進(jìn)行中值合成去云處理;然后將影像統(tǒng)一轉(zhuǎn)成UTM 投影,WGS-84 地理坐標(biāo)系。從美國農(nóng)業(yè)部網(wǎng)站獲取的農(nóng)業(yè)數(shù)據(jù)分析可以得到,美國農(nóng)業(yè)種植區(qū)域廣,作物種植物候區(qū)域間差異比較大,本文在大區(qū)域尺度上選擇播種和生長旺盛的遙感影像分別為3月15日至6月15日和7月1日至10月1日時間段,通過兩個時期影像合成晴空影像進(jìn)行模型訓(xùn)練。表1是訓(xùn)練遙感影像選取時間窗口和目標(biāo)作物(玉米、大豆)種植結(jié)構(gòu)。
表1 伊利諾伊州和印第安納州訓(xùn)練數(shù)據(jù)集遙感影像及作物樣本信息Table 1 Detailed information of the remote sensing image data of training dataset and samples of Illinois and Indiana
圖1 訓(xùn)練數(shù)據(jù)集構(gòu)建流程Fig.1 The flowchart of the training data set construction
圖1是訓(xùn)練數(shù)據(jù)集構(gòu)建技術(shù)流程,選取訓(xùn)練區(qū)域2016年—2019年秋糧作物生長季的影像,進(jìn)行去云處理,選取訓(xùn)練區(qū)域2016年—2019年CDL 數(shù)據(jù)作為標(biāo)簽數(shù)據(jù),在GEE 平臺進(jìn)行重分類和影像標(biāo)準(zhǔn)化,即將原有的作物標(biāo)簽重分類為模型訓(xùn)練需要的自然數(shù)序列(0-玉米;1-大豆;2-其他;3-背景值),并與訓(xùn)練區(qū)域的遙感影像波段疊加合成為訓(xùn)練數(shù)據(jù)集。
2.2.2 測試數(shù)據(jù)集構(gòu)建
本研究為分析秋糧分類模型的時空尺度上的泛化能力,選取了美國本土3個農(nóng)作物集中種植區(qū)和中國黑河市作為測試區(qū)域,對2016年—2020年秋糧提取進(jìn)行時間泛化研究。分析黑河市農(nóng)業(yè)統(tǒng)計資料,該地區(qū)秋糧物候種植與美國研究差異比較大,選 擇4月1 日至6月20 日、7月1 日至10月15日 2個時間段與訓(xùn)練區(qū)時間對應(yīng)。
表2 測試區(qū)遙感影像選取時間詳見表2,為保證測試區(qū)域作物生長季影像的完備,本研究適當(dāng)調(diào)整了影像選取的時間窗口。預(yù)測數(shù)據(jù)集的預(yù)處理流程與訓(xùn)練數(shù)據(jù)集影像處理部分一致。
表2 測試區(qū)域遙感影像選取時間段Table 2 Time window for remote sensing image selection in test area
表3 黑河市2016年—2020年春播作物野外樣點(diǎn)個數(shù)Table 3 Number of field samples of spring sown crops in Heihe City from 2016 to 2020
2.2.3 精度評價數(shù)據(jù)
對于美國3個測試區(qū)域(A1、A2、A3),本研究采用2016年—2020年的CDL 數(shù)據(jù)作為參考數(shù)據(jù)進(jìn)行精度評價,黑河市是使用2016年—2020年的春播作物野外實(shí)測數(shù)據(jù)進(jìn)行精度評價。圖2是各測試區(qū)參考數(shù)據(jù)分布圖。
圖2 各測試區(qū)參考數(shù)據(jù)Fig.2 Reference data of all test sites
近年來,深度全卷積網(wǎng)絡(luò)FCN(Fully Convolutional Network)因具有學(xué)習(xí)高層次特征的能力,在語義分割領(lǐng)域取得長足的進(jìn)展。FCN 是一種端到端深度網(wǎng)絡(luò)結(jié)構(gòu),通過卷積層下采樣擴(kuò)展感受野,增加上下文信息,提高分類精度;通過添加上采樣層,使輸出圖像和輸入圖像的尺寸保持一致,實(shí)現(xiàn)逐像素分類。U-net是繼承FCN 優(yōu)點(diǎn)的深度卷積神經(jīng)網(wǎng)絡(luò)(Ronneberger等,2015),該模型是U型對稱網(wǎng)絡(luò),左右兩側(cè)分別對應(yīng)編碼和解碼,編碼結(jié)構(gòu)主要作用是降低維度、提取圖像特征,解碼結(jié)構(gòu)主要作用是恢復(fù)圖像細(xì)節(jié)特征和空間、維度信息;解碼和編碼的對應(yīng)層相連接,恢復(fù)提取目標(biāo)的細(xì)節(jié)信息和圖像分辨率。近些年來已有研究將U-net模型應(yīng)用于多波段遙感數(shù)據(jù)分類,Pan 等(2020)基于U-net 深度學(xué)習(xí)架構(gòu),利用Worldview 影像對廣州市復(fù)雜城中村的單個建筑進(jìn)行分割和分類,U-net 模型的建筑分割整體精度達(dá)到86%以上,分類整體精度達(dá)到83%以上,Wei等(2019)將歸一化方法引入到U-net 模型中,利用Sentinel-1時空數(shù)據(jù)進(jìn)行2017年吉林省扶余市農(nóng)作物制圖,總體精度達(dá)到85%,Kappa 系數(shù)為0.82。作為典型的FCN 網(wǎng)絡(luò)之一,U-net 模型應(yīng)用于多波段遙感數(shù)據(jù)分類,可以克服樣本量小、樣本量不平衡問題(Ronneberger等,2015)。
本文基于遷移學(xué)習(xí)策略的U-net架構(gòu)在編碼階段共有6層,輸入圖像大小從256逐漸被壓縮至4像素,本文的網(wǎng)絡(luò)架構(gòu)如圖3所示。在解碼階段,大部分上采樣方法均采用反卷積方式,在輸出層前所用的上采樣方法為雙線性內(nèi)插法。同時,為保證提升模型訓(xùn)練速度,所有特征提取模塊均采用殘差卷積模塊(Ronneberger等,2015)。
圖3 實(shí)驗(yàn)設(shè)計思路Fig.3 Experimental design idea
本研究共設(shè)計6 個實(shí)驗(yàn)場景開始模型的訓(xùn)練,見圖3,分別用2016年、2017年、2018年、2019年美國的CDL 作為標(biāo)簽數(shù)據(jù)進(jìn)行模型訓(xùn)練,分別記為model_2016、model_2017、model_2018和model_2019,為分析在訓(xùn)練數(shù)據(jù)集中加入多年份訓(xùn)練數(shù)據(jù)是否能提升模型的泛化能力,使用2016年和2017年的數(shù)據(jù)訓(xùn)練了model_16_17,使用2016年—2018年的數(shù)據(jù)訓(xùn)練了model_16_17_18,共生成6個秋糧識別模型。
為對比不同模型遷移泛化性能,本研究訓(xùn)練了一個單年份的隨機(jī)森林模型進(jìn)行模型遷移作物時空泛化分類,對比分析傳統(tǒng)機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型之間的時空泛化差異。
3.2.1 模型訓(xùn)練與預(yù)測
本研究使用深度學(xué)習(xí)框架是卷積神經(jīng)網(wǎng)絡(luò)框架Caffe(Convolutional architecture for fast feature)。模型超參數(shù)設(shè)置參考了Wei 等(2019),分別為初始學(xué)習(xí)率為10-4,下降策略為inv,學(xué)習(xí)率變化指數(shù)為0.0001,power 為0.75,梯度下降算法設(shè)置為Adam,權(quán)值衰減為0.0005;單年份訓(xùn)練數(shù)據(jù)的batch_size為32,model_2016_17的batch_size為64,model_2016_17_18 的batch_size 為128。本研究訓(xùn)練數(shù)據(jù)集和預(yù)測數(shù)據(jù)均被切分為256×256個像元大小斑塊,相鄰斑塊之間重疊度為128個像元。本文采用交叉信息熵構(gòu)建損失函數(shù)。
式中,C為總類別數(shù),本研究C=4,分別對應(yīng)玉米、大豆、其他和背景值,則i=0,1,2,3;y是對應(yīng)的真值,(y==i)為關(guān)系運(yùn)算,若y=i,值為1,若y≠1,值為0;ai是模型最后一層全卷積層輸出對應(yīng)真值類別i的概率。
在模型訓(xùn)練階段,遷移學(xué)習(xí)預(yù)訓(xùn)練U-net網(wǎng)絡(luò),使用訓(xùn)練數(shù)據(jù)集對模型進(jìn)行訓(xùn)練,模型最后通過全卷積層與SoftmaxWithLoss 層相連接計算訓(xùn)練Loss,進(jìn)行梯度下降、權(quán)值更新保證Loss 的收斂,直接Loss收斂滿足閾值要求確定最終訓(xùn)練模型。
在預(yù)測階段,將U-net模型中的SoftmaxWithLoss層改為Softmax層,輸出結(jié)果每一層對應(yīng)每種地物類別的歸屬概率值,每個像元的最終類別由對應(yīng)概率最高的類別所確定,最終生成作物專題圖。
3.2.2 精度評價方法
本研究采用混淆矩陣定量評價識別模型的精度,采用總體精度OA(Overall Accuracy)、F1分?jǐn)?shù)(F1-score)作為精度評價指標(biāo)。
(1)總體精度:分類問題中所有像元被正確分類的像元數(shù)占像元總數(shù)的比值,其計算公式如下:
式中,Po表示總體精度,pkk表示第k類中被分類正確的像元數(shù),n為總類別數(shù),p為總樣本數(shù)。
(2)F1-分?jǐn)?shù):F1分?jǐn)?shù)綜合考慮某一類別的制圖精度與用戶精度影響,是一種更為均衡、綜合的分類衡量指標(biāo)(趙英時,2003)。計算公式如下所示:式中,Pu是用戶精度,即被分為某類的像元中正確分類的像元數(shù)與該類像元總數(shù)的比值;Pp表示制圖精度,即被分為某類的像元中正確分類的像元數(shù)與真值中該類像元總數(shù)的比值。
根據(jù)3.2節(jié)中的方法和超參數(shù)設(shè)置,本研究訓(xùn)練6個分類模型,不同模型的收斂速度如圖4所示。
圖4 模型訓(xùn)練Loss圖Fig.4 Loss diagram of model training
圖4中,前4 個loss 圖是單年份數(shù)據(jù)訓(xùn)練模型loss 和驗(yàn)證精度的變化過程,后兩個loss 圖是兩個多年份數(shù)據(jù)訓(xùn)練模型的loss變化圖。在模型訓(xùn)練過程,4 個單年份模型的迭代次數(shù)均到了50 萬次,模型驗(yàn)證精度維持在90%以上;由于model_2016_17 和model_2016_17_18 對應(yīng)兩個年份模型的數(shù)據(jù)量增大,導(dǎo)致訓(xùn)練速度下降,耗時更長,驗(yàn)證精度也達(dá)到了90%以上。
圖5是model_2016在美國3個測試區(qū)2016年—2020年的玉米、大豆預(yù)測結(jié)果;圖6 是model_2016_17_18和model_2016在黑河市測試區(qū)的玉米、大豆預(yù)測結(jié)果。從兩個地區(qū)預(yù)測結(jié)果發(fā)現(xiàn),在美國測試區(qū)能夠準(zhǔn)確地識別玉米和大豆,地塊較完整,邊緣清晰;但在黑河測試區(qū),單年份模型多個年份玉米和大豆均存在漏分的現(xiàn)象,地塊形狀表現(xiàn)的不完整。
圖5 model_2016在美國3個測試區(qū)玉米和大豆的預(yù)測結(jié)果Fig.5 Prediction results of maize and soybean in US test area by model_2016
圖6 Model_2016_17_18和Model_2016在黑河市的玉米、大豆預(yù)測結(jié)果Fig.6 Maize and soybean prediction results of Model_2016_17_18 and Model_2016 in Heihe City
圖7 和表4 是單年份數(shù)據(jù)訓(xùn)練的4 個模型分別在測試區(qū)域預(yù)測當(dāng)年數(shù)據(jù)的總體精度和大豆、玉米的制圖精度、用戶精度和F1分?jǐn)?shù)。
表4 不同模型在測試區(qū)域預(yù)測當(dāng)年玉米和大豆精度Table4 Accuracy of prediction of maize and soybean by different models in the test area in the current yea
圖7 不同模型在測試區(qū)預(yù)測當(dāng)年數(shù)據(jù)的總體精度Fig.7 Overall accuracy of different models in the test area in predicting the current year’s data
分析數(shù)據(jù)可以得到,單年份數(shù)據(jù)訓(xùn)練的4個模型在美國的3個測試區(qū)均能實(shí)現(xiàn)當(dāng)年空間泛化,3個區(qū)域總體精度達(dá)到80%以上,玉米的制圖精度為83%—87%,F(xiàn)1 分?jǐn)?shù)在0.8—0.84,大豆的制圖精度為73%—85%,F(xiàn)1 分?jǐn)?shù)在0.78—0.84,略低于玉米;在黑河市測試區(qū),4個模型的總體精度較美國測試區(qū)精度降低,介于60%—77%,玉米和大豆的制圖精度也明顯低于美國測試區(qū)域。
4.3.1 美國測試區(qū)多年泛化
為了驗(yàn)證模型在時間尺度泛化能力,以美國某一年的訓(xùn)練模型為基模型,預(yù)測測試區(qū)內(nèi)其他年份的作物。圖8 是6 個模型在美國3 個測試區(qū)的作物預(yù)測結(jié)果。4 個單年份的作物識別模型在美國測試區(qū)的總體精度沒有大的變化,介于80%—83%,F(xiàn)1 分?jǐn)?shù)在0.80—0.87;大豆的F1 分?jǐn)?shù)0.76—0.84。多年數(shù)據(jù)訓(xùn)練的作物識別模型model_2016_17 和model_2016_17_18 在美國3 個測試區(qū)的總體精度較單年份并沒有明顯提升,最高達(dá)到84%,玉米F1 分?jǐn)?shù)最高達(dá)到0.88,大豆F1 分?jǐn)?shù)最高0.84,說明多年份數(shù)據(jù)訓(xùn)練的作物識別模型在美國測試區(qū)對于作物識別時間泛化精度提升并不明顯。從不同年份的時間泛化角度分析,在美國測試區(qū),這些模型并沒有表現(xiàn)出時間泛化上的顯著差異,說明在美國測試區(qū),無論是單年份,還是多年份的作物分類模型,均能實(shí)現(xiàn)跨年份的作物模型泛化。
圖8 美國測試區(qū)玉米、大豆F1分?jǐn)?shù)和總體精度Fig.8 F1 scores and overall accuracy of maize and soybean in US test area
4.3.2 黑河測試區(qū)多年泛化分析
圖9是6個作物分類模型在黑河市進(jìn)行玉米、大豆的識別結(jié)果。在4個單年份模型的結(jié)果中,每年的總體精度為69%—79%,玉米F1分?jǐn)?shù)在0.69—0.80;大豆的F1分?jǐn)?shù)低于玉米,在0.65—0.73。兩個多年份的作物識別模型總體精度得到了提升,為72%—79%,玉米F1 分?jǐn)?shù)在0.69—0.81;大豆F1 分?jǐn)?shù)在0.66—0.76。單年份模型在黑河測試區(qū)當(dāng)年數(shù)據(jù)上表現(xiàn)的更好,但時間泛化到其他年份表現(xiàn)略差。由于黑河市2018年、2019年云覆蓋嚴(yán)重造成有效遙感影像數(shù)據(jù)缺失過多,導(dǎo)致這兩個年的預(yù)測結(jié)果精度較低,因此對這兩年結(jié)果不再做深入分析。
圖9 黑河市測試區(qū)玉米、大豆F1分?jǐn)?shù)和總體精度Fig.9 F1 fractions and overall accuracy of maize and soybean in the test area of Heihe City
深度學(xué)習(xí)作為一種“端—端”的機(jī)器學(xué)習(xí)方法,特征不變性是模型泛化的基礎(chǔ)。為深入探究深度學(xué)習(xí)模型的時空泛化能力,提取并分析2016年訓(xùn)練區(qū)和測試區(qū)的影像特征,圖10 訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)兩個時期的特征,波段組合為Swir2、Swir1和Nir。在第一時期數(shù)據(jù)中,作物剛播種,玉米和大豆的光譜特征接近“裸地”,二者無明顯區(qū)別,這一時期影像可以與處于生長的植被有效地區(qū)分開;在第二時期數(shù)據(jù)中,玉米和大豆的光譜差異明顯,這是進(jìn)行二者分類的遙感特征基礎(chǔ)。
圖10 訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的光譜特征Fig.10 Spectral characteristics of training data and test data
本研究為進(jìn)一步研究數(shù)據(jù)光譜特征分布,將2016年美國訓(xùn)練數(shù)據(jù)和測試區(qū)域A1 的數(shù)據(jù)光譜特征進(jìn)行統(tǒng)計分析,見圖11 和12。訓(xùn)練數(shù)據(jù)的玉米和大豆的光譜值約在500—800 具有可分性,與CDL 數(shù)據(jù)在測試區(qū)域?qū)?yīng)的光譜值一致,model_2016 對A1 的預(yù)測結(jié)果中玉米和大豆的光譜集中在這個范圍內(nèi),但相近光譜值內(nèi)大豆和其他類別的像元數(shù)量與訓(xùn)練區(qū)的差別較大,因此大豆和其他類別的精度較低。Muhammad 等(2015b)使用歷史參考數(shù)據(jù)訓(xùn)練出的模型跨年份進(jìn)行泛化推廣,證實(shí)鄰近年份泛化能力強(qiáng),從美國、黑河之間泛化結(jié)果可以看到模型泛化能力跟年份的相關(guān)是因?yàn)槟觌H間作物遙感特征相似,因此在年際間模型進(jìn)行泛化應(yīng)用時,確保年際間的遙感特征具有一定的一致性和穩(wěn)定性。
圖11 美國2016年訓(xùn)練數(shù)據(jù)光譜特征分布圖Fig.11 Spectral feature distribution of US training data in 2016
圖12 2016年A1數(shù)據(jù)光譜特征Fig.12 Spectral characteristics of data in A1 region in 2016
深度學(xué)習(xí)工作機(jī)制復(fù)雜,參數(shù)龐大,常被稱為“黑箱”算法,能夠?qū)ζ涔ぷ鳈C(jī)制和運(yùn)算原理進(jìn)行分析,增強(qiáng)其可解釋性,可提高模型的泛化能力(Zintgraf等,2017;紀(jì)守領(lǐng)等,2019),分析模型的最后一層特征是檢驗(yàn)?zāi)P头夯芰Φ囊环N常用作法。本研究可視化U-net解碼過程的最后一層“conv_out_new”,通過提取的特征解釋模型的泛化能力。
圖13 是美國測試區(qū)的部分區(qū)域及其響應(yīng)特征可視化結(jié)果,圖13(d)和圖13(e)可見特征激活的高響應(yīng)值區(qū)域?qū)?yīng)CDL 中的大豆和玉米,在圖13(d)中模型對于玉米的響應(yīng)高,在圖13(e)中對應(yīng)大豆的激活響應(yīng)特征,而在圖13(f)中較高激活響應(yīng)值的地物更多為各類地物邊界和道路,最后圖13(g)和圖13(h)反映這些層對大豆和與玉米的激活響應(yīng)低。
圖13 美國測試區(qū)特征可視化圖Fig.13 Visualization diagram of extracted features in American test area
圖14 是黑河測試區(qū)部分區(qū)域及其響應(yīng)特征可視化圖,圖14(a)和圖14(b)分別是測試區(qū)的兩個時期數(shù)據(jù),圖14(c)—(g)是提取分類模型上采樣最后一層的特征可視化結(jié)果。分析其特征可視化結(jié)果發(fā)現(xiàn),在圖14(d)中模型表現(xiàn)為高響應(yīng)值的區(qū)域?qū)?yīng)“玉米”,圖14(e)中高響應(yīng)區(qū)對應(yīng)“大豆”,圖14(f)對應(yīng)其他地物類型,但是對于其他地物的邊界也表現(xiàn)為高響應(yīng)值,但存在誤分,同樣圖14(f)和圖14(g)也是上述地物的低響應(yīng)。
圖14 黑河市測試區(qū)提取W可視化圖Fig.14 Visualization diagram of extracted features in the test area of Heihe City
分析U-net模型架構(gòu),上采樣的過程不僅還原了輸入數(shù)據(jù)的分辨率和空間維度信息,同時結(jié)合上下文信息,但是在最后一層卷積后會丟失一些細(xì)小特征。結(jié)合精度評價和特征可視化結(jié)果分析,該模型在美國和中國兩個測試區(qū)的作物特征描述是比較準(zhǔn)確的,但是在中國測試區(qū)存在其他地物誤分和邊界不夠清晰的問題,最大原因可能是美國和中國兩個測試區(qū)的田塊尺寸和作物種植結(jié)構(gòu)差異。
隨機(jī)森林(Random Forest RF)是一種具有較高準(zhǔn)確度、良好抗噪能力的傳統(tǒng)機(jī)器學(xué)習(xí)算法,被許多領(lǐng)域廣泛應(yīng)用(Smith等,2010),其本質(zhì)是基于bagging框架的多棵決策樹的集成學(xué)習(xí)方法,它采用bootstrap抽樣方法從原始訓(xùn)練集中抽取多個訓(xùn)練子集,每個訓(xùn)練子集都運(yùn)用一定算法進(jìn)行節(jié)點(diǎn)分裂,從而構(gòu)建對應(yīng)的一棵決策樹,所有訓(xùn)練子集構(gòu)建的決策樹組合即為隨機(jī)森林,預(yù)測時基于每個像元每棵樹都輸出一個結(jié)果進(jìn)行投票,投票數(shù)最多的類別為對應(yīng)像元的最終結(jié)果。
本研究使用2017年的訓(xùn)練數(shù)據(jù)訓(xùn)練隨機(jī)森林,預(yù)測數(shù)據(jù)為2016年—2020年4 個測試區(qū)域的數(shù)據(jù),數(shù)據(jù)集的組織與深度學(xué)習(xí)保持一致。分類體系與深度學(xué)習(xí)模型一致,利用GEE 中的stratifiedSample 方法將CDL數(shù)據(jù)轉(zhuǎn)化為點(diǎn)數(shù)據(jù),利用sampleRegions構(gòu)建訓(xùn)練數(shù)據(jù)集,將數(shù)據(jù)和訓(xùn)練樣本輸入到scikitlearn 進(jìn)行訓(xùn)練模型和結(jié)果預(yù)測,子決策樹數(shù)量n=300,其余參數(shù)默認(rèn),得到作物分類結(jié)果之后,進(jìn)行精度評價。隨機(jī)森林的預(yù)測結(jié)果如圖15所示。
圖15 隨機(jī)森林時空泛化結(jié)果Fig.15 Spatial and temporal generalization results of random forest
結(jié)合圖7、圖8 和圖15 分析得到,隨機(jī)森林的預(yù)測結(jié)果較深度學(xué)習(xí)模型低,美國預(yù)測結(jié)果總體精度最高為75%,黑河市的預(yù)測結(jié)果總體精度最高為62%,說明隨機(jī)森林的時空泛化能力較深度學(xué)習(xí)作物分類模型更差。隨機(jī)森林是基于數(shù)據(jù)的統(tǒng)計學(xué)習(xí)模型,較深度學(xué)習(xí),隨機(jī)森林沒利用除光譜之外的深層信息,如紋理、空間等特征,導(dǎo)致模型魯棒性差,不合適時空泛化推廣。
為了進(jìn)一步探討測試集數(shù)據(jù)窗口大小對泛化效率的影響,選取黑河市嫩江縣作為泛化區(qū)域,選取測試數(shù)據(jù)時縮小時間窗口至一個半月內(nèi),使用model_2016_17_18 進(jìn)行作物識別。研究發(fā)現(xiàn)當(dāng)縮小數(shù)據(jù)合成的時間窗口時,該模型的預(yù)測結(jié)果總體精度均提升到79%,且大豆的識別精度提升更為明顯(表5),提升至75%,說明適當(dāng)縮小影像的時間窗口有助于提升作物識別的精度,究其原因是預(yù)測數(shù)據(jù)的合成時間窗口縮小能更加精準(zhǔn)的刻畫作物生長的關(guān)鍵特征。Wang 等(2019)研究通過減少不同州和年份的標(biāo)簽數(shù)據(jù)來體現(xiàn)樣本均衡問題,發(fā)現(xiàn)在GDD(Growing Degree Days)相似的地區(qū)和年份上訓(xùn)練的隨機(jī)森林模型遷移到目標(biāo)區(qū)域的作物識別準(zhǔn)確率始終超過80%,同時準(zhǔn)確率會隨著GDD 差異的增大而降低,說明了提高訓(xùn)練區(qū)和測試區(qū)遙感特征的一致性是提高精度的關(guān)鍵,與本文發(fā)現(xiàn)相同。然而這方面的研究仍比較少,如何在大區(qū)域尺度通過物候匹配提高模型泛化能力尤為關(guān)鍵,將會是一個重點(diǎn)研究方向。
表5 model_2016_17_18預(yù)測嫩江縣2017年數(shù)據(jù)精度評價Table 5 Model _2016_17_18 predict data accuracy evaluation in Nenjiang County in 2017
本研究以美國伊利諾伊州和印第安州作為訓(xùn)練數(shù)據(jù)的采集區(qū)域,歷史CDL 數(shù)據(jù)作為作物標(biāo)簽,訓(xùn)練了2016年—2019年4 個單年份數(shù)據(jù)的玉米、大豆分類模型,兩個混合年份數(shù)據(jù)的分類模型,在美國和中國設(shè)置了4個空間泛化區(qū)域,探究了基于CDL 遷移訓(xùn)練深度學(xué)習(xí)模型進(jìn)行作物分類的時空泛化能力,并與隨機(jī)森林分類模型進(jìn)行了對比,得到以下結(jié)論:
(1)本研究的6個秋糧分類模型在美國的空間泛化精度優(yōu)于中國,美國3個測試區(qū)秋糧分類精度無空間差異。通過對模型提取到的特征和訓(xùn)練測試數(shù)據(jù)光譜特征進(jìn)行分析之后發(fā)現(xiàn)玉米和大豆在第二時期數(shù)據(jù)中的光譜特征差異是其分類的基礎(chǔ),在美國和中國出現(xiàn)空間泛化差異的原因是兩個區(qū)域之間作物種植結(jié)構(gòu)和地塊景觀的差異,因此模型在泛化時對分類特征的提取出現(xiàn)了空間差異。
(2)本研究的6 個秋糧分類模型在美國3 個測試區(qū)2016年—2020年的時間泛化總體精度在80%以上,玉米的精度高于大豆;在黑河市測試區(qū)的時間泛化能力總體低于美國,兩個區(qū)域之間相差約8%,但多年份分類模型優(yōu)于單年份分類模型,玉米的精度優(yōu)于大豆。多年份模型能夠提升模型時空泛化能力的原因是多年的樣本擴(kuò)大了標(biāo)識樣本數(shù)量,將中國與美國秋糧種植的差異通過樣本數(shù)量的增加進(jìn)行彌補(bǔ)。
(3)隨機(jī)森林秋糧分類模型的時空泛化的總體精度較深度學(xué)習(xí)在美國測試區(qū)低7%,在黑河市測試區(qū)低8%。隨機(jī)森林是基于數(shù)據(jù)的統(tǒng)計學(xué)習(xí)模型,與深度學(xué)習(xí)相比,隨機(jī)森林未利用光譜之外的深層信息,且魯棒性不強(qiáng),因此時空泛化能力差。
本研究已經(jīng)證實(shí)了利用CDL 作為標(biāo)簽樣本訓(xùn)練模型,可以實(shí)現(xiàn)空間、時間的泛化。在今后研究中將會對模型泛化數(shù)據(jù)的最適宜時間窗口和跨區(qū)域泛化時農(nóng)業(yè)景觀和作物種植結(jié)構(gòu)的影響做進(jìn)一步探究。同時現(xiàn)在作物分布的數(shù)據(jù)集越來越多,這些數(shù)據(jù)集能夠進(jìn)一步提供豐富的作物標(biāo)簽數(shù)據(jù)用于深度學(xué)習(xí)模型訓(xùn)練,為大尺度作物深度學(xué)習(xí)識別標(biāo)簽樣本缺乏提供解決途徑。