楊晉云,張 莎,白 雲(yún),黃安齊,張佳華
基于機器學習融合多源遙感數(shù)據(jù)模擬SPEI監(jiān)測山東干旱*
楊晉云1,張 莎1,白 雲(yún)1,黃安齊1,張佳華2**
(1.青島大學計算機科學技術(shù)學院,青島 266071;2.中國科學院遙感與數(shù)字地球研究所,北京 100094)
以山東省為研究區(qū),選擇偏差校正隨機森林BRF(Bias-corrected random forest),支持向量回歸SVR(Support vector regression)和Cubist模型三種機器學習方法融合多影響因子模擬3個月時間尺度的標準化降水蒸散指數(shù)SPEI-3,以期為精確監(jiān)測山東地區(qū)干旱提供一種方法。將2001?2017年23個站點的SPEI-3值作為因變量,多源遙感數(shù)據(jù)包括降水量、地表溫度、蒸散發(fā)、潛在蒸散發(fā)、歸一化植被指數(shù)以及土壤濕度六類7個影響因子作為自變量,自變量和因變量構(gòu)成數(shù)據(jù)集的80%作為訓練集,20%作為測試集。根據(jù)BRF模型得到研究區(qū)各個站點的模擬值以及各影響因子的相對重要性,繪制SPEI-3的空間分布圖,并進行驗證。結(jié)果表明,綜合因子比單一因子模擬效果好,BRF模型測試集中的模擬值和觀測值的決定系數(shù)R2達到了0.856,均方根誤差RMSE為0.359,BRF模型能較好模擬站點SPEI-3值。大部分站點模擬值與觀測值反映的干旱趨勢一致,反映站點不同程度旱情的月份個數(shù)基本相同。此外,BRF模型模擬的SPEI-3的空間分布與站點SPEI-3觀測值表現(xiàn)的干旱程度基本一致,且SPEI-3空間分布站點之外柵格數(shù)據(jù)也可以較準確地反映旱情,說明根據(jù)BRF模型可在站點和空間尺度上較精確地監(jiān)測山東地區(qū)干旱情況。
機器學習;多源遙感;干旱;標準化降水蒸散指數(shù);山東省
干旱是一種常見、發(fā)生頻率較高的災(zāi)害,是由水分收支或供求不平衡所形成的水分虧缺現(xiàn)象[1],干旱的精準監(jiān)測對農(nóng)業(yè)生產(chǎn)具有重要意義[2?3]。由于降水量年內(nèi)分配不均,山東省旱澇災(zāi)害頻繁,給農(nóng)業(yè)生產(chǎn)以及社會經(jīng)濟發(fā)展帶來嚴重的影響[4],因此,研究干旱對山東省糧食安全、農(nóng)業(yè)生產(chǎn)、生態(tài)環(huán)境建設(shè)和社會經(jīng)濟發(fā)展的影響具有重要的現(xiàn)實意義。
目前國內(nèi)外研究學者提出了很多干旱監(jiān)測指標,主要分為基于站點氣象數(shù)據(jù)的傳統(tǒng)指標和基于衛(wèi)星數(shù)據(jù)的遙感監(jiān)測指標。基于站點氣象數(shù)據(jù)的傳統(tǒng)指標有標準化降水指數(shù)(Standard Precipitation Index,SPI)[5],帕默爾干旱指數(shù)(Palmer Drought Severity Index,PDSI)[6],標準化降水蒸散指數(shù)(Standardized Precipitation Evapotranspiration Index,SPEI)[7]等。SPEI同時考慮降水和溫度對干旱的影響,又具有多種時間尺度,已被廣泛應(yīng)用于干旱研究中[8?12]。由于站點實測數(shù)據(jù)準確性高,基于站點氣象數(shù)據(jù)的傳統(tǒng)指標在干旱監(jiān)測與研究中被廣泛應(yīng)用,但其都是基于站點尺度計算的,不具有空間代表性,在應(yīng)用于區(qū)域尺度干旱監(jiān)測時有一定的局限性?
基于衛(wèi)星遙感監(jiān)測干旱是通過建立由衛(wèi)星獲得的植被狀況、地表溫度、熱慣量等參數(shù)與地面干旱監(jiān)測指標的關(guān)系來間接監(jiān)測干旱[13]。近年來,學者們提出用遙感干旱指數(shù)研究空間尺度的干旱情況,包括溫度狀態(tài)指數(shù)(Temperature Condition Index,TCI)[14],降水狀態(tài)指數(shù)PCI(Precipitation Condition Index)[15],植被狀態(tài)指數(shù)VCI(Vegetation Condition Index)[16],土壤濕度狀態(tài)指數(shù)SMCI(Soil Moisture Condition Index)[17]等。由于干旱的復(fù)雜性,單一的遙感指數(shù)不能準確反映干旱情況,很多學者提出了融合多源遙感指數(shù)來監(jiān)測干旱[18?20]。但是目前融合多源遙感數(shù)據(jù)得到的綜合干旱指數(shù)多通過枚舉方式賦予各遙感指數(shù)權(quán)重系數(shù)的方法獲得,并使用站點指數(shù)來驗證綜合干旱指數(shù)的適用性,且遙感指數(shù)存在明顯的時空適用性差異[3]。在空間尺度上精確監(jiān)測干旱仍需進一步深入研究,選擇一個合適的遙感干旱指標在站點以及空間尺度上精確監(jiān)測干旱,對農(nóng)業(yè)生產(chǎn)具有重要的意義。
機器學習方法具有非線性、預(yù)測準確率高、泛化能力強的特點,可有效處理大量數(shù)據(jù)[21?22],隨著長時序遙感數(shù)據(jù)的積累,已成為監(jiān)測干旱所使用的另一主要方法[23?26]。以往利用機器學習方法監(jiān)測山東地區(qū)干旱的研究報道較少,本研究利用機器學習方法融合多源遙感數(shù)據(jù)直接模擬站點指數(shù)SPEI,得到站點指數(shù)SPEI的空間分布,擴大了站點指數(shù)監(jiān)測干旱的空間尺度,以期為精確監(jiān)測山東地區(qū)干旱提供方法借鑒。
山東?。?4°25′?38°23′E,114°36′?122°36′N)位于中國東部沿海,土壤類型多樣,地形以山地丘陵為主,東部是半島,西部及北部屬華北平原,中南部為山地丘陵,形成平原盆地交錯環(huán)列其間的地貌;地跨淮河、黃河、海河、小清河和膠東五大水系;主要農(nóng)作物有小麥、玉米、大豆等(圖1)。山東地區(qū)屬溫帶大陸季風性氣候,降水年內(nèi)時空分配極為不均,致使春、秋、冬季易干旱[27]。將山東地區(qū)劃分為半島、魯東南、魯西北、魯西南和魯中。
1.2.1 遙感數(shù)據(jù)
(1)MODIS植被指數(shù)等數(shù)據(jù)
MODIS搭載在Terra 和 Aqua衛(wèi)星上,提供了大量的產(chǎn)品并且被廣泛應(yīng)用。使用的2001?2017年的MODIS產(chǎn)品從Land Processes Distributed Active Cent獲得,包括土地覆蓋類型產(chǎn)品MCD12Q1、植被指數(shù)產(chǎn)品 MOD13A1、地表溫度產(chǎn)品MOD11A2及蒸散發(fā)和潛在蒸散發(fā)產(chǎn)品MOD16A2。MCD12Q1為年尺度的土地覆蓋類型產(chǎn)品,空間分辨率為500m,提取研究區(qū)內(nèi)的農(nóng)田覆蓋區(qū)域。MOD13A1為16d合成的地表植被指數(shù)產(chǎn)品,空間分辨率為500m,利用提取的農(nóng)田覆蓋區(qū)域掩膜植被指數(shù)產(chǎn)品獲取農(nóng)田區(qū)的植被指數(shù);MOD11A2為8d合成的地表溫度產(chǎn)品,空間分辨率為1000m,將其重采樣為500m;MOD16A2為8d合成的蒸散發(fā)產(chǎn)品,空間分辨率為500m,由于數(shù)據(jù)空間上有缺失值,將其進行鄰域分析處理。以上產(chǎn)品通過求平均值均合成為月值。
(2)TRMM降水量數(shù)據(jù)
TRMM(The Tropical Rainfall Measuring Mission)是1997年作為美國國家航空航天局(NASA)和日本宇宙航空研究開發(fā)機構(gòu)(JAXA)的聯(lián)合太空任務(wù)而發(fā)射,以提供基于衛(wèi)星的全球降水監(jiān)測數(shù)據(jù)[28]。TRMM3B43是0.25°×0.25°月平均格點數(shù)據(jù)集,從https://daac.gsfc.nasa.gov/網(wǎng)站獲得。數(shù)據(jù)期限為2001?2017年,計算1個月(TRMM-P1)和3個月(TRMM-P3)尺度的累計降水量,并將結(jié)果重采樣為500m。
(3)GLDAS土壤濕度數(shù)據(jù)
GLDAS數(shù)據(jù)是由美國航空航天局(NASA)戈達德空間飛行中心(GSFC)與美國海洋和大氣局(NOAA)國家環(huán)境預(yù)報中心(NCEP)聯(lián)合開發(fā)的同化產(chǎn)品,結(jié)合4個陸面模式(Mosaic、Noah、CLM和VIC)輸出的土壤濕度數(shù)據(jù)[29]。使用2001?2017年的GLDAS土壤濕度數(shù)據(jù)(https://giovanni.gsfc. nasa. gov/giovanni/),空間分辨率是0.25°,將其重采樣為500m。
1.2.2 站點數(shù)據(jù)
計算站點尺度的SPEI-3,所用數(shù)據(jù)為山東省23個氣象站點2001?2017年月降水量和平均氣溫數(shù)據(jù),氣象站點分布如圖1所示,月降水量和平均氣溫數(shù)據(jù)從中國氣象數(shù)據(jù)共享網(wǎng)(http://data.cma.cn/)獲取。
1.3.1 技術(shù)流程
技術(shù)分析流程如圖2所示,首先,歸一化處理各個影響因子并提取站點值,將其作為自變量,計算的標準化降水蒸散指數(shù)SPEI-3作為因變量。自變量和因變量構(gòu)成數(shù)據(jù)集的80%作為訓練集,20%作為測試集;其次采用三種機器學習模型偏差校正隨機森林BRF(Bias-corrected Random Forest)、支持向量回歸SVR(Support Vector Regression)、Cubist分別進行訓練,將訓練好的模型用于測試集,分別計算三種模型的決定系數(shù)R2、均方根誤差RMSE(Root Mean Squared Error)及平均絕對誤差MAE(Mean Absolute Error),優(yōu)先選擇出最佳模型;根據(jù)最佳模型得出23個站點的SPEI-3模擬值以及各影響因子的相對重要性,將相對重要性作為權(quán)重,根據(jù)各個因子的遙感影像繪制SPEI-3的空間分布,并進行驗證。
1.3.2 柵格遙感數(shù)據(jù)歸一化處理
選擇對標準化降水蒸散指數(shù)(SPEI-3)影響較大的因子,包括降水、地表溫度、植被、蒸散發(fā)、潛在蒸散發(fā)、土壤濕度作為機器學習算法的自變量。為統(tǒng)一數(shù)據(jù)的范圍,將各影響因子歸一化處理,使數(shù)據(jù)在[0,1]。根據(jù)各因子對干旱的影響特點,選擇相應(yīng)的歸一化公式(表1)。
表1 針對每個柵格計算六類影響因子的歸一化公式
注:i表示月份,min、max分別表示該影響因子2001?2017年i月相應(yīng)柵格的最小值和最大值。
Note: i represents the month, min and max represent the minimum and maximum value of the corresponding grid in the i month of the impact factor from 2001 to 2017, respectively.
1.3.3 站點標準化降水蒸散指數(shù)(SPEI-3)的計算
標準化降水蒸散指數(shù)SPEI具有多時間尺度的特征,3個月時間尺度的SPEI即SPEI-3的計算步驟[30]為
(1)采用Thornthwaite[31]方法計算月潛在蒸散量PET。
(2)計算每個月降水和潛在蒸散量的差值。
式中,Pi為月降水量,PETi為月潛在蒸散量,i表示月份。建立不同時間尺度的氣候水分平衡累積序列,即
式中,k為時間月尺度,取值為3,n為計算次數(shù)。
(3)對Di進行正態(tài)化,首先采用Log-logistic概率密度函數(shù),建立數(shù)據(jù)序列。
式中,α為尺度參數(shù),β為形狀參數(shù),為Origin參數(shù),由線性矩方法獲得,進而得出Di的累計概率密度函數(shù)為
當P≤0.5時,
當P>0.5時,P=1?P,
其中,C0=2.515517,C1=0.802853,C2=0.010328,d1=1.432788,d2=0.189269,d3=0.001308。
結(jié)合降水和氣溫數(shù)據(jù)計算山東地區(qū)23個氣象站點的SPEI-3的值(簡稱觀測值)。根據(jù)國際上通用的SPEI指數(shù)的干旱等級劃分標準[32],將SPEI劃分為5個等級(表2)。
表2 SPEI-3的干旱等級劃分標準
1.3.4 機器學習算法模型
(1)Bias-corrected random forest(BRF)
隨機森林(Random Forest,RF)是通過集成學習的思想將多棵樹集成的機器學習算法,它的基本單元是決策樹[33]。在回歸問題中,隨機森林的輸出是所有決策樹輸出的平均值,可避免產(chǎn)生一些不合理的數(shù)值,所以隨機森林在準確性方面具有較強優(yōu)勢。但是,隨機森林處理過大或過小的數(shù)值時,會有偏差。因此,采用偏差校正隨機森林的方法,其回歸樹的個數(shù)ntree為500,樹節(jié)點mtry個數(shù)為3。詳細方法為:
①用訓練數(shù)據(jù)集Ytrain=RF(Xtrain)構(gòu)建RF模型,其中Xtrain和Ytrain分別代表自變量和因變量。
③構(gòu)建以殘差為因變量,訓練數(shù)據(jù)集作為自變量的RF模型,rtrain=RFres(Xtrain,Ytrain),這個RF模型用來估計測試集的殘差。
⑥將預(yù)測出的殘差值與預(yù)測值相加,得出最終的預(yù)測值。
(2)Support Vector Regression(SVR)
支持向量回歸(SVR)的目的是使廣義誤差界降到最小,從而達到泛化性能。這種泛化誤差界是訓練誤差和控制假設(shè)空間復(fù)雜性的正則項的組合,是由Vapnik[34]提出的一種基于統(tǒng)計學習理論的機器學習方法。使用的該模型是R軟件(3.6.1)中的e1071包,核函數(shù)kernel選擇了徑向基核函數(shù)Radial Basis Function,gamma為0.001。
(3)Cubist 模型
Cubist模型是一種商業(yè)的機器學習方法,可以實現(xiàn)對大數(shù)據(jù)的挖掘,實現(xiàn)在上百個因子中快速識別預(yù)測值的相關(guān)因子并建立模型[35]?Cubist規(guī)則與模型的匹配完善了單一模型帶來的不足,從而提升了模型預(yù)測精度[36]?使用的該模型是R軟件(3.6.1)中的Cubist包。參數(shù)committees設(shè)置為1,參數(shù)neighbors 設(shè)置為9。
將23個站點2001?2017年標準化降水蒸散指數(shù)各影響因子的站點值和SPEI-3作為數(shù)據(jù)集,以80%作為訓練集(樣本數(shù)為3590),20%作為測試集(樣本數(shù)為898)。訓練集和測試集均為隨機取樣獲取,為保證機器學習方法的穩(wěn)定性,每個模型運行50次。每個機器學習模型都計算了測試集的觀測值和模擬值的決定系數(shù)(R2)、均方根誤差(RMSE)和平均絕對誤差(MAE)。R2一般用于評估模擬值和觀測值的符合程度,RMSE用來衡量模型預(yù)測值和實際值的偏差,MAE可以反映模擬值誤差的實際情況。R2越接近于1,RMSE和MAE越接近于0,表示模型性能越好。各指標的計算式為
R是統(tǒng)計領(lǐng)域廣泛使用的一種統(tǒng)計分析軟件,屬于GNU系統(tǒng)的一個免費、源代碼開放的軟件,可用于統(tǒng)計計算。R軟件包含大量的庫和包,可以快速實現(xiàn)開發(fā)設(shè)計,完成機器學習的功能。
分別采用自變量是單一因子和綜合因子輸入方法對三種算法的模擬精度進行比較,結(jié)果見表3。由表中可看出,無論是訓練集還是測試集,BRF算法單一因子對每個站點逐月標準化降水蒸散指數(shù)(SPEI-3)的模擬值和觀測值間擬合的決定系數(shù)(R2)均最大,均方根誤差(RMSE)和平均絕對誤差(MAE)均相對較??;將7個因子同時輸入模型進行綜合模擬的結(jié)果也發(fā)現(xiàn),BRF算法的模擬效果最好,其R2最大,RMSE和MAE最小,與董婷等[23]利用隨機森林RF得到的模擬值和實測SPEI-3值的決定系數(shù)在0.49~0.71之間對比,本研究的精度顯著提高??傊?,輸入自變量是綜合因子時,BRF模型模擬值與觀測值的差異最小,一致性最強,表現(xiàn)出更強的模擬能力。
注:BRF是偏差校正隨機森林模型,SVR是支持向量回歸模型,R2是絕對系數(shù),RMSE是均方根誤差,MAE是平均絕對誤差。
Note:BRF is the bias correction random forest model, SVR is the support vector regression model, R2is the absolute coefficient, RMSE is the root mean square error, MAE is the mean absolute error.
將23個站點2001?2017年7個影響因子作為自變量的輸入,將精度平均減少值作為標準度量,得到各因子的相對重要性。表4結(jié)果表明,TRMM-P3的相對重要性最高為52.14%,TRMM-P1的相對重要性為8.37%,表明降水是影響干旱最重要的因子。由于模擬的標準化降水蒸散指數(shù)SPEI是3個月時間尺度的,因此與3個月的降水量TRMM-P3相關(guān)性最大?其次是土壤因子和溫度因子,相對重要性分別為12.06%和11.36%,3個月時間尺度的SPEI與農(nóng)業(yè)干旱有關(guān)[10],因此土壤濕度對SPEI-3的模擬發(fā)揮了重要作用。其余影響因子的相對重要性均低于10%,表明這些因子對模擬SPEI-3的貢獻較少,對干旱的影響較小。另外由于MODIS的ET和PET數(shù)據(jù)缺失值較多,使用鄰域數(shù)值分析在一定程度上降低了數(shù)據(jù)的準確性;植被對干旱響應(yīng)的滯后性,導致歸一化植被指數(shù)NDVI的相對重要性也較低。
表4 各因子對干旱評估的相對重要性
2.3.1 站點歷年干旱情況模擬
將多源衛(wèi)星數(shù)據(jù)輸入優(yōu)選的BRF模型中,模擬得到每個站點2001?2017年逐月標準化降水蒸散指數(shù)SPEI-3值,與利用實測降水、氣溫等數(shù)據(jù)計算的站點SPEI-3值進行比較(圖3)。由圖中可以看出,BRF模型較好地模擬了SPEI-3值,各站點2001?2017年逐月SPEI-3的模擬值與觀測值很接近。
根據(jù)表2對SPEI的干旱劃分標準,統(tǒng)計得到2001?2017年各站點基于觀測值SPEI-3與模擬值SPEI-3判斷的不同旱情級別(無旱、輕旱、中旱、重旱、特旱)的月份個數(shù),結(jié)果如表5所示。從表中可以看出,模擬值和觀測值所反映的不同旱情月份個數(shù)基本相同。由于遙感柵格數(shù)據(jù)的缺值,導致模擬值比觀測值反映不同旱情的月份個數(shù)少,特別是臨沂,成頭山、青島則無模擬值。
為驗證BRF模型SPEI-3模擬值反映干旱變化趨勢的效果,20個站點2001?2017年模擬值與觀測值的變化趨勢如圖4。由圖4可以看出,BRF模型可以較好地模擬SPEI-3值,盡管少數(shù)站點的SPEI-3模擬值與觀測值存在不一致,但大多數(shù)站點SPEI-3模擬值與觀測值的變化趨勢保持一致,可判斷干旱變化趨勢。因此,BRF模型可較好模擬站點SPEI-3值,反映站點的不同旱情以及干旱變化趨勢。
表5 23個站點觀測值和模擬值反映的不同旱情的月份個數(shù)
(續(xù)表)
注:“?”表示無模擬值。 Note: “?” is no simulated data.
2.3.2 典型年空間分布柵格干旱模擬
選取SPEI-3空間分布柵格數(shù)據(jù)以及站點SPEI-3數(shù)據(jù),評價SPEI-3空間分布監(jiān)測干旱的精確性以及SPEI-3空間分布站點之外柵格數(shù)據(jù)反映干旱的情況,選取干旱年2002年和2011年[3]數(shù)據(jù),其分布如圖5和圖6所示。由圖可見,SPEI-3空間分布和站點觀測值所表現(xiàn)的干旱程度基本保持一致。由圖5可知,2002年6月以后,全省高溫少雨,基本處于干旱狀態(tài),尤其在8月,魯中和魯東南出現(xiàn)了特旱,魯西北和魯西南也有一部分地區(qū)發(fā)生特旱。9?11月旱情集中發(fā)生在濟南、泰安、泰山等地,與山東地區(qū)的厄爾尼諾現(xiàn)象和無有效降水持續(xù)時間[37]有關(guān)?由圖6可知,2011年1月山東省大部分地區(qū)出現(xiàn)了特旱,因為2010年12月?2011年1月降水量很少所導致[38]。3–4月和6–7月均有局部地區(qū)出現(xiàn)重旱,與童德明等[3]研究結(jié)果一致。SPEI-3空間分布站點之外柵格數(shù)據(jù)反映的旱情與歷史實際旱情一致,總體來說,BRF模型模擬的SPEI-3的空間分布與站點SPEI-3觀測值表現(xiàn)的干旱程度基本一致,且SPEI-3空間分布站點之外柵格數(shù)據(jù)也可以較準確地反映旱情,SPEI-3空間分布可以較準確地監(jiān)測山東干旱。
(1)三種機器學習模型中,自變量輸入綜合因子比單一干旱因子的模擬效果好,BRF模型的模擬效果最好,模擬值與觀測值的測試集的R2達到了0.865。輸入自變量是綜合因子時,BRF模型模擬值與觀測值的差異最小,一致性最強,表現(xiàn)出更強的模擬能力。
(2)各個影響因子中,TRMM-P3的相對重要性最高,達到52.14%,TRMM-P1的相對重要性為8.37%,表明降水是影響干旱最重要的影響因子。其次是土壤濕度SM,相對重要性為12.06%,表明土壤濕度對模擬SPEI-3發(fā)揮了重要作用。
(3)根據(jù)BRF模型,得出站點的SPEI-3模擬值和SPEI-3空間分布。站點模擬值SPEI-3與觀測值SPEI-3所反映的不同級別旱情的月份個數(shù)基本相同,站點SPEI-3模擬值與觀測值反映的干旱趨勢基本保持一致,說明BRF模型可較好模擬站點SPEI-3值。根據(jù)BRF模型繪制的SPEI-3空間分布與站點觀測值反映的干旱情況基本一致,站點之外的SPEI-3空間分布柵格數(shù)據(jù)所顯示的旱情與歷史實際遭受的旱情一致。總體來說,根據(jù)BRF模型模擬SPEI-3可在站點和空間尺度上較精確地監(jiān)測山東地區(qū)干旱。
本研究在選取影響因子時,只考慮了降水、地表溫度、植被、蒸散發(fā)、潛在蒸散發(fā)、土壤濕度六類因子模擬3個月時間尺度的標準化降水蒸散指數(shù)SPEI-3監(jiān)測山東地區(qū)的旱情,由于干旱的復(fù)雜性,高程、植被覆蓋類型等對干旱也有一定程度的影響,未來研究中需要考慮這些因子[39],提高模型精度,才能更精確地監(jiān)測干旱。
目前根據(jù)不同水資源供需關(guān)系將干旱劃分為氣象干旱、農(nóng)業(yè)干旱、水文干旱和社會經(jīng)濟干旱四大類[40],本研究在確定因變量時直接選取3個月時間尺度的標準化降水蒸散指數(shù)(SPEI-3)作為農(nóng)業(yè)干旱指數(shù)[10],且計算蒸散量項也僅采用Thornthwaite方法,采用Penman-Monotrith方法計算的SPEI監(jiān)測干旱會更準確。此外,由于山東地區(qū)存在人為灌溉的因素,將SPEI-3作為監(jiān)測干旱的指標受到一定制約。可以考慮根據(jù)不同的干旱類型,選取不同干旱監(jiān)測指標作為因變量,如SPEI-1可監(jiān)測氣象干旱,土壤濕度和作物產(chǎn)量可監(jiān)測農(nóng)業(yè)干旱等,從而進一步提高不同類型干旱監(jiān)測的精確性。
[1] 張強,姚玉璧,李耀輝,等.中國西北地區(qū)干旱氣象災(zāi)害監(jiān)測預(yù)警與減災(zāi)技術(shù)研究進展及其展望[J].地球科學進展,2015,30(2):196 -213.Zhang Q,Yao Y Bi,Li Y H,et al. Research progress and prospect of drought meteorological disaster monitoring, early warning and disaster mitigation techniques in northwest China[J].Advances in Earth Science,2015,30(2):196-213.(in Chinese)
[2] 徐鈺,江麗華,張建軍,等.氣候變化對山東省農(nóng)業(yè)生產(chǎn)的影響與對策[J].中國農(nóng)業(yè)氣象,2010,31(S1):23-26.Xu Y,Jiang L H,Zhang J J,et al.Impact of climate change on Shandong agricultural production and the adaption countermeasure[J].Chinese Journal of Agrometeorology,2010,31(S1)23-26.(in Chinese)
[3] 童德明,白雲(yún),張莎,等.干旱嚴重程度指數(shù)(DSI)在山東省干旱遙感監(jiān)測中的適用性[J].中國農(nóng)業(yè)氣象,2020,41(2):102-112. Tong D M,Bai Y,Zhang S, et al. Applicability of drought severity Index(DSI) in remote sensing monitoring of drought in Shandong Province [J].Chinese Journal of Agrometeorology,2020,41(2):102-112.(in Chinese)
[4] 王慶,馬倩倩,夏艷玲,等.最近50年來山東地區(qū)夏季降水的時空變化及其影響因素研究[J].地理科學,2014,34(2):220-228.Wang Q, Ma Q Q, Xia Y L, et al.Temporal and spatial changes of summer precipitation in Shandong province in recent 50 years and its influencing factors [J]. Geography science,2014,34 (2): 220-228.(in Chinese)
[5] Mckee T B, Doesken N J, Klesist J.The relationship of drought frequency and duration to time scale[J].Paper Presented at 8th Conference on Applied Climatology,1993,17(22):179-183.
[6] Palmer W C.Meteorological drought[R].Research Paper No 45,US Dept of Commerce,1965:1-58.
[7] 王林,陳文.標準化降水蒸散指數(shù)在中國干旱監(jiān)測的適用性分析[J].高原氣象,2014,33(2):423-431.Wang L, Chen W.Analysis of applicability of standardized precipitation evapotranspiration index in drought monitoring in China [J]. Plateau Meteorology, 2014,33(2):423-431.(in Chinese)
[8] 容錦盟,周丹,羅靜,等.4種干旱指標在華北地區(qū)氣象干旱監(jiān)測中的適用性分析[J].干旱地區(qū)農(nóng)業(yè)研究,2019,37(1):265-273.Rong J M, Zhou D, Luo J, et al. Applicability of four drought indexes in meteorological drought monitoring in north China [J].Agricultural Research in the Arid Areas, 2009,37(1):265-273.(in Chinese)
[9] 張玉靜,王春乙,張繼權(quán).基于SPEI指數(shù)的華北冬麥區(qū)干旱時空分布特征分析[J].生態(tài)學報,2015,35(21):7097-7107.Zhang Y J, Wang C Y, Zhang J Q. Analysis of spatial and temporal distribution characteristics of drought in north China winter wheat region based on SPEI index [J]. Acta Ecologica Sinica, 2015, 35(21):7097-7107.(in Chinese)
[10] Wang Q, Wu J, Lei T,et al.Temporal-spatial characteristics of severe drought events and their impact on agriculture on a global scale[J].Quaternary International,2014,349:10-21.
[11] 楊思遙,孟丹,李小娟,等.華北地區(qū)2001-2014年植被變化對SPEI氣象干旱指數(shù)多尺度的響應(yīng)[J].生態(tài)學報,2018,38(3):1028-1039.Yang S Y, Meng D, Li X J, et al. Multi-scale response of vegetation change to SPEI meteorological drought index in North China from 2001 to 2014 [J].Acta Ecologica Sinica,2018, 38(3):1028-1039.(in Chinese)
[12] Xing L, Binbin H, Xingwen Q, et al. Use of the Standardized Precipitation Evapotranspiration Index(SPEI) to characterize the drying trend in southwest China from 1982-2012[J].Remote Sensing,2015,7(8):10917-10937.
[13] 郭鈮,王小平.遙感干旱應(yīng)用技術(shù)進展及面臨的技術(shù)問題與發(fā)展機遇[J].干旱氣象,2015,33(1):1-18.Guo N, Wang X P. Development of remote sensing drought application technology, technical problems and development opportunities [J]. Drought Meteorology, 2015,33 (1):1-18.(in Chinese)
[14] Kogan F N.Application of vegetation index and brightness temperature for drought detection[J].Advances in Space Research,1995,15(11):91-100.
[15] Oliver J E.Monthly precipitation distribution: a comparative index[J].Professional Geographer,2010,32(3):300-309.
[16] Kogan F N.Remote sensing of weather impacts on vegetation in non-homogeneous areas[J].International Journal of Remote Sensing,1990,11(8):1405-1419.
[17] 胡蝶,沙莎,王麗娟,等.歐空局主被動微波土壤水分融合產(chǎn)品在甘肅省干旱監(jiān)測中的應(yīng)用[J].干旱氣象,2019,37(4):517-528.Hu D,Sha S,Wang L J,et al.Application of ESA active and passive microwave soil water fusion products in Drought monitoring in Gansu Province [J].Journal of Arid Meteorology,2019,37(4):517-528.
[18] Rhee J,Im J,Carbone G J.Monitoring agricultural drought for arid and humid regions using multi-sensor remote sensing data[J].Remote Sensing of Environment, 2010,114(12):2875-2887.
[19] Zhang L,Jiao W,Zhang H, et al.Studying drought phenomena in the Continental United States in 2011 and 2012 using various drought indices[J]. Remote Sensing of Environment, 2017, 190:96-106.
[20] 杜靈通,田慶久,王磊,等.基于多源遙感數(shù)據(jù)的綜合干旱監(jiān)測模型構(gòu)建[J].農(nóng)業(yè)工程學報, 2014, 30(9):126-132.Du L T, Tian Q J, Wang L,et al.Building a comprehensive drought monitoring model based on multi-source remote sensing data [J].Transactions of the CSAE, 2014,30 (9):126-132.(in Chinese)
[21] Rahmat S N,Jayasuriya N,Bhuiyan M A.Short-term droughts forecast using Markov chain model in Victoria, Australia[J]. Theoretical and Applied Climatology, 2017,129(1-2):1-13.
[22] 王飛,楊勝天,丁建麗,等.環(huán)境敏感變量優(yōu)選及機器學習算法預(yù)測綠洲土壤鹽分[J].農(nóng)業(yè)工程學報, 2018,34(22):110-118.Wang F,Yang S T, Fing J L, et al. Selection of environmental sensitive variables and prediction of oasis soil salinity by machine learning algorithm [J].Transactions of the CSAE, 2018, 34 (22):110-118. (in Chinese)
[23] 董婷,任東,邵攀,等.基于多源遙感數(shù)據(jù)和隨機森林的綜合旱情指標構(gòu)建[J].農(nóng)業(yè)機械學報, 2019(8):1000-1298.Dong T,Ren D,Shao P,et al.Construction of comprehensive drought index based on multi-source remote sensing data and characteristics of severe drought events and their impact on agriculture on a global scale[J].Transactions of the Chinese Society for Agriculture Machinery,2019(8):1000-1298.(in Chinese)
[24] 吳晶,陳元芳,余勝男.基于隨機森林模型的干旱預(yù)測研究[J].中國農(nóng)村水利水電,2016(11):17-22.Wu J,Chen Y F,Yu S N.Drought prediction based on random forest [J].China Rural Water Conservancy and Hydropower, 2016 (11):17-22.(in Chinese)
[25] Belayneh A, Adamowski J, Khalil B, et al. Long-term SPI drought forecasting in the Awash River Basin in Ethiopia using wavelet neural network and wavelet support vector regression models[J]. Journal of Hydrology, 2014,508:418-429.
[26] 樊高峰,張勇,柳苗,等.基于支持向量機的干旱預(yù)測研究[J].中國農(nóng)業(yè)氣象,2011,32(3):475-478.Fan G F,Zhang Y,Liu M, et al.Drought prediction based on support vector machine [J].ChineseJournalofAgrometeorology, 2011,32 (3):475-478.(in Chinese)
[27] Park S,Im J,Jang E,et al.Drought assessment and monitoring through blending of multi-sensor indices using machine learning approaches for different climate regions[J]. Agricultural & Forest Meteorology, 2016, 217:50.
[28] Fang J,Yang W,Luan Y,et al. Evaluation of the TRMM3B42 and GPM IMERG products for extreme precipitation analysis over China[J].Atmospheric Research,2019, 223(JUL):24-38.
[29] Houser P R, et al. The global land data assimilation system[J].Bull Amer Meteor- Soc,2004,85(3):381-394.
[30] Vicente-Serrano S M,BegueríaS,López-Moreno JI. A multiscalar drought index sensitive to global warming:the standardized precipitation evapotranspiration index[J].Journal of Climate,2010,23(7):1696-1718.
[31] Thornthwaite C W. The climates of the earth[J].Geographical Review, 1933, 23(3):433-440.
[32] 黃浩,張勃,馬尚謙,等.甘肅河東地區(qū)氣象干旱時空變化及干旱危險性分析[J].中國農(nóng)業(yè)氣象,2020,41(7):459-469.Huang H, Zhang B, Ma S Q,et al.Analysis on temporal and spatial variation of meteorological drought and drought risk in HeDong area, GanSu [J].ChineseJournalofAgrometeorology,2020,41(7):459-469.(in Chinese)
[33] Zhang G,Lu Y. Bias-corrected random forests in regression[J].Journal of Applied Statistics,2012,39(1):151-160.
[34] Cortes C, Vapnik V.Support-vector networks[J].Machine Learning,1995,20(3):273-297.
[35] Kuhn M, Johnson K.Applied Predictive Modeling[M].New York:Springer,2013,383-385.
[36] Frank E, Wang Y, Inglis S, et al.Using Model Trees for Classification[J]. Machine Learning,1998,32(1):63-76.
[37] 張勝平,陳希村,蘇傳寶,等.2002年山東省嚴重干旱分析[J].水文,2004,24(3):42-45.Zhang S P, Chen X C, Su C B, et al. Analysis of severe drought in Shandong province in 2002 [J]. Hydrology, 2004,24 (3):42-45.(in Chinese)
[38] 苑文華,王瑜,張慧. 2010-2011年秋冬季山東特大氣象干旱特征及成因分析[C].第31屆中國氣象學會年會,2014.Yuan W H,Wang Y, Zhang H.Analysis on the characteristics and causes of severe meteorological drought in Shandong during the autumn and winter of 2010-2011[C].The 31st Annual Meeting of Chinese Meteorological Society,2014.(in Chinese)
[39] Shen R,Huang A,Li B , et al. Construction of a drought monitoring model using deep learning based on multi-source remote sensing data[J]. International Journal of Applied Earth Observation & Geoinformation, 2019, 79:48-57.
[40] 韓家琪.基于大數(shù)據(jù)思維的干旱監(jiān)測方法研究[D].北京:中國農(nóng)業(yè)科學院,2018:2-3.Han J Q.The research of drought monitoring based on big data[D].Beijing:Chinese Academy of Agricultural Sciences, 2018:2-3.(in Chinese)
SPEI Simulation for Monitoring Drought Based Machine Learning Integrating Multi-Source Remote Sensing Data in Shandong
YANG Jin-yun1, ZHANG Sha1, BAI Yun1, HUANG An-qi1, ZHANG Jia-hua2
(1.College of Computer Science and Technology, Qingdao University, Qingdao 266071,China; 2.Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100094)
In this study, Shandong province was taken as the research area, and three machine learning methods, namely Bias corrected Random Forest(BRF), Support Vector Regression(SVR) and Cubist model were selected to integrate multiple impact factors to simulate the standardized precipitation evapotranspiration index on a three-month time scale(SPEI-3), so as to provide a method for accurate monitoring of drought in Shandong province. SPEI-3 values of 23 stations from 2001 to 2017 were taken as dependent variables. Multi-source remote sensing data including precipitation, surface temperature, evapotranspiration, potential evapotranspiration, normalized difference vegetation index and soil moisture were taken as independent variables. Independent variables and dependent variables constituted 80% of the data set as training set and 20% as test set. According to the BRF model, the simulated values of each site in the study area and the relative importance of each impact factor were obtained. The spatial distribution diagram of SPEI-3 was drawn and verify them. The results showed that the multiple factor simulation was more effective than the single factor. The R2of the simulated value and observed value in the BRF model’s test set reached 0.856, and the RMSE of the root mean square error was 0.359. The BRF model can well simulate the SPEI-3’s values of the sites. Simulated and observed values for most sites are consistent with the drought trend, and reflect the number of months of different drought conditions is basically the same. The spatial distribution of SPEI-3 simulated by the BRF model is basically consistent with the drought degree of observed SPEI-3 at the site, and SPEI-3 spatial distribution of raster data outside the sites can also reflect the drought situation more accurately. According to the BRF model, the drought situation in Shandong province can be monitored more accurately at the site and spatial scale.
Machine learning; Multi-source remote sensing; Drought; Standardized precipitation evapotranspiration index; Shandong province
10.3969/j.issn.1000-6362.2021.03.007
楊晉云,張莎,白雲(yún),等.基于機器學習融合多源遙感數(shù)據(jù)模擬SPEI監(jiān)測山東干旱[J].中國農(nóng)業(yè)氣象,2021,42(3):230-242
2020?09?11
中國科學院戰(zhàn)略先導項目(XDA19030402);國家自然科學基金(41871253);山東省基礎(chǔ)研究計劃(2018GNC110025)
張佳華,研究員,主要研究衛(wèi)星遙感及其在氣象、災(zāi)害、環(huán)境與生態(tài)中的應(yīng)用、全球變化的區(qū)域響應(yīng)、城市生態(tài)遙感等,E-mail:zhangjh@radi.ac.cn
楊晉云,E-mail:yjy5144@163.com