李清亮,蔡凱旋,耿慶田,劉光潔,孫明玉,張 崳,于繁華
(長(zhǎng)春師范大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,吉林 長(zhǎng)春 130032)
土壤溫度作為大氣和陸地表面水熱循環(huán)共同作用的結(jié)果,是地球科學(xué)多個(gè)領(lǐng)域的重要變量,如氣象學(xué)[1-2],農(nóng)業(yè)[3-4]和環(huán)境科學(xué)[5]等。目前土壤溫度的測(cè)量過(guò)程過(guò)于復(fù)雜[6-7],無(wú)法在大部分區(qū)域提供監(jiān)測(cè)點(diǎn)。因此,準(zhǔn)確地土壤溫度預(yù)測(cè)具有顯著應(yīng)用價(jià)值。然而土壤溫度的時(shí)空變化受多種環(huán)境因素影響[8],給土壤溫度的準(zhǔn)確預(yù)測(cè)帶來(lái)巨大挑戰(zhàn),同時(shí)也使其成為具有深遠(yuǎn)意義的科學(xué)問(wèn)題。目前基于機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)經(jīng)驗(yàn)?zāi)P褪峭寥罍囟阮A(yù)測(cè)一個(gè)重要的研究領(lǐng)域[2]。
近年來(lái),隨著機(jī)器學(xué)習(xí)技術(shù)迅速發(fā)展,已在多種領(lǐng)域成功應(yīng)用[9-11]。其中基于機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)模型在土壤溫度預(yù)測(cè)中也取得了一定成果,最常見(jiàn)的有:人工智能神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)[12-14]、支持向量回歸(Support Vector Regression, SVR)[15-16]、極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)[1-2]。ANN由于可以模擬人腦組織結(jié)構(gòu)進(jìn)行推理的特點(diǎn),已被廣泛應(yīng)用于多種預(yù)測(cè)領(lǐng)域。在土壤溫度預(yù)測(cè)中,Mihalakakou等人[12]基于ANN模型取得了較好的預(yù)測(cè)性能。Kisi等人[13]指出土壤淺層預(yù)測(cè)時(shí)徑向基神經(jīng)網(wǎng)絡(luò)(Radial Basis Neural Network, RBNN)相比廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network, GRNN)、多層感知機(jī)(Multilayer Perceptron, MLP)和線性回歸(Linear Regression, LR)預(yù)測(cè)模型展示了更優(yōu)的預(yù)測(cè)性能。支持向量回歸(SVR)預(yù)測(cè)模型是由支持向量分類(lèi)器(Support Vector Machines, SVM)發(fā)展而來(lái),在土壤溫度預(yù)測(cè)中發(fā)揮了重要作用。Delbari等人[16]在伊朗地區(qū)的測(cè)試中,證明了SVR預(yù)測(cè)模型可以成功應(yīng)用在土壤溫度的預(yù)測(cè)。Feng等人[1]在中國(guó)陜西省的測(cè)試中,通過(guò)比較GRNN、反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPNN)、隨機(jī)森林(Random Forests, RF) 和ELM的預(yù)測(cè)模型,發(fā)現(xiàn)ELM預(yù)測(cè)模型的預(yù)測(cè)能力最高。
然而,在前人研究主要基于ANN,SVR和ELM等方法實(shí)現(xiàn)土壤溫度預(yù)測(cè)。缺少其他機(jī)器學(xué)習(xí)算法如極限梯度提升(XGBoost)和長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)等研究。XGBoost是基于梯度下降方法,將多個(gè)弱分類(lèi)器融合成一種強(qiáng)分類(lèi)器,這種加強(qiáng)學(xué)習(xí)能力的模式,使XGBoost在多種領(lǐng)域的預(yù)測(cè)研究得到廣泛應(yīng)用[17-19]。同時(shí),具有記憶細(xì)胞的LSTM模型既可以學(xué)習(xí)其短期行為,也可以學(xué)習(xí)其長(zhǎng)期行為。這種模式使LSTM在模擬自然系統(tǒng)時(shí)非常有用[20-22]。同時(shí)土壤溫度的影響因素很多,如太陽(yáng)輻射、大氣溫度等,同時(shí)基于機(jī)器學(xué)習(xí)針對(duì)影響因素重要性的量化評(píng)價(jià)并結(jié)合預(yù)測(cè)模型的方式并未展開(kāi)研究。事實(shí)上預(yù)測(cè)模型中不同影響因素的組合對(duì)預(yù)測(cè)能力有很大影響。
本文將在中國(guó)長(zhǎng)白山和海北區(qū)域進(jìn)行測(cè)試,首先基于XGBoost計(jì)算土壤溫度預(yù)測(cè)中每個(gè)影響因素的重要性,然后將影響因素依據(jù)重要性大小依次進(jìn)行組合并作為預(yù)測(cè)模型的輸入,其中本文嘗試基于LSTM作為預(yù)測(cè)模型。最后根據(jù)不同組合的預(yù)測(cè)性能選擇最優(yōu)的影響因素。
本文在中國(guó)東北部吉林省長(zhǎng)白山地區(qū)(41°41′N(xiāo),127°42′E至42°51′N(xiāo),128°16′E)和中國(guó)西北部青海省海北地區(qū)(31°36′N(xiāo),86°35′E至39°19′N(xiāo),103°104′E)進(jìn)行了測(cè)試。 在FLUXNET(https://FLUXNET.fluxdata.org/)上下載了半小時(shí)尺度的三年數(shù)據(jù)(2003年1月1日至2005年12月31日),其影響因素分別為大氣溫度、相對(duì)濕度、太陽(yáng)輻射、蒸汽壓、風(fēng)速、降水量和風(fēng)速,其中土壤溫度是在土壤深度為5 cm時(shí)觀測(cè)得到。長(zhǎng)白山和海北都是我國(guó)重要的生態(tài)自然保護(hù)區(qū)。長(zhǎng)白山地區(qū)以是種植業(yè)為主的農(nóng)業(yè)地域類(lèi)型,發(fā)展商品谷物農(nóng)業(yè),主要種植大豆、玉米、冬小麥及谷子(小米)等。海北屬高原大陸性氣候,太陽(yáng)輻射強(qiáng)度大,日照時(shí)間長(zhǎng),日夜溫差大,有利于油菜、青稞、馬鈴薯及蔬菜等種植業(yè)的發(fā)展。并且土壤溫度對(duì)這些資源的生長(zhǎng)有很大影響,因此,土壤溫度預(yù)測(cè)對(duì)這些生態(tài)資源的保護(hù)和管理具有重要意義。
本研究主要考慮兩個(gè)問(wèn)題:(1)對(duì)于土壤溫度預(yù)測(cè)時(shí),不同影響因素起到不同作用,這些影響因素或其組合與土壤溫度間的關(guān)系如何?(2)土壤溫度預(yù)測(cè)是一種時(shí)間序列預(yù)測(cè)問(wèn)題,哪一種機(jī)器學(xué)習(xí)算法最符合土壤溫度時(shí)間序列的機(jī)制?為了解決上述問(wèn)題,本文提出XGBoost-LSTM融合模型, 如圖1所示。對(duì)于多個(gè)氣象數(shù)據(jù)來(lái)說(shuō),不同因素與土壤溫度之間的相關(guān)性不同。首先基于XGBoost對(duì)各個(gè)影響因素進(jìn)行排序。對(duì)排序后的影響因素,本文按其重要性依次進(jìn)行組合作為L(zhǎng)STM模型的輸入,找到效果最佳的輸入組合,進(jìn)而基于LSTM模型挖掘土壤溫度與其影響因素間的關(guān)聯(lián),并實(shí)現(xiàn)預(yù)測(cè)。
圖1 XGBoost-LSTM模型的土壤溫度預(yù)測(cè)流程圖Fig.1 Framework of XGBoost-LSTM
XGBoost是一種新的梯度提升機(jī)器Boosting算法。Boosting分類(lèi)器作為集成學(xué)習(xí)模型,具有將弱分類(lèi)器轉(zhuǎn)化為強(qiáng)分類(lèi)器的能力。其核心是將多個(gè)準(zhǔn)確率較低的決策樹(shù)模型組合成一個(gè)準(zhǔn)確率較高的模型,通過(guò)不斷迭代生成決策樹(shù),擬合殘差優(yōu)化目標(biāo)函數(shù),從而優(yōu)化預(yù)測(cè)效果。當(dāng)XGBoost 模型完成訓(xùn)練,本文針對(duì)影響因素在該模型的貢獻(xiàn)程度計(jì)算其重要性。具體方法如下:先計(jì)算特征j在單棵樹(shù)中的重要程度,即找到與特征j有關(guān)的結(jié)點(diǎn),計(jì)算該結(jié)點(diǎn)分裂前后的平方損失值,損失值越大說(shuō)明該特征越重要。單個(gè)樹(shù)中特征j的計(jì)算方法如下:
(1)
(2)
通過(guò)式(1)和式(2)量化每個(gè)特征的重要程度后,即可實(shí)現(xiàn)特征排序。
LSTM是一種重要的遞歸神經(jīng)網(wǎng)絡(luò)模型,具有記憶細(xì)胞的LSTM既可以學(xué)習(xí)土壤溫度與其環(huán)境因子之間的短期行為,也可以學(xué)習(xí)其長(zhǎng)期行為。
圖2說(shuō)明了LSTM的結(jié)構(gòu),其工作流程如下式所述:
圖2 LSTM流程圖Fig.2 Structure of LSTM
i(t)=σ(Wihh(t-1)+
Wixx(t)+Wicc(t-1)+bi),
(3)
f(t)=σ(Wfhh(t-1)+
Wfxx(t)+Wfcc(t-1)+bf),
(4)
c(t)=f(t)?c(t-1)+
i(t)?tanh(Wchh(t-1)+Wcxx(t)+bc,
(5)
o(t)=σ(Wohh(t-1)+
Woxx(t)+Wocc(t)+bo),
(6)
h(t)=o(t)?tanh(c(t)),
(7)
(8)
本文在Intel Core(TM)i7-5820K,3.30 GHz CPU和64 Gb內(nèi)存的服務(wù)器上進(jìn)行實(shí)驗(yàn)。在Pycharm 2018.2.8,tensorflow作為工具實(shí)現(xiàn)所有預(yù)測(cè)模型。整個(gè)數(shù)據(jù)集的前四分之三部分(長(zhǎng)白山和海北區(qū)域,2003年1月1日 00:00至2005年12月31日23:30階段的數(shù)據(jù),共計(jì)52 608個(gè))用于訓(xùn)練(2003年1月1日00:00至2005年4月1日12:30階段的數(shù)據(jù),共計(jì)39 456個(gè)),其余四分之一部分用于測(cè)試(2005年4月1日12:30至2005年12月31日23:30階段的數(shù)據(jù),總共13 152個(gè))。為了驗(yàn)證本文方法的有效性,通過(guò)與五種數(shù)據(jù)驅(qū)動(dòng)預(yù)測(cè)模型(LR,SVR,XGBoost,BPNN,ELM)作對(duì)比,并采用不同的統(tǒng)計(jì)評(píng)價(jià)標(biāo)準(zhǔn)評(píng)估模型性能,如均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、納什效率系數(shù)(NS)、LMI系數(shù)和威爾莫特一致性指數(shù)(WI),定義如下:
(9)
(10)
(11)
(12)
(13)
本章節(jié)主要對(duì)比了LR, SVR, XGBoost, BPNN, ELM 5種預(yù)測(cè)模型,并基于scikit-learn工具實(shí)現(xiàn)所有方法。XGBoost預(yù)測(cè)模型模型中,通過(guò)scikit-learn工具中提供的selection.GridSearchCV函數(shù)調(diào)整參數(shù),并優(yōu)化XGBoost模型。其以CART回歸樹(shù)作為XGBoost模型模型的二叉樹(shù)進(jìn)行構(gòu)建、學(xué)習(xí)率為0.005,葉子上的最小樣本數(shù)為1,樹(shù)的個(gè)數(shù)為800,最大深度為5。BPNN預(yù)測(cè)模型模型中,定義三層結(jié)構(gòu)(輸入層、隱藏層、輸出層),以平方誤差作為損失函數(shù),采用Adam進(jìn)行優(yōu)化,批處理數(shù)據(jù)量為200,迭代次數(shù)為300,學(xué)習(xí)率為1×10-5。ELM預(yù)測(cè)模型模型中,利用hpelm工具提供的elm函數(shù)對(duì)ELM進(jìn)行建模,初始化三層神經(jīng)元網(wǎng)絡(luò)(輸入層、隱藏層、輸出層),定義隱藏層的sigmoid激活函數(shù),設(shè)置節(jié)點(diǎn)數(shù)為128。通過(guò)實(shí)驗(yàn)對(duì)比,發(fā)現(xiàn)上述設(shè)置預(yù)測(cè)結(jié)果最好。
本文方法中,影響預(yù)測(cè)性能的主要超參數(shù)有:LSTM神經(jīng)單元個(gè)數(shù)、批量數(shù)據(jù)大小、迭代次數(shù)、學(xué)習(xí)率、影響因素的選取。因此,下面本文將通過(guò)預(yù)測(cè)性能定義最優(yōu)的超參數(shù)。本文方法中,影響預(yù)測(cè)性能的主要超參數(shù)有:LSTM神經(jīng)單元個(gè)數(shù)、批量數(shù)據(jù)大小、迭代次數(shù)、學(xué)習(xí)率、影響因素的選取。
在測(cè)試LSTM神經(jīng)單元個(gè)數(shù)時(shí),首先定義迭代次數(shù)為200次,批量數(shù)據(jù)大小為200次,學(xué)習(xí)率為1×10-4,選取大氣溫度、相對(duì)濕度和蒸氣壓。在(30,50,100和150)中分別測(cè)試LSTM神經(jīng)單元個(gè)數(shù);同時(shí)選擇最優(yōu)的LSTM神經(jīng)單元個(gè)數(shù)后,再?gòu)?50,100,150,250,300,350,400,450,500)中選擇批量數(shù)據(jù)大?。黄浯螐?100,200,300,400,500,600,800,1 000,1 100,1 200)中選擇迭代次數(shù);再?gòu)?1×10-3, 1×10-4, 1×10-5)中選擇學(xué)習(xí)率。最后等上述參數(shù)均選取最優(yōu)之后,本文LSTM預(yù)測(cè)模型的最優(yōu)結(jié)構(gòu)隨之確定。進(jìn)而針對(duì)影響因素的選取進(jìn)行測(cè)試,首先基于XGBoost算法計(jì)算所有影響因素(大氣溫度、相對(duì)濕度、太陽(yáng)輻射、蒸汽壓、風(fēng)速、降水量和風(fēng)速)的特征重要性,并依據(jù)重要程度從高到低進(jìn)行組合,依次輸入LSTM預(yù)測(cè)模型中,并測(cè)試哪些組合對(duì)土壤溫度的預(yù)測(cè)更有幫助。其中LSTM預(yù)測(cè)模型輸入特征中的輸入維度(input_size)為影響因素的個(gè)數(shù);歷史數(shù)據(jù)序列的長(zhǎng)度(time_step)定義為7。本文首先以長(zhǎng)白山區(qū)域進(jìn)行實(shí)驗(yàn),不同LSTM神經(jīng)單元個(gè)數(shù)(LSTM_size)、批量數(shù)據(jù)大小(batch_size)、迭代次數(shù)(train_epoch)和學(xué)習(xí)率(e)的預(yù)測(cè)結(jié)果分別如表1~表5所示(表中加粗?jǐn)?shù)值為最優(yōu)結(jié)果)。從表1可知,參數(shù)取值不同,預(yù)測(cè)模型的預(yù)測(cè)能力也不一樣。首先LSTM神經(jīng)單元個(gè)數(shù)過(guò)多,預(yù)測(cè)模型將過(guò)擬合,降低預(yù)測(cè)模型學(xué)習(xí)氣象數(shù)據(jù)的泛化能力,同時(shí)個(gè)數(shù)太少,預(yù)測(cè)模型將遺失重要信息并無(wú)法有效挖掘土壤溫度與其影響因素間的關(guān)聯(lián),因此LSTM_size=50時(shí),預(yù)測(cè)性能最好(RMSE=2.413,MAE=1.893,NS=0.921,WI=0.980,LMI=0.740);從表2可知,若迭代次數(shù)太小,預(yù)測(cè)模型無(wú)法收斂于最優(yōu)值,而迭代次數(shù)太大,將明顯出現(xiàn)過(guò)擬合現(xiàn)象,預(yù)測(cè)性能將不會(huì)提升, 因此train_epoch=1 100時(shí),預(yù)測(cè)性能最好(RMSE=2.234,MAE=1.756,NS=0.932,WI=0.983,LMI=0.759);同理,從表3可知批量數(shù)據(jù)主要控制著訓(xùn)練過(guò)程一次處理樣本的信息,過(guò)小將導(dǎo)致預(yù)測(cè)模型難于收斂,過(guò)大將導(dǎo)致預(yù)測(cè)模型性能無(wú)法達(dá)到最優(yōu), 因此batch_size=400時(shí),預(yù)測(cè)性能最好(RMSE=2.392,MAE=1.875,NS=0.922,WI=0.981,LMI=0.743);最后從表4可知學(xué)習(xí)率是控制訓(xùn)練過(guò)程中每一次逼近最優(yōu)值的步長(zhǎng),過(guò)小容易選入局部最優(yōu),而過(guò)大將無(wú)法逼近最優(yōu)值并在最優(yōu)值附近不斷徘徊。因此當(dāng)LSTM_size=50,batch_size=400,train_epoch=1 100,e=1×10-4時(shí)性能最佳,進(jìn)而通過(guò)確定上述參數(shù),本文得到了最優(yōu)的LSTM預(yù)測(cè)模型結(jié)構(gòu)。
表1 不同LSTM神經(jīng)單元個(gè)數(shù)在長(zhǎng)白山氣象站的預(yù)測(cè)結(jié)果
表2 不同批量數(shù)據(jù)大小在長(zhǎng)白山氣象站的預(yù)測(cè)結(jié)果
表3 不同迭代次數(shù)在長(zhǎng)白山氣象站的預(yù)測(cè)結(jié)果
表4 不同學(xué)習(xí)率在長(zhǎng)白山氣象站的預(yù)測(cè)結(jié)果
得到最優(yōu)LSTM預(yù)測(cè)模型結(jié)構(gòu)后,然后分析影響因素的組合對(duì)預(yù)測(cè)能力的影響,XGBoost-LSTM預(yù)測(cè)模型的整體的數(shù)據(jù)處理流程如圖3所示。首先根據(jù)2.3節(jié)XGBoost部分計(jì)算所有影響因素的重要性,如圖4所示。同時(shí)在XGBoost模型計(jì)算影響因素重要性的過(guò)程中,分別對(duì)XGBoost模型訓(xùn)練中學(xué)習(xí)率、樹(shù)的個(gè)數(shù)為800和樹(shù)的最大深度所對(duì)應(yīng)的平方損失減少值進(jìn)行分析,以選取最優(yōu)參數(shù),對(duì)比結(jié)果如表5所示。 當(dāng)學(xué)習(xí)率為0.005,樹(shù)的個(gè)數(shù)為800,最大深度為5時(shí),平方損失減少值最優(yōu)(-0.078 481)。
表5 不同參數(shù)的XGBoost模型性能對(duì)比
圖3 XGBoost-LSTM整體流程Fig.3 Framework of XGBoost-LSTM model
圖4 影響因素重要性得分Fig.4 Weight of the meteorological inputs
最終通過(guò)實(shí)驗(yàn)可知,影響因素重要性由高低排序如下:大氣溫度、蒸汽壓、太陽(yáng)輻射、相對(duì)濕度、風(fēng)速、大氣壓和降水量。然后根據(jù)影響因素重要性,通過(guò)逐步組合生成7種預(yù)測(cè)模型輸入:大氣溫度(輸入1),大氣溫度+太陽(yáng)輻射(輸入2),大氣溫度+太陽(yáng)輻射+蒸汽壓(輸入3),大氣溫度+太陽(yáng)輻射+蒸汽壓+相對(duì)濕度(輸入4),大氣溫度+太陽(yáng)輻射+蒸汽壓+相對(duì)濕度+風(fēng)速(輸入5),大氣溫度+太陽(yáng)輻射+蒸汽壓+相對(duì)濕度+風(fēng)速+大氣壓(輸入6),大氣溫度+太陽(yáng)輻射+蒸汽壓+相對(duì)濕度+風(fēng)速+大氣壓+降水量(輸入7)。
最后基于LSTM預(yù)測(cè)模型對(duì)對(duì)上述7組合進(jìn)行測(cè)試,以找到最優(yōu)的影響因素組合,如表6所示。根據(jù)實(shí)驗(yàn)可知,以大氣溫度、太陽(yáng)輻射和蒸汽壓3種組合作為輸入,可以得到更好的預(yù)測(cè)結(jié)果。
表6 不同輸入組合的預(yù)測(cè)結(jié)果
圖5展示了在長(zhǎng)白山區(qū)域,本文方法與目前常用的5種數(shù)據(jù)驅(qū)動(dòng)模型的散點(diǎn)圖對(duì)比。從圖5可知,本文方法得到的土壤溫度預(yù)測(cè)值(y)和觀測(cè)值(x)之間的線性關(guān)系(y=0.980 6x+0.210 7)更接近理想線(y=x),同時(shí)相比其它數(shù)據(jù)驅(qū)動(dòng)模型也得到了最高的R2(R2=0.934 2)。需要注意的是LR模型雖然具有最高R2,但其線性關(guān)系相較于其他數(shù)據(jù)驅(qū)動(dòng)模型具有較大差距。因此表明本文方法在長(zhǎng)白山區(qū)域預(yù)測(cè)效果最好。圖6展示了海北區(qū)域散點(diǎn)圖對(duì)比結(jié)果。其中,ELM預(yù)測(cè)模型預(yù)測(cè)結(jié)果相比本文模型更接近于線性關(guān)系,但由于其在長(zhǎng)白山的表現(xiàn)一般,表現(xiàn)出其不穩(wěn)定性。綜合兩區(qū)域散點(diǎn)圖的線性關(guān)系可知,本文方法效果最佳。
圖5 長(zhǎng)白山區(qū)域溫度預(yù)測(cè)值與真實(shí)值的數(shù)據(jù)驅(qū)動(dòng)散點(diǎn)圖Fig.5 Scatterplots of the estimated and observed values of temperature(℃) using the data-driven models for Changbai Mountain metrological station
圖6 海北區(qū)域溫度預(yù)測(cè)值與真實(shí)值的數(shù)據(jù)驅(qū)動(dòng)散點(diǎn)圖Fig.6 Scatterplots of the estimated and observed values of temperature (°C) using the data-driven models for Haibei Mountain metrological station
表7和表8指出了不同數(shù)據(jù)驅(qū)動(dòng)模型在長(zhǎng)白山和海北區(qū)域性能數(shù)據(jù)統(tǒng)計(jì)對(duì)比。可知,本文方法在長(zhǎng)白山站點(diǎn)得到的RMSE,MAE,RAME都比其他數(shù)據(jù)驅(qū)動(dòng)模型的值小,同時(shí)WI,LMI的值最高。在海北站區(qū)域中,ELM預(yù)測(cè)模型的RMSE值優(yōu)于本文方法,但NS,LMI出現(xiàn)異常結(jié)果。其原因可能是ELM是一種隨機(jī)選擇隱層權(quán)值的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),這種隨機(jī)性使預(yù)測(cè)模型訓(xùn)練時(shí)產(chǎn)生非最優(yōu)解,從而影響預(yù)測(cè)結(jié)構(gòu)[1]。綜上所述,本文方法在不同站點(diǎn)的土壤溫度預(yù)測(cè)中都優(yōu)于其他數(shù)據(jù)驅(qū)動(dòng)模型。
表7 長(zhǎng)白山地區(qū)不同數(shù)據(jù)驅(qū)動(dòng)模型的性能對(duì)
表8 海北地區(qū)不同數(shù)據(jù)驅(qū)動(dòng)模型的性能對(duì)
然而,在前人研究主要基于ANN、SVR和ELM等方法實(shí)現(xiàn)土壤溫度預(yù)測(cè)。缺少其它機(jī)器學(xué)習(xí)算法如極限梯度提升(XGBoost)和長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)等研究。XGBoost是基于梯度下降方法,融合多個(gè)弱分類(lèi)器成為一種強(qiáng)分類(lèi)器,這種加強(qiáng)學(xué)習(xí)能力的模式,使XGBoost在多種領(lǐng)域的預(yù)測(cè)研究得到廣泛應(yīng)用。同時(shí),具有記憶細(xì)胞的LSTM模型既可以學(xué)習(xí)其短期行為,也可以學(xué)習(xí)其長(zhǎng)期行為。這種模式使LSTM在模擬自然系統(tǒng)時(shí)非常有用。同時(shí)土壤溫度的影響因素很多,如太陽(yáng)輻射、大氣溫度等。但基于機(jī)器學(xué)習(xí)針對(duì)影響因素重要性的量化評(píng)價(jià),并結(jié)合預(yù)測(cè)模型的方式并未展開(kāi)研究。事實(shí)上,預(yù)測(cè)模型中不同影響因素的組合對(duì)預(yù)測(cè)能力有很大影響。
本文將在中國(guó)長(zhǎng)白山和海北區(qū)域進(jìn)行測(cè)試,首先基于XGBoost計(jì)算土壤溫度預(yù)測(cè)中每個(gè)影響因素的重要性,然后將影響因素依據(jù)重要性大小依次進(jìn)行組合并作為預(yù)測(cè)模型的輸入,其中本文將嘗試基于LSTM作為預(yù)測(cè)模型。最后根據(jù)不同組合的預(yù)測(cè)性能選擇最優(yōu)的影響因素。通過(guò)實(shí)驗(yàn)結(jié)果表明本文提出的預(yù)測(cè)模型與目前土壤溫度中常用的數(shù)據(jù)驅(qū)動(dòng)模型,在預(yù)測(cè)結(jié)果散點(diǎn)圖和準(zhǔn)確度統(tǒng)計(jì)結(jié)果的對(duì)比中,均表現(xiàn)出更高的精確度。
然而由于FLUXNE采集數(shù)據(jù)限制,本文主要針對(duì)白山和海北區(qū)域中5 cm土壤深度進(jìn)行實(shí)驗(yàn)。不同的土壤深度和更多的觀測(cè)站點(diǎn)對(duì)預(yù)測(cè)模型性能的影響需要進(jìn)一步研究。同時(shí)在實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn),不同損失函數(shù)的使用導(dǎo)致預(yù)測(cè)結(jié)果不同,因此針對(duì)損失函數(shù)改進(jìn)對(duì)預(yù)測(cè)能力的影響是必要的。