亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        三種機(jī)器學(xué)習(xí)模型在太湖藻華面積預(yù)測(cè)中的應(yīng)用

        2020-12-26 02:42:58朱躍龍吳志勇姜悅美
        關(guān)鍵詞:模型

        吳 娟,朱躍龍,金 松,楊 濤,馮 鈞,吳志勇,薛 濤,姜悅美

        (1.太湖流域管理局水文局(信息中心),上海 200434; 2.河海大學(xué)水文水資源學(xué)院,江蘇 南京 210098)

        太湖(119° 52′ 32″E~120° 36′ 10″ E、30° 55′ 40″N~31°32′58″N)是我國(guó)第三大淡水湖,水面面積約2 338 km2,是典型的大型淺水湖泊。近幾十年來(lái),太湖藍(lán)藻水華(以下簡(jiǎn)稱“藻華”)呈現(xiàn)非線性、復(fù)雜性等特點(diǎn)[1]。藻華不完全是本地藍(lán)藻短時(shí)快速生長(zhǎng)暴發(fā)所致[2],而是已經(jīng)成為優(yōu)勢(shì)種群的藍(lán)藻在合適條件下,受物理(溫度[3]、光照[4]、水動(dòng)力[5]等)、化學(xué)(氮、磷[6]等)[7]、生物(與其他藻類的競(jìng)爭(zhēng))[8]因素等共同影響,在較短的時(shí)間里改變水平與垂直位置形成“暴發(fā)”[9],因此,藻華本質(zhì)是藻類生物量在水體中逐漸增加、上浮、聚集、遷移的過(guò)程[10]。藻華擴(kuò)張分為時(shí)間擴(kuò)張、空間擴(kuò)張和生物量擴(kuò)張。時(shí)間擴(kuò)張用藻華持續(xù)時(shí)間、發(fā)生時(shí)間等表征,空間擴(kuò)張用基于遙感影像的藻華面積表征,生物量擴(kuò)張用葉綠素a、浮游植物總生物量等表征[11]。由于生物量統(tǒng)計(jì)主要以特定湖區(qū)采樣監(jiān)測(cè)、計(jì)數(shù)鑒定方法為主,受制于采樣站點(diǎn)的位置與頻次,獲取資料困難,因此,本文以研究藻華時(shí)間、空間擴(kuò)張為主。

        研究表明,氣候變化、水體富營(yíng)養(yǎng)化是太湖藻華增多的重要原因[12]。大面積偶發(fā)性太湖藻華受氣象因子影響較大,而大面積頻發(fā)性藻華主要受營(yíng)養(yǎng)鹽空間分布影響[13]。太湖處于較高的營(yíng)養(yǎng)鹽水平,超過(guò)藻華發(fā)生的閾值[14],但季節(jié)性營(yíng)養(yǎng)鹽抑制過(guò)程[15]對(duì)藻華強(qiáng)度有一定的限制作用[16],足以維持水華持續(xù)發(fā)生[17]。杭鑫等[18]認(rèn)為氣溫、風(fēng)、降水等氣象因子對(duì)太湖藻華影響較大,適宜的氣象因子為藻華暴發(fā)提供了有利條件。秦伯強(qiáng)等[19]研究表明:藻華面積形成過(guò)程較復(fù)雜,藍(lán)藻細(xì)胞生長(zhǎng)階段,營(yíng)養(yǎng)鹽濃度、溫度、光照等因素為藻華提供了物質(zhì)基礎(chǔ);在藍(lán)藻水華暴發(fā)階段,藻華面積空間分布則受藍(lán)藻細(xì)胞團(tuán)浮力作用與水動(dòng)力湍流作用的共同影響,風(fēng)速?zèng)Q定藻華垂向分布,風(fēng)向和風(fēng)速共同決定其水平分布。

        藍(lán)藻生態(tài)動(dòng)力學(xué)模型因過(guò)程復(fù)雜、參數(shù)眾多[20],導(dǎo)致應(yīng)用在預(yù)測(cè)中存在一定的困難,而機(jī)器學(xué)習(xí)算法(如神經(jīng)網(wǎng)絡(luò)等)為太湖藻華預(yù)測(cè)提供了新的理論和方法[21]。機(jī)器學(xué)習(xí)是一門研究計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類活動(dòng)的學(xué)科[22],也是知識(shí)發(fā)現(xiàn)、數(shù)據(jù)挖掘的重要基礎(chǔ)[23]。通過(guò)挖掘數(shù)據(jù)背后的深度價(jià)值和內(nèi)在聯(lián)系[24],機(jī)器學(xué)習(xí)具有高度的非線性與靈活性[25],應(yīng)用于短期降水預(yù)報(bào)[26]、徑流預(yù)測(cè)[27]、藻華預(yù)警[28],有效提升了預(yù)報(bào)精度和效率。張艷會(huì)等[29]采用BP人工神經(jīng)網(wǎng)絡(luò)和模糊理論,建立了藻華發(fā)生的模糊風(fēng)險(xiǎn)評(píng)價(jià)方法;于家斌等[30]提出基于長(zhǎng)短期記憶(LSTM)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)藻華預(yù)測(cè)模型(LSTM模型預(yù)測(cè)精度較高,對(duì)樣本具有較好的適應(yīng)性);羅曉春等[31]采用隨機(jī)森林機(jī)器學(xué)習(xí)算法分析同期氣象因子與藻華綜合指數(shù)的關(guān)系,定量評(píng)估影響藻華的主要?dú)庀笠蜃拥呢暙I(xiàn)率。上述研究為太湖藻華的預(yù)測(cè)預(yù)警與風(fēng)險(xiǎn)管理提供了參考。

        太湖湖面寬廣,一般采用野外觀測(cè)和數(shù)值模擬研究湖流導(dǎo)致藻華遷移和堆積。風(fēng)向分布具有不均勻性,并隨著風(fēng)速減小差異有所擴(kuò)大。在低風(fēng)速條件下,無(wú)法形成穩(wěn)定環(huán)流,藍(lán)藻容易在太湖表面積聚,而此時(shí)各湖區(qū)之間風(fēng)向差異較大,需要借助藍(lán)藻生態(tài)動(dòng)力學(xué)模型深入研究。本研究側(cè)重采用全太湖、分湖區(qū)建模的思路,基于支持向量機(jī)(SVM)、長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)、極端梯度提升樹(shù)(XGBoost)模型,快速預(yù)判各湖區(qū)藻華面積,旨在為太湖藻華預(yù)測(cè)預(yù)警、風(fēng)險(xiǎn)管理提供技術(shù)支撐。

        1 數(shù)據(jù)與方法

        1.1 數(shù)據(jù)來(lái)源

        按照岸線、水質(zhì)和水下地形等因素,太湖可分為竺山湖、梅梁湖、貢湖等[32],見(jiàn)圖1。近年來(lái),中分辨率成像光譜儀(MODIS)數(shù)據(jù)因其光譜分辨率高、觀測(cè)周期短等特點(diǎn),廣泛應(yīng)用于太湖藻華動(dòng)態(tài)監(jiān)測(cè)[33]。考慮到太湖藻華每年4月開(kāi)始零星暴發(fā),12月以后基本無(wú)大范圍藻華暴發(fā),因此,選取4—11月的 EOS /MODIS 影像數(shù)據(jù)(排除了云層、天氣質(zhì)量等對(duì)影像質(zhì)量影響較大的數(shù)據(jù))共761景,時(shí)間間隔從1 d到15 d不等,藻華面積來(lái)源于中國(guó)科學(xué)院南京地理與湖泊研究所解譯成果。本研究采用的藻華面積為絕對(duì)面積,指當(dāng)像元內(nèi)存在水華時(shí),只計(jì)算像元內(nèi)水華覆蓋部分的面積。太湖內(nèi)共布設(shè)33個(gè)監(jiān)測(cè)點(diǎn),覆蓋了全部水域,監(jiān)測(cè)項(xiàng)目包括pH、總磷、總氮、高錳酸鹽指數(shù)、氨氮、葉綠素a、藍(lán)藻密度,僅每月上旬監(jiān)測(cè)1次,根本無(wú)法滿足藻華面積建模要求,因此本研究只能采用環(huán)湖10個(gè)水質(zhì)站、4個(gè)氣象站時(shí)間分布較精細(xì)的數(shù)據(jù)進(jìn)行建模。水質(zhì)指標(biāo)包括水溫、pH、電導(dǎo)率、溶解氧、氨氮、總磷、總氮、濁度、高錳酸鹽指數(shù),氣象指標(biāo)包括氣溫、風(fēng)速、風(fēng)向、降水。本研究的資料序列均為2014—2018年。由于東部沿岸區(qū)與東太湖沒(méi)有MODIS藻華資料,而貢湖、南部沿岸區(qū)均有水源地,因此,本研究采用全太湖、貢湖、南部沿岸區(qū)、中西北湖區(qū)(西部沿岸區(qū)+湖心區(qū)+竺山湖+梅梁湖)分別建模。南部沿岸區(qū)代表站包括幻溇、濮溇、湯溇,中西北湖區(qū)代表站包括長(zhǎng)豐澗、大港、洪巷、官瀆、社瀆。

        圖1 太湖分區(qū)與觀測(cè)站示意圖Fig.1 Sub-regions in Taihu Lake and observation stations

        1.2 研究方法

        太湖藻華受物理、化學(xué)、生物因素等共同影響,機(jī)理十分復(fù)雜,呈非線性變化特征。本研究需要先采用Pearson 相關(guān)系數(shù)去除不相關(guān)或重復(fù)變量,提取對(duì)各湖區(qū)藻華面積影響較大的主要?dú)庀笏乃|(zhì)因子。從時(shí)間、空間尺度上考慮到不同湖區(qū)水質(zhì)差異較大,MODIS成像時(shí)間為上午10:30左右,因此,從時(shí)間尺度上分成3個(gè)模型,模型1采用當(dāng)天0:00—8:00之前的氣象、水文、水質(zhì)數(shù)據(jù)預(yù)測(cè)當(dāng)天的藻華面積,模型2采用提前一天0:00—23:00的數(shù)據(jù)預(yù)測(cè)當(dāng)天的藻華面積,模型3采用提前兩天0:00—23:00的數(shù)據(jù)預(yù)測(cè)當(dāng)天的藻華面積。由于SVM、LSTM、XGBoost模型既可解決分類問(wèn)題,也可解決回歸問(wèn)題,并且處理非線性問(wèn)題有一定的優(yōu)越性,在水質(zhì)評(píng)價(jià)與預(yù)測(cè)研究中有一定的應(yīng)用情景,因此,本研究分別開(kāi)展兩類算法的應(yīng)用研究,共建立24個(gè)模型。訓(xùn)練集、驗(yàn)證集為2014—2018年序列數(shù)據(jù),其中隨機(jī)抽取70%的樣本(533組)用于訓(xùn)練,剩下30%的樣本(228組)作為驗(yàn)證集。

        1.2.1 數(shù)據(jù)預(yù)處理

        由于輸入變量可能不在同一個(gè)數(shù)量級(jí)上,數(shù)據(jù)之間的差異性可能對(duì)模型學(xué)習(xí)能力存在一定的不利影響,為了減少數(shù)值差異、保證模型參數(shù)穩(wěn)定收斂,需要進(jìn)行歸一化處理,確保各變量處于相同的量級(jí)。

        (1)

        式中:X——輸入變量;X′——變量X歸一化后的值;Xmin、Xmax——X的最小值、最大值。

        1.2.2SVM

        SVM是通過(guò)核函數(shù),將低維輸入空間中線性不可分的點(diǎn)映射成高維特征空間中線性可分的點(diǎn),通過(guò)劃分超平面,使所有的點(diǎn)到分類超平面的距離最大化[34]。其中,高維空間中距離分類超平面最近的那些點(diǎn)所對(duì)應(yīng)的低維空間點(diǎn)被稱為支持向量[35]。核函數(shù)的作用是接受兩個(gè)低維空間中的輸入向量,計(jì)算出經(jīng)過(guò)某種變換后二者在高維空間中的向量?jī)?nèi)積值,具體見(jiàn)文獻(xiàn)[36]。

        常用的核函數(shù)有線性、多項(xiàng)式、徑向基、sigmoid核函數(shù)。經(jīng)對(duì)比,本研究采用誤差較小、分類準(zhǔn)確率較高的徑向基函數(shù)作為核函數(shù)[37]。SVM采用徑向基核函數(shù),相應(yīng)參數(shù)為懲罰因子c和核參數(shù)g。為確定最佳的參數(shù)值,將c、g分別取以2為底的指數(shù)離散值,代入V折交叉驗(yàn)證法中,選取平均誤差最小的c、g值;采用網(wǎng)格搜索法,減小取值范圍和間隔,確定最佳參數(shù),根據(jù)計(jì)算,最佳參數(shù)為c=0.76,g=0.38,V=5。

        1.2.3LSTM

        RNN屬于深度學(xué)習(xí)方法[38],用于處理非線性時(shí)間序列,但在實(shí)際建模中,存在梯度消失及梯度爆炸問(wèn)題[39]。為此,Hochreiter等提出了LSTM,將RNN中隱含層中的神經(jīng)元替換為記憶體,實(shí)現(xiàn)信息保留與長(zhǎng)期記憶。通過(guò)記憶細(xì)胞進(jìn)行狀態(tài)信息存儲(chǔ),門結(jié)構(gòu)負(fù)責(zé)細(xì)胞狀態(tài)的更新與保持[40]。每個(gè)記憶體包含一到多個(gè)記憶細(xì)胞和3種“門”,包括“遺忘門”、“輸入門”和“輸出門”。 LSTM訓(xùn)練過(guò)程是尋找最優(yōu)參數(shù),使模型收斂、損失函數(shù)達(dá)到最小[41]。算法見(jiàn)文獻(xiàn)[42]。LSTM 網(wǎng)絡(luò)層中隱藏神經(jīng)元數(shù)目是影響準(zhǔn)確率的重要參數(shù),為尋求模型的全局最優(yōu)解,采用基于梯度下降、具有相當(dāng)魯棒性的ADAM自適應(yīng)學(xué)習(xí)率優(yōu)化算法;經(jīng)計(jì)算,初始學(xué)習(xí)率取0.001,隱藏神經(jīng)元數(shù)為256,可使全局最優(yōu)。

        1.2.4XGBoost

        XGBoost模型為樹(shù)結(jié)構(gòu),是對(duì)梯度提升決策樹(shù)算法的改進(jìn),采用加法學(xué)習(xí)模型進(jìn)行優(yōu)化[43]。通過(guò)不斷迭代生成新的樹(shù),加入子樹(shù)使模型不斷逼近樣本分布,將多個(gè)分類準(zhǔn)確率較低的樹(shù)模型組合成一個(gè)準(zhǔn)確率較高的模型[44]。通過(guò)在Xgboost損失函數(shù)中加入正則項(xiàng),既控制模型的復(fù)雜度,也降低模型的方差,避免模型過(guò)擬合[45]。算法見(jiàn)文獻(xiàn)[46]。XGBoost模型主要參數(shù)包括eta、subsample、max_depth。eta指學(xué)習(xí)速率,可以提高模型的魯棒性;subsample指訓(xùn)練的實(shí)例樣本占總體樣本的比例;max_depth為樹(shù)的最大深度,用來(lái)避免過(guò)擬合。經(jīng)計(jì)算,最佳參數(shù)為eta=0.15,sub-sample=0.2,max_depth=8。

        1.3 模型評(píng)價(jià)

        常用評(píng)價(jià)指標(biāo)包括:納什效率系數(shù)(NSE)、相對(duì)偏差(PB),公式如下:

        (2)

        (3)

        NSE取值范圍為負(fù)無(wú)窮至1,越接近1表示模擬效果越好、可信度越高;NSE接近0,表示模擬結(jié)果接近觀測(cè)值的平均值水平,即總體結(jié)果可信,但過(guò)程模擬誤差大。PB絕對(duì)值越小,模擬效果越好。

        Pearson 相關(guān)系數(shù)(r)是描述兩個(gè)隨機(jī)變量線性相關(guān)的統(tǒng)計(jì)量,計(jì)算公式如下:

        (4)

        r取值范圍為-1.0~1.0,越接近1.0,正相關(guān)越顯著,越接近-1.0,負(fù)相關(guān)性越顯著。構(gòu)造統(tǒng)計(jì)量t檢驗(yàn)相關(guān)性是否顯著,計(jì)算公式如下:

        (5)

        統(tǒng)計(jì)量t遵從自由度ν=n-2的t分布。給定顯著性水平α,查t分布表,若t>tα,認(rèn)為相關(guān)系數(shù)是顯著的。

        2 結(jié)果與分析

        2.1 相關(guān)性分析

        為了確定所選氣象、水文、水質(zhì)因子對(duì)太湖藻華面積模擬的有效性,提高藻華面積模型的準(zhǔn)確性,采用Pearson相關(guān)系數(shù)去除相關(guān)性不顯著的變量。分別計(jì)算當(dāng)天、提前1 d到提前30 d共計(jì)31種時(shí)間尺度條件下,全太湖、貢湖、南部沿岸區(qū)、中西北湖區(qū)藻華面積,以及氣象、水文、水質(zhì)數(shù)據(jù)之間的Pearson相關(guān)系數(shù),發(fā)現(xiàn)當(dāng)天、提前1 d、提前2 d時(shí)間尺度相關(guān)系數(shù)明顯高于其他時(shí)段。Pearson相關(guān)系數(shù)較顯著的因子如表1所示,全太湖藻華面積與水溫、風(fēng)速、降水等氣象因子相關(guān)性較高,其中,與當(dāng)天無(wú)錫2:00、8:00風(fēng)速負(fù)相關(guān)性較顯著,分別達(dá)到-0.17、-0.23。不同時(shí)間尺度下的貢湖藻華面積與水溫、濁度、總氮、氨氮正相關(guān)性均較高,相關(guān)系數(shù)均可達(dá)0.15以上。南部沿岸區(qū)藻華面積與水溫呈顯著正相關(guān)性,相關(guān)系數(shù)均可達(dá)0.19以上,與當(dāng)日東山站2:00、8:00風(fēng)速呈顯著負(fù)相關(guān)性。中西北湖區(qū)藻華面積與當(dāng)日宜興站2:00、8:00風(fēng)速的負(fù)相關(guān)性較顯著。

        表1 藻華面積與氣象、水文、水質(zhì)因子之間的Pearson相關(guān)系數(shù)Table 1 Pearson relative coefficient between cyanobacterial bloom area and factors including meteorological, hydrological and water quality factors

        2.2 模型分析結(jié)果

        將訓(xùn)練集和驗(yàn)證集分別代入訓(xùn)練好的全太湖、貢湖、南部沿岸區(qū)、中西北湖區(qū)藻華面積模擬模型中,并對(duì)輸出值進(jìn)行反歸一化處理。模擬值與觀測(cè)值之間的NSE與PB見(jiàn)表2。對(duì)于不同時(shí)間尺度(當(dāng)天、提前1 d、提前2 d)下的全太湖藻華面積回歸模型訓(xùn)練集與驗(yàn)證集而言,XGBoost回歸模型NSE最高、PB最低,其次是LSTM回歸模型、SVM回歸模型;驗(yàn)證期的XGBoost回歸模型,當(dāng)天的模型1與提前1 d的模型2,相對(duì)優(yōu)于提前2 d的模型3。

        表2 3種機(jī)器學(xué)習(xí)回歸模型評(píng)價(jià)結(jié)果Table 2 Evaluation results of three machine-learning regression methods

        對(duì)于不同時(shí)間尺度下貢湖、南部沿岸區(qū)、中西北湖區(qū)的藻華面積回歸模型NSE,XGBoost模型訓(xùn)練集與驗(yàn)證集NSE普遍較高,訓(xùn)練集LSTM模型的NSE高于SVM模型,驗(yàn)證集SVM模型的NSE高于LSTM模型;驗(yàn)證期的貢湖SVM模型:藻華面積模型1、南部沿岸區(qū)XGBoost藻華面積模型1、中西北湖區(qū)XGBoost藻華面積模型2的NSE高于相應(yīng)湖區(qū)的其他時(shí)間尺度模型,與全太湖藻華面積回歸模型表現(xiàn)也基本一致。

        《太湖藍(lán)藻水華評(píng)價(jià)方法(試行)》將藍(lán)藻水華面積分為4類:<240 km2、[240,600)km2、[600,1 000]km2、>1 000 km2,相應(yīng)面積水域發(fā)生水華分別稱為零星湖區(qū)、局部湖區(qū)、區(qū)域、大范圍水華暴發(fā)[47]。以全太湖藻華面積過(guò)程線擬合效果為例,分析SVM、LSTM、XGBoost回歸模型模擬結(jié)果,見(jiàn)圖2~4。模擬結(jié)果表明:不同時(shí)間尺度下SVM、LSTM回歸模型訓(xùn)練集的模擬值偏低,XGBoost回歸模型訓(xùn)練集模擬值與實(shí)測(cè)值基本接近;盡管SVM、XGBoost回歸模型驗(yàn)證集模擬值較實(shí)測(cè)值偏小,但有效模擬了零星湖區(qū)、局部湖區(qū)水華的發(fā)展趨勢(shì);LSTM回歸模型驗(yàn)證集的模擬值與實(shí)測(cè)值差異較大,不合理跳動(dòng)較多,這也驗(yàn)證了神經(jīng)網(wǎng)絡(luò)模型存在過(guò)學(xué)習(xí)、泛化能力差的固有缺陷。

        圖2 基SVM于回歸模型的全太湖藻華面積訓(xùn)練集與驗(yàn)證集模擬Fig.2 Training set and verification set simulations of cyanobacterial bloom area with SVM regression model in Taihu Lake

        圖3 基于LSTM回歸模型的全太湖藻華面積訓(xùn)練集與驗(yàn)證集模擬Fig.3 Training set and verification set simulations of cyanobacterial bloom area with LSTM regression model in Taihu Lake

        圖4 基于XGBoost回歸模型的全太湖藻華面積訓(xùn)練集與驗(yàn)證集模擬Fig.4 Training set and verification set simulations of cyanobacterial bloom area with XGBoost regression model in Taihu Lake

        從上述分析可知,回歸模型在驗(yàn)證期模擬效果不太好,考慮到藻華面積預(yù)測(cè)與防控業(yè)務(wù)中主要關(guān)注藻華面積與相應(yīng)湖區(qū)面積比例的范圍,對(duì)精確數(shù)值關(guān)注較少。為進(jìn)一步改進(jìn)藻華面積模型,采用分類算法輸出離散的類別值。將藻華面積與相應(yīng)湖區(qū)面積比例按照<10%、[10%,25%)、[25%,50%)、>50%分成4類,分析不同時(shí)間尺度下SVM、LSTM、XGBoost分類模型的正確率,見(jiàn)表3。表3結(jié)果表明:全太湖各模型的訓(xùn)練集正確率達(dá)到0.97以上,驗(yàn)證集SVM、XGBoost分類模型正確率達(dá)到0.80以上,LSTM分類模型正確率略低,為0.66~0.86,誤差較大,見(jiàn)圖5。貢湖各模型的訓(xùn)練集正確率達(dá)到0.89以上,驗(yàn)證集正確率達(dá)到0.82以上;南部沿岸區(qū)各模型的訓(xùn)練集正確率達(dá)到0.97以上,驗(yàn)證集正確率達(dá)到0.80以上;中西北湖區(qū)訓(xùn)練集正確率達(dá)到0.83以上,驗(yàn)證集XGBoost模型正確率達(dá)到0.80以上,好于LSTM分類模型、SVM分類模型。總體而言,貢湖藻華面積SVM、LSTM、XGBoost分類模型驗(yàn)證集正確率普遍優(yōu)于其他湖區(qū),可能與貢湖風(fēng)浪站相對(duì)于其他環(huán)湖站點(diǎn)位置更加偏向于貢湖內(nèi)部,氣象、水文、水質(zhì)數(shù)據(jù)代表性更強(qiáng)有關(guān)。

        圖5 不同時(shí)間尺度下SVM、LSTM、XGBoost分類模型的藻華面積驗(yàn)證集模擬Fig.5 Verification of cyanobacterial bloom areas with SVM, LSTM and XGBoost classification models in Taihu Lake

        表3 3種機(jī)器學(xué)習(xí)分類模型評(píng)價(jià)結(jié)果Table 3 Evaluation results of three machine-learning classification methods

        從上述研究可知,SVM、LSTM模型在藻華面積較低時(shí),模擬與實(shí)測(cè)結(jié)果較接近;當(dāng)藻華面積超過(guò)600 km2時(shí),模擬與實(shí)測(cè)結(jié)果偏差較大??赡茉蛴?個(gè):一是太湖藻華面積高值相對(duì)較少,且水華從暴發(fā)到消退較快,在運(yùn)用機(jī)器學(xué)習(xí)方法訓(xùn)練模型時(shí),如果目標(biāo)值數(shù)量不均等、數(shù)值差異大,SVM、LSTM模型一般偏向于數(shù)量多、數(shù)值低的藻華面積的樣本。二是LSTM較適合大數(shù)據(jù)的機(jī)器學(xué)習(xí),在數(shù)據(jù)量足夠多的情況下效果較優(yōu),而本研究的數(shù)據(jù)量可能遠(yuǎn)遠(yuǎn)達(dá)不到大數(shù)據(jù)的要求,LSTM無(wú)法很好地保證模型的泛化能力,存在陷入局部最優(yōu)以及收斂時(shí)間長(zhǎng)等問(wèn)題[48],導(dǎo)致模擬效果不佳。三是太湖風(fēng)浪作用顯著,適度的間歇性風(fēng)浪擾動(dòng)可以促進(jìn)氮磷等營(yíng)養(yǎng)鹽釋放,刺激藍(lán)藻細(xì)胞生理特征改變,對(duì)太湖藻華遷移聚集影響較大,而模型只考慮了風(fēng)場(chǎng),流場(chǎng)數(shù)據(jù)的缺乏導(dǎo)致水動(dòng)力輸移考慮可能不夠??傮w而言,由于XGBoost模型在損失函數(shù)尋優(yōu)過(guò)程中加入了正則項(xiàng)來(lái)控制過(guò)擬合現(xiàn)象,模擬藻華面積與實(shí)測(cè)相比,精度較高、穩(wěn)健性較好。

        3 結(jié) 論

        a. XGBoost全太湖與分區(qū)的回歸模型訓(xùn)練集與驗(yàn)證集模擬效果均較好,LSTM回歸模型訓(xùn)練集較好、但驗(yàn)證集較差,SVM回歸模型介于XGBoost與LSTM回歸模型之間;SVM、XGBoost回歸模型的驗(yàn)證集模擬值偏小,但有效模擬了藻華的發(fā)展趨勢(shì);選取當(dāng)天、提前1 d的氣象水文水質(zhì)因子作為太湖及分區(qū)藻華面積模型的輸入,模擬結(jié)果較好。

        b. 在全太湖、中西北湖區(qū)藻華面積模擬中,XGBoost分類模型正確率較高;在貢湖、南部沿岸區(qū)藻華面積模擬中,SVM、LSTM、XGBoost分類模型正確率均較高。

        c. SVM、LSTM模型在藻華面積較低時(shí)模擬與實(shí)測(cè)結(jié)果較接近,當(dāng)藻華面積較高時(shí)模擬與實(shí)測(cè)偏差較大,可能與機(jī)器學(xué)習(xí)方法訓(xùn)練模型一般偏向于數(shù)量多、數(shù)值低的藻華面積的樣本有關(guān);XGBoost模型精度較高、穩(wěn)健性較好,適合在太湖藻華面積預(yù)測(cè)中推廣。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        麻豆国产成人av高清在线观看| 在线成人福利| 国产中文字幕乱码在线| 亚洲欧美一区二区三区国产精| 人妻少妇精品视中文字幕国语| 国产主播无套内射一区| 日韩性感av一区二区三区| 亚洲av综合日韩精品久久| 狠狠躁天天躁无码中文字幕图| 色欲色欲天天天www亚洲伊| 自拍偷自拍亚洲精品播放| 黄 色 成 年 人 网 站免费| 亚洲天堂av一区二区三区不卡| 久久国产亚洲精品一区二区三区| 精品国产亚洲亚洲国产| 国产激情久久久久影院老熟女免费 | 国内免费自拍9偷1拍| 国产黄大片在线观看| 亚洲欧洲日产国码无码久久99| 国产亚洲美女精品久久| 蜜桃av在线播放视频| 一区二区激情偷拍老牛视频av| 一区二区三区午夜视频在线| 亚洲av成人一区二区三区本码| 精品人妻av一区二区三区| 日韩精品无码中文字幕电影| 国产精品免费久久久免费| 国产美女黄性色av网站| 日韩中文字幕素人水野一区| 肉体裸交137日本大胆摄影| 天天爽夜夜爽人人爽曰喷水| 国产欧美日本亚洲精品一4区| aⅴ色综合久久天堂av色综合| 日韩精品一区二区av在线| 精品一区2区3区4区| 高h喷水荡肉爽文np肉色学校| 激情伊人五月天久久综合| 国产成人精品三级麻豆| 中文字幕精品一区二区日本 | 乱色精品无码一区二区国产盗| 成人看片黄a免费看那个网址|