亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的旱災(zāi)風(fēng)險評估方法

        2022-07-01 13:46:58嶺,宋輝,陳
        人民長江 2022年6期
        關(guān)鍵詞:特征文本模型

        馮 嶺,宋 文 輝,陳 繼 坤

        (華北水利水電大學(xué) 信息工程學(xué)院,河南 鄭州 450046)

        0 引 言

        干旱是降水或河川徑流異常引起的水分短缺現(xiàn)象[1],而旱災(zāi)是世界上危害最廣泛、最嚴重的自然災(zāi)害之一[2]。中國地處典型季風(fēng)氣候區(qū),旱災(zāi)的影響尤為突出[3]。據(jù)《中國水旱災(zāi)害公報》統(tǒng)計,中國農(nóng)作物平均年成災(zāi)面積近年來呈現(xiàn)出逐年增長的態(tài)勢,從20世紀50年代的531.7萬hm2,迅速增長至 90 年代的1 384.2萬hm2。每年因旱災(zāi)損失糧食基本維持在300多億kg,造成的工農(nóng)業(yè)直接經(jīng)濟損失近千億元[4]。因此,如何在旱災(zāi)發(fā)生前進行災(zāi)情風(fēng)險評估,準確預(yù)測災(zāi)情的發(fā)生,保障糧食安全,是干旱相關(guān)工作者需迫切展開的工作。

        傳統(tǒng)的旱災(zāi)風(fēng)險等級評估方法大多是通過定義各種指標對旱災(zāi)的風(fēng)險等級進行評價。在指標方面,張偉杰等[5]基于標準化降水指數(shù)SPI,分別以月尺度、季節(jié)尺度、半年尺度、年尺度對內(nèi)蒙古達茂草原近56 a間的干旱演變與趨勢特征進行分析;聶明秋等[6]采用非參數(shù)法以渭河流域為研究對象,構(gòu)建了綜合干旱指數(shù),分析了渭河流域綜合干旱的演變規(guī)律,結(jié)合干旱風(fēng)險因子探究風(fēng)險的動態(tài)演變特征;任怡等[7]利用水資源供求指數(shù)、綜合干旱指數(shù)對陜西省干旱時空分布進行了分析。

        以上基于指標的方法通常只能對已發(fā)生干旱的強度進行分析,而無法對未來旱災(zāi)發(fā)生的可能性和風(fēng)險等級進行預(yù)測。隨著機器學(xué)習(xí)方法的發(fā)展,將多源數(shù)據(jù)與機器學(xué)習(xí)算法相結(jié)合已經(jīng)成為當前旱災(zāi)風(fēng)險等級評估的一個重要趨勢,多元線性回歸[8]、遺傳算法[9]、人工神經(jīng)網(wǎng)絡(luò)[10]等機器學(xué)習(xí)模型和算法被用于對旱災(zāi)的風(fēng)險等級進行評估。在這方面,F(xiàn)ung等[11]基于改進的支持向量回歸模型,對馬來西亞蘭加特河流域下游的農(nóng)業(yè)干旱進行預(yù)測;Djerbouai等[12]使用小波神經(jīng)網(wǎng)絡(luò)和隨機模型,對北阿爾及利亞地區(qū)進行了干旱預(yù)測預(yù)報;Seibert等[13]通過比較3種不同的統(tǒng)計方法,即多元線性回歸模型、人工神經(jīng)網(wǎng)絡(luò)模型、隨機森林回歸樹模型,對水文干旱進行季節(jié)性預(yù)報;Khan等[14]利用支持向量機(Support Vector Machine,SVM)、人工神經(jīng)網(wǎng)絡(luò)和K近鄰算法對巴基斯坦進行了干旱建模分析。盡管上述方法可以在一定程度上對未來發(fā)生的干旱風(fēng)險進行預(yù)測和評估,但在這些方法中考慮的影響旱災(zāi)風(fēng)險的因素較為單一,并沒有將干旱影響因素與實際旱災(zāi)風(fēng)險關(guān)聯(lián)起來。

        針對已有旱災(zāi)風(fēng)險等級評估方法的不足,本研究旨在基于歷史旱情文本數(shù)據(jù)和氣象數(shù)據(jù),建立一種數(shù)據(jù)驅(qū)動的短期旱災(zāi)風(fēng)險等級評估方法。首先,對旱情文本進行預(yù)處理,提取干旱等級標簽;其次,選取多個影響干旱的氣象因素,通過深度學(xué)習(xí)算法來挖掘氣象數(shù)據(jù)與歷史災(zāi)情之間的關(guān)系;最后,建立基于數(shù)據(jù)驅(qū)動的多源多模態(tài)旱災(zāi)風(fēng)險等級評估模型,以對未來發(fā)生旱災(zāi)的風(fēng)險等級進行評估。以此可在旱災(zāi)發(fā)生前對旱災(zāi)進行預(yù)警,降低旱災(zāi)造成的負面影響,減少國家的經(jīng)濟損失。

        1 材料與方法

        1.1 研究區(qū)概況

        河南省是中國的糧食與農(nóng)業(yè)大省,而旱災(zāi)對河南省的影響尤為強烈。鄭州市位于河南省中部偏北,地處南北氣候過渡帶,常年平均降水量為628 mm,降水量的年際變化大,年內(nèi)分布不均勻。地形和氣候的2個過渡帶決定了鄭州市旱澇災(zāi)害會頻繁發(fā)生[15],故選擇河南省境內(nèi)的鄭州市作為實例來研究旱災(zāi)風(fēng)險。

        1.2 數(shù)據(jù)來源

        研究區(qū)的氣象數(shù)據(jù)來源于中國氣象資料共享服務(wù)網(wǎng)(http:/cdc.cma.gov.cn/)河南省縣級以上區(qū)域18個氣象站1951~2020年的逐月氣象資料。

        研究區(qū)文本數(shù)據(jù)來源于《中國氣象災(zāi)害大典(河南卷)》干旱災(zāi)害篇章中的災(zāi)情記錄文本。該文本中,記錄了河南省地區(qū)從公元前1804年到公元2000年的歷史旱災(zāi)。2000年以后的標簽以河南省水利廳、農(nóng)業(yè)廳發(fā)布的新聞報道為主,輔以網(wǎng)絡(luò)報道期刊數(shù)據(jù)等。

        基于上述2個數(shù)據(jù)集,以鄭州市為例,根據(jù)1951~2017年的氣象數(shù)據(jù)和災(zāi)情記錄文本數(shù)據(jù),對2018~2020年的旱災(zāi)風(fēng)險等級進行了預(yù)測評估,最后對2021年旱災(zāi)情況進行了預(yù)測。

        1.3 旱災(zāi)風(fēng)險等級評估方法

        旱災(zāi)風(fēng)險評估主要是實現(xiàn)對未來可能發(fā)生旱災(zāi)的風(fēng)險等級進行評估。在該方法中,綜合考慮到了多種風(fēng)險因素,比如:降水量、氣溫、平均相對濕度以及平均水汽壓等,融合了氣象監(jiān)測數(shù)據(jù)和旱情歷史文本數(shù)據(jù);并基于機器學(xué)習(xí)和深度學(xué)習(xí)算法,構(gòu)建了旱災(zāi)風(fēng)險等級評估模型,以對未來一段時間內(nèi)發(fā)生旱災(zāi)的可能性和嚴重程度進行評估。該模型的主要實現(xiàn)流程如圖1所示。

        旱災(zāi)風(fēng)險等級評估的主要流程包括以下4個部分:① 旱災(zāi)風(fēng)險等級評估模型訓(xùn)練集的構(gòu)建;② 基于支持向量機的旱災(zāi)風(fēng)險等級評估模型的訓(xùn)練;③ 基于長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory Networks,LSTM)的未來氣象特征值預(yù)測;④ 基于支持向量機的未來旱災(zāi)風(fēng)險等級的評估。

        (1) 基于氣象監(jiān)測數(shù)據(jù)和旱情歷史文本數(shù)據(jù),篩選可能對旱災(zāi)發(fā)生具有影響的氣象特征,并抽取歷史旱災(zāi)的風(fēng)險等級標簽,構(gòu)建用于進行旱災(zāi)風(fēng)險評估模型的訓(xùn)練數(shù)據(jù)集。

        (2) 基于旱災(zāi)訓(xùn)練數(shù)據(jù)集,采用SVM分類算法,對旱災(zāi)風(fēng)險等級評估模型進行訓(xùn)練。

        (3) 對于已有的氣象特征數(shù)據(jù),采用LSTM預(yù)測其未來一段時間的特征值。

        圖1 旱災(zāi)風(fēng)險等級評估技術(shù)路線示意Fig.1 Technical roadmap for drought risk assessment

        (4) 將LSTM得到的一系列未來特征值,加載到訓(xùn)練好的旱災(zāi)風(fēng)險等級評估模型,從而對未來可能發(fā)生的旱災(zāi)風(fēng)險等級進行評估。

        1.3.1構(gòu)建旱災(zāi)訓(xùn)練數(shù)據(jù)集

        為了獲得有效的旱災(zāi)風(fēng)險等級評估模型,首先需要構(gòu)建旱災(zāi)風(fēng)險等級評估的訓(xùn)練數(shù)據(jù)集。數(shù)據(jù)集包括標簽集和特征集2個部分。對于標簽集,基于歷史災(zāi)情記錄、國家或地區(qū)的干旱災(zāi)害統(tǒng)計報告等文本數(shù)據(jù),采用文本抽取方法從中來抽取相應(yīng)的旱災(zāi)等級標簽。對于特征集,基于氣象監(jiān)測數(shù)據(jù)中的相關(guān)指標,從中篩選出用于旱災(zāi)風(fēng)險等級評估的主要特征。

        (1) 標簽抽取。對于標簽集,基于歷史災(zāi)情記錄、國家或地區(qū)的干旱災(zāi)害統(tǒng)計報告等文本數(shù)據(jù),通過文本抽取和統(tǒng)計分析的方法,抽取各個城市歷年發(fā)生的旱情信息,以用于構(gòu)建特征集對應(yīng)的旱災(zāi)風(fēng)險等級標簽。標簽抽取的流程如圖2所示。

        圖2 標簽抽取流程Fig.2 Label extraction process

        根據(jù)歷史災(zāi)情文本,應(yīng)首先構(gòu)建地名詞典以及干旱詞典;然后,采用正則表達式以及模板匹配法對干旱災(zāi)情文本中的時間、地點以及干旱等級進行識別和抽取,以形成結(jié)構(gòu)化的旱災(zāi)風(fēng)險等級標簽;最后,對抽取的標簽進行人工校驗,以保證所抽取標簽的準確性。標簽抽取的流程共包含以下3個步驟。

        步驟1:構(gòu)建地名詞典和旱災(zāi)風(fēng)險等級詞典。在歷史災(zāi)情文本中,通常采用“省、市、縣”3個不同大小的粒度來表述旱災(zāi)發(fā)生的范圍。對此,將城市作為研究粒度,即將“縣”轉(zhuǎn)換為對應(yīng)的“市”。為了獲得“省”“縣”與“市”之間的關(guān)系,定義了地名詞典。此外,根據(jù)歷史災(zāi)情文本中對災(zāi)情的相關(guān)描述,從描述的嚴重程度以及當年的旱情實際情況,將旱災(zāi)風(fēng)險劃分為5個等級:正常、輕旱、中旱、重旱、特旱,并構(gòu)建干旱等級詞典,以用于旱災(zāi)風(fēng)險等級標簽的抽取。

        步驟2:基于地名詞典和旱災(zāi)風(fēng)險等級詞典,采用正則表達式和模式匹配法,從歷史災(zāi)情文本中抽取旱災(zāi)發(fā)生的時間、城市以及旱災(zāi)的風(fēng)險等級。在經(jīng)過程序自動抽取后,為了保證所抽取標簽信息的質(zhì)量,對抽取的標簽進行人工校驗。

        步驟3:將抽取的結(jié)構(gòu)化標簽保存為csv文件,以方便計算機讀取。圖3給出了標簽抽取結(jié)果的示例圖,由圖3可以看出,每一條標簽記錄的格式為〈時間,城市,月份,旱災(zāi)風(fēng)險等級〉。例如,〈1949,商丘,3,2〉表示1949年3月商丘發(fā)生了中度干旱。

        圖3 標簽抽取結(jié)果示例Fig.3 Sample image of label extraction results

        (2) 特征集構(gòu)建。通過對歷史災(zāi)情文本的抽取,得到用于構(gòu)建旱災(zāi)風(fēng)險等級評估模型的標簽集合。但為了構(gòu)建完整的旱災(zāi)風(fēng)險等級評估模型,還需要獲得與旱災(zāi)風(fēng)險等級標簽有關(guān)聯(lián)的特征。將氣象指標作為候選特征集,然后基于隨機森林算法對各個指標的重要性進行計算,并將重要度較高的前k個指標用于構(gòu)建旱災(zāi)風(fēng)險等級評估模型,所采用的候選氣象指標如表1所列。

        表1 旱災(zāi)風(fēng)險等級評估候選特征集Tab.1 Candidate feature set for drought risk assessment

        表1中的指標的具體含義及其與旱災(zāi)的關(guān)系描述如下。

        降水是影響干旱的重要因素,常見的干旱預(yù)報系統(tǒng)大多是依據(jù)降水量來對未來的干旱進行預(yù)測。例如,春播期降水量偏少,極易造成春旱。除此之外,在現(xiàn)有的干旱指標中,如標準化降水指數(shù)(SPI)、帕爾默干旱指數(shù)(PDSI)、地表水供給指數(shù)(SWSI)等都將降水量作為衡量干旱的主要因素;高溫少雨會直接導(dǎo)致干旱的發(fā)生,尤其是夏季持續(xù)的高溫天氣會造成土壤水分大量蒸發(fā)、土壤墑情變差,導(dǎo)致十分嚴重的干旱。因此,可以考慮把氣溫作為評估旱災(zāi)風(fēng)險等級的特征之一;氣壓跟天氣有密切的關(guān)系,一般來說,地面上高氣壓的地區(qū)往往是晴天,地面上低氣壓的地區(qū)往往是陰雨天。氣壓通過影響天氣,從而影響干旱。

        風(fēng)速與水分蒸發(fā)有著密切的關(guān)系,風(fēng)可將蒸發(fā)物表面飽和度較高的空氣吹走。因此,風(fēng)速越大,水分蒸發(fā)越快,造成土壤失墑,導(dǎo)致干旱的發(fā)生;濕度越大,空氣中含有的水汽越接近于飽和水汽壓,也越容易形成凝結(jié),從而形成降水影響干旱;日照與干旱有著一定關(guān)系。氣候干旱的地區(qū),常年是晴朗天氣,日照時數(shù)就多。熱帶雨林氣候區(qū)常年陰雨天氣,日照時數(shù)就少。因此,日照時長與干旱存在一定的關(guān)聯(lián);水汽壓與降水量之間存在線性關(guān)系,與蒸發(fā)快慢也有著密切的關(guān)系。白天溫度高,蒸發(fā)快,進入大氣的水汽多,水汽壓就大;夜間情況相反。因此,水汽壓也是影響干旱的一個重要因素。

        對于以上候選特征,采用隨機森林算法[16],基于袋外誤差(OOB)理論來判斷每個特征在隨機森林中的每棵樹上的貢獻度,從而計算各個特征的重要度,并將排名前k個特征作為用于構(gòu)建旱災(zāi)風(fēng)險等級評估模型的特征。對于任意特征x的特征重要度Ix的計算公式如下:

        (1)

        式中:N代表訓(xùn)練樣本的個數(shù),ROOB1表示決策樹對袋外數(shù)據(jù)進行分類,統(tǒng)計的正確分類的個數(shù);ROOB2為決策樹對擾動后的袋外數(shù)據(jù)進行分類,統(tǒng)計的正確分類個數(shù)[17]。如果加入擾動后,袋外數(shù)據(jù)準確率大幅度下降,說明這個特征對于樣本的預(yù)測結(jié)果有很大影響,進而說明重要程度比較高。

        (3) 標簽與特征的融合。 基于篩選出的用于構(gòu)建旱災(zāi)風(fēng)險等級評估模型的特征以及從歷史災(zāi)情記錄文本中抽取的標簽,將表示同一城市同一時間的特征和標簽進行融合,從而構(gòu)成完整的旱災(zāi)訓(xùn)練數(shù)據(jù)集,所構(gòu)建的旱災(zāi)訓(xùn)練集的示例如表2所列。

        表2 訓(xùn)練數(shù)據(jù)集示例Tab.2 Example of training data set

        1.3.2基于SVM的旱災(zāi)風(fēng)險等級評估模型

        根據(jù)前文中得到的訓(xùn)練數(shù)據(jù)集,采用分類算法來構(gòu)建旱災(zāi)風(fēng)險等級評估模型,并對模型中的未知參數(shù)進行訓(xùn)練。常見的分類算法包括K近鄰[18]、決策樹[19]、樸素貝葉斯[20]、支持向量機[21]等。其中,基于支持向量機的分類算法具有較好的學(xué)習(xí)泛化能力,可以解決非線性、高維數(shù)、局部極小點等分類中存在的問題。因此,本研究采用支持向量機分類器對旱災(zāi)預(yù)測模型進行訓(xùn)練,其訓(xùn)練過程如圖4所示。

        圖4 基于SVM的旱災(zāi)風(fēng)險等級評估模型Fig.4 Drought risk assessment model based on SVM

        支持向量機算法的基本思想是在特征空間上找到最佳的分離超平面,使得訓(xùn)練集上正、負樣本的間隔最大。假設(shè)訓(xùn)練數(shù)據(jù)集中的訓(xùn)練樣本為(x1,y1),(x2,y2),……,(xi,yi),xi為用于進行旱災(zāi)風(fēng)險等級評估的特征向量,yi為旱災(zāi)風(fēng)險等級標簽。對于線性可分的情況,支持向量機分類算法需要找到一個超平面,使2個異類支持向量到超平面的距離之和最大。

        然而,由于訓(xùn)練樣本往往不是線性可分的,因此,通常需要將樣本從原始空間映射到一個更高維的特征空間中,使得樣本在這個特征空間內(nèi)線性可分,從而找到一個合適的劃分超平面。樣本數(shù)據(jù)經(jīng)過高位映射后的超平面可以表示為

        f(x)=wTφ(xi)+b

        (2)

        式中:w為加權(quán)向量,φ(xi)為映射函數(shù),b為偏差。尋找超平面的過程即求優(yōu)化問題的最優(yōu)解過程,所得到的最優(yōu)化問題是:

        (3)

        通過拉格朗日乘子法將原問題轉(zhuǎn)化為對偶問題求解,即可得到用于旱災(zāi)風(fēng)險等級評估的SVM分類器。

        1.3.3基于LSTM的未來特征值預(yù)測

        基于支持向量機分類算法得到旱災(zāi)風(fēng)險等級評估模型后,當給定一組與旱災(zāi)相關(guān)的特征時,可基于這組特征對當前的旱災(zāi)風(fēng)險等級進行評估。但為了對未來可能存在的旱災(zāi)風(fēng)險進行預(yù)測,需要對未來的特征值即未來m個時刻的降水量、氣溫、水汽壓等進行預(yù)測。鑒于在旱災(zāi)風(fēng)險等級評估模型中采用的特征都為時序型特征,因此,可以采用時間序列模型對未來時刻的特征值進行預(yù)測。

        長短期記憶神經(jīng)網(wǎng)絡(luò)[22]是一種常見的時間序列預(yù)測模型,它可以學(xué)習(xí)長期依賴信息,是當下比較流行的循環(huán)神經(jīng)網(wǎng)絡(luò)。近年來,隨著深度學(xué)習(xí)的不斷發(fā)展,LSTM已經(jīng)在語音識別、機器翻譯、負荷預(yù)測、交通流量預(yù)測等眾多不同領(lǐng)域成功應(yīng)用。由于該模型具有良好的時序預(yù)測能力,因此,可采用LSTM對旱災(zāi)相關(guān)特征未來m個時刻的特征值進行預(yù)測。LSTM單元結(jié)構(gòu)如圖5所示。

        圖5 LSTM單元結(jié)構(gòu)示意Fig.5 LSTM unit structure diagram

        LSTM 3個重要的門中,遺忘門ft決定了上一時刻的單元狀態(tài)有多少保留到當前時刻;輸入門it決定了當前時刻網(wǎng)絡(luò)的輸入有多少保存到單元狀態(tài);輸出門ot決定了控制單元狀態(tài)有多少輸出到 LSTM 的當前輸出值,gt代表輸入單元?!伴T”以及輸入單元的計算公式如下。

        遺忘門:

        ft=σ(Wfx·xt+Wfh·ht-1+bf)

        (4)

        輸入門:

        it=σ(Wixxt+Wihht-1+bi)

        (5)

        輸入單元:

        gt=φ(Wgxxt+Wghht-1+bg)

        (6)

        輸出門:

        ot=σ(Wox·xt+Woh·ht-1+bo)

        (7)

        輸出:

        ht=φ(gt?it+ct-1?ft)?ot

        (8)

        式中:Wgx,Wgh等是權(quán)重矩陣,b是偏置項,σ表示sigmod激活函數(shù),φ表示tanh激活函數(shù)。“門”實際上就是一層全連接層,它的輸入是一個向量,輸出是一個0~1的實數(shù)向量,通過“門”來決定保留哪些信息。

        由LSTM的原理可知,對于時序型數(shù)據(jù),LSTM可通過“門”來記憶有用的信息,對數(shù)據(jù)未來值進行預(yù)測。旱災(zāi)風(fēng)險評估研究中用于構(gòu)建模型的氣象數(shù)據(jù)均為時序數(shù)據(jù)。因此,對于選取的每個特征可采用LSTM來預(yù)測其未來一段時間的特征值。本文基于LSTM建立了適用于氣象特征預(yù)測的深度學(xué)習(xí)預(yù)測模型,得到每個特征未來一段時間的特征值后,將預(yù)測的特征值輸入到之前完成訓(xùn)練的旱災(zāi)風(fēng)險等級評估模型中,即可對未來可能發(fā)生的旱災(zāi)風(fēng)險等級進行評估。為了驗證本研究中旱災(zāi)風(fēng)險等級評估模型的有效性,將通過算例對所提出的方法進行分析驗證。

        2 結(jié)果與分析

        2.1 旱災(zāi)訓(xùn)練集構(gòu)建

        旱災(zāi)訓(xùn)練集的構(gòu)建包括標簽集構(gòu)建和特征集構(gòu)建2個部分。

        (1) 標簽構(gòu)建。為準確提取河南省歷史干旱情況,基于《中國氣象災(zāi)害大典(河南卷)》干旱災(zāi)害篇史料記載,根據(jù)上文標簽抽取方法,將災(zāi)情劃分特大干旱、嚴重干旱、中度干旱、輕度干旱和正常5個等級,分別用數(shù)字4,3,2,1,0來表示(若對應(yīng)城市當年未記錄發(fā)生旱災(zāi),則標記為正常)。抽取的旱災(zāi)風(fēng)險等級標簽以月為粒度,當旱災(zāi)災(zāi)情記錄文本中以季節(jié)來表述旱情情況時,將季節(jié)轉(zhuǎn)換為對應(yīng)的月。以鄭州市為例,將1951~2011年的鄭州歷史旱災(zāi)發(fā)生情況以月為單位進行標簽抽取,從而得到732條標簽數(shù)據(jù)。本研究在抽取過程中所用到的地名詞典以及干旱等級詞典分別如表3和表4所列。

        表3 地名詞典Tab.3 Gazetteer

        表4 干旱等級詞典Tab.4 Dictionary of drought levels

        (2) 特征篩選。對于表1中所列的候選特征集,采用隨機森林算法計算各個特征的重要性,并按照重要度從大到小進行排序,得到了重要度最高的前6個特征,如表5所列。

        表5 重要度最高的前6個特征Tab.5 The top 6 most important features

        將這6個特征作為構(gòu)建旱災(zāi)風(fēng)險等級評估模型的特征?;诤Y選出的構(gòu)建旱災(zāi)風(fēng)險等級評估模型的特征,以及從歷史災(zāi)情記錄文本中抽取的標簽,將表示同一城市同一時間的特征和標簽進行融合,從而構(gòu)成完整的旱災(zāi)訓(xùn)練數(shù)據(jù)集。

        2.2 旱災(zāi)風(fēng)險等級評估模型

        基于得到的旱災(zāi)訓(xùn)練數(shù)據(jù)集,采用支持向量機分類算法構(gòu)建旱災(zāi)風(fēng)險等級評估模型,并對模型中的未知參數(shù)進行訓(xùn)練。在該算例中,分別選擇線性核、多項式核、高斯核作為SVM分類器的核函數(shù),采用10折交叉驗證法對旱災(zāi)風(fēng)險等級評估模型進行訓(xùn)練,在訓(xùn)練過程中對SVM分類器的參數(shù)C和gamma進行調(diào)參優(yōu)化。其中,C是懲罰系數(shù),即對誤差的寬容度,C越高,對誤差要求越嚴格,容易出現(xiàn)過擬合;C越小,越容易出現(xiàn)欠擬合。gamma決定了數(shù)據(jù)映射到新的特征空間后的分布,gamma越大,則用于分類的支持向量越少;gamma值越小,則用于分類的支持向量越多。在訓(xùn)練過程中,不斷地對參數(shù)C和gamma進行調(diào)參優(yōu)化,最終得出核函數(shù)選取線性核且C=0.9時,SVM分類器在訓(xùn)練數(shù)據(jù)集上的效果最好,即可得到所需的旱災(zāi)風(fēng)險等級評估模型。

        2.3 未來特征值預(yù)測

        為了對未來的旱災(zāi)風(fēng)險等級進行預(yù)測,對于每一個用于構(gòu)建旱災(zāi)風(fēng)險等級評估模型的特征,如降水量、氣溫、水汽壓等。首先,采用LSTM來預(yù)測該特征在未來m個時刻的特征值。在該算例中,基于LSTM模型,用前11個月的特征值來預(yù)測第12個月的特征值。例如,根據(jù)鄭州市前11個月的氣溫,預(yù)測第12個月的氣溫,并在下一步將得到的第12個月的特征值加載訓(xùn)練好的旱災(zāi)風(fēng)險等級評估模型中,從而對未來1個月的旱災(zāi)風(fēng)險等級進行評估。

        為了驗證LSTM在未來特征值預(yù)測上的效果,選用1951~2000年共50 a鄭州市的各個特征值的逐月數(shù)據(jù),來構(gòu)建LSTM模型,并對2001~2013年的每個月的特征值進行預(yù)測,預(yù)測曲線如圖6所示。

        圖6 6種特征預(yù)測曲線Fig.6 Six characteristic prediction curves

        為了判斷預(yù)測結(jié)果優(yōu)劣,選取平均絕對誤差(MAE)和決定系數(shù)(R2)作為評價指標。表6是對特征預(yù)測的評價,其中,平均絕對誤差表示預(yù)測誤差,數(shù)值越小表示預(yù)測精度越高;決定系數(shù)表示擬合優(yōu)度,數(shù)值在0~1區(qū)間,數(shù)值越接近于1表示擬合越好。

        (9)

        (10)

        通過圖6的特征預(yù)測曲線以及表6中列出的特征預(yù)測指標評價結(jié)果可以看出:對于選取的構(gòu)建旱災(zāi)風(fēng)險評估模型的6個特征,基于LSTM的特征值預(yù)測結(jié)果與真實值較為接近。在誤差方面,平均絕對誤差數(shù)值相對較??;在擬合優(yōu)度方面,預(yù)測特征中有一半特征決定系數(shù)在0.90以上。因此,采用LSTM網(wǎng)絡(luò)模型對各個特征的未來值進行預(yù)測是可行的。

        表6 特征預(yù)測指標評估Tab.6 Evaluation of feature prediction indicators

        2.4 旱災(zāi)風(fēng)險等級評估結(jié)果

        通過LSTM預(yù)測得到了每個月的特征值,再將其加載到旱災(zāi)風(fēng)險等級評估模型中,即可對每個月的旱災(zāi)風(fēng)險等級進行評估。對于旱災(zāi)研究,在災(zāi)情記錄文本中多以季節(jié)為單位來記錄旱災(zāi)的發(fā)生情況。因此,將以月為單位記錄的旱災(zāi)風(fēng)險等級合并為以季節(jié)為單位的旱災(zāi)風(fēng)險等級,并以當季最高的旱災(zāi)風(fēng)險等級作為本季的旱災(zāi)風(fēng)險等級。表7給出了對2018年冬到2020年秋的旱災(zāi)風(fēng)險等級評估結(jié)果。

        表7 旱災(zāi)風(fēng)險等級評估結(jié)果Tab.7 Forecast results of drought risk levels

        通過表7可以得出:在評估2 a的情況下,預(yù)測準確率為75%,證明本研究對于旱災(zāi)風(fēng)險等級評估具有一定效果。另外,若將預(yù)測結(jié)果分為兩類(正常與干旱)時,準確率會進一步提升到87.5%。結(jié)果顯示:鄭州市在2019年和2020年春季干旱較為嚴重,將預(yù)測的結(jié)果與歷史資料中記載的真實結(jié)果進行比較,發(fā)現(xiàn)旱災(zāi)風(fēng)險等級預(yù)測結(jié)果基本符合歷史實際情況。另外,對2020年夏季預(yù)測結(jié)果進行誤差分析,推測可能由于降水量預(yù)測小于實際值,且日照時長大于實際值導(dǎo)致最終誤差。

        3 結(jié) 論

        本文基于歷史旱情文本數(shù)據(jù)和氣象數(shù)據(jù),提出了一種新的旱災(zāi)評估思路,建立了數(shù)據(jù)驅(qū)動的多源多模態(tài)旱災(zāi)風(fēng)險等級評估模型。通過對未來一段時間內(nèi)可能發(fā)生的旱災(zāi)風(fēng)險等級進行評估,可以得到如下結(jié)論。

        (1) 氣象數(shù)據(jù)可與文本災(zāi)情數(shù)據(jù)相結(jié)合,用于旱災(zāi)風(fēng)險等級評估;

        (2) 結(jié)合多種機器學(xué)習(xí)算法的優(yōu)勢,構(gòu)建了旱災(zāi)風(fēng)險等級評估模型,證明了大數(shù)據(jù)分析方法可用于研究旱災(zāi)問題;

        (3) 算例評估結(jié)果顯示,研究區(qū)春季干旱較為嚴重,基本符合實際情況。

        此外,在初始選取評估特征時,考慮了氣象、水文、墑情等多方面因素。但由于數(shù)據(jù)較難獲取,僅基于氣象特征來構(gòu)建模型,可能由于風(fēng)險因素不夠全面,影響評估結(jié)果的準確性。隨著旱災(zāi)風(fēng)險因素的相關(guān)數(shù)據(jù)獲取難度降低,采用此方法將得到更為準確的評估結(jié)果。

        猜你喜歡
        特征文本模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達“特征”
        在808DA上文本顯示的改善
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        抓住特征巧觀察
        3D打印中的模型分割與打包
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        777米奇色狠狠俺去啦| 日韩精品少妇专区人妻系列| 男男做h嗯啊高潮涩涩| 亚洲国产精品无码久久一线| 国产精品一区av在线| 中文字幕日韩三级片| 国产成人综合久久精品免费| 国产人成无码视频在线1000| 国产黄色一区二区三区,| 国产成人无码a在线观看不卡| 青春草在线视频免费观看| 人妻在卧室被老板疯狂进入国产| 天堂网av在线| 国产在线一区二区av| 7m精品福利视频导航| 国产乱子伦精品无码码专区| 黄片在线观看大全免费视频| 日韩精品乱码中文字幕| 国产精品久久国产精品99| 高清在线亚洲中文精品视频| 中文字幕在线人妻视频| 午夜一区二区三区观看| 国产高清在线精品一区二区三区| 亚洲av日韩av综合aⅴxxx| 香蕉蜜桃av一区二区三区| 日日摸夜夜添夜夜添高潮喷水| 国产欧美亚洲精品a| 麻豆国产AV网站| 国产自拍在线视频91| 国产成人亚洲精品青草天美 | 亚洲av永久无码一区| 无码 免费 国产在线观看91| 男女搞事在线观看视频| 国产av无码专区亚洲av毛网站 | 人妻av乱片av出轨| 久热爱精品视频在线观看久爱 | 9 9久热re在线精品视频| JIZZJIZZ国产| 大香蕉视频在线青青草| 久久97久久97精品免视看| 91精选视频在线观看|