亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于RF-RFE算法的地鐵車站洪澇災害預測研究

        2024-03-12 11:43:46蓮,劉
        鐵道標準設計 2024年3期
        關(guān)鍵詞:模型

        白 蓮,劉 平

        (蘭州理工大學土木工程學院,蘭州 730050)

        1 研究背景

        洪澇災害一直是威脅人類社會發(fā)展的重要因素之一。近年來,中國城市化進程快速發(fā)展,但城市防洪防災基礎配套設施與城市化快速進程需求未能匹配,我國每年遭受洪澇災害的城市超過百座,其中發(fā)生地鐵車站洪澇災害的案例更是屢見不鮮。同時,由于地鐵車站的建筑結(jié)構(gòu)和運行環(huán)境均處于封閉或者半封閉狀態(tài)之中,因此,一旦發(fā)生地鐵車站洪澇災害,車站內(nèi)的相關(guān)設備設施出現(xiàn)故障,地鐵運行系統(tǒng)受阻,且救援難度也較大,嚴重威脅了人員的生命安全,并造成大量的經(jīng)濟損失。

        目前,國內(nèi)外學者對地鐵車站洪澇災害進行了大量研究。在災害防汛措施方面,AOKI等[1]依據(jù)地鐵車站系統(tǒng)的防汛措施,開發(fā)了能夠承受15m深洪水壓力的滑動門;LIN等[2]基于流體容積模型方法,模擬了擋洪設施失效后,洪水入侵地鐵車站的全過程,為極端天氣下地鐵車站的安全設計提供了參考;LIU等[3]將改進的投影尋蹤模型(PPM)運用到地鐵車站工程抗?jié)衬芰υu價中,有效地處理了地鐵車站工程抗?jié)衬芰Φ母呶粩?shù)據(jù);趙露薇等[4]研究了暴雨干擾下地鐵系統(tǒng)脆弱性形成機制,以期為暴雨天氣下地鐵系統(tǒng)安全運營提供參考建議。在災害應急管理方面,馬晴晴等[5]將降雨情景下的地表積水分布與地鐵站進行耦合,量化了積水對地鐵站的干擾程度,為地鐵站制定應急管理措施提供了新思路;WU等[6]為地鐵車站工程暴雨內(nèi)澇災害應急預案,提出了一種基于語言直覺模糊集、結(jié)構(gòu)熵權(quán)和TOPSIS的群決策方法;LONG和ZHANG[7]提出了一種改進經(jīng)驗公式的應急疏散引導方案,研究行人行為對引導疏散的影響,通過地鐵車站疏散模擬實驗,提供了相應的應急疏散措施。在災害風險評估方面,閆緒嫻等[8]構(gòu)建了韌性城市下地鐵洪澇災害風險分析模型,從韌性角度對地鐵系統(tǒng)洪澇災害防治提出針對性建議;LYU等[9]對地鐵系統(tǒng)的洪水風險進行了評估研究,以期增加地鐵系統(tǒng)功能恢復力;YU等[10]采用組合賦權(quán)法,建立了地鐵車站內(nèi)澇風險的模糊綜合評價模型,為地鐵車站內(nèi)澇風險評估提供了新思路。

        然而,上述研究均集中在災害管理及風險評估方面,缺少對地鐵車站洪澇災害的預測研究,若能在極端天氣情況來臨前,依據(jù)相關(guān)變量建模預測某地鐵車站是否會發(fā)生洪澇災害,可幫助車站相關(guān)管理人員制定合適的應對措施,加強地鐵車站防洪減災的能力。因此,李輝山、白蓮等[11]提出了一種基于DNN神經(jīng)網(wǎng)絡的地鐵洪澇災害預測方法,并取得了較好的預測效果,但該方法在變量選擇時未降低相關(guān)數(shù)據(jù)維度及未去除變量間的冗余,在進行預測時,數(shù)據(jù)的復雜度和冗余信息會嚴重影響到整個預測過程的速度以及整體的數(shù)據(jù)檢測性能。隨機森林-遞歸特征消除(random forest-recursive feature elimination,RF-RFE)方法能夠處理大量數(shù)據(jù)和評價正則化回歸特征變量的重要性,該方法在去除冗余特征的同時,可篩選出最佳特征變量,有效地縮短數(shù)據(jù)訓練和交叉驗證的時間,提高預測模型的運算速度及數(shù)據(jù)檢測性能。

        綜上,基于RF-RFE和DNN神經(jīng)網(wǎng)絡,提出了地鐵車站洪澇災害的預測方法。首先,使用發(fā)生地鐵車站洪澇災害的實測數(shù)據(jù),構(gòu)建災害初始變量集,通過隨機森林-遞歸特征消除(random forest-recursive feature elimination,RF-RFE)方法選出重要變量;其次,使用重要變量數(shù)據(jù)訓練DNN神經(jīng)網(wǎng)絡,得到最優(yōu)網(wǎng)絡結(jié)構(gòu);最后,將實測災害數(shù)據(jù)輸入預測模型,測試分析預測模型性能。該方法優(yōu)化了災害變量集,降低了敏感數(shù)據(jù)對模型預測結(jié)果的影響,提高了預測模型的準確率,實現(xiàn)了對地鐵車站洪澇災害的準確預測。

        2 變量集構(gòu)建

        2.1 初始變量集選擇

        通過災害實際案例、文獻查閱和專家訪談的形式,初步確定地鐵車站洪澇災害變量集。為保證文獻查閱的完整性、代表性和科學性,在SCI-E、Elsevier、中國知網(wǎng)、萬方等數(shù)據(jù)庫輸入“地鐵車站內(nèi)澇”“地鐵車站災害”“城市軌道交通暴雨”等關(guān)鍵詞,檢索出相關(guān)文獻。依據(jù)全面性文獻篩選原則,梳理出17個災害變量集,將17個災害變量集發(fā)送給具有相關(guān)理論基礎的專家,通過“專家意見—反饋說明—修改意見—統(tǒng)一意見”程序,多次循環(huán)往復,最終確定13個地鐵車站洪澇災害變量集。所確定的災害變量集如表1所示。

        表1 地鐵車站洪澇災害變量集

        由表1可知,地鐵車站洪澇災害的原因主要表現(xiàn)在以下3個方面。(1)氣候變暖和城市化效應。據(jù)相關(guān)研究指出[12],未來極端氣候出現(xiàn)的概率會大大增加,隨著我國城市化進程的快速發(fā)展,大量基礎設施和城市更新等建設項目改變了原有城市構(gòu)造[13],使得城市路面硬化嚴重、城市周邊部分河道被填埋及城市調(diào)蓄能力下降等,如若遇到極端強降水天氣,極易發(fā)生城市內(nèi)澇,引發(fā)地鐵車站洪澇災害事故。(2)地鐵車站排水系統(tǒng)能力[14]。車站排水系統(tǒng)主要依附市政排水系統(tǒng),強降雨導致市政排水系統(tǒng)超負荷運作,造成排水管道爆裂或堵塞,使得車站周邊積水過多,易發(fā)生積水倒灌現(xiàn)象。(3)應急管理措施[15]。地鐵車站應急管理措施能及時降低發(fā)生洪澇災害的風險、減少人員傷亡和財產(chǎn)損失,最快恢復車站運營秩序。

        2.2 基于RF-RFE的變量選擇

        采用RF-RFE算法從地鐵車站洪澇災害初始變量中選擇重要變量,能夠隨機選取樣本和特征,還可使模型有較好的擬合和抗噪能力,提高分類的正確率[16]。

        2.2.1 隨機森林和變量重要性分析

        隨機森林(Random Forest,RF)是一種多棵決策樹集成學習算法[17],其思想是運用統(tǒng)計學理論,利用Bootstrap重抽樣方法從原始訓練樣本中得到多個訓練子集,并對每個子集進行決策樹建模,多棵決策樹集合構(gòu)建為隨機森林,所有決策樹預測平均值為最終預測結(jié)果,算法的主要步驟如下。

        (2)從所有樣本中隨機選擇x個變量,n個訓練子集與x個變量構(gòu)建一棵決策樹,在決策樹的每個節(jié)點處抽取mtry個變量,計算每個變量蘊含的信息量,并選擇分類能力最佳的變量進行節(jié)點分裂。

        (3)重復前面步驟,直至生成含有m棵決策樹的隨機森林。

        (6)變量φx的重要度計算如式(1)所示。

        (1)

        2.2.2 RF-RFE算法

        遞歸特征消除(Recursive Feature Elimination,RFE)是反復構(gòu)建模型,直至選出最優(yōu)特征子集的一種特征變量排序選擇方法[18]。RF-RFE算法是將RFE方法引入隨機森林算法,并對變量重要性排序進行選擇。本文選擇RF-RFE算法是考慮到該算法有助于減少冗余信息對算法的影響,可提高地鐵車站洪澇災害變量分類正確率。RF-RFE算法步驟是通過“訓練初始變量集—計算變量重要性—變量重要性排序—刪除重要性最小變量—計算分類正確率”遞歸重復過程,直至所有變量計算完畢,將分類正確率最高的訓練集所對應的變量作為重要變量,具體流程如圖1所示。

        圖1 RF-RFE算法流程

        3 基于RF-RFE和DNN神經(jīng)網(wǎng)絡的預測模型

        3.1 DNN神經(jīng)網(wǎng)絡基本原理

        DNN(深度神經(jīng)網(wǎng)絡,Deep Neural Networks)是一種深層學習,在1986年由D.E.Rumelhart和J.L.McCelland等在研究BP神經(jīng)過程中被提出。DNN神經(jīng)網(wǎng)絡主要具有以下優(yōu)勢:(1)強大的非線性擬合能力;(2)強特征提取能力;(3)較強的刻畫能力?;谝陨蟽?yōu)點,選擇DNN神經(jīng)網(wǎng)絡構(gòu)建地鐵車站洪澇災害預測模型,可規(guī)避非線性災害數(shù)據(jù)的過度擬合,使得模型具有良好的表達能力。

        DNN深層神經(jīng)網(wǎng)絡由3個部分組成:DNN的拓撲結(jié)構(gòu)、激活函數(shù)與損失函數(shù)、訓練DNN算法[19]。DNN神經(jīng)網(wǎng)絡結(jié)構(gòu)如圖2所示。

        圖2 DNN神經(jīng)網(wǎng)絡結(jié)構(gòu)

        在圖2所示網(wǎng)絡結(jié)構(gòu)中,x1,x2,…,xn為DNN神經(jīng)網(wǎng)絡輸入值;b為隱含層神經(jīng)單元的偏置值;w1,w2,…,wn為神經(jīng)單元連接的權(quán)值;y為神經(jīng)元輸出,可按照式(2)計算,其中g(shù)為神經(jīng)元激活函數(shù),本文使用tanh、Sigmoid激活函數(shù),分別如式(3)、式(4)所示。

        y=g(z)=g(wx+b)

        (2)

        (3)

        (4)

        3.2 RF-RFE和DNN神經(jīng)網(wǎng)絡算法流程

        RF-RFE和DNN神經(jīng)網(wǎng)絡算法包括以下兩個部分:①利用RF-RFE算法得到地鐵車站洪澇災害重要變量;②以重要變量為輸入樣本,訓練DNN神經(jīng)網(wǎng)絡預測模型。算法流程如圖3所示,具體步驟如下。

        圖3 RF-RFE和 DNN神經(jīng)網(wǎng)絡算法流程

        (1)收集地鐵車站洪澇災害數(shù)據(jù)。

        (2)使用RF-RFE算法計算分類樣本的正確率,得到重要變量。

        (a)初始變量訓練集輸入為

        訓練集的輸出為

        式中,n為訓練樣本總數(shù);xi,j為第j個輸入樣本的第i個變量;第i個變量的具體內(nèi)容見表1;yj∈{0,1}為第j個輸入樣本所對應地鐵車站洪澇災害事件的判別標簽,0表示未發(fā)生地鐵車站洪澇災害,1表示發(fā)生地鐵車站洪澇災害。

        (b)使用RF訓練13個初始變量集,計算變量重要性并記錄分類正確率。

        (c)刪除重要度最小的變量,重新訓練變量集,計算變量重要性并記錄分類正確率。

        (d)重復步驟(c),直至所有變量集訓練完畢,最高分類正確率的訓練集所對應的變量為重要變量。

        經(jīng)過步驟(2),可得13個初始變量的重要性排序以及每個訓練集的分類正確率,最高分類正確率的訓練集所對應的輸入變量為重要變量。

        (3)構(gòu)建重要變量訓練集,訓練DNN神經(jīng)網(wǎng)絡。

        使用重要變量構(gòu)建訓練集來訓練DNN神經(jīng)網(wǎng)絡,本網(wǎng)絡選取精準率P、召回率R、F1分數(shù)(調(diào)和平均數(shù))、準確率(Accuracy)等4個指標作為模型評價指標。TP代表預測正確的發(fā)生地鐵車站洪澇災害數(shù)量;TN代表預測正確的未發(fā)生地鐵車站洪澇災害數(shù)量;FP代表未發(fā)生地鐵車站洪澇災害中錯誤預測為發(fā)生地鐵車站洪澇災害數(shù)量;FN代表發(fā)生地鐵車站洪澇災害中錯誤預測為未發(fā)生地鐵車站洪澇災害數(shù)量;F1是P和R的調(diào)和平均數(shù),F1越接近為1,說明模型表現(xiàn)越好,計算如式(5)~式(8)所示。

        (5)

        (6)

        (7)

        (8)

        4 實例分析

        4.1 樣本數(shù)據(jù)及預處理

        本文樣本數(shù)據(jù)來源于發(fā)生地鐵車站洪澇災害的案例,共248組數(shù)據(jù),其中正樣本為遭受地鐵車站洪澇災害共129組數(shù)據(jù),負樣本為未遭受洪澇災害共119組,正負樣本比例約為0.52∶0.48。樣本數(shù)據(jù)信息主要依靠國家氣象信息中心、百度地形圖、城市軌道交通工程項目建設標準和防洪標準等官方發(fā)布信息與國家規(guī)范[20-22],其中部分數(shù)據(jù)依靠新聞發(fā)布的實時信息來源于https://www.chinanews.com.cn/china/,數(shù)據(jù)處理為優(yōu)良中差4個等級,對應數(shù)值4,3,2,1,發(fā)生地鐵車站洪澇災害為1,未發(fā)生地鐵車站洪澇災害為0。

        為提升訓練速度和分類效果,消除樣本之間量級不同所造成的影響,將所有數(shù)據(jù)使用最值歸一化處理且映射到[0,1],歸一化計算如式(9)所示。

        (9)

        式中,xscale為歸一化后的數(shù)據(jù);x為原始數(shù)據(jù);xmax、xmin為原始數(shù)據(jù)的最大、最小值。

        4.2 變量選擇

        使用RF-RFE算法對地鐵車站洪澇災害的變量進行篩選并評價時,需要人工對隨機特征變量個數(shù)及決策樹數(shù)量等重要參數(shù)進行設定。隨機特征變量個數(shù)為特征變量總數(shù)的平方根,此處設置為4,決策數(shù)的數(shù)量設置為50。經(jīng)過RF-RFE算法提取后,地鐵車站洪澇災害初始變量的重要性排序為:{C1,C7,C6,C9,C4,C10,C12,C11,C5,C3,C8,C2,C13}。每刪除重要性排序在最后一位變量時,需重新訓練變量集并計算分類正確率。分類正確率隨變量個數(shù)的變化曲線如圖4所示。

        圖4 分類正確率與變量個數(shù)關(guān)系曲線

        如圖4所示,當變量個數(shù)少于7時,分類正確率整體呈上升趨勢;當變量個數(shù)等于7時,分類正確率達到峰值為88.1%;當變量個數(shù)大于7時,分類正確率呈下降趨勢;在所有變量都被計算時,分類正確率為83.74%,與選用重要性排序前7個變量數(shù)相比,分類正確率下降了4.36%。因此,本研究選擇重要性排序靠前的7個變量(C1降雨量、C7積水回灌、C6河道影響、C9防洪高程設計、C4地區(qū)年降雨量、C10排水系統(tǒng)能力、C12信息調(diào)度能力)作為地鐵車站洪澇災害預測的重要變量,部分重要變量訓練集如表2所示,行向量表示訓練樣本,列向量表示重要變量,訓練集輸入矩陣如式(10)所示。

        表2 重要變量訓練集節(jié)選

        input=

        (10)

        4.3 DNN神經(jīng)網(wǎng)絡模型

        DNN神經(jīng)網(wǎng)絡主要包含隱藏層的層數(shù)和各隱藏層的節(jié)點數(shù)目兩部分,本研究利用重要變量構(gòu)建的訓練集訓練DNN神經(jīng)網(wǎng)絡。具體網(wǎng)絡結(jié)構(gòu)為1層輸入層、6層隱含層和1層輸出層,其中,輸入層神經(jīng)元節(jié)點為重要變量;隱藏層神經(jīng)元激活函數(shù)選用tanh函數(shù)、dropout(隨機失活)=0.1、r(學習率)=0.000 5;輸出層為1個神經(jīng)元節(jié)點,即是否發(fā)生地鐵車站洪澇災害,激活函數(shù)Sigmoid將數(shù)據(jù)映射到[0,1]中,取閾值為0.5,即輸出層輸出大于0.5時預測為發(fā)生地鐵車站洪澇災害,小于0.5時預測為未發(fā)生地鐵車站洪澇災害。該網(wǎng)絡選用二分類交叉熵損失作為損失函數(shù),如式11所示。

        (11)

        4.4 訓練結(jié)果與分析

        通過準確率和F1分數(shù)兩個評價指標來衡量DNN預測模型,預測模型訓練集、驗證集和測試集的準確率變化如圖5所示。

        圖5 DNN模型準確率預測結(jié)果

        如圖5所示,3種樣本的準確率隨著訓練進程而顯著提升,前1 000次迭代中訓練集、驗證集和測試集的準確率快速上升;中間1 000~2 500次迭代中,訓練集的準確率穩(wěn)定在0.86~0.88之間,驗證集的準確率在0.84處上下波動,測試集的準確率在0.80~0.9之間波動;后2 500~4 000次迭代中,訓練集的準確率在0.87處保持平穩(wěn),驗證集的準確率波動范圍縮小,在0.85處保持相對平穩(wěn),測試集的準確率達到0.85~0.9。這表明了該模型具有良好的預測精度和模型泛化能力。

        圖6為DNN神經(jīng)網(wǎng)絡訓練集、驗證集和測試集的F1分數(shù)變化圖,前1 000次迭代快速上升,后1 000~4 000次迭代中,訓練集、驗證集和測試集F1分數(shù)值穩(wěn)定在0.87~0.90之間,說明模型未過度擬合且表現(xiàn)良好。

        圖6 DNN模型調(diào)和平均數(shù)曲線

        5 結(jié)論

        通過地鐵車站洪澇災害實例研究、文獻查閱及專家訪談方法,篩選出影響發(fā)生地鐵車站洪澇災害因素作為初始變量集;并采用隨機森林—遞歸特征消除(RF-RFE)算法進行初始變量集優(yōu)選,構(gòu)建了重要變量集;最后,將重要變量集作為DNN神經(jīng)網(wǎng)絡模型的輸入變量,對DNN神經(jīng)網(wǎng)絡進行了訓練,得到地鐵車站洪澇災害預測模型。主要結(jié)論如下。

        (1)RF-RFE與DNN神經(jīng)網(wǎng)絡算法結(jié)合,與未去除變量信息冗余相比,有效降低了DNN神經(jīng)網(wǎng)絡算法的輸入維度,提高了預測模型的運算速度。以重要變量為輸入的DNN神經(jīng)網(wǎng)絡模型更具有良好的性能,準確率提升了4.36%,驗證了選擇重要變量可以提高DNN神經(jīng)網(wǎng)絡算法的預測精度,證明RF-RFE和DNN神經(jīng)網(wǎng)絡算法相結(jié)合的預測方法具有理論意義。

        (2) 基于RF-RFE與DNN神經(jīng)網(wǎng)絡預測模型在地鐵車站洪澇災害案例中的預測準確率結(jié)果為88.1%,F1分數(shù)為90%,說明預測模型具有較好的識別能力和泛化能力,能夠滿足對于地鐵車站洪澇災害預測的需求,證明該預測方法具有應用價值。

        為得到更具有普遍性的結(jié)論,后續(xù)研究需要將RF-RFE與DNN神經(jīng)網(wǎng)絡算法用于其他數(shù)據(jù)庫,并從理論上分析和論證該方法應用于數(shù)據(jù)處理的優(yōu)越性。此外,可繼續(xù)補充和提煉災害數(shù)據(jù)樣本,如何構(gòu)建更全面的地鐵車站洪澇災害初始變量集有待進一步討論。

        猜你喜歡
        模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        一個相似模型的應用
        亚洲国产成人久久精品一区| 精品国产免费一区二区三区| 亚洲精品美女久久久久99| 国产区福利| 久久免费精品国产72精品剧情| 在线观看国产av一区二区| 激情综合五月开心婷婷| 欧美另类高清zo欧美| 久久久久中文字幕无码少妇| 最新日韩精品视频免费在线观看| av在线播放男人天堂| 天天躁日日躁狠狠躁av麻豆| 久久不见久久见免费影院www| 日本午夜国产精彩| 久久精品国产亚洲av成人擦边 | 欧美日韩国产成人高清视| 无码毛片高潮一级一免费| 一区二区三区国产大片| 亚洲天堂亚洲天堂亚洲色图| 成午夜精品一区二区三区| 无码中文字幕在线DVD| 日本午夜理伦三级好看| 亚洲天堂av高清在线| 无码av中文一区二区三区桃花岛| 50岁熟妇大白屁股真爽| 国产91 对白在线播放九色| 日本一区二区高清视频| 人妻少妇精品视频一区二区三区l| 日本丰满老妇bbw| 亚洲看片lutube在线观看| 久久国产精彩视频| 视频在线播放观看免费| 亚洲国产精品日本无码网站| 欧美成a人片在线观看久| 无码国产精品第100页| 亚洲国产91精品一区二区| 国产亚洲精品久久久闺蜜| 四虎永久免费一级毛片| 色综久久综合桃花网国产精品| 免费观看国产短视频的方法| 国产老熟女狂叫对白|