彭漱墀
(韶關(guān)市防洪管理中心,廣東 韶關(guān) 512000)
隨著我國(guó)水利建設(shè)的發(fā)展和現(xiàn)實(shí)需求,水工建筑物種類和數(shù)量越來越多,對(duì)可以反映水工建筑物實(shí)際情況的預(yù)測(cè)模型需求也隨之提高,研究人員為此進(jìn)行了一系列研究。萇登侖[1]通過三維軟件Inventor建立了三維水工建筑物模型,以解決實(shí)際工程中的問題。陳星豪、李裕勇[2]建立了水工建筑物安全決策模型,該模型能夠高效地對(duì)水工建筑物進(jìn)行評(píng)測(cè)。崔偉等[3]將非等時(shí)距灰色模型應(yīng)用在實(shí)際工程中,通過該模型對(duì)建筑物的沉降進(jìn)行了預(yù)測(cè),模型驗(yàn)證表明該模型誤差較小,能較好地預(yù)測(cè)建筑物沉降。
本文基于神經(jīng)網(wǎng)絡(luò)算法中的LSTM算法,建立水工建筑物安全監(jiān)控深度模型,從數(shù)據(jù)處理、網(wǎng)絡(luò)結(jié)構(gòu)和外延預(yù)測(cè)3個(gè)方面對(duì)監(jiān)控大數(shù)據(jù)進(jìn)行優(yōu)化。結(jié)合某水工建筑物實(shí)例,驗(yàn)證模型的有效性,從不同角度對(duì)比LSTM模型與其他模型在水工建筑物安全監(jiān)控預(yù)測(cè)方面的差異。
相對(duì)于信息技術(shù)行業(yè)其他領(lǐng)域而言,水工建筑物的大數(shù)據(jù)安全監(jiān)控有一定的獨(dú)特性,主要包含以下幾點(diǎn):
1) 就容量而言。單一水工建筑物安全監(jiān)控的數(shù)據(jù)監(jiān)測(cè)量為小規(guī)模數(shù)據(jù)集,而對(duì)多個(gè)水工建筑物項(xiàng)目進(jìn)行長(zhǎng)期監(jiān)控的數(shù)據(jù)量則較為龐大。
2) 就種類而言。水工建筑物安全監(jiān)控的數(shù)據(jù)主要來自監(jiān)測(cè)儀器,為結(jié)構(gòu)化數(shù)據(jù)格式。數(shù)據(jù)演變形式較為復(fù)雜,存在一定的周期性,有可能出現(xiàn)突變、噪聲等事件。
3) 就采集效率而言。通常采樣是以天為單位,雖然監(jiān)測(cè)儀器采集的頻率較高,但仍舊受到系統(tǒng)制約。此外,在短期內(nèi),數(shù)據(jù)采集的較為密集,間隔時(shí)間短;而在后期采集間隔則增加,采集頻率降低。
4) 就數(shù)據(jù)真實(shí)性而言。水工建筑物監(jiān)控?cái)?shù)據(jù)通常通過儀器進(jìn)行采集,在儀器不發(fā)生故障的前提下,通常采集到的數(shù)據(jù)具有較高的質(zhì)量,比較能反映真實(shí)情況。
對(duì)水工建筑物在施工和工作階段進(jìn)行監(jiān)測(cè)所獲得的數(shù)據(jù)主要為結(jié)構(gòu)化時(shí)序數(shù)據(jù)。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法在相鄰兩層節(jié)點(diǎn)進(jìn)行互連,但是同層節(jié)點(diǎn)相互獨(dú)立,因此在機(jī)器學(xué)習(xí)時(shí)難以反映數(shù)據(jù)內(nèi)在的延續(xù)性。
循環(huán)神經(jīng)網(wǎng)絡(luò)是在原本的基礎(chǔ)上,引入時(shí)序概念,節(jié)點(diǎn)間通過隱性連接,在時(shí)序數(shù)據(jù)方面表現(xiàn)出較好的適應(yīng)性。但在循環(huán)神經(jīng)網(wǎng)絡(luò)算法中,若進(jìn)行高迭代計(jì)算,則容易出現(xiàn)網(wǎng)絡(luò)不穩(wěn)定問題,甚至網(wǎng)絡(luò)無法收斂。LSTM為“長(zhǎng)短期記憶網(wǎng)絡(luò)”,是一種改進(jìn)后的循環(huán)神經(jīng)網(wǎng)絡(luò),克服了循環(huán)神經(jīng)網(wǎng)絡(luò)在高迭代算法中不穩(wěn)定問題,而且在間隔較長(zhǎng)的時(shí)序數(shù)據(jù)計(jì)算中具有較強(qiáng)預(yù)測(cè)能力,是目前較為流行和先進(jìn)的深度學(xué)習(xí)算法之一。
本文基于LSTM深度學(xué)習(xí)算法,構(gòu)建水工建筑物安全分析模型。該模型可適用于多種類型的水工建筑物,主要建立過程包括數(shù)據(jù)處理、網(wǎng)絡(luò)結(jié)構(gòu)和預(yù)測(cè)方法。
通過對(duì)原始觀測(cè)數(shù)據(jù)進(jìn)行必要處理,如清洗、降噪和變換等,可以提高水工建筑物安全監(jiān)控模型的外延能力。前端數(shù)據(jù)處理主要包含數(shù)據(jù)清洗、降噪平滑和數(shù)據(jù)變換3個(gè)步驟。
在數(shù)據(jù)清洗中,通過差值補(bǔ)填和異常檢測(cè)手段對(duì)監(jiān)測(cè)數(shù)據(jù)中的局部缺失值和異常值進(jìn)行處理,進(jìn)而獲得修正后的序列。
在原始監(jiān)測(cè)數(shù)據(jù)中,通常會(huì)存在一定程度的噪聲,因此需要進(jìn)行降噪平滑處理。具體為先將輸入序列進(jìn)行正序?yàn)V波處理,然后將處理后的序列進(jìn)行逆轉(zhuǎn)后再次通過濾波器,最后再進(jìn)行逆轉(zhuǎn)輸出后獲得降噪平滑序列。
在數(shù)據(jù)變換中,對(duì)上述平滑序列歸一化處理。通過歸一化處理,可以避免梯度更新誤差,也能提高求得最優(yōu)解的效率。
經(jīng)過數(shù)據(jù)前端處理后,將處理后的數(shù)據(jù)劃分成訓(xùn)練集、驗(yàn)證集和測(cè)試集,然后通過下述措施對(duì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行改進(jìn)和優(yōu)化。
1) 通過并聯(lián)方式對(duì)深層網(wǎng)絡(luò)LSTM1和LSTM2進(jìn)行搭建。LSTM1為一元時(shí)序預(yù)測(cè),通過監(jiān)測(cè)數(shù)據(jù)對(duì)目標(biāo)量進(jìn)行預(yù)測(cè)。LSTM2是一種多元回歸預(yù)測(cè)算法,通過多個(gè)影響因子與目標(biāo)量之間的聯(lián)系來構(gòu)件模型,然后依據(jù)該模型進(jìn)行參數(shù)求解。
2) 參數(shù)調(diào)試和優(yōu)化。通過試算和隨機(jī)搜索等方式,對(duì)各參數(shù)進(jìn)行調(diào)整,以獲得最優(yōu)參數(shù)集。
3) 在計(jì)算時(shí)序數(shù)據(jù)時(shí),會(huì)存在一定的歷史冗余數(shù)據(jù),這將導(dǎo)致模型復(fù)雜性增加,提高模型的計(jì)算難度和降低精確度。因此,通過驗(yàn)證集對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行多次評(píng)估驗(yàn)證,選取有效的記憶區(qū)間。
4) 為防止由于測(cè)試集過少而出現(xiàn)的過度擬合問題,需要對(duì)網(wǎng)絡(luò)深度和訓(xùn)練周期進(jìn)行控制,同時(shí)通過標(biāo)準(zhǔn)化和正則化約束模型參數(shù),以期對(duì)模型的泛化能力進(jìn)行提高。
外延預(yù)測(cè)方法主要為直接多步預(yù)測(cè)(DMP)和滾動(dòng)單步預(yù)測(cè)(POP)。直接多步預(yù)測(cè)是目前較為常見的外延方法,應(yīng)用較廣,可以一次返回多個(gè)預(yù)測(cè)值,效率較高。滾動(dòng)單步預(yù)測(cè)是通過不斷迭代的方式進(jìn)行預(yù)測(cè),對(duì)上一步驟的計(jì)算結(jié)果作為當(dāng)前步驟的輸入值,不斷進(jìn)行滾動(dòng)迭代,實(shí)現(xiàn)間接多步預(yù)測(cè)。而對(duì)于較為穩(wěn)定的預(yù)測(cè)模型,沒有必要進(jìn)行較高頻次的更新學(xué)習(xí),可在周期性迭代過程中設(shè)定更新時(shí)間進(jìn)行控制。
通過上文建立的水工建筑物安全監(jiān)控模型,選取某大壩進(jìn)行應(yīng)用實(shí)測(cè)數(shù)據(jù)與濾波后的數(shù)據(jù)對(duì)比情況,主要包括鋼筋應(yīng)力變化、裂縫開合度變化、應(yīng)變數(shù)據(jù)情況、水位變化情況。結(jié)果表明,濾波之后的數(shù)據(jù)與原數(shù)據(jù)趨勢(shì)較為一致,在數(shù)值方面基本相同,去掉了原始數(shù)據(jù)中的跳點(diǎn)和壞點(diǎn)。差異表現(xiàn)較為顯著的是水位情況,見圖1。從圖1中可以看出,水位的原始監(jiān)測(cè)數(shù)據(jù)存在較大的波動(dòng),因此濾波之后的曲線與原數(shù)據(jù)差異較明顯,但變化趨勢(shì)基本一致,且濾波之后的數(shù)值與其周圍原始數(shù)據(jù)的平均值較為接近,因此濾波數(shù)據(jù)也是較為合理的。
圖1 監(jiān)測(cè)儀器數(shù)據(jù)記錄與濾波數(shù)據(jù)對(duì)比(水位應(yīng)變)
為了增加模型預(yù)測(cè)效果的對(duì)比性,選用SRSM模型和BPNN模型作為L(zhǎng)STM模型的對(duì)照。在機(jī)器學(xué)習(xí)工程中,將各模型參數(shù)調(diào)制最優(yōu),然后對(duì)鋼筋應(yīng)力、裂縫開合度、結(jié)構(gòu)應(yīng)變和水位數(shù)據(jù)進(jìn)行預(yù)測(cè)。
表1為3個(gè)模型在鋼筋應(yīng)變、裂縫開合度、應(yīng)變和水位預(yù)測(cè)中的誤差值。誤差值選用3個(gè)標(biāo)準(zhǔn)進(jìn)行統(tǒng)計(jì),分別為均方誤差(MSE)、平均絕對(duì)誤差(MAE)和平均絕對(duì)百分比誤差(MAPE)。從表1可以看出,SRSM、BPNN和LSTM 3個(gè)模型中,誤差最小的為L(zhǎng)STM模型,誤差結(jié)果由小到大排序?yàn)長(zhǎng)STM、BPNN和SRSM。
表1 不同模型預(yù)測(cè)結(jié)果誤差統(tǒng)計(jì)
本文基于神經(jīng)網(wǎng)絡(luò)算法中的LSTM算法,建立了水工建筑物安全監(jiān)控模型,從數(shù)據(jù)處理、網(wǎng)絡(luò)結(jié)構(gòu)和外延預(yù)測(cè)3個(gè)方面對(duì)模型進(jìn)行了優(yōu)化。結(jié)合某水工建筑物實(shí)例,驗(yàn)證了模型的有效性,從不同角度對(duì)比了LSTM模型與其他模型在水工建筑物安全監(jiān)控預(yù)測(cè)方面的差異。結(jié)論如下:
1) LSTM模型不僅能準(zhǔn)確預(yù)測(cè)水工建筑物參數(shù)隨時(shí)間變化的數(shù)值和趨勢(shì),也能在一定程度上反映參數(shù)的波動(dòng)情況,體現(xiàn)出良好的預(yù)測(cè)效果。
2) 與其他模型相比,深度學(xué)習(xí)模型可以應(yīng)用于不同場(chǎng)景。同一場(chǎng)景而言,深度學(xué)習(xí)預(yù)測(cè)效果更佳。
3) SRSM、BPNN和LSTM 3個(gè)模型中,誤差最小的為L(zhǎng)STM模型,誤差結(jié)果由小到大排序?yàn)長(zhǎng)STM、BPNN和SRSM。