張 乾, 詹淑慧, 徐 鵬
(北京建筑大學供熱、供燃氣、通風及空調工程北京市重點實驗室,北京100044)
軌道交通在我國的一些大中型城市發(fā)展迅速,截至2017年末,中國內地已開通地鐵的城市有34個,運營線路總里程達5 033 km,城市軌道交通路線165條。與此同時,隨著我國十三五規(guī)劃和清潔能源政策的大力推行,天然氣在一次能源消費結構中的占比不斷增長,埋地鋼質燃氣管道出現與軌道交通路線平行敷設、交叉穿越敷設的情況。
1969年10月1日北京地鐵一期建成通車,投入運營后,其主體結構發(fā)現嚴重腐蝕,隧道內水管腐蝕穿孔,東段部分區(qū)段穿孔情況最嚴重,更換管道54處[1]。1999年廣州地鐵一號線開通后,中壓燃氣管網腐蝕搶修量從2000年起迅速增長,且持續(xù)高發(fā)[2]。2010年廣州白云機場地鐵開通后,機場航油管道陰極保護系統(tǒng)出現癱瘓,嚴重威脅安全[3]。國內諸多埋地管道都面臨雜散電流的危害,如何預測軌道交通雜散電流所產生的腐蝕風險,并對其進行有效的預判和干預是實際生產中急需解決的問題。
軌交雜散電流的形成機理見圖1。電流由牽引變電所正極產生,大部分經架空饋線、走行軌流回至牽引變電所負極,少部分從走行軌與地面絕緣不良位置泄漏入道床,經道床流入土壤,最后流入埋地鋼質燃氣管道,引起管道壁面的電化學反應,產生腐蝕。長期累積的持續(xù)腐蝕會造成壁面穿孔等嚴重問題[4]。
圖1 軌交雜散電流的形成機理
隨著大數據技術的發(fā)展,分析處理海量管道建設維護數據成為可能。近年來,一些學者開始嘗試使用數據挖掘技術對雜散電流的成因、控制、抵消等加以研究,但對于雜散電流的預測研究較少。
李威等人[5]提出用BP模型預測地鐵雜散電流腐蝕的危險性。王少博[6]基于神經網絡的預測方法,進行了接地網腐蝕率預測的應用研究。但用于預測雜散電流的腐蝕速度,BP神經網絡模型的預測精度并不高。
有學者使用故障樹評價法、模糊綜合評價法和層次分析法等方法分析過燃氣管道風險[7],但這些方法在學習時序性規(guī)律時準確度欠佳。機器學習和深度學習則基于對海量歷史數據進行挖掘并學習,因此相對于傳統(tǒng)的學習方法,更能得到相對客觀的評價結果[8]。1997年,Hochreiter等人[9]提出長短期記憶方法模型LSTM(Long Short-Term Memory)。2005年,Graves等人[10]進行了模型的改進和推廣。
本文對位于北京市的某段遭受軌道交通雜散電流影響的埋地鋼質燃氣管道在同一位置進行了連續(xù)監(jiān)測,基于數據挖掘方法,運用LSTM方法建立雜散電流對埋地鋼質燃氣管道腐蝕影響的預測模型,對一定時間的通電電位進行監(jiān)測,利用模型尋找其變化發(fā)展的規(guī)律,并將預測結果與實測數據進行了對比驗證,從而為開發(fā)具有智能控制及反饋功能的排流設備打基礎,達到防止雜散電流對燃氣管道產生持續(xù)性干擾的效果,減少腐蝕泄漏。
LSTM為長短期記憶網絡(Long Short-Term Memory),是一種時間序列模型。時間序列分析是數據處理分析領域中的重點分支之一,其基于數理統(tǒng)計學和隨機理論過程,將相同時間間隔的樣本數據按照時間順序排列,進行分析的一種數據處理方法[11]。時間序列分析法最大特點是數據的連貫性和相關性,因此可以依據歷史數據預測未來數值。LSTM模型在處理時序性問題時準確度較高,應用范圍廣,是一種特殊的循環(huán)神經網絡(Recurrent Neural Network,RNN),適合于處理和預測時間序列中間隔和延遲相對較長的重要事件。所有RNN都具有神經網絡的重復模塊鏈的形式,其標準形式見圖2,A表示神經網絡模塊,圖2中有3個相同的神經網絡模塊,中間的神經網絡模塊展示了其具體的內部結構。每個神經網絡模塊只有1個tanh層作為激活層,每個神經網絡模塊中的tanh層的處理(以圖2的中間神經網絡模塊為例),是通過當前輸入(xt)及上一時刻的輸出(ht-1)來得到當前輸出(ht),利用上一時刻學習到的信息進行當前時刻的學習,以此類推。
圖2 標準RNN模型
LSTM模型是在標準RNN模型基礎上豐富了內部網絡單元,將原本的1個網絡層(tanh層)擴充為4個網絡層(1個tanh層、3個σ層),見圖3。圖3中每一個箭頭代表攜帶了一個向量,從上一個節(jié)點的輸出到下一個節(jié)點的輸入;粉色圓圈代表逐點運算,如矢量的加法、乘法等;黃色框代表神經網絡層,如tanh層、σ層;箭頭的合并代表連接,箭頭分叉代表其內容被復制。xt表示輸入的向量,ht表示輸出的向量,ct表示其中的神經元細胞的輸出的向量。LSTM通過“門”(gate)來控制遺棄或者添加信息,從而實現遺忘或記憶的功能?!伴T”是一種使信息選擇性通過的結構,由一個σ層和一個矢量的乘法操作組成。σ層的輸出值在[0,1]區(qū)間,0代表完全遺棄,1代表完全通過。在學習過程中,這代表了對學習到的信息的過濾,將無用的學習信息丟棄,更新并添加有用的學習信息。因此,LSTM可以較好地彌補RNN可能出現的梯度錯誤、長期數據記憶能力局限的弊端。一個神經網絡模塊A查看輸入xt并輸出ht,多個神經網絡模塊依次相連接。因此LSTM以這種線性變換的形式,將信息以鏈式多層傳遞,最終輸出。LSTM模型的訓練過程可概括為4個環(huán)節(jié):根據前向計算方法求出輸出值;反向計算每個LSTM單元的誤差項;根據相應誤差項計算每個權重的梯度;應用基于梯度的優(yōu)化算法更新權重。本文在選取基于梯度的優(yōu)化算法時,選擇了Adam算法,這種算法能對不同參數計算適應性學習率并且占用較少的儲存資源。
圖3 LSTM模型
本文使用深度學習框架keras(由Python編寫的開源人工神經網絡庫),建立LSTM模型。模型參數的設置采用keras的默認參數值,是框架通過多次調整參數確定的最優(yōu)結果,在設計框架時為通用數值。在模型訓練中,設定訓練值與測試值的損失函數為均方誤差損失函數,均方誤差損失函數采用 L2 正則化,并將 L2 正則化權重設為 3。向后傳播參數的更新器采用adam,更新器的學習率lr=0.001, 動量超參數分別為beta_1=0.9, beta_2=0.999。選擇滑動窗口數值為4。
對某地遭受雜散電流干擾的鋼質燃氣管道在同一位置進行通電電位的持續(xù)監(jiān)測,模型的輸入是一段時間內的實際監(jiān)測值,模型的輸出是后一時刻的預測值。
對某地遭受雜散電流干擾的鋼質燃氣管道在同一位置進行通電電位的持續(xù)監(jiān)測。測試管道公稱直徑為800 mm,材質為L485鋼,采用3PE防腐層。依據GB/T 21246—2007《埋地鋼質管道陰極保護參數測量方法》,選取推薦的準確率較高的試片檢測法監(jiān)測管道通電電位。
試片檢測法檢測原理見圖4。用導線連接埋地鋼質燃氣管道的測試樁和一片與鋼質燃氣管道材料相同的標準測試片,形成電流通路。電流由埋地鋼質燃氣管道流向標準測試片,使標準測試片產生極化作用。在導線上安裝電流中斷器,通過操作中斷器的開關,控制電路的通斷。
圖4 試片檢測法檢測原理
測量現場見圖5。本文中論及的電位均相對于銅/飽和硫酸銅參比電極(CSE)。使用UDL-2型數據記錄儀在管道與埋設的標準測試片充分極化的狀態(tài)下,對埋地管道測試點的通電電位進行長時間同步連續(xù)監(jiān)測。
圖5 測試點測試現場
在測試管道上選取某點作為研究對象,對該處測試樁的通電電位進行24 h數據采集。采集期為2018年3月31日10:00至2018年4月1日10:00,1 s采集一次數據。除去因斷電測量斷電電位的時間,共取得81 044個通電電位數據,得到原始通電電位隨時間的分布見圖6。
根據圖6可以看出:3月31日23:55左右至4月1日5:25左右,軌交停車不運行,故該時段的通電電位近似為一條直線,保持在-1.2 V左右;其余時間段內,通電電位始終處于劇烈波動中,波動范圍為-1.4~-0.7 V,表明受雜散電流干擾非常嚴重。此外,通電電位的變化趨勢未形成明顯規(guī)律,用傳統(tǒng)的數學模型進行分析并預測是不妥的。但是數據的時間間隔固定為1 s,且按照時間順序排列,具有連貫性,因此可以滿足LSTM模型的時序性分析,可以采用LSTM模型。
為研究通電電位隨時間的變化規(guī)律,在原始數據中隨機選取一段時間的通電電位作為實驗數據,本次選取的時間段為2018年3月31日15:14:42至15:20:09,1 s采集一次數據,共取得327個通電電位數據,經過發(fā)現并糾正數據文件中可識別的錯誤,檢查數據一致性,處理無效值和缺失值等[12],得到實驗數據隨時間的分布見圖7。
圖7 所選時間段內原始電位數據隨時間的分布
由圖7可知:在較短時間序列中,埋地鋼質燃氣管道的通電電位隨時間仍有較大波動,每1 s的波動幅度不同、變化趨勢未形成明顯規(guī)律。將采集到的327個電位數據,按時間順序以7∶3的比例劃分為訓練集和驗證集,即前70%用于模型的訓練,后30%用于訓練后得到的預測進行驗證,得到前229個數據作為訓練集,后98個數據作為驗證集。選擇模型的滑動窗口大小為4,則訓練集中共得到225組訓練樣本,例如將2018年3月31日15:14:42—15:14:45采集到的數據輸入LSTM模型,LSTM模型的輸出為2018年3月31日15:14:46的電位,以此類推。驗證集中共得到94組驗證樣本,在預測時,例如輸入2018年3月31日15:18:24—15:18:27的電位,則LSTM模型的輸出即為2018年3月31日15:18:28的電位,以此類推。
根據LSTM模型所得預測結果見圖8。由圖8可知,實測通電電位曲線和預測通電電位曲線的趨勢基本一致。
圖8 LSTM模型預測結果
采用皮爾遜相關系數(PCC)和平均相對誤差(MAPE) 兩個指標對預測結果的準確性進行評估。二者都是評估機器學習模型及深度學習模型最常用的評估指標。PCC代表預測結果較真實結果的線性相關性系數,MAPE代表預測結果較真實結果的平均偏離程度,計算公式[13]分別為:
(1)
(2)
式中IPCC——皮爾遜相關系數
N——樣本總數,個
i——第i個樣本
Xi——第i個樣本的預測值
σX——樣本預測值的標準差
Yi——第i個樣本的真實值
σY——樣本真實值的標準差
IMAPE——平均相對誤差
真實值與預測值的皮爾遜相關系數越大、平均相對誤差越小,準確度越高。經計算得到,經過LSTM模型得到的預測值與真實值的皮爾遜相關系數為0.966,平均相對誤差為2.43%,準確度較高。LSTM模型應用于智能排流設備,有助于實現及時整流,防止雜散電流對燃氣管道產生持續(xù)性干擾,減少腐蝕泄漏。
① 根據長短期記憶網絡(LSTM)具有較好的數據連貫性及相關性、處理時序性問題時準確度較高的特點,建立軌交雜散電流對燃氣管道影響預測的LSTM模型,該模型建模簡單,易于操作。
② 對遭受雜散電流干擾的埋地鋼質燃氣管道通電電位在同一位置進行持續(xù)監(jiān)測,應用LSTM模型對雜散電流作用于埋地鋼質燃氣管道的影響進行了短期預測,并與實測結果進行了對比分析,準確度較高。
③ 利用LSTM模型對受到軌交雜散電流影響的燃氣管道狀況作出預測,可以為研制開發(fā)更智能的具有反饋功能的排流裝置提供支撐和參考。