周 波
(中國石油工程建設(shè)有限公司 西南分公司,四川 成都 610041)
天然氣能否準(zhǔn)確計量直接影響著開發(fā)、運(yùn)行、配給及用戶等各方的經(jīng)濟(jì)利益,而管路結(jié)構(gòu)的安全性是影響天然氣流量計量準(zhǔn)確性的主要因素之一。天然氣管道事故常處于突發(fā)情況,需要建立能即使發(fā)現(xiàn)天然氣輸送管道的應(yīng)急響應(yīng)技術(shù)。
數(shù)字孿生是通過物理模型、傳感器更新、運(yùn)行歷史等數(shù)據(jù),包括多學(xué)科、多物理量和時間尺度及多概率的實(shí)時仿真過程,在虛擬空間中進(jìn)行映射,創(chuàng)造一個能表達(dá)其相對應(yīng)的實(shí)體設(shè)備全部周期過程的數(shù)字模型。數(shù)字孿生體的工程意義是在實(shí)際運(yùn)行系統(tǒng)之外,構(gòu)建一個與實(shí)際運(yùn)行系統(tǒng)運(yùn)行環(huán)境基本一致的虛擬化系統(tǒng),且使虛擬化系統(tǒng)的運(yùn)行時間前推一定周期,從而判斷實(shí)際運(yùn)行系統(tǒng)在未來短周期內(nèi)可能發(fā)生的故障,并作出提前預(yù)警。
受制于工程邏輯學(xué)的局限性,實(shí)際搭建液化天然氣((Liquefied Natural Gas,簡稱LNG)輸送管道數(shù)字孿生體時,存在海量的隱藏傳導(dǎo)機(jī)制和不完備數(shù)據(jù),所以,只能通過機(jī)器學(xué)習(xí)系統(tǒng)搭建仿真系統(tǒng),而無法實(shí)現(xiàn)完全一致且無需后續(xù)干預(yù)的數(shù)字孿生體。建筑信息模型(Building Information Modeling,簡稱BIM)系統(tǒng)中內(nèi)置的數(shù)字孿生體的時間前推能力難以滿足實(shí)際運(yùn)行需求。
該研究設(shè)計了一套相對完善的基于機(jī)器學(xué)習(xí)算法的數(shù)字孿生體仿真運(yùn)行算法,并對其進(jìn)行了驗(yàn)證。
今天,大部分LNG天然氣管道已經(jīng)實(shí)現(xiàn)了壓力、流量、溫度等儀表的1 s周期遠(yuǎn)程實(shí)時抄表工作且形成了物聯(lián)網(wǎng)大數(shù)據(jù)體系。隨著量子力學(xué)發(fā)展,使用高精度三軸激光陀螺儀捕捉管道的震動,可以有效反映出管道內(nèi)的氣液混合情況、渦流湍流情況等。數(shù)字孿生體建設(shè)中,這些儀表采集的物聯(lián)網(wǎng)大數(shù)據(jù)稱為其主要數(shù)據(jù)來源。
該研究設(shè)計的數(shù)字孿生體,對各探頭數(shù)據(jù)在BIM系統(tǒng)中構(gòu)建數(shù)據(jù)LOD(Levels of Detail,簡稱LOD)技術(shù)圖,且在授時系統(tǒng)驅(qū)動下形成圖時序序列,進(jìn)而使用模糊神經(jīng)網(wǎng)絡(luò)對所有圖序列分別執(zhí)行卷積壓縮,使每個圖序列形成1個雙精度浮點(diǎn)型特征變量,再將這些特征變量輸入到多列神經(jīng)網(wǎng)絡(luò)中,重新組建各個壓力表、流量表、溫度表在前推時間點(diǎn)的曲線估計前推結(jié)果數(shù)據(jù)。該數(shù)字孿生體構(gòu)建策略如圖1所示:
圖1 圖論統(tǒng)計支持下的多列神經(jīng)網(wǎng)絡(luò)數(shù)字孿生體系統(tǒng)算法邏輯
圖1中,使用了圖論統(tǒng)計法、空間卷積法、時序圖序列同構(gòu)化方法等數(shù)據(jù)前置治理算法,模糊神經(jīng)網(wǎng)絡(luò)、對數(shù)神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法,多列神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)重構(gòu)法等數(shù)據(jù)解模糊算法等,形成數(shù)字孿生體中前推一定時間周期的數(shù)據(jù)曲線估計前推模型。相關(guān)算法將在后續(xù)章節(jié)中展開論述。
圖論統(tǒng)計學(xué)方法
使用LOD法將儀表數(shù)據(jù)定義到BIM的三維模型中,形成數(shù)據(jù)投影。數(shù)據(jù)表達(dá)為{,,,,,,,},其中,{}為儀表序列號,{,,}為儀表測量點(diǎn)的BIM三維空間坐標(biāo),{,}為儀表管道邏輯關(guān)系前后連接點(diǎn),{}為儀表讀數(shù);{}為儀表讀數(shù)時間戳;將相同{,,,,,}標(biāo)識的序列在時間軸{}上展開,形成圖序列原始統(tǒng)計結(jié)果;
四維時空空間卷積方法
四維時空空間卷積方法是將上述{,,,,,,,}序列,以{,,,}四個坐標(biāo)維度作為卷積維度,對{}值執(zhí)行空間卷積,強(qiáng)化特征數(shù)據(jù),其基函數(shù)如公式(1):
(1)
式中:(,,,)為卷積后輸出結(jié)果;()為卷積核,為一個小規(guī)模四維陣列數(shù)據(jù),不同的卷積核賦值方式會實(shí)現(xiàn)不同的卷積效果,如邊緣強(qiáng)化、離群捕捉、峰值強(qiáng)化等;(-)(-)(-)(-)為被卷積序列分量函數(shù);
基于六階多項(xiàng)式深度迭代回歸算法的模糊神經(jīng)網(wǎng)絡(luò)
六階多項(xiàng)式深度迭代回歸算法的統(tǒng)計學(xué)本質(zhì)是將大宗數(shù)據(jù)卷積到1個雙精度浮點(diǎn)型變量內(nèi),使其在最小的信息損失量前提下使用較小規(guī)模數(shù)據(jù)代表大宗數(shù)據(jù)的數(shù)據(jù)特征。六階多項(xiàng)式深度迭代回歸算法的節(jié)點(diǎn)基函數(shù)如公式(2):
(2)
基于對數(shù)深度迭代回歸算法的對數(shù)神經(jīng)網(wǎng)絡(luò)
對數(shù)深度迭代回歸算法的統(tǒng)計學(xué)本質(zhì)是利用對數(shù)曲線的非線性特征放大數(shù)據(jù)在自變量坐標(biāo)軸0值附近的細(xì)節(jié),該數(shù)字孿生體算法中,將其作為多列神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)函數(shù),其基函數(shù)如公式(3):
(3)
式中:、為待回歸系數(shù);其他數(shù)學(xué)符號含義同式(2)。
在Matlab中加載Simulink控件構(gòu)建仿真環(huán)境,數(shù)據(jù)訓(xùn)練中,采用某單位LNG天然氣輸送管道中壓力、流量、溫度、震動加速度儀表數(shù)據(jù)作為原始數(shù)據(jù)作為原始數(shù)據(jù),使用中間數(shù)據(jù)作為輸入數(shù)據(jù),對應(yīng)的前推數(shù)據(jù)作為輸出數(shù)據(jù)執(zhí)行數(shù)據(jù)訓(xùn)練,后續(xù)類似數(shù)據(jù)組織方式組織收斂效果驗(yàn)證。每個特定分列的算法模塊內(nèi)部邏輯結(jié)構(gòu)相同,根據(jù)不同的大數(shù)據(jù)訓(xùn)練需求對其分別訓(xùn)練,使其向特定的應(yīng)用方向數(shù)據(jù)收斂。
驗(yàn)證試驗(yàn)中,使用仿真數(shù)據(jù)與原始數(shù)據(jù)之間的決定系數(shù)、標(biāo)準(zhǔn)偏差率和平均離群率作為驗(yàn)證方法。其中:
決定系數(shù)()的算法如式(4):
(4)
標(biāo)準(zhǔn)偏差率的算法如式(5):
(5)
式中:為輸入序列的標(biāo)準(zhǔn)偏差率;為輸入序列中的第個輸入項(xiàng);為輸入序列的算數(shù)平均值;為統(tǒng)計樣本數(shù)量。
平均離群率的算法如式(6):
(6)
式中:為標(biāo)準(zhǔn)離群率;、、為離群率線性回歸預(yù)測直線的系數(shù);(,)為第個散點(diǎn)的二維空間坐標(biāo);max();min()為離群率估計的最大值和最小值。
對數(shù)據(jù)孿生體前推時間周期曲線估計預(yù)測數(shù)據(jù)的算法效能驗(yàn)證方法使用驗(yàn)證敏感度的方式進(jìn)行計算,敏感度計算方法為為數(shù)據(jù)預(yù)測值與數(shù)據(jù)實(shí)測值之差與數(shù)據(jù)實(shí)測值的比值均值,其算法如式(7):
(7)
式中:為統(tǒng)計數(shù)據(jù)節(jié)點(diǎn)的數(shù)量;為第個數(shù)據(jù)實(shí)測值;為第個數(shù)據(jù)預(yù)測值。
對天然氣流量分布數(shù)據(jù)流在定時域窗口進(jìn)行值域區(qū)間的數(shù)據(jù)頻率分布統(tǒng)計和頻域區(qū)間的數(shù)據(jù)分散度運(yùn)算,可以建立動態(tài)的流量分布耦合數(shù)據(jù),比較分析流量分布數(shù)據(jù)耦合度的統(tǒng)計如表1所示。
表1 流量分布數(shù)據(jù)耦合度統(tǒng)計表
表1中,決定系數(shù)一般指可決系數(shù),表示一個隨機(jī)變量與多個隨機(jī)變量關(guān)系的數(shù)字特征;標(biāo)準(zhǔn)偏差率時一種度量數(shù)據(jù)分布的分散程度標(biāo)準(zhǔn),用以衡量實(shí)際值與理論值或者估計值的偏差程度;平均離群率是多點(diǎn)數(shù)據(jù)集中偏離大部分?jǐn)?shù)據(jù)的一種算法。
天然氣輸送管道的滲透率和孔隙度等相關(guān)參數(shù)會隨著輸送壓力的變換而發(fā)生動態(tài)變化,同時該變化又會影響到壓力的分布狀況,針對壓力分布數(shù)據(jù)耦合度如表2所示。
表2 壓力分布數(shù)據(jù)耦合度統(tǒng)計表
由表2可知,數(shù)字孿生體算法仿真在壓力分布數(shù)據(jù)耦合度統(tǒng)計中的決定系數(shù)驗(yàn)證結(jié)果略高于BIM自帶的結(jié)果,在標(biāo)準(zhǔn)偏差率和平均離群率的驗(yàn)證結(jié)果卻明顯低于BIM自帶的數(shù)據(jù)結(jié)果。
對數(shù)字孿生體算法仿真和BIM自帶數(shù)據(jù)系統(tǒng)依據(jù)上述的系統(tǒng)數(shù)據(jù)耦合度驗(yàn)證結(jié)果數(shù)據(jù)曲線,進(jìn)行系統(tǒng)的數(shù)據(jù)前推估計敏感度統(tǒng)計,如表3所示。
表3 數(shù)據(jù)前推估計敏感度統(tǒng)計表
由表3可知,顯示數(shù)字孿生體算法仿真在5 s和曲線估計前推數(shù)據(jù)結(jié)果略高于BIM自帶的結(jié)果,在15、30、60 s時的估計前推數(shù)據(jù)均明顯優(yōu)于BIM自帶的敏感度結(jié)果,且比較結(jié)果為<10000,<005,說明具有明顯統(tǒng)計學(xué)意義。
通過在MATLAB中加載Simulink控件構(gòu)建仿真環(huán)境,對流量分布和壓力分布的數(shù)據(jù)耦合度,以及數(shù)據(jù)前推估計敏感度進(jìn)行了測試,結(jié)果證明了數(shù)字孿生體算法仿真能夠有效的對異常數(shù)據(jù)預(yù)警和主動推送,能夠提高系統(tǒng)應(yīng)用的安全性,具有很好的應(yīng)用價值。