李雨,侯磊,徐磊,白小眾,劉金海,孫欣,谷文淵
基于混合BP神經(jīng)網(wǎng)絡(luò)的原油管道電耗預(yù)測(cè)研究
李雨1,2,侯磊1,2,徐磊1,2,白小眾3,劉金海3,孫欣3,谷文淵3
(1.中國(guó)石油大學(xué)(北京)石油工程教育部重點(diǎn)實(shí)驗(yàn)室,北京 102200; 2.國(guó)家石油天然氣管網(wǎng)集團(tuán)有限公司油氣調(diào)度中心,北京 102200; 3.國(guó)家管網(wǎng)集團(tuán)北方管道有限責(zé)任公司 錦州輸油氣分公司,遼寧 錦州 121000)
原油管道電耗的準(zhǔn)確預(yù)測(cè)能夠用于控制原油管道耗能水平,充分挖掘原油管道輸送系統(tǒng)的節(jié)能潛力。實(shí)際采集到的原油管道運(yùn)行數(shù)據(jù)具有波動(dòng)范圍大的特點(diǎn),且存在嚴(yán)重的噪聲干擾和信息冗余,對(duì)精確預(yù)測(cè)管道電耗造成不良影響。為解決上述問(wèn)題,提出一種基于混合神經(jīng)網(wǎng)絡(luò)的電耗預(yù)測(cè)模型。利用自適應(yīng)噪聲的完備集成經(jīng)驗(yàn)?zāi)B(tài)分解,對(duì)原油管道日運(yùn)行數(shù)據(jù)進(jìn)行分解;利用主成分分析對(duì)分解后數(shù)據(jù)做降維處理;利用改進(jìn)粒子群算法調(diào)節(jié)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù);使用該模型預(yù)測(cè)某原油管道電耗,并與常見(jiàn)的幾種預(yù)測(cè)模型展開(kāi)對(duì)比。結(jié)果表明,分解算法能夠提高模型預(yù)測(cè)精度;該混合神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度最高,其測(cè)試集的平均絕對(duì)誤差為5.394%,較使用分解算法前降低39.200%。
原油管道; 電耗預(yù)測(cè); 人工神經(jīng)網(wǎng)絡(luò); 改進(jìn)粒子群算法
目前預(yù)測(cè)原油管道運(yùn)行電耗存在兩種方法[1?2]。一種方法是考慮輸量、壓降和環(huán)境等因素對(duì)原油管道運(yùn)行電耗的影響,利用理論公式計(jì)算管道在某個(gè)具體運(yùn)行工況下的運(yùn)行電耗,這種方法也被稱為工藝法。該方法在計(jì)算管道運(yùn)行電耗時(shí)不但需要引入大量假設(shè),而且需要簡(jiǎn)化求解問(wèn)題,大幅降低了模型的預(yù)測(cè)精度。另一種方法是利用神經(jīng)網(wǎng)絡(luò)建立電耗預(yù)測(cè)模型以完成預(yù)測(cè)任務(wù)。該方法不引入額外假設(shè),預(yù)測(cè)效果更好。但該方法應(yīng)用于原油管道電耗預(yù)測(cè)時(shí)存在兩個(gè)問(wèn)題:由于神經(jīng)網(wǎng)絡(luò)精度受參數(shù)影響很大,需要使用科學(xué)的方法調(diào)節(jié)模型參數(shù)以提高神經(jīng)網(wǎng)絡(luò)的性能;神經(jīng)網(wǎng)絡(luò)模型精度易受輸入數(shù)據(jù)質(zhì)量的影響,當(dāng)輸入數(shù)據(jù)噪聲較多時(shí),神經(jīng)網(wǎng)絡(luò)不能表現(xiàn)出最好的預(yù)測(cè)性能。搜索算法能夠快速優(yōu)化神經(jīng)網(wǎng)絡(luò)模型參數(shù)[3?5],提高模型預(yù)測(cè)效果,該方法目前被廣泛應(yīng)用于太陽(yáng)輻射預(yù)測(cè)[6]、建筑物能耗[7]、設(shè)備故障診斷[8]和油井套管無(wú)損檢測(cè)[9]等領(lǐng)域,但在管道運(yùn)行電耗預(yù)測(cè)領(lǐng)域應(yīng)用很少。經(jīng)驗(yàn)?zāi)B(tài)分解[10]與其改進(jìn)方法[11]被廣泛用于分解數(shù)據(jù)信號(hào)以減弱噪聲影響,提高模型預(yù)測(cè)精度。自適應(yīng)噪聲的完備集成經(jīng)驗(yàn)?zāi)B(tài)分解[12]作為傳統(tǒng)經(jīng)驗(yàn)?zāi)B(tài)分解方法的改進(jìn),減弱了白噪聲對(duì)分解結(jié)果的影響,更適合用于分離出數(shù)據(jù)信號(hào)中對(duì)預(yù)測(cè)不利的噪聲信息。本研究將自適應(yīng)噪聲的完備集成經(jīng)驗(yàn)?zāi)B(tài)分解、改進(jìn)粒子群算法和BP神經(jīng)網(wǎng)絡(luò)結(jié)合,提出一種原油管道日電耗預(yù)測(cè)模型,并利用某原油管道3年運(yùn)行數(shù)據(jù)驗(yàn)證該模型的預(yù)測(cè)效果。
自適應(yīng)噪聲的完備集成經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)是一種改進(jìn)的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)方法,該方法能夠更快地對(duì)信號(hào)進(jìn)行分解,提取出不同時(shí)間尺度的特征信息且不產(chǎn)生重構(gòu)誤差,故該方法往往能夠篩選出含噪聲較多的分量,改善預(yù)測(cè)效果。該方法利用EMD分解時(shí)間序列()獲得1(),利用式(1)對(duì)得到的c()繼續(xù)分解得到c1(),重復(fù)式(1)至殘差不能被分解[13]。
因此,時(shí)間序列()經(jīng)過(guò)CEEMDAN分解得到的各個(gè)分量可表示為:
本研究利用該方法分解運(yùn)行報(bào)表中的12個(gè)輸入特征,共獲得100個(gè)新輸入特征。分解后數(shù)據(jù)既包含有效信息,也包含一定數(shù)量的噪聲和冗余信息。其中,噪聲信息會(huì)降低模型的預(yù)測(cè)精度,數(shù)據(jù)維度的增長(zhǎng)會(huì)造成數(shù)據(jù)樣本稀疏、樣本間距離計(jì)算困難等問(wèn)題,不利于BP神經(jīng)網(wǎng)絡(luò)(BPNN)的訓(xùn)練,同時(shí)會(huì)增加神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間。因此,需要對(duì)數(shù)據(jù)做降維處理,在降低數(shù)據(jù)維度的同時(shí)剔除其中的噪聲信息。
主成分分析法(PCA)是降低數(shù)據(jù)維度的方法,利用方差的累計(jì)貢獻(xiàn)率衡量原始數(shù)據(jù)信息被保留的程度。方差累計(jì)貢獻(xiàn)率的閾值多憑借經(jīng)驗(yàn)決定,保留閾值以上的數(shù)據(jù),舍棄閾值以下的數(shù)據(jù)。本研究利用主成分分析分別對(duì)運(yùn)行報(bào)表中的12個(gè)輸入特征和經(jīng)CEEMDAN分解后的100個(gè)輸入特征進(jìn)行降維,取方差累計(jì)貢獻(xiàn)率為99%時(shí)主成分分析確定的特征作為模型輸入特征。
BP神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近某一非線性函數(shù),因此被廣泛應(yīng)用于建立預(yù)測(cè)模型。BP神經(jīng)網(wǎng)絡(luò)包含輸入層、隱含層和輸出層,本研究所提出的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 單隱含層神經(jīng)網(wǎng)絡(luò)示意圖
輸入層和隱含層分別包括53和17個(gè)神經(jīng)元,激活函數(shù)為relu函數(shù),不同層的神經(jīng)元間利用權(quán)值連接,權(quán)值的數(shù)值有正有負(fù)。神經(jīng)網(wǎng)絡(luò)通過(guò)修正權(quán)值使模型平均均方誤差(MSE)達(dá)到最小。神經(jīng)網(wǎng)絡(luò)的初始權(quán)值滿足隨機(jī)分布,不同的權(quán)值初始分布使訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)表現(xiàn)出不同的預(yù)測(cè)結(jié)果。為減弱不同權(quán)值初始分布對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的影響,需要進(jìn)行重復(fù)實(shí)驗(yàn)。當(dāng)重復(fù)實(shí)驗(yàn)次數(shù)增多而模型預(yù)測(cè)誤差均值趨于穩(wěn)定時(shí)便認(rèn)為已進(jìn)行了足夠次數(shù)的重復(fù)實(shí)驗(yàn)。本研究將降維后數(shù)據(jù)作為BPNN輸入,將日電耗作為輸出,建立單隱含層的電耗預(yù)測(cè)模型,進(jìn)行30次重復(fù)實(shí)驗(yàn)并取30組模型預(yù)測(cè)誤差平均值來(lái)評(píng)價(jià)模型預(yù)測(cè)精度。
改進(jìn)粒子群算法(ISPO)[13?14]通過(guò)計(jì)算粒子群中每個(gè)個(gè)體在不同位置下得到的適應(yīng)度函數(shù)值來(lái)指導(dǎo)下一代個(gè)體的運(yùn)動(dòng),最終全部粒子聚集在適應(yīng)度函數(shù)值最高的位置,從而達(dá)到尋優(yōu)目的。相比傳統(tǒng)粒子群算法,改進(jìn)粒子群算法對(duì)求解種群最優(yōu)位置和個(gè)體最優(yōu)位置的過(guò)程進(jìn)行優(yōu)化,減少了需要調(diào)節(jié)的參數(shù)數(shù)量。改進(jìn)粒子群算法利用式(3)計(jì)算種群最優(yōu)位置。
利用式(4)求解每個(gè)粒子的歷史最佳位置。
在量子空間中的粒子移動(dòng)方向具有隨機(jī)性,設(shè)粒子從某點(diǎn)移動(dòng)到它的相對(duì)位置的概率為,則有式(5):
利用蒙特卡洛模擬求得值,有~(0,1),則有式(6):
最后得到子代粒子位置:
本研究利用粒子群算法(PSO)、引力搜索算法(GSA)、遺傳算法(GA)和模擬退火算法(SA)調(diào)節(jié)BPNN的參數(shù),分別建立PSO?BPNN、GSA?BPNN、GA?BPNN、SA?BPNN預(yù)測(cè)模型,將其與IPSO?BPNN模型進(jìn)行對(duì)比。粒子群算法通過(guò)更新粒子群最優(yōu)位置和個(gè)體最優(yōu)位置來(lái)指導(dǎo)粒子運(yùn)動(dòng),并獲得全局最優(yōu)解。引力搜索算法通過(guò)計(jì)算粒子間萬(wàn)有引力來(lái)指導(dǎo)粒子運(yùn)動(dòng),并獲得全局最優(yōu)解。遺傳算法通過(guò)攜帶數(shù)據(jù)信息的染色體進(jìn)行遺傳和變異來(lái)獲得全局最優(yōu)解。模擬退火算法利用粒子在降溫過(guò)程中會(huì)逐漸趨于穩(wěn)定的特點(diǎn),在高溫時(shí)跳出局部最優(yōu)解,在低溫時(shí)獲得全局最優(yōu)解[15?17]。
為評(píng)價(jià)預(yù)測(cè)模型精度,選取均方根誤差(RMSE)、決定系數(shù)(2)和平均絕對(duì)百分比誤差(MAPE)3個(gè)指標(biāo)評(píng)價(jià)模型精度。各誤差指標(biāo)的計(jì)算公式如下:
建模步驟為:利用CEEMDAN分解原始數(shù)據(jù);利用主成分分析法分別對(duì)原始數(shù)據(jù)的12個(gè)輸入特征和CEEMDAN分解后的100個(gè)輸入特征進(jìn)行降維,得到處理后數(shù)據(jù);把處理后數(shù)據(jù)作為BPNN輸入,日電耗作為輸出,建立預(yù)測(cè)模型,并設(shè)定一個(gè)BPNN的隱含層神經(jīng)元數(shù)和初始學(xué)習(xí)速率;設(shè)定模型測(cè)試集2作為適應(yīng)度函數(shù);執(zhí)行IPSO算法得到BPNN的最優(yōu)隱含層神經(jīng)元數(shù)和最優(yōu)初始學(xué)習(xí)速率;得到精度最高的BPNN預(yù)測(cè)模型;利用該模型預(yù)測(cè)管道運(yùn)行電耗;利用2.6節(jié)介紹的3個(gè)誤差指標(biāo)評(píng)價(jià)模型精度。具體流程如圖2所示。
本研究共建立8個(gè)電耗預(yù)測(cè)模型進(jìn)行對(duì)比分析。使用相同訓(xùn)練數(shù)據(jù)建模,再利用IPSO等不同搜索算法調(diào)節(jié)模型結(jié)構(gòu),驗(yàn)證IPSO算法搜索神經(jīng)網(wǎng)絡(luò)參數(shù)的效果優(yōu)于其他搜索算法;使用CEEMDAN分解的數(shù)據(jù)建模,再利用IPSO調(diào)節(jié)模型參數(shù),驗(yàn)證CEEMDAN確實(shí)能夠提升模型預(yù)測(cè)精度。
圖2 神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練流程圖
表1展示了不同數(shù)量的主成分與方差累計(jì)貢獻(xiàn)率的計(jì)算結(jié)果。由于特征數(shù)量多,只展示部分?jǐn)?shù)據(jù)。由表1可知,未分解數(shù)據(jù)集降至9維時(shí),方差累計(jì)貢獻(xiàn)率首次超過(guò)99%;CEEMDAN分解后的數(shù)據(jù)集降至52維時(shí),方差累計(jì)貢獻(xiàn)率首次超過(guò)99%。因此,本研究最終將兩組數(shù)據(jù)分別降至9維和52維。
表1 主成分?jǐn)?shù)量及累計(jì)貢獻(xiàn)率
CEEMDAN?IPSO?BPNN模型在進(jìn)行不同次數(shù)的重復(fù)實(shí)驗(yàn)時(shí)將測(cè)試集MAPE均值做成折線圖,結(jié)果如圖3所示。分析圖3發(fā)現(xiàn),當(dāng)每組重復(fù)實(shí)驗(yàn)15~30次時(shí),MAPE穩(wěn)定在5.4%左右。因此,保守地認(rèn)為30次重復(fù)實(shí)驗(yàn)已足夠。
圖3 MAPE折線圖
表2展示了所有電耗預(yù)測(cè)模型的MAPE、2和RMSE。
表2 預(yù)測(cè)模型的誤差統(tǒng)計(jì)
表3 CEEMDAN?IPSO?BPNN模型參數(shù)
統(tǒng)計(jì)部分模型的預(yù)測(cè)值與測(cè)試集真實(shí)值的對(duì)比結(jié)果如圖4所示。由圖4可知,CEEMDAN?IPSO?BPNN模型的預(yù)測(cè)結(jié)果在頭部和尾部與真實(shí)數(shù)據(jù)幾乎一致,中間部分112組數(shù)據(jù)波動(dòng)幅度相對(duì)較小,97%的數(shù)據(jù)處于10%誤差帶內(nèi),與真實(shí)值數(shù)據(jù)偏差很小,說(shuō)明CEEMDAN?IPSO?BPNN能夠?qū)崿F(xiàn)日電耗的精確預(yù)測(cè)。
圖4 真實(shí)值與預(yù)測(cè)值對(duì)比
將IPSO?BPNN與BPNN、PSO?BPNN、GSA?BPNN、GA?BPNN、SA?BPNN進(jìn)行對(duì)比,不但說(shuō)明搜索算法調(diào)節(jié)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的必要性,而且說(shuō)明改進(jìn)粒子群算法(IPSO)能夠更好地提升模型預(yù)測(cè)精度。對(duì)比CEEMDAN?IPSO?BPNN、CEEMDAN?PSO?BPNN、IPSO?BPNN和PSO?BPNN發(fā)現(xiàn),CEEMDAN與多種搜索算法組合時(shí)均能提升模型精度,說(shuō)明利用CEEMDAN分解輸入特征以提升模型精度的方法是可行的。
(1)提出了一種基于自適應(yīng)噪聲的完備集成經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)、改進(jìn)粒子群算法(IPSO)和BPNN的混合管道日電耗預(yù)測(cè)模型。該模型實(shí)現(xiàn)了對(duì)該管道日電耗的準(zhǔn)確預(yù)測(cè),預(yù)測(cè)精度高于其余對(duì)比模型的精度。
[1] 吳倩. 原油管道運(yùn)行能耗統(tǒng)計(jì)分析與預(yù)測(cè)[D].北京:中國(guó)石油大學(xué)(北京),2012.
[2] Zeng C L,Wu C C,Zuo L L,et al.Predicting energy consumption of multiproduct pipeline using artificial neural networks[J].Energy,2014,66:791?798.
[3] 王立志,慕曉冬,劉宏嵐.采用改進(jìn)粒子群優(yōu)化的SVM方法實(shí)現(xiàn)中文文本情感分類[J].計(jì)算機(jī)科學(xué),2020,47(1):231?236.
Wang L Z,Mu X D,Liu H L.Using SVM method optimized by improved particle swarm optimization to analyze emotion of Chinese text[J].Computer Science,2020,47(1):231?236.
[4] 陶文華,袁正波.焦炭質(zhì)量的DE?BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型研究[J].系統(tǒng)仿真學(xué)報(bào),2018,30(5):1650?1656.
Tao W H,Yuan Z B.Prediction model of coke quality based on DE?BP neural network[J].Journal of System Simulation,2018,30(5):1650?1656.
[5] 唐承娥.基于交變粒子群BP網(wǎng)絡(luò)的電力系統(tǒng)短期負(fù)荷預(yù)測(cè)[J].計(jì)算機(jī)科學(xué),2017,44(11A):133?135.
Tang C E.Short?term load forecasting of power system based on alternating particle swarm BP network[J].Computer Science,2017,44(11A):133?135.
[6] Eseve A T,Zhang J,Zheng D.Short?term photovoltaic solar power forecasting using a hybrid Wavelet?PSO?SVM model based on SCADA and meteorological information[J].Renewable Energy,2018,118:357?367.
[7] Zhang F,Deb C,Lee S E,et al.Time series forecasting for building energy consumption using weighted support vector regression with differential evolution optimization technique[J].Energy and Buildings,2016,126(2):94?103.
[8] 呂楠,姚平喜.基于BP神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷[J].煤礦機(jī)械,2020,41(8):172?173.
Lü N,Yao P X.Fault diagnosis of rolling bearing based on BP neural network[J].Coal Mine Machinery,2020,41(8):172?173.
[9] 黃軍,孟凡順,張旭,等.基于PCA的遺傳神經(jīng)網(wǎng)絡(luò)在套損預(yù)測(cè)中的應(yīng)用[J].西安石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,33(6):84?89.
Huang J,Meng F S,Zhang X,et al.Application of genetic neural network based on PCA in prediction of casing damage[J].Journal of Xi'an Shiyou University(Natural Science Edition),2018,33(6):84?89.
[10] Rabi J,Balusamy T,Jawahar R R.Analysis of vibration signal responses on pre induced tunnel defects in friction stir welding using wavelet transform and empirical mode decomposition[J].Defence Technology,2019,15(6):885?896.
[11] Wang L M,Shao Y M.Fault feature extraction of rotating machinery using a reweighted complete ensemble empirical mode decomposition with adaptive noise and demodulation analysis[J].Mechanical Systems and Signal Processing,2020,138:106545.
[12] Zhang W,Qu Z,Zhang K,et al.A combined model based on CEEMDAN and modified flower pollination algorithm for wind speed forecasting[J].Energy Conversion and Management,2017,136(1):439?451.
[13] 鄭偉博.粒子群優(yōu)化算法的改進(jìn)及其應(yīng)用研究[D].青島:青島大學(xué),2016.
[14] Li J,Li Q.Medium term electricity load forecasting based on CEEMDAN?permutation entropy and ESN with leaky integrator neurons[J].Electric Machines and Control,2015,19(8):70?80.
[15] 周闖,孫鐵,張素香.AHP?模糊數(shù)學(xué)的風(fēng)機(jī)機(jī)組與管網(wǎng)系統(tǒng)能耗評(píng)價(jià)[J].遼寧石油化工大學(xué)學(xué)報(bào),2019,39(3):64?69.
Zhou C,Sun T,Zhang S X.Energy consumption evaluation method of bower unit basedon AHP?fuzzy mathematics[J].Journal of Liaoning Shihua University,2019,39(3):64?69.
[16] 侯磊,許新裕,崔金山,等.基于BP神經(jīng)網(wǎng)絡(luò)的輸油管道能耗預(yù)測(cè)方法[J].節(jié)能技術(shù),2009,27(5):401?406.
Hou L,Xu X Y,Cui J S,et al.A prediction method of energy consumption for oil pipeline based on BP neural network[J].Energy Conservation Technology,2009,27(5):401?407.
[17] 華東陽(yáng),王壽喜,郭喬,等.基于粒子群算法的液體管道仿真模型參數(shù)校正方法[J].油氣儲(chǔ)運(yùn),2020,39(12):1386?1393.
Hua D R,Wang S X,Guo Q,et al.Correction method for parameters of liquid pipeline simulation model based on particle swarm optimization algorithm[J].Oil & Gas Storage and Transportation,2020,39(12):1386?1393.
Power Consumption Prediction Method for Crude Oil Pipeline Based on Hybrid BP Neural Network
Li Yu1,2, Hou Lei1,2, Xu Lei1,2, Bai Xiaozhong3, Liu Jinhai3, Sun Xin3, Gu Wenyuan3
(1.MOE Key Laboratory of Petroleum Engineering,China University of Petroleum(Beijing),Beijing 102200,China;2.Oil & Gas Control Center,National Petroleum and Natural Gas Pipeline Network Group Co. Ltd.,Beijing 102200,China;3.Jinzhou Oil and Gas Transmission Branch of National Pipe Network Group North Pipeline Co. Ltd.,Jinzhou Liaoning 121000,China)
Accurately predicting the power consumption of crude oil pipelines is conducive to controlling the energy consumption level of such pipelines and fully tapping the energy saving potential of crude oil pipeline transportation systems. Actual operation data of such pipelines have the characteristics of large fluctuation range serious noise interference, and information redundancy, which affect the accurate prediction of pipeline power consumption. To solve these problems, this paper proposes a power consumption prediction model based on a hybrid neural network. The daily operation data of crude oil pipelines are decomposed by complete ensemble empirical mode decomposition with adaptive noise. Principal component analysis is performed to reduce the dimensions of the decomposed data. The improved particle swarm optimization algorithm is applied to adjust the structural parameters of the neural network. The proposed model is applied to predict the power consumption of a crude oil pipeline and compared with some common prediction models. The results show that the decomposition algorithm can improve the prediction accuracy of the model. The hybrid neural network model has the highest prediction accuracy. The average absolute error of the test set is 5.394%, which is 39.200% lower than that before the decomposition algorithm is used.
Crude oil pipeline; Power consumption prediction; Artificial neural network; Improved particleswarm optimization algorithm
TE832
A
10.3969/j.issn.1006?396X.2022.02.011
1006?396X(2022)02?0068?06
2020?12?14
2021?03?15
國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2016YFC0802100)。
李雨(1996?),男,碩士研究生,從事油氣管道輸送技術(shù)方面研究;E?mail:825481000@qq.com。
侯磊(1966?),男,博士,教授,博士生導(dǎo)師,從事油氣儲(chǔ)運(yùn)工程技術(shù)方面研究;E?mail:houleicup@126.com。
(編輯 王戩麗)