林煒國 (大慶油田有限責(zé)任公司中油電能基建管理中心)
隨著我國國民經(jīng)濟的發(fā)展,原油、成品油管道的建設(shè)迎來了高峰期。我國原油具有高含蠟、高黏度、高凝點的物性,直接進行管輸其水力摩阻非常大,因此采用加壓、加熱的輸送方式,其目的是提高原油溫度、降低黏度,克服流動過程中的高程損失和沿程摩阻[1-2]。我國每年輸油管道電耗約占總運行成本的1/2 以上,因此運行電耗的管理水平直接關(guān)系管道的經(jīng)濟效益[3]。
目前,有關(guān)管道能耗的預(yù)測方法有工藝計算法和統(tǒng)計預(yù)測法[4-6],前者多通過現(xiàn)場監(jiān)測數(shù)據(jù),利用Pipesim、OLGA、SPS 等商業(yè)模擬軟件,實現(xiàn)電耗的核算,但管道電耗受多種因素影響,針對現(xiàn)有的自動化水平,很多參數(shù)的選取并不科學(xué);后者通過收集和挖掘管道多年的歷史數(shù)據(jù),在近似模型的基礎(chǔ)上實現(xiàn)電耗預(yù)測,但對樣本質(zhì)量要求較高,當樣本數(shù)量較少時容易出現(xiàn)過擬合。此外,每條輸油管道的運行狀況不同,受地勢起伏、站間距離、站內(nèi)工藝和管理水平的影響,不同因素影響管道電耗的程度也有所不同,故還需對輸入變量實施特征選擇,以反映變量間的非線性關(guān)系[7]?;诖?,以某油田兩條輸油管道為例,在收集原始數(shù)據(jù)的基礎(chǔ)上,根據(jù)水力學(xué)原理對變量進行擴充,結(jié)合K近鄰互信息估計和支持向量機(SVM)實現(xiàn)小樣本信息的回歸預(yù)測。研究結(jié)果可為原油生產(chǎn)和節(jié)能開泵方案的制定提供理論依據(jù)。
數(shù)據(jù)來源于某油田兩條輸油管道,管道A 投產(chǎn)于2014 年,管徑為323.9 mm×7.1 mm,長度為21.66 km,設(shè)計輸量為330×104t/a,實際輸量為215×104t/a; 管道B 投產(chǎn)于2012 年, 管徑為219 mm×6 mm,長度為11.55 km,設(shè)計輸量為72×104t/a,實際輸量為43.9×104t/a。因老油田原油產(chǎn)量降低,現(xiàn)兩條管道的負荷率均不足70%。
每條管道的運行報表共有125 組數(shù)據(jù),包括管道運行、油品物性、站場特性和環(huán)境特性等方面的信息,管道特征信息見表1。根據(jù)達西公式,水力摩阻系數(shù)與雷諾數(shù)Re和管壁相對當量粗糙度ε 有關(guān),不同流態(tài)區(qū)對應(yīng)的Re有所不同。根據(jù)蘇霍夫公式,總傳熱系數(shù)K和參數(shù)a與管道沿線的熱損失相關(guān),摩阻損失與熱損失之間是相互關(guān)聯(lián)的,一般油溫越高,黏度越低,摩阻損失越小,動能損失和電能消耗越小,而熱能消耗就大[8-9]。最終,共得到29 個輸入特征,按照4∶1 的比例抽取訓(xùn)練集和測試集,采用分層抽樣替代簡單的隨機抽樣,避免抽樣誤差和樣本不均衡的現(xiàn)象。計算公式為:
表1 管道特征信息Tab.1 Pipeline characteristic information
式中:Re為雷諾數(shù);ρ為油品密度,kg/m3;v為流速,m/s;d為管道內(nèi)徑,m;μ為動力黏度,Pa·s;K為總傳熱系數(shù),W/(m2·℃);G為油品質(zhì)量流量,kg/s;c為油品比熱容,J/(kg·℃);D為管道外徑,m;L為熱油管道輸送距離,m;TR、TZ分別為出站溫度和進站溫度,℃;T0為地溫,℃。
對于上述篩選的29 個特征,不同特征間具有明顯的非線性特征,如日輸量增加,會增大泵輸出功率,導(dǎo)致出站壓力和下站進壓增大,泵機組供能偏大;進出站溫度變化會影響油品的黏度和密度,進而影響水力摩阻系數(shù)和日耗電??紤]到皮爾遜相關(guān)系數(shù)需滿足數(shù)據(jù)正態(tài)性和線性相關(guān)的條件,故在此采用K近鄰互信息估計對變量進行特征選擇。
設(shè)數(shù)據(jù)集為D={X1,X2,X3,…X29} ,每個特征下的數(shù)據(jù)量為Xi={xi1,xi2,xi3,…xi125} ,管道日耗電定為Y,將特征Xi和Y組成一個向量空間,此時Zij為特征Xi和Y之間的點,通過X和Y方向上的最大歐式距離作為最近鄰的標準,某點Z與其他點Z′的距離為:
在定義了K值后,將Zij到最近K個鄰居的距離記為ε(i,j) ,投影到X和Y方向上,統(tǒng)計出距離小于ε(i,j)的點個數(shù),分別記為nX和nY,隨后利用下式得到特征Xi和Y的互信息值:
式中:N為隨機點的個數(shù);ψ為伽馬函數(shù)?;バ畔⒅翟酱螅卣鏖g的相關(guān)性就越強。
由此計算不同K值下的互信息值,見表2。雖然K值差異帶來了分類結(jié)果和泛化性能的不一致,但兩條管道在前6 個特征的排名基本固定,依次為日輸量、雷諾數(shù)、進出站壓差、出站壓力、進站壓力、進出站溫差等。以A 管道為例,對比不同特征與日耗電之間的關(guān)系,繪制散點圖見圖1。
圖1 不同特征與日耗電的散點圖Fig.1 Scatter plot of different characteristics and daily power consumption
表2 不同K 值下的互信息值Tab.2 Mutual information values under different K values
日輸量的變化會影響泵的揚程和效率,進而影響管道日耗電,現(xiàn)場人員通常根據(jù)日耗電制定月度和季度輸送計劃,從而獲知油品輸量。日耗電與衡量流動狀態(tài)的雷諾數(shù)相關(guān)性較強,而與衡量傳熱能力的總傳熱系數(shù)、參數(shù)a值的相關(guān)性較小,說明決定管道電耗水平的主控因素是原油流動狀態(tài)。根據(jù)達西公式,雷諾數(shù)與水力摩阻系數(shù)呈負相關(guān),而水力摩阻系數(shù)與日耗電呈負相關(guān),故雷諾數(shù)與日耗電呈正相關(guān),兩者均受介質(zhì)流速的影響。進出站壓差的重要性強于出站壓力和進站壓力,說明離心泵提供的壓能越大,日耗電越多,單一參數(shù)具有隨機性,相關(guān)性較弱。進出站溫差只與加熱爐的熱效率、節(jié)流損失率、過量空氣系數(shù)和排煙溫度等有關(guān),其最高加熱溫度不能超過原油初餾點,且管輸過程中油品物性變化很小,不能決定管道運行電耗[10-12]。此外,油品物性和環(huán)境特性與日耗電的相關(guān)性均較弱,這是由于日耗電通過日報表數(shù)據(jù)統(tǒng)計,可以反映當日特征波動的信息有限,且溫度特征不能直接反映管道電耗水平。
綜上,K近鄰互信息估計不僅可以實現(xiàn)特征選擇和數(shù)據(jù)降維,還能通過特征間的變化反映運行電耗變化情況。
SVM 模型通過非線性映射將所有數(shù)據(jù)轉(zhuǎn)化至高維空間,在有限的數(shù)據(jù)樣本中尋找輸入變量和輸出變量之間的交叉復(fù)雜關(guān)系,以獲得最好的預(yù)測精度?;貧w公式為:
式中:Y為樣本預(yù)測值;αi、為拉格朗日乘子;K為核函數(shù);m,mi分別為樣本的輸入變量和第i個輸入變量;b為偏置。
針對兩條輸油管道建立8 個預(yù)測模型,將表2中與日耗電相關(guān)性較強的特征依次遞增作為SVM 的輸入變量,將日耗電作為輸出變量,形成1#~6#模型;將未進行特征選擇的29 個原始特征作為SVM的輸入變量,形成7#模型;將通過皮爾遜相關(guān)系數(shù)進行特征選擇的前7 個特征作為SVM 的輸入變量,形成8#模型。通過網(wǎng)格搜索和窮舉法確認SVM 模型中的懲罰參數(shù)和不敏感損失參數(shù),隱含層固定為1層,節(jié)點數(shù)固定為3。不同模型的輸入特征子集見表3,不同模型的預(yù)測誤差見表4。
表3 不同模型的輸入特征子集Tab.3 Input feature subsets of different models
表4 不同模型的預(yù)測誤差Tab.4 Prediction errors of different models
采用平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)和決定系數(shù)(R2)來衡量模型的精度和泛化能力。其中,1#模型的預(yù)測效果較差,雖然從散點圖中可知日輸量與日耗電的相關(guān)性較大,但單一特征并不能完全反映日耗電變化的非平穩(wěn)特性,這也說明了輸油管道電耗影響因素的復(fù)雜性。從1#~8#模型預(yù)測結(jié)果可知:平均絕對百誤差和均方根誤差數(shù)值先降低后升高,預(yù)測準確度先升高后降低,管道A 和管道B 分別在輸入特征數(shù)5 和4 時的預(yù)測效果最好,這說明了不同輸油管道的運行狀態(tài)不一致,特征變量的選取上有差異,同時后加入的特征與電耗的相關(guān)性較弱,導(dǎo)致干擾信息對結(jié)果的影響逐漸減少。7#模型將所有的特征作為輸入變量,其預(yù)測效果甚至劣于只考慮單一“日輸量”特征時的預(yù)測效果,進一步說明了特征選擇和聚合的重要性。對比8#模型與其余模型可知,皮爾遜相關(guān)系數(shù)的特征篩選結(jié)果并不可靠,該相關(guān)系數(shù)更適合做線性相關(guān)的數(shù)據(jù)分析,且篩選結(jié)果中包含了多種熱力學(xué)參數(shù),溫度變化對日耗電的影響有限。
不同模型的相對誤差箱線圖見圖2,該圖可反映不同模型誤差的分布情況。從圖2 可以看出,管道A 和管道B 分布在5#模型和4#模型上的相對誤差范圍最小,模型的泛化能力最強。
圖2 不同模型的相對誤差箱線圖Fig.2 Box plots of relative errors of different models
利用上述電耗預(yù)測方法,在管道月運行電耗預(yù)測的基礎(chǔ)上,對管道首站的開泵方案(主要為調(diào)轉(zhuǎn)速和葉輪切割)進行調(diào)整。以管道A 為例,首站共有DY25-30×4 型離心泵4 臺,DYT30-50×6 型離心泵3 臺,常規(guī)方案是將流量區(qū)間分為4 個,隨著管輸流量的增加,逐級啟動泵;對啟停泵+調(diào)速+改變?nèi)~輪直徑的方案進行能耗優(yōu)化。雖然流量區(qū)間未發(fā)生改變,但受變頻調(diào)速和葉輪直徑的影響,各泵流量均在性能曲線的范圍內(nèi)變化,分配流量隨輸量的變化也在不斷變化,啟停泵的臺數(shù)和方案越來越多,DY25-30×4 型離心泵雖然揚程和功率較小,但該泵的利用率較高,首站的設(shè)備負荷率有所提升。以管道A 在4 800~5 000 t/d 的流量區(qū)間為例,雖然優(yōu)化后開泵數(shù)、開泵型號和葉輪直徑?jīng)]有改變,但轉(zhuǎn)速升高可提高泵的功率區(qū)間和可輸送流量區(qū)間,進而提高泵的能量利用率,降低電耗;以管道B 在1 000~1 400 t/d 的流量區(qū)間為例,雖然優(yōu)化后開泵數(shù)、開泵型號和轉(zhuǎn)速沒有改變,但葉輪直徑增大可提高泵功率,同時對揚程的影響不大,可綜合提高泵效。依次類推,兩條管道的開泵方案優(yōu)化效果對比見表5。管道A 每月可節(jié)約電耗0.26×104~0.67×104kWh,管道B 每月可節(jié)約電耗0.14×104kWh。今后可在該文模型的基礎(chǔ)上對管道運行電耗進行預(yù)測,優(yōu)先替換淘汰型電動機(見工信部關(guān)于[高耗能落后機電設(shè)備(產(chǎn)品)淘汰目錄(第三批)]中所列設(shè)備),對于不符合GB18613—2020《電動機能效限定值及能效等級》標準中能效限定值要求,建議更換電動機;同時對比可實施的開泵方案,盡量將泵的流量和揚程控制在銘牌標注的范圍內(nèi),調(diào)整轉(zhuǎn)速和葉輪直徑,保證泵機組在最高效率點運轉(zhuǎn),獲得最大的節(jié)能效果。
表5 開泵方案優(yōu)化效果對比Tab.5 Comparison of optimization results of opening pump schemes
1)通過整理和收集管道運行、油品物性、站場特性、環(huán)境特性等方面的信息,結(jié)合水力學(xué)原理對變量進行擴充,共得到29 個與管道電耗相關(guān)的特征,包括雷諾數(shù)、總傳熱系數(shù)和參數(shù)a等變量。
2)通過互信息值分析,得到日輸量、進出站壓差、雷諾數(shù)等因素對電耗的影響較大,其中日輸量、雷諾數(shù)、進出站壓差、出站壓力、進出站溫差與電耗呈正相關(guān),進站壓力與電耗呈負相關(guān)。
3) 采用SVM 模型對管道日耗電進行長期預(yù)測,預(yù)測結(jié)果的相對誤差范圍最小,模型的泛化能力較強,可結(jié)合預(yù)測結(jié)果制定現(xiàn)場計劃耗電量,完成對開泵數(shù)、轉(zhuǎn)速及葉輪直徑等參數(shù)的優(yōu)化,節(jié)電效果顯著。