邵必林,劉 通,饒 媛
(西安建筑科技大學(xué) 管理學(xué)院,陜西 西安 710055)
隨著中國城市化進(jìn)程加快,我國能源面臨匱乏問題,環(huán)境與資源代價高昂。煤炭、石油等傳統(tǒng)能源一方面因過度開采而儲存量越來越少,另一方面也給環(huán)境帶來了巨大污染,因此發(fā)展低碳經(jīng)濟(jì)、開發(fā)清潔能源、減少大氣排放成為長遠(yuǎn)發(fā)展的必然要求。天然氣作為一種清潔能源,因其排放的溫室氣體較低,并且沒有硫化物等污染物排放而逐漸受到關(guān)注。2020 年,我國天然氣產(chǎn)量為1 925 億立方米,同比增長9.8%,天然氣探明新增地質(zhì)儲量1.29 萬億立方米,我國天然氣能源儲量豐富。但是隨著天然氣使用的逐漸普及,許多城市已出現(xiàn)天然氣供求矛盾,“氣荒”問題日益嚴(yán)重。因此,合理把握天然氣用戶用氣規(guī)律,分析影響用戶需求的各種因素,對天然氣負(fù)荷值進(jìn)行預(yù)測是當(dāng)前亟待解決的問題。
通過對國內(nèi)外文獻(xiàn)進(jìn)行梳理發(fā)現(xiàn),現(xiàn)有天然氣負(fù)荷預(yù)測模型主要分為單一模型和組合預(yù)測模型兩種。單一模型的天然氣負(fù)荷預(yù)測主要分為兩個階段,第一階段主要是通過傳統(tǒng)數(shù)理統(tǒng)計(jì)、相關(guān)性分析和回歸分析進(jìn)行預(yù)測分析。Sarak等[1]將度日法應(yīng)用于天然氣負(fù)荷預(yù)測,將城市的度日、人口和居民分布記錄用來估計(jì)全國范圍的天然氣需求,結(jié)果表明,該種方法能夠定位能源需求分布。Ding[2]設(shè)計(jì)一種自適應(yīng)灰色預(yù)測模型,對比于傳統(tǒng)灰色模型,改進(jìn)模型的擬合性能和預(yù)測性能優(yōu)于原始模型。Ying 等[3]在自回歸模型中加入外生變量,提高了模型計(jì)算效率。第二階段是在人工智能、大數(shù)據(jù)、機(jī)器學(xué)習(xí)背景下,使用群智能算法、機(jī)器學(xué)習(xí)算法等進(jìn)行預(yù)測分析。2012 年,Demirel[4]運(yùn)用多元回歸模型、ARMAX 模型和BP 神經(jīng)網(wǎng)絡(luò)對天然氣負(fù)荷進(jìn)行預(yù)測,通過預(yù)測結(jié)果比較發(fā)現(xiàn),相較于ARMAX 和多元線性模型而言,BP 神經(jīng)網(wǎng)絡(luò)預(yù)測效果更好。Kodogiannis 等[5]用乘法小波神經(jīng)網(wǎng)絡(luò)代替模糊規(guī)則的THEN 部分,提出一種新型的神經(jīng)網(wǎng)絡(luò)模型,通過與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,本文提出的負(fù)荷預(yù)測模型具有更高的準(zhǔn)確性。Szoplik[6]、Laib[7]、Taspinar[8]對多層神經(jīng)網(wǎng)絡(luò)進(jìn)行設(shè)計(jì)和訓(xùn)練,比較了使用多層神經(jīng)網(wǎng)絡(luò)模型在隱層神經(jīng)元數(shù)量和訓(xùn)練過程中使用的數(shù)據(jù)集大小方面的預(yù)測結(jié)果,實(shí)驗(yàn)證明,該模型可用于任何情況。郭琳[9]對比分析了LSTM 模型、GM 模型、SVM 模型和BP 神經(jīng)網(wǎng)絡(luò)對燃?xì)庳?fù)荷預(yù)測的效果,結(jié)果證明LSTM 模型在燃?xì)庳?fù)荷預(yù)測領(lǐng)域優(yōu)于其他3 個模型。王晨[10]對比分析了PCA-WNN 模型與BP 神經(jīng)網(wǎng)絡(luò)、灰色預(yù)測模型、廣義回歸模型預(yù)測效果,最終確定PCA-WNN 模型在精確性和運(yùn)算速度上具有優(yōu)勢。舒漫[11]建立基于XGBoost 算法的成都市城市燃?xì)馊肇?fù)荷及季度負(fù)荷預(yù)測模型,首次將XGBoost 算法應(yīng)用于燃?xì)庳?fù)荷領(lǐng)域。何恒根[12]針對BP 神經(jīng)網(wǎng)絡(luò)預(yù)測時間長的缺點(diǎn),采用主成分分析法進(jìn)行數(shù)據(jù)降維,減少BP 神經(jīng)網(wǎng)絡(luò)預(yù)測時間。黃維[13]在深度信念神經(jīng)網(wǎng)絡(luò)中添加了自適應(yīng)學(xué)習(xí)率,補(bǔ)足了傳統(tǒng)的DBN 在預(yù)訓(xùn)練和調(diào)優(yōu)過程中注重調(diào)節(jié)w和b的值,忽視學(xué)習(xí)率的缺點(diǎn)。
組合預(yù)測法一般分為橫向和縱向兩種:橫向是將數(shù)據(jù)分解,使用不同的方法分別預(yù)測,最后相加;縱向是將前一種模型的預(yù)測結(jié)果當(dāng)作數(shù)據(jù)集,輸入后面的模型進(jìn)行訓(xùn)練和預(yù)測。組合模型法可以將多種模型的優(yōu)點(diǎn)集合起來,缺點(diǎn)是預(yù)測時間長、模型建立復(fù)雜度高。Sánchez-úbeda等[14]提出一種分解組合模型,該方法結(jié)合了預(yù)測模型的簡單表示,使專家能夠綜合判斷分析和統(tǒng)計(jì)預(yù)測調(diào)整情況,具有較高的計(jì)算效率和準(zhǔn)確性。Forouzanfar 等[15]將Logistic 方法與自然語言處理和遺傳算法結(jié)合,實(shí)驗(yàn)結(jié)果證明了Logistic 函數(shù)可以應(yīng)用于天然氣預(yù)測領(lǐng)域。Liu 等[16]提出一種基于多小波變換和多神經(jīng)網(wǎng)絡(luò)的短期負(fù)荷預(yù)測方法。仿真結(jié)果表明,組合的負(fù)荷預(yù)測模型精度高于任何一個單一的網(wǎng)絡(luò)模型和未經(jīng)多小波變換預(yù)處理的3 種神經(jīng)網(wǎng)絡(luò)組合預(yù)測模型。Zhu 等[17]提出一種基于SVR 的支持向量回歸局部預(yù)測方法和FNF-SVRLP 局部預(yù)測方法,對天然氣短期需求進(jìn)行預(yù)測,與單一模型相比,該模型具有更高的預(yù)測精度。Zhang[18]提出一種貝葉斯模型平均組合預(yù)測天然氣消費(fèi)量的方法,其能夠有效地處理模型結(jié)構(gòu)和參數(shù)的不確定性,提高預(yù)測精度。Wang 等[19]將非線性模型與線性模型相結(jié)合,建立了自回歸綜合移動平均模型,有效地融合了線性模型和非線性模型的優(yōu)點(diǎn),提高了預(yù)測性能。劉媛華[20]將BP 神經(jīng)網(wǎng)絡(luò)和SVR 兩種方法加以組合并對空氣質(zhì)量指數(shù)進(jìn)行預(yù)測,實(shí)驗(yàn)證明,該模型泛化能力更強(qiáng)。朱青等[21]將LSTM 和XGBoost 兩種模型進(jìn)行組合,實(shí)驗(yàn)結(jié)果表明組合模型的RMSE 低于3種單一模型。
以上方法沒有考慮不同階段的天然氣負(fù)荷值變化規(guī)律,以及未提出精確度更高的預(yù)測模型。針對該問題,本文采用RVM 模型與GRNN 模型組合的形式進(jìn)行不同階段的天然氣負(fù)荷預(yù)測。相關(guān)向量機(jī)模型(RVM)對天然氣負(fù)荷數(shù)據(jù)線性部分具有良好的分析能力。廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)能夠很好地適應(yīng)非線性映射,具有不容易過擬合、泛化錯誤率低、結(jié)果易解釋的優(yōu)勢。
相關(guān)向量機(jī)(Relevance Vector Machine,RVM)是由Tipping[22]在2001 年提出的機(jī)器學(xué)習(xí)算法,該模型基于貝葉斯框架指導(dǎo),保留相關(guān)向量點(diǎn)。貝葉斯理論是在先驗(yàn)概率約束條件下,經(jīng)過自身相關(guān)運(yùn)算去除沒有關(guān)系的點(diǎn),最后獲得一個稀疏化模型。相關(guān)向量機(jī)模型在對數(shù)據(jù)進(jìn)行訓(xùn)練預(yù)測的過程中,許多參數(shù)的后驗(yàn)概率值會逐漸接近于零,而這些數(shù)據(jù)實(shí)際上與天然氣負(fù)荷預(yù)測沒有關(guān)系,僅有較少數(shù)量的數(shù)據(jù)點(diǎn)即相關(guān)向量參數(shù)的后驗(yàn)概率非零,對模型預(yù)測起關(guān)鍵作用,原理如式(1)所示。其中,z為目標(biāo)變量,x為輸入數(shù)據(jù),λ為權(quán)值,θ為數(shù)據(jù)噪聲精度,值為σ-2。
其中,y(x)為均值,由線性模型給出,模型如式(2)所示。其中,k(x,xn)為核函數(shù),b為偏置參數(shù)。
在相關(guān)向量機(jī)中,若對輸入向量進(jìn)行N 次檢測,與之對應(yīng)的目標(biāo)值為z=(z1,z2,…zN)T,其似然函數(shù)為如(3)所示。
對零均值以下的高斯先驗(yàn)而言,由于線性模型與相關(guān)向量機(jī)的先驗(yàn)概率部分相似,故需加以考慮,權(quán)參數(shù)向量λ先驗(yàn)函數(shù)如式(4):
式(4)中,αi是參數(shù)λi的精度值,超參矩陣為α=(α1,α2,…,αM)T。通常需對α進(jìn)行賦值,這也意味著每個參數(shù)精度的初始值相同。超參數(shù)矩陣與相對應(yīng)的權(quán)參數(shù)后驗(yàn)概率值成反比關(guān)系,即超參數(shù)矩陣增大時,后驗(yàn)概率值便會不斷減小,當(dāng)其后驗(yàn)概率越小,與它有關(guān)的函數(shù)預(yù)測作用率也越低,需將其刪掉,因而新的概率檢驗(yàn)?zāi)P蜁尸F(xiàn)出稀疏化的形式。
經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn),將相關(guān)向量機(jī)模型與線性模型結(jié)合,其權(quán)值參數(shù)后驗(yàn)概率分布仍符合高斯分布,結(jié)果如式(5)所示。其中,μ為均值,∑為方差。
對于α、θ的最優(yōu)值,可以使用第二類最大似然方法進(jìn)行確定。該方法是將邊緣似然函數(shù)進(jìn)行最大化得到,邊緣似然最大化如式(6)所示,其中,z=(z1,z2,…zN)T。
通過對上式進(jìn)行對數(shù)求導(dǎo)可實(shí)現(xiàn)目標(biāo)最大化,從而求出超參數(shù)α、θ最優(yōu)解,求解結(jié)果如式(7)所示。其中,μi為均值μ的第i個向量分量,δi=1 -為協(xié)方差矩陣對應(yīng)的第i個元素。
廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regresion Neural Network,GRNN)是由Specht[23]于1991 年提出的一種新型網(wǎng)絡(luò)結(jié)構(gòu)。對比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),廣義回歸神經(jīng)網(wǎng)絡(luò)采用最大概率原則計(jì)算神經(jīng)網(wǎng)絡(luò)輸出,因此該網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力,對非線性數(shù)據(jù)的預(yù)測優(yōu)于一般徑向基函數(shù),在樣本較多或較少時都具有很好的學(xué)習(xí)能力。
廣義回歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)有輸入層、模式層、求和層和輸出層4 種,其計(jì)算邏輯如式(8)所示。其中,X是訓(xùn)練集的輸入向量;Xi為訓(xùn)練集中第i個樣本,Xi=表示當(dāng)前樣本X與Xi間的歐式距離平方。
模式層中,第i個神經(jīng)元的輸出為X與Xi之間歐式距離平方的指數(shù)形式,如式(9)所示,其中,σ為平滑因子。
求和層由兩部分組成。其中,第一部分與輸出向量維數(shù)m對應(yīng),共有個j=1,2,…,m節(jié)點(diǎn)。第j個節(jié)點(diǎn)輸出Sj為網(wǎng)絡(luò)訓(xùn)練集中第i=1,2,…,N個樣本的輸出向量Yi=[yi1,yi2,…yim,]T中的第j個元素yij與模式層第i個神經(jīng)元輸出Pi的加權(quán)和(以yij當(dāng)作模式層中第i個神經(jīng)元Pi與求和層中第j個神經(jīng)元間的連接權(quán)值),其計(jì)算式如式(10)所示。
求和層第二部分只有1 個節(jié)點(diǎn),輸出SD為模式層各節(jié)點(diǎn)輸出Pi之和(作為輸出層各節(jié)點(diǎn)計(jì)算的公共分母項(xiàng)),其計(jì)算式如式(11)所示。
輸出層神經(jīng)元個數(shù)與輸入向量Y維數(shù)m相同,各神經(jīng)元的輸出為求和層中兩種求和結(jié)果相除,如式(12)所示。
因此,對于廣義回歸神經(jīng)網(wǎng)絡(luò)參數(shù),確定平滑因子σ的值是最重要的工作。
在天然氣負(fù)荷的諸多影響因素中,氣象條件是影響其變化的重要因素,主要包含溫度、天氣類型、濕度、降雨量等。溫度是導(dǎo)致氣象敏感負(fù)荷變化的主要因素,溫度一般分為日最高溫度、最低溫度和平均溫度。溫度一般與天然氣負(fù)荷值呈現(xiàn)負(fù)相關(guān)關(guān)系,特別是對于居民用氣而言,當(dāng)溫度較低時,取暖用氣以及外出減少、室內(nèi)活動的增加都會導(dǎo)致天然氣使用量的增大。而天氣類型的變化也會影響人們的出行,進(jìn)而影響天然氣的使用,比如當(dāng)天氣類型為晴天時,人們一般會外出,因此天然氣使用量較少,當(dāng)天氣比較惡劣時,人們會選擇在家里,天然氣使用量較大。此外,還有節(jié)假日、突發(fā)性事件、商業(yè)活動、供熱取暖用氣等因素也對天然氣負(fù)荷值有一定影響。但是過多的影響因素會導(dǎo)致預(yù)測模型構(gòu)建復(fù)雜、預(yù)測時間過長。通過對天然氣負(fù)荷影響因素進(jìn)行皮爾遜相關(guān)性分析,然后剔除掉影響因子低的因素,留下相關(guān)性高的影響因素用于訓(xùn)練,這樣既可以減少預(yù)測時間,還可以提高預(yù)測精度。皮爾遜相關(guān)性計(jì)算公式如式(13)所示。其中,Rxy表示變量x與變量y的相關(guān)性值;n為變量x、y觀測值的數(shù)量;xi表示變量x的第i個觀測值,yi表示變量y的第i個觀測值;表示變量x的平均值,表示變量y的平均值。
經(jīng)過皮爾遜相關(guān)系數(shù)法分析,各影響因素與天然氣負(fù)荷值的相關(guān)系數(shù)值如表1 所示。當(dāng)皮爾遜相關(guān)系數(shù)絕對值小于0.1 時,判斷為影響因素與天然氣負(fù)荷值相關(guān)性不強(qiáng),因此本文最終選定影響因素為最高溫度、最低溫度、歷史負(fù)荷值、風(fēng)力值。此外,近年來西安市供熱能源中天然氣所占比例越來越高,西安市集中供熱時間為11 月15 日至次年的3 月15 日。因此,本文將天然氣負(fù)荷預(yù)測分為兩部分,分別為非供熱階段預(yù)測和集中供熱階段預(yù)測。
Table 1 Pearson coefficient value of natural gas load influencing factors表1 天然氣負(fù)荷影響因素皮爾遜系數(shù)值
天然氣負(fù)荷值數(shù)據(jù)樣本的質(zhì)量和數(shù)量會對預(yù)測模型的效果產(chǎn)生很大影響。由于數(shù)據(jù)在采集過程中會出現(xiàn)各種各樣的問題,本文使用的數(shù)據(jù)處理方法主要有3 種:缺失數(shù)據(jù)補(bǔ)齊、異常數(shù)據(jù)修正和數(shù)據(jù)歸一化。缺失數(shù)據(jù)補(bǔ)齊主要是依靠樣本之間的相關(guān)性修補(bǔ)數(shù)據(jù),根據(jù)具體變量的實(shí)際分布情況采用平均值、眾數(shù)、中位數(shù)進(jìn)行修補(bǔ)。異常數(shù)據(jù)主要是受到一定隨機(jī)因素和潛在波動的影響,因此天然氣負(fù)荷值的走勢會不同于之前的數(shù)據(jù)點(diǎn),對整體負(fù)荷序列發(fā)展趨勢產(chǎn)生干擾,不利于預(yù)測。針對連續(xù)突變的異常情況,可以歷史相同日期的正常數(shù)據(jù)取平均值。未進(jìn)行歸一化時,由于特征向量中不同特征值的差異很大,會導(dǎo)致預(yù)測模型訓(xùn)練過程中梯度下降方向容易偏離,從而增加了訓(xùn)練時間并且擬合效果較差。進(jìn)行歸一化后,數(shù)據(jù)評價標(biāo)準(zhǔn)統(tǒng)一,避免了小數(shù)據(jù)值被大數(shù)據(jù)值吞食。梯度在下降過程中更為平順,會使網(wǎng)絡(luò)快速收斂,更快尋找到目標(biāo)函數(shù)的極小值。目前,常見的歸一化方法有Z-score 分?jǐn)?shù)法、最大最小歸一化方法。本文采用最大最小歸一化方法,將原始數(shù)據(jù)規(guī)范到[0,1]區(qū)間,其公式如式(14)所示。其中,X為原始天然氣負(fù)荷值數(shù)據(jù),Xmax、Xmin分別為原始負(fù)荷值數(shù)據(jù)的最大值和最小值,Xnorm為歸一化后的數(shù)據(jù)。
天然氣負(fù)荷數(shù)據(jù)具有非平穩(wěn)、周期性波動特點(diǎn),RVM和GRNN 組合模型能夠擬合數(shù)據(jù)中線性部分和非線性部分。天然氣負(fù)荷數(shù)據(jù)中線性部分由RVM 模型進(jìn)行擬合。GRNN 模型則是擬合RVM 模型殘差中的非線性部分。
令Rt為RVM 模型t 時刻的預(yù)測結(jié)果,Zt為天然氣實(shí)際值,gt為t時刻實(shí)際值與RVM 模型預(yù)測結(jié)果的差值,表示為gt=Zt-Rt。{gt}為RVM 模型所有預(yù)測差值的集合。{gt}用GRNN 模型進(jìn)行逼近,其預(yù)測結(jié)果設(shè)為Gt,則組合時間序列預(yù)測模型結(jié)果如式(15)所示。
RVM-GRNN 天然氣負(fù)荷預(yù)測模型結(jié)構(gòu)如圖1所示。
Fig.1 RVM-GRNN model structure圖1 RVM-GRNN模型結(jié)構(gòu)
具體建模步驟為:①對天然氣負(fù)荷值數(shù)據(jù)進(jìn)行預(yù)處理,修補(bǔ)缺失值和異常值,并對數(shù)據(jù)歸一化;②構(gòu)建RVM天然氣負(fù)荷預(yù)測模型,輸入訓(xùn)練集,得到預(yù)測結(jié)果Rt;③使用實(shí)際值Zt減去Rt得到殘差gt;④構(gòu)建GRNN 殘差預(yù)測模型,將殘差gt導(dǎo)入訓(xùn)練好的GRNN 模型中,進(jìn)行殘差預(yù)測,得到預(yù)測結(jié)果Gt;⑤將步驟②所得Rt和步驟④所得Gt相加則為RVM-GRNN 模型的預(yù)測結(jié)果。
為檢驗(yàn)各模型對天然氣負(fù)荷預(yù)測效果,本文選用平均絕對誤差(MAE)、均方誤差(MSE)及平均絕對誤差百分比(MAPE)3 個指標(biāo),計(jì)算公式如式(16)—式(18)所示。其中,n 為樣本數(shù)量,Zt為天然氣負(fù)荷實(shí)際值,為天然氣負(fù)荷預(yù)測值。
考慮數(shù)據(jù)完整性和可得性,以西安市某氣站2010-2015 年每日天然氣負(fù)荷值為算例,收集天然氣負(fù)荷值數(shù)據(jù)1 826 條,負(fù)荷值單位為萬m3/日。根據(jù)西安市集中供熱時間段將數(shù)據(jù)集劃分為非供熱階段和集中供熱階段,其中,非供熱階段數(shù)據(jù)1 220條,集中供熱階段數(shù)據(jù)606條。
為顯示本文所提組合模型效果,選用天然氣負(fù)荷領(lǐng)域預(yù)測常用方法BP 神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)、多元線性回歸(Multivariable Linear Regression model,MLR)和 極 限 學(xué) 習(xí) 機(jī)(Extreme Learning Machine,ELM)進(jìn)行比較。BPNN 模型是通過輸入變量對預(yù)測值進(jìn)行擬合,通過賦予輸入向量不同的權(quán)重,這種層次結(jié)構(gòu)的正向傳播過程可以得到預(yù)測誤差,之后再利用反向傳播法得到各層參數(shù)的梯度,根據(jù)梯度下降法更新參數(shù),重復(fù)這種訓(xùn)練過程使得預(yù)測誤差最小化。MLR 模型在訓(xùn)練階段計(jì)算出天然氣負(fù)荷值與影響因素之間的回歸系數(shù),再將需要進(jìn)行預(yù)測時間段的相關(guān)數(shù)據(jù)輸入,得出預(yù)測值。ELM 模型具有良好的泛化性能,比起傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型,其訓(xùn)練過程簡單、輸入權(quán)值和閾值隨機(jī)獲得、計(jì)算量小,已廣泛應(yīng)用于各種預(yù)測領(lǐng)域。
3.3.1 RVM與GRNN模型參數(shù)設(shè)置
相關(guān)向量機(jī)的預(yù)測效果受到核函數(shù)選擇和核參數(shù)設(shè)置影響,對常用核函數(shù)進(jìn)行對比分析發(fā)現(xiàn),使用柯西核函數(shù)預(yù)測效果更好,同時使用控制變量法確定核參數(shù),最終確定核寬度為5,迭代次數(shù)為30。GRNN 模型參數(shù)主要是平滑因子,本文對平滑因子使用交叉驗(yàn)證的方式進(jìn)行確定,最終設(shè)置為0.1。完成參數(shù)設(shè)置后,將本文提出的RVM-GRNN 組合模型、RVM 模型及GRNN 模型進(jìn)行對比,驗(yàn)證組合模型天然氣負(fù)荷預(yù)測的有效性。
3.3.2 非供熱階段天然氣負(fù)荷預(yù)測
非供熱階段天然氣負(fù)荷預(yù)測使用900條數(shù)據(jù)作為模型訓(xùn)練集,100 條數(shù)據(jù)作為測試集。最終預(yù)測結(jié)果及評價指標(biāo)如圖2和表2所示。
Fig.2 Comparison of prediction results of various models of natural gas load in non-heating stage圖2 非供熱階段天然氣負(fù)荷各模型預(yù)測結(jié)果比較
Table 2 Comparison of prediction and evaluation indexes of three models in non-heating stage表2 非供熱階段3種模型的預(yù)測評價指標(biāo)比較
由圖2 可知,3 種模型的預(yù)測走勢與天然氣負(fù)荷實(shí)際值大致相同,但是RVM-GRNN 組合模型比起單一的RVM和GRNN 模型而言,RVM-GRNN 組合模型的天然氣負(fù)荷預(yù)測效果更優(yōu)。為了對預(yù)測結(jié)果作進(jìn)一步分析,本文使用MAE、MSE、MAPE 3 種評價指標(biāo)進(jìn)行判斷,從表2 可以看出,組合模型的MAE、MSE、MAPE 值均小于RVM 和GRNN模型,由此可以斷定RVM-GRNN 組合模型的預(yù)測效果更優(yōu)。
為了驗(yàn)證本文RVM-GRNN 組合模型的有效性,與傳統(tǒng)常用天然氣負(fù)荷預(yù)測模型進(jìn)行比較。圖3 為傳統(tǒng)天然氣負(fù)荷預(yù)測模型與組合模型的誤差曲線比較,可以看出,組合學(xué)習(xí)方法的誤差分布點(diǎn)在零附近波動,表明其誤差較小,而傳統(tǒng)天然氣負(fù)荷預(yù)測模型誤差分布波動較大。
Fig.3 Error comparison of prediction models in non-heating stage圖3 非供熱階段各預(yù)測模型誤差比較
從表3 可以看出,傳統(tǒng)模型的評價指標(biāo)均大于組合模型,進(jìn)一步證實(shí)了組合模型的適用性,預(yù)測效果優(yōu)于傳統(tǒng)模型。
Table 3 Comparison of evaluation indexes of traditional prediction models in non-heating stage表3 非供熱階段傳統(tǒng)預(yù)測模型評價指標(biāo)比較
3.3.3 集中供熱階段天然氣負(fù)荷預(yù)測
集中供熱階段天然氣負(fù)荷預(yù)測使用500條數(shù)據(jù)作為模型訓(xùn)練集,100 條數(shù)據(jù)作為測試集,其預(yù)測結(jié)果及評價指標(biāo)如圖4和表4所示。
Fig.4 Comparison of prediction results of various models of natural gas load in heating stage圖4 供熱階段天然氣負(fù)荷各模型預(yù)測結(jié)果比較
由圖4 可以看出,在集中供熱階段,天然氣負(fù)荷值波動幅度較大,3 種模型中,GRNN 模型預(yù)測效果相對較差,有多個數(shù)據(jù)點(diǎn)的預(yù)測值偏差較大,RVM 模型和RVMGRNN 組合模型預(yù)測效果較好,預(yù)測結(jié)果與負(fù)荷值走勢相同。從表4 評價指標(biāo)可以看出,RVM-GRNN 組合模型的MAE、MSE、MAPE 均小于RVM 和GRNN 模型,因而對于供熱階段而言,組合模型優(yōu)于單一模型,也表明RVM-GRNN組合模型在供熱階段天然氣負(fù)荷預(yù)測也具有適用性。
Table 4 Comparison of prediction and evaluation indexes of three models in heating stage表4 供熱階段3種模型的預(yù)測評價指標(biāo)比較
集中供熱階段組合模型與傳統(tǒng)預(yù)測模型的誤差結(jié)果比較如圖5 所示。結(jié)果顯示,傳統(tǒng)模型預(yù)測誤差波動較大,組合模型預(yù)測誤差相對較小。
Fig.5 Error comparison of prediction models in heating stage圖5 供熱階段各預(yù)測模型誤差比較
從表5 也可以看出,組合模型的評價指標(biāo)均小于其他模型,表明在集中供熱階段,組合模型的預(yù)測效果依然優(yōu)于傳統(tǒng)天然氣負(fù)荷預(yù)測模型。
Table 5 Comparison of prediction error indexes of three models in heating stage表5 供熱階段傳統(tǒng)預(yù)測模型的評價指標(biāo)比較
本文在現(xiàn)有天然氣負(fù)荷預(yù)測研究成果的基礎(chǔ)上,分析了西安市天然氣負(fù)荷量在非供熱階段和供熱階段的特征,并利用RVM 和GRNN 組合預(yù)測的優(yōu)化方式,擬合天然氣負(fù)荷值的線性和非線性特征。通過與單一模型預(yù)測效果進(jìn)行比較,非供熱階段組合模型的MAPE 比RVM 模型降低7.76%,比GRNN 模型降低16.13%。集中供熱階段組合模型的MAPE 比RVM 模型降低10.29%,比GRNN 模型降低73%。為進(jìn)一步驗(yàn)證模型適用性,對組合模型和傳統(tǒng)預(yù)測模型預(yù)測結(jié)果進(jìn)行比較。數(shù)據(jù)表明,RVM-GRNN 組合模型預(yù)測效果更好,不論是在非供熱階段還是集中供熱階段,組合模型都可以對天然氣負(fù)荷值進(jìn)行準(zhǔn)確預(yù)測,可以為供氣公司供氣提供指導(dǎo)。但是影響天然氣負(fù)荷的影響因素眾多,本文僅考慮了供熱、溫度、歷史負(fù)荷和風(fēng)力等因素。對于天然氣使用而言,還受政策、商業(yè)活動、人口流入流出等多種因素影響。因此,后續(xù)研究可以考慮引入更多因素,以提高天然氣負(fù)荷預(yù)測準(zhǔn)確性。