陳 貝,臧子璇
(重慶大學(xué)城市建設(shè)與環(huán)境工程學(xué)院,重慶400045)
在燃?xì)獾闹?、長期負(fù)荷預(yù)測中,數(shù)據(jù)記錄不完善、統(tǒng)計信息缺失等是影響預(yù)測精度的重要因素,而灰色系統(tǒng)理論正是針對此類“部分信息已知,部分信息未知”的“小樣本”、“貧信息”不確定性系統(tǒng)的研究,它通過對“部分”已知信息的生成、開發(fā)實現(xiàn)對現(xiàn)實的確切描述和認(rèn)識[1-2]?;疑P蛢H利用已知負(fù)荷數(shù)據(jù)達(dá)到對未來負(fù)荷的預(yù)測,但事實上,燃?xì)獾哪甓蓉?fù)荷受到多種因素的影響,如國民經(jīng)濟發(fā)展情況、產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、能源政策、人口和燃?xì)鈨r格等[3]。因此,在利用歷史負(fù)荷值探尋負(fù)荷發(fā)展規(guī)律的同時考慮其他因素的影響更符合人類對事物發(fā)展的認(rèn)知規(guī)律。研究表明,年度負(fù)荷與影響因素間具有較高的線性相關(guān)性,而各種可以量化的因素之間存在著嚴(yán)重的多重相關(guān)性,采用傳統(tǒng)的回歸分析方法會產(chǎn)生比較大的偏差,而偏最小二乘回歸分析方法對此類情況有出色的解決能力。在進行預(yù)測模型的組合時,建立基于貝葉斯理論的動態(tài)權(quán)重模型可保證模型的有效精度。本文采用基于GM(1,1)模型和偏最小二乘回歸的貝葉斯組合模型對某市燃?xì)庳?fù)荷進行了預(yù)測。
貝葉斯理論的核心是當(dāng)不能準(zhǔn)確知悉一個事物的本質(zhì)時,可以依靠與事物特定本質(zhì)相關(guān)的事件出現(xiàn)的多少去判斷其本質(zhì)屬性的概率。用數(shù)學(xué)語言表達(dá)就是:支持某項屬性的事件發(fā)生得愈多,則該屬性成立的可能性就愈大。本文的負(fù)荷預(yù)測正是基于這種不確定性及可能性思想的理論。在預(yù)測領(lǐng)域,Bates等人于1969年首先提出組合預(yù)測方法[4]。貝葉斯權(quán)重法是根據(jù)前期的預(yù)測表現(xiàn),應(yīng)用貝葉斯組合定理計算出來的條件概率,即模型的信用值。信用值越大,表示這一模型此前的預(yù)測表現(xiàn)越好,它就將在下一期的預(yù)測中擔(dān)當(dāng)主要角色,從而使模型在整個預(yù)測區(qū)間內(nèi)始終保持良好的預(yù)測精度[5]。
累加生成能夠弱化數(shù)列隨機性,將任意非負(fù)的數(shù)列、擺動的與非擺動數(shù)列轉(zhuǎn)化成為非減的、遞增的數(shù)列,增強數(shù)列的規(guī)律性。
將原始數(shù)列{x(0)}中的數(shù)據(jù)x(0)(k)進行一次累加生成處理,則原始數(shù)列
記為數(shù)列x(1):
模型的其一階微分方程形式為:
其中,a,u—模型參數(shù)。
將⑷式進行離散化處理得到:
記
得
由最小二乘法解方程組⑺,得到模型參數(shù):
得到離散化微分方程的解為:
累減還原即為GM(1,1)模型的時間相應(yīng)函數(shù):
偏最小二乘法是一種多自變量對多因變量的建?;貧w方法,集多元線性回歸分析、典型相關(guān)分析和主成分分析等功能為一體。它可以解決樣本數(shù)據(jù)較少及變量集合內(nèi)部存在較高程度的相關(guān)性的問題。
數(shù)據(jù)的標(biāo)準(zhǔn)化處理:
xi—自變量;
Sxi—自變量的均方差;
y*—因變量的標(biāo)準(zhǔn)化向量;
y—因變量;
Sy—因變量的均方差。
經(jīng)主成分提取得標(biāo)準(zhǔn)化變量的回歸方程:
其中,y?*—標(biāo)準(zhǔn)化自變量的擬合值;αi—標(biāo)準(zhǔn)化方程的系數(shù)
由式(12)、(13)得還原為原始變量的回歸方程:
將某一特定燃?xì)庳?fù)荷時間序列表示為函數(shù):
其中,yt—時間序列在時段t的實際值;
式(15)在某一預(yù)測時刻只對k個時間序列中的某一值成立或接近,通常這個k值無法事先獲知。根據(jù)k值的隨機性與不確定性的特點,引入一個變量Z表示k的不確定性,Z可以取k中任何值,則可定義條件概率為=Prob(Z=k/yt,yt-1,…,y)。
根據(jù)貝葉斯定理可知:
合并得:
式(19)得到的是由模型k產(chǎn)生實際時間序列的概率,稱為模型的信用值,即被用做模型k在當(dāng)前T時間組合預(yù)測模型中所擁有的權(quán)重,這一權(quán)重也將應(yīng)用于下一時間的組合模型中。可以看出:該模型是一種自適應(yīng)和啟發(fā)式算法,能夠根據(jù)前期實際值及預(yù)測誤差自動調(diào)整各模型的權(quán)重,保證預(yù)測精度。第t+1時間的預(yù)測結(jié)果為:
文中選取國內(nèi)生產(chǎn)總值(x1,億元)、第二產(chǎn)業(yè)產(chǎn)值(x2,億元);第三產(chǎn)業(yè)產(chǎn)值(x3,億元)、人均國內(nèi)生產(chǎn)總值(x4,萬元)和城市非農(nóng)業(yè)人口數(shù)(x5,萬人)等5個影響因素對城市燃?xì)饽甓蓉?fù)荷(y,億m3)進行偏最小二乘回歸分析建模[7]。
表1 某市燃?xì)庳?fù)荷及各項因素的原始數(shù)據(jù)
由表1數(shù)據(jù)得灰色GM(1,1)模型方程:
及偏最小二乘回歸模型方程:
由式(19)-(22)即可得出組合模型。擬合結(jié)果見表2,實測數(shù)據(jù)與擬合值的比較,相對誤差比較見圖1、圖2。
表2 三種模型的預(yù)測值與相對誤差
由模擬結(jié)果可以看出:GM(1,1)模型最大相對誤差為5.24%,最小相對誤差為0.00%;偏最小二乘回歸模型的最大相對誤差為-4.65%,最小相對誤差為0.04%;組合模型的最大相對誤差為4.4%,最小相對誤差為0.02%;組合預(yù)測模型的平均誤差為最小。通過精度檢驗,模型等級為一級(好)。
圖1 實測數(shù)據(jù)與擬合值的比較
圖2 相對誤差的對比
基于GM(1,1)模型及偏最小二乘回歸分析模型的組合模型采用自適應(yīng)和啟發(fā)式算法,具有較強的動態(tài)適應(yīng)性,用貝葉斯概率理論解決了模型中權(quán)重分配的不確定性。通過實例分析,此方法應(yīng)用于燃?xì)庳?fù)荷預(yù)測中能有效地減小模型誤差,因此可以用于燃?xì)庳?fù)荷預(yù)測領(lǐng)域。
[1] 傅立.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)技術(shù)文獻出版社,1992.
[2] 焦文玲,嚴(yán)銘卿,廉樂明.城市燃?xì)庳?fù)荷的灰色預(yù)測[J].煤氣與熱力,2001,21(5):387-389.
[3] 嚴(yán)銘卿.燃?xì)庳?fù)荷中長期預(yù)測的方法[J].燃?xì)饧夹g(shù),2009(10):13-18.
[4] Bates J M,Granger C W J.Combination of forecasts[J].Operational Re-search Quarterly,1969,20(4):451-468.
[5] 鄭中為,史其信.基于貝葉斯組合模型的短期交通量預(yù)測研究[J].中國公路學(xué)報,2005,18(1):85-89.
[6] 王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國防工業(yè)出版社,1999.
[7] 苗艷姝,段常貴.燃?xì)饽甓蓉?fù)荷預(yù)測的偏最小二乘回歸分析法[J].哈爾濱商業(yè)大學(xué)學(xué)報:自然科學(xué)版,2008,24(1):95-96.
[8] 劉志謙,宋瑞,孫麗明.基于貝葉斯組合模型的物流預(yù)測與分析[J].技術(shù)與方法,2009,28(12):116-117.