文/任 飛 朱美琳
改革開放以來,我國(guó)的航空運(yùn)輸業(yè)發(fā)展很快,從運(yùn)輸總量上來看,我國(guó)民航業(yè)已經(jīng)成為全球僅次于美國(guó)的第二大航空運(yùn)輸系統(tǒng)。航油供應(yīng)對(duì)航空運(yùn)輸業(yè)的發(fā)展密切相關(guān),航空運(yùn)輸?shù)某掷m(xù)快速發(fā)展,使航油需求不斷增加。改革開放三十多年來,民航運(yùn)輸總周轉(zhuǎn)量年均增長(zhǎng)17%以上,遠(yuǎn)高于其他交通運(yùn)輸方式[1],如此高的快速發(fā)展,帶來航油消耗也不斷增加,航油的總消耗量也在以年均14.8%的速度增長(zhǎng)。隨著西部經(jīng)濟(jì)的不斷發(fā)展,也帶來西部民航運(yùn)輸?shù)陌l(fā)展,從而進(jìn)一步帶動(dòng)航油的快速消耗。2013年西北18個(gè)機(jī)場(chǎng)總加油量86.4萬噸,較2012年增長(zhǎng)18.88%[2],高于全國(guó)加油量增長(zhǎng)率49.84%[3]。
近幾年來,國(guó)際航油價(jià)格大幅度變化, 2013年航油的年平均價(jià)格比2009年增長(zhǎng)了55%,從2009年到2013年,航油每噸價(jià)格的方差是均值的200倍[4]。如何在頻繁的油價(jià)變動(dòng)環(huán)境下降低存儲(chǔ)和運(yùn)營(yíng)成本,對(duì)于航油公司來說是個(gè)亟待解決的重要任務(wù)。通常的策略是當(dāng)航油價(jià)格較高時(shí),航油公司僅購(gòu)入滿足下月飛行需求且盡量少的航油,以減少運(yùn)營(yíng)成本,當(dāng)航油價(jià)格較低時(shí),可適當(dāng)多儲(chǔ)備一些,以備油價(jià)較高時(shí)使用。 這一決策的前提條件就需要對(duì)短期(未來幾個(gè)月)的加油量有較為精確的預(yù)測(cè),目前一般采用的方法還是靠經(jīng)驗(yàn)和歷年數(shù)據(jù)簡(jiǎn)單估算所得,并沒有很精確的數(shù)學(xué)模型。
加油量和航油消耗量是兩個(gè)不同的概念,本文主要是站在航油公司的角度去分析各機(jī)場(chǎng)加油量,而不是站在航空公司的角度去分析航油消耗量,盡管兩者有一點(diǎn)的相關(guān)性,但出發(fā)點(diǎn)不同,分析的結(jié)果也是不同的。本文以西北航油公司的月度加油量數(shù)據(jù)為依據(jù),深入分析,建立符合實(shí)際的數(shù)學(xué)模型,獲取未來短期的預(yù)測(cè)數(shù)據(jù),進(jìn)而可幫助航油公司確定采購(gòu)量和庫存量,從而達(dá)到減少成本的目的。
目前,關(guān)于加油量預(yù)測(cè)的文獻(xiàn)還比較少見,研究部隊(duì)油料消耗預(yù)測(cè)的研究較多,見[5][6],國(guó)外的文獻(xiàn)大都是從飛機(jī)自身的工程結(jié)構(gòu)上分析影響油耗的因素,而從大環(huán)境去考慮對(duì)油耗的預(yù)測(cè)則較少,Vedant Singh和Som esh K. Sharm a利用結(jié)構(gòu)方程模型對(duì)燃油消耗做了全方位的預(yù)測(cè),從航空器運(yùn)行、飛機(jī)技術(shù)與設(shè)計(jì)、社會(huì)經(jīng)濟(jì)政治、航空基礎(chǔ)設(shè)施等方面考慮油耗優(yōu)化問題,算是分析較全面的文獻(xiàn)資料[7]。
由于民用機(jī)場(chǎng)主要是進(jìn)行客運(yùn),呈比較明顯的季節(jié)性,所以機(jī)場(chǎng)加油量數(shù)據(jù)是較典型的周期型數(shù)據(jù),對(duì)于有周期的時(shí)間序列數(shù)據(jù)預(yù)測(cè),比較成熟的方法是ARIMA模型[8],它將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后進(jìn)行回歸所建立的模型,還有一種方法是簡(jiǎn)單線性回歸[9],其思想是將周期因素作為自變量,加入到原有自變量中,然后進(jìn)行線性回歸。
上述方法都是針對(duì)線性數(shù)據(jù)的,它們描述時(shí)間序列的非線性關(guān)系的能力較差。在非線性回歸模型中,Vapnik等人提出支持向量機(jī)(SVM)理論[10]表現(xiàn)出比較優(yōu)秀的性能,能較好地解決以往很多學(xué)習(xí)方法的小樣本、非線性、高維數(shù)、局部極小點(diǎn)等實(shí)際問題,被廣泛應(yīng)用。但支持向量回歸并沒有考慮周期性。
本文針對(duì)機(jī)場(chǎng)加油量時(shí)間序列的特點(diǎn), 提出了一種基于周期的支持向量機(jī)回歸算法用于機(jī)場(chǎng)加油量時(shí)間序列的預(yù)測(cè)。
要對(duì)機(jī)場(chǎng)加油量進(jìn)行預(yù)測(cè),尤其是月度預(yù)測(cè),需要比較細(xì)致的模型,因此除了獲取歷年加油量數(shù)據(jù)以外,還應(yīng)分析影響加油量的其他因素,抽絲剝繭,才能進(jìn)行深層次的預(yù)測(cè)。
(1)首先考慮到不同的機(jī)場(chǎng)規(guī)模,加油量的變化也是不一樣的,因此,本文將機(jī)場(chǎng)進(jìn)行歸納總結(jié),分為三類:
①干線機(jī)場(chǎng),如西安、蘭州機(jī)場(chǎng),運(yùn)作多年,客流量大,季節(jié)性突出,加油量較為穩(wěn)定地同比增長(zhǎng)。
②支線機(jī)場(chǎng),如敦煌、延安機(jī)場(chǎng),多是旅游城市,旅游季節(jié)客流較大,其他季節(jié)變化無常,有時(shí)還有停運(yùn)現(xiàn)象。
③新接收機(jī)場(chǎng),如中衛(wèi)、金昌等機(jī)場(chǎng),剛開始發(fā)展,歷史數(shù)據(jù)少,沒有自己的儲(chǔ)油設(shè)備,客流非常不穩(wěn)定,季節(jié)性因素少,有些航班自帶回油,不在這些小機(jī)場(chǎng)加油。
針對(duì)上面三種不同的機(jī)場(chǎng),其影響加油量的因素也各不相同,因此一定要區(qū)別對(duì)待。尤其是支線機(jī)場(chǎng)的加油量,對(duì)新接收機(jī)場(chǎng)的發(fā)展具有很重要的參考價(jià)值。本文對(duì)不同規(guī)模大小的機(jī)場(chǎng)分別建模,采用的預(yù)測(cè)參數(shù)設(shè)定是不一樣的。
(2)影響加油量的一個(gè)非常重要的因素就是季節(jié)性。民用機(jī)場(chǎng)主要進(jìn)行的是客運(yùn),不同季節(jié)的旅游人數(shù)會(huì)給客運(yùn)帶來不同的吞吐量,在旅游(春運(yùn))旺季,每個(gè)航空公司的航班都會(huì)比淡季有所增加,隨之帶來的加油量也有所不同。
(3)同(2)中所述,每月的旅客吞吐量直接影響到加油量的多少。但每月的吞吐量數(shù)據(jù)都是月末統(tǒng)計(jì)出來的,并不能夠提前獲取,對(duì)未來幾個(gè)月的吞吐量的值只能是預(yù)測(cè),因此并不精確,為了避免誤差累積,因此在后續(xù)的建模中,將使用航班架次代替吞吐量。
(4)航班架次雖不能完全替代旅客吞吐量,但國(guó)內(nèi)的機(jī)型差別不大,滿員率差別也不大,因此兩者的變化趨勢(shì)還是非常相似的。以西安機(jī)場(chǎng)為例,2009年到2013年,旅客吞吐量與航班架次的相關(guān)系數(shù)為99.8%[11],因此可以用航班架次作為影響加油量的因素之一。另外航空公司通常都會(huì)提前幾個(gè)月公布其航班計(jì)劃,因此相對(duì)精確的航班架次是可以通過各航空公司公布的數(shù)據(jù)得到。
(5)由于每個(gè)航班的飛行距離是不同的,而不同的飛行距離,加油量也隨之不同,因此航班飛行距離是必須考慮的因素。本文首先通過航班架次知道每個(gè)航班的起飛地點(diǎn)和降落地點(diǎn),然后根據(jù)兩地的經(jīng)緯度計(jì)算出兩地距離。
(6)另外不同的機(jī)型,其載客人數(shù)不同,帶來的加油量也不同。目前西部地區(qū)主要飛行的客機(jī)是波音系列和空客系列,受跑道長(zhǎng)度限制,一般沒有超大型飛機(jī)。本文考慮以737機(jī)型作為基準(zhǔn),將其他機(jī)型與737飛機(jī)進(jìn)行比較,給出不同的權(quán)重。當(dāng)然飛機(jī)的新舊程度也會(huì)影響到加油量,不過這個(gè)引起的變化較小,于是忽略不計(jì)。
(7)其他影響因素。由于給飛機(jī)加油時(shí)是由人主觀控制,因此加油量的多少還會(huì)受一些人為因素的影響,另外天氣變化、少量軍用機(jī)加油等,這些因素在整個(gè)加油量里面所占的比重非常少,因此可以綜合用一個(gè)擾動(dòng)隨機(jī)變量表示。
綜合上面所述,飛行距離是綜合了旅客吞吐、航班架次的復(fù)合指標(biāo),筆者將月度的加權(quán)飛行總距離作為最主要的影響因素。獲取步驟如下:
Step 1 獲取各航空公司月度的所有航班信息
Step 2 通過各機(jī)場(chǎng)的經(jīng)緯度計(jì)算各機(jī)場(chǎng)間的距離dij,表示i機(jī)場(chǎng)到j(luò)機(jī)場(chǎng)的飛行距離。
Step 3 計(jì)算每個(gè)航班的機(jī)型權(quán)重,alpha=航班機(jī)型滿員數(shù)/737飛機(jī)滿員數(shù)。
表1 各模型參數(shù)表
Step 4 將每個(gè)航班的飛行距離乘以機(jī)型權(quán)重,再進(jìn)行累加,得到月度所有航班的加權(quán)飛行距離之和distance。
支持向量回歸是在分類算法上演化來的,實(shí)質(zhì)上是采用支持向量機(jī)對(duì)原因變量衍生出的兩類點(diǎn)X,X*分類,得到的分類超平面即為所求的回歸超平面。求解支持向量機(jī)回歸問題,首先將每個(gè)樣本點(diǎn)的y值分別減少和增加ε,得到包含兩類樣本的訓(xùn)練集D。利用支持向量機(jī)求解分類問題,假設(shè)存在超平面在 精度下無誤差地完全將兩類點(diǎn)分開,即稱該ε-帶超平面為訓(xùn)練樣本的線性回歸函數(shù)。
同時(shí)為增強(qiáng)泛化能力我們把線性硬ε-帶軟化,并引進(jìn)松弛變量和懲罰參數(shù)C,在描述非線性問題時(shí),用一個(gè)非線性映射)(xxΦ→把數(shù)據(jù)映射到一個(gè)高維空間,得到ε-帶支持向量回歸機(jī)的原始問題。
常用的核函數(shù)有:多項(xiàng)式核,高斯核,Sigm oid核等。
上述模型是普通的支持向量回歸模型,并沒有考慮到周期因素,本文在此基礎(chǔ)上,引入周期自變量,設(shè)時(shí)間變量為t,周期長(zhǎng)度為T,對(duì)于一般的周期函數(shù)可以表示為:
本文使用西部地區(qū)民用機(jī)場(chǎng)的月加油量數(shù)據(jù)進(jìn)行預(yù)測(cè),主要包括敦煌機(jī)場(chǎng)、嘉峪關(guān)機(jī)場(chǎng)、蘭州中川機(jī)場(chǎng)、西安咸陽國(guó)際機(jī)場(chǎng)、西寧曹家堡機(jī)場(chǎng)、延安機(jī)場(chǎng)、銀川河?xùn)|機(jī)場(chǎng)、榆林西沙機(jī)場(chǎng)等8個(gè)機(jī)場(chǎng),按照第2節(jié)中的機(jī)場(chǎng)分類,西安咸陽國(guó)際機(jī)場(chǎng)、蘭州中川機(jī)場(chǎng)、西寧曹家堡機(jī)場(chǎng)、銀川河?xùn)|機(jī)場(chǎng)為干線機(jī)場(chǎng),敦煌機(jī)場(chǎng)、嘉峪關(guān)機(jī)場(chǎng)、延安機(jī)場(chǎng)、榆林機(jī)場(chǎng)為支線機(jī)場(chǎng),本文分別對(duì)這8個(gè)機(jī)場(chǎng)建模??紤]到數(shù)據(jù)綱量的統(tǒng)一,對(duì)各項(xiàng)數(shù)據(jù)(包括自變量)進(jìn)行了z-score標(biāo)準(zhǔn)化處理。
本文選取了2011年1月到2013年12月的加油量數(shù)據(jù),并求出每個(gè)月的各機(jī)場(chǎng)航班的飛行距離。使用ARIM A模型、簡(jiǎn)單線性回歸模型、傳統(tǒng)的支持向量機(jī)模型(不帶周期自變量,只有distance為自變量)、帶周期變動(dòng)的支持向量機(jī)模型分別對(duì)8組數(shù)據(jù)進(jìn)行擬合。ARIM A模型使用SPSS軟件,其中的各項(xiàng)參數(shù)由軟件經(jīng)優(yōu)化后自動(dòng)選取,簡(jiǎn)單線性回歸模型也使用了SPSS軟件,支持向量機(jī)模型使用的是matlab工具包,并在此基礎(chǔ)上修改而成,其中核函數(shù)為高斯核函數(shù)其余各項(xiàng)參數(shù),由網(wǎng)格法自動(dòng)尋優(yōu)確定。各基本模型參數(shù)如表1所示。
在線性回歸里,飛行距離的系數(shù)都比較高,說明飛行距離同加油量是非常相關(guān)的,這與我們之前的分析相吻合。
以敦煌為例,可以得到各個(gè)算法的擬合曲線。
圖1 敦煌擬合圖
利用R方來計(jì)算各模型的擬合效果,得到表2。
表2 各模型擬合效果表
可以看出帶周期變動(dòng)的支持向量機(jī)的擬合度是比較高的。
我們用上面的模型對(duì)2014年1月和2月的數(shù)據(jù)進(jìn)行預(yù)測(cè),將之與實(shí)際值進(jìn)行比較,計(jì)算兩個(gè)月的平均誤差,如表3所示。
表3 各模型的預(yù)測(cè)誤差
從上表可以看出,傳統(tǒng)支持向量機(jī)和帶周期的支持向量機(jī)模型的預(yù)測(cè)能力都表現(xiàn)不錯(cuò),基本預(yù)測(cè)誤差都能控制在5%以內(nèi),尤其是對(duì)支線機(jī)場(chǎng)(敦煌、嘉峪關(guān)、延安、榆林)的預(yù)測(cè),在其波動(dòng)比較大的情況下,ARIMA模型以及簡(jiǎn)單線性回歸模型就會(huì)出現(xiàn)比較大的誤差。當(dāng)然支持向量機(jī)也會(huì)存在部分過擬合現(xiàn)象,因預(yù)測(cè)的月數(shù)較少,問題還不是很明顯。
機(jī)場(chǎng)加油量的估計(jì)對(duì)機(jī)場(chǎng)的發(fā)展有著十分重要的作用,可減少機(jī)場(chǎng)運(yùn)營(yíng)成本,提高機(jī)場(chǎng)的競(jìng)爭(zhēng)力。本文使用基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的支持向量機(jī)理論,根據(jù)時(shí)間序列的性質(zhì),給出了帶周期的支持向量機(jī)回歸方法。通過對(duì)機(jī)場(chǎng)加油量的預(yù)測(cè)實(shí)驗(yàn),表明支持向量機(jī)方法,有很強(qiáng)的學(xué)習(xí)和預(yù)測(cè)能力,在機(jī)場(chǎng)加油量預(yù)測(cè)上有很大的應(yīng)用價(jià)值。在未來的研究工作中,將時(shí)間序列的方法組合,降低單一方法預(yù)測(cè)中一些不利因素的影響,提高學(xué)習(xí)和預(yù)測(cè)能力將是研究的重點(diǎn)。
[1]中國(guó)民航運(yùn)輸總周轉(zhuǎn)量年均增17% 存四結(jié)構(gòu)性問題。中國(guó)新聞網(wǎng)。http://finance.chinanew s.com/cj/2012/07-20/4046610.shtm l
[2]中國(guó)航空油料有限責(zé)任公司西北公司2013年財(cái)務(wù)決算報(bào)告
[3]中國(guó)航油集團(tuán)公司2014年工作會(huì)議文件
[4]發(fā)改委內(nèi)部數(shù)據(jù)
[5]李偉,王紅旗,嚴(yán)喬喬.BP神經(jīng)網(wǎng)絡(luò)—馬爾科夫模型在軍用油料消耗預(yù)測(cè)中的應(yīng)用研究[J],中國(guó)儲(chǔ)運(yùn),2012(01),125~126
[6]王冰,劉巖,周慶忠.軍隊(duì)油料消耗預(yù)測(cè)策略研究[J],中國(guó)儲(chǔ)運(yùn),2011(03),51~54
[7]Vedant Singh, Somesh K. Sharma. Evolving base for the fuel consumption optimization in Indian air transport: application of structural equation modeling[J], European Transport Research Review,F(xiàn)ebruary 2014
[8]Box G.E.P, Jenkins G.M, Reinsel G.C. Time Series Analysis: Forecasting and Control [M], 3th ed. Englewood Cliffs, Prentice Hall, 1994, 89~130
[9] 鄧明, 張荷觀. 利用線性回歸模型對(duì)季節(jié)指數(shù)的估計(jì)[J],江南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2008, Vol 7(3), 375~378
[10]Vapnik V. Statistical learning theory[ M] . NY: Springer , 1998
[11]西安咸陽國(guó)際機(jī)場(chǎng)主頁 http://www.xxia.com/intro.aspx