擺倩倩 吳薇薇 陸燕楠 魏文斌 張 潔
(南京航空航天大學(xué)民航學(xué)院 南京 210016)
目前國內(nèi)民航機(jī)場運(yùn)營收入的主要來源仍為航空性業(yè)務(wù)收入,多數(shù)機(jī)場尤其欠發(fā)達(dá)地區(qū)的支線機(jī)場仍處于依靠客貨吞吐量增長帶動收入增長的初級發(fā)展階段[1],客流量的大小直接影響民航機(jī)場航空性收入的多少.客流預(yù)測一直是民航業(yè)備受關(guān)注的研究領(lǐng)域,國內(nèi)外學(xué)者對機(jī)場客流量預(yù)測的研究成果大致分為線性和非線性理論的預(yù)測方法.基于線性理論的預(yù)測方法有時(shí)間序列模型、灰色模型等[2]雖取得了較高的預(yù)測精度,但普遍存在無法反映非線性部分變化規(guī)律的問題.非線性預(yù)測方法主要有神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,多數(shù)從機(jī)場客流歷史數(shù)據(jù)本身挖掘有效信息.
近年國內(nèi)支線機(jī)場建設(shè)的大發(fā)展加劇了多機(jī)場環(huán)境下鄰近機(jī)場間的客流競爭態(tài)勢[3],單純的線性回歸模型已經(jīng)無法對復(fù)雜因素影響下的機(jī)場客流量做出準(zhǔn)確的預(yù)測.神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力[4],本文選取GDP、全年接待游客數(shù)量及鄰近樞紐機(jī)場的旅客吞吐量為自變量[5],構(gòu)造Elman神經(jīng)網(wǎng)絡(luò)與多元線性回歸[6-7]的串聯(lián)組合預(yù)測模型,對支線機(jī)場的客流量進(jìn)行預(yù)測.以江蘇地區(qū)支線機(jī)場——常州奔牛機(jī)場(以下簡稱常州機(jī)場)的客流預(yù)測為例驗(yàn)證模型的有效性.結(jié)果表明,Elman神經(jīng)網(wǎng)絡(luò)在多指標(biāo)同步預(yù)測方面的穩(wěn)定性較好,模型整體性能優(yōu)于傳統(tǒng)的計(jì)量經(jīng)濟(jì)模型,取得了較好的預(yù)測結(jié)果.
本文結(jié)合《常州市國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計(jì)公報(bào)》與《南京市國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計(jì)公報(bào)》中2001—2015年的相關(guān)數(shù)據(jù),選取常州市GDP(x1)、常州市全年接待游客數(shù)量(x2)、南京祿口機(jī)場旅客吞吐量(x3)為自變量對常州機(jī)場旅客吞吐量(y)進(jìn)行預(yù)測[8].
(1)
(2)
運(yùn)用SPSS進(jìn)行相關(guān)性分析,結(jié)果見表2.
由表2可知,各指標(biāo)與因變量間的相關(guān)系數(shù)均大于90%,存在顯著的相關(guān)關(guān)系.
表1 常州機(jī)場旅客吞吐量及相關(guān)指標(biāo)的歷史數(shù)據(jù)
表2 指標(biāo)相關(guān)性分析
1.3.1Elman神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
Elman神經(jīng)網(wǎng)絡(luò)是一種具有局部記憶和局部反饋連接功能的遞歸神經(jīng)網(wǎng)絡(luò),通過在BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)的基礎(chǔ)上加入一個(gè)承接層,將隱含層的輸出進(jìn)行延遲與存儲,并自聯(lián)到隱含層的輸入.這種自聯(lián)方式在增強(qiáng)網(wǎng)絡(luò)對歷史數(shù)據(jù)敏感性的同時(shí)更好的實(shí)現(xiàn)了數(shù)據(jù)的動態(tài)映射,適用于時(shí)間序列問題的動態(tài)建模.
設(shè)網(wǎng)絡(luò)的輸入層包含r個(gè)節(jié)點(diǎn),隱含層和承接層均包含n個(gè)節(jié)點(diǎn),輸出層包含m個(gè)節(jié)點(diǎn).則輸入向量I(k)∈Rr,輸出向量O(k)∈Rm,隱含層輸出向量x(k)∈Rn*n,承接層輸出向量xc(k)∈Rn*n.f,g分別為輸出層、隱含層的傳遞函數(shù).
網(wǎng)絡(luò)的數(shù)學(xué)模型為
xk=f(wCxc(k)+wHI(k-1))
(3)
xc(k)=x(k-1)
(4)
o(k)=g(wOx(k))
(5)
式中:wH,wC,wO分別為輸入層與隱含層、隱含層與承接層、隱含層與輸出層之間的連接權(quán)陣,wH∈Rn×r,wC∈Rn×n,wO∈Rn×m.
1.3.2Elman神經(jīng)網(wǎng)絡(luò)權(quán)值修正的學(xué)習(xí)算法
設(shè)訓(xùn)練集為(I(k),Od(k)),網(wǎng)絡(luò)實(shí)際輸出為{O(k)},k=1,2,…,N.其中:
I(k)={I1(k),I2(k),…,Ir(k)}T,Od(k)=
{Od1(k),Od2(k),…,Odm(k)}T,O(k)=
{O1(k),O2(k),…,Om(k)}T
設(shè)網(wǎng)絡(luò)各層神經(jīng)元的輸入輸出分別為μ、O,如隱含層第i個(gè)神經(jīng)元在k時(shí)刻的輸入、輸出分別為μi(k),Oi(k);輸出層第j個(gè)神經(jīng)元的輸入、輸出分別為μj(k),Oj(k).
Oi(k)=g(μi(k))
(6)
Oj(k)=f(μj(k))
(7)
由于動態(tài)遞歸網(wǎng)絡(luò)的輸出與當(dāng)前及過去時(shí)刻的輸入信號均有關(guān),因而必須采用動態(tài)學(xué)習(xí)規(guī)則.本文對遞歸網(wǎng)絡(luò)學(xué)習(xí)算法的研究采用有序鏈?zhǔn)椒▌t.
令ej(k)為第j個(gè)輸出節(jié)點(diǎn)在k時(shí)刻期望輸出與實(shí)際輸出值之間的誤差,即
ej(k)=Odj(k)-Oj(k)
(8)
定義k時(shí)刻網(wǎng)絡(luò)權(quán)值調(diào)整的誤差函數(shù)為
(9)
修正后的權(quán)值計(jì)算公式為
w(k+1)=Δw(k)+w(k)
(10)
下面以隱含層與輸出層的之間的權(quán)值調(diào)整為例,分析逐層反向調(diào)整網(wǎng)絡(luò)權(quán)值的具體步驟:
(11)
根據(jù)微分鏈?zhǔn)椒▌t
-ej(k)f′(μj(k))Oi(k)
(12)
權(quán)值修正量為
(13)
引入局部梯度的定義
ej(k)f′(μj(k))
(14)
則式(13)更新為
(15)
采用上述有序鏈?zhǔn)椒▌t對圖1中的權(quán)值進(jìn)行調(diào)整.
(16)
同理,隱含層的權(quán)值為
(17)
關(guān)聯(lián)層的權(quán)值為
(18)
1) Elman神經(jīng)網(wǎng)絡(luò)預(yù)測的樣本數(shù)據(jù)劃分 以常州機(jī)場2001-2013年(下文分別以1~13表示)的指標(biāo)數(shù)據(jù)為基礎(chǔ),構(gòu)造訓(xùn)練樣本矩陣:
pk=(x1k,x2k,x3k),k=1,2…,13
(19)
式中:k為指標(biāo)數(shù)據(jù)取自的年份.
令P1=p1:p4,P2=p2:p5,…,P10=p10:p13則訓(xùn)練樣本矩陣T為
T=[P1,P2…,P10]=
(20)
以P1為例:p1:p3為模型輸入,p4為模型的目標(biāo)輸出,依此類推,相當(dāng)于一個(gè)時(shí)間序列問題,可以通過Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測.其映射函數(shù)表示為
pk=f(pk-1,pk-2,pk-3),k=4,5…,13
(21)
2) 神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置 反復(fù)訓(xùn)練并不斷調(diào)整神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置,對比發(fā)現(xiàn),當(dāng)隱含層節(jié)點(diǎn)數(shù)為9,學(xué)習(xí)速率為0.05,最大訓(xùn)練次數(shù)為10 000時(shí),網(wǎng)絡(luò)的預(yù)測誤差最小且預(yù)測性能穩(wěn)定.
Elman神經(jīng)網(wǎng)絡(luò)測試樣本輸出數(shù)據(jù)反歸一化處理后的結(jié)果見表3,預(yù)測誤差率圖見圖1.
表3 Elman神經(jīng)網(wǎng)絡(luò)測試樣本指標(biāo)輸出結(jié)果
圖1 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測誤差率圖
由于支線機(jī)場客流量大小還受到外來流動人口數(shù)量、旅客出行時(shí)間成本、地面交通可達(dá)性等隨地區(qū)經(jīng)濟(jì)、發(fā)展現(xiàn)狀等快速變化且不易量化因素的影響,本文僅選取近三年的客流量數(shù)據(jù)進(jìn)行模型驗(yàn)證.驗(yàn)證結(jié)果顯示,模型對13,14,15年指標(biāo)預(yù)測值的平均誤差率分別為1.53%,3%,7.5%,雖呈現(xiàn)一定的誤差累積趨勢,但仍小于10%,說明該神經(jīng)網(wǎng)絡(luò)對多指標(biāo)預(yù)測的效果較好.模型訓(xùn)練過程的誤差下降曲線見圖2.
圖2 Elman神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差下降曲線圖
用訓(xùn)練好的網(wǎng)絡(luò)對2016-2018年指標(biāo)值進(jìn)行預(yù)測,結(jié)果見表4.
表4 Elman神經(jīng)網(wǎng)絡(luò)指標(biāo)預(yù)測結(jié)果
本節(jié)仍以表1所示歷史數(shù)據(jù)為基礎(chǔ),常州機(jī)場年旅客吞吐量作為被解釋變量,常州GDP、常州全年游客量、南京機(jī)場旅客吞吐量作為解釋變量,構(gòu)建多元線性回歸模型,表達(dá)式為
(22)
式中:k=1,2,…,12;α0,α1,α2,α3為模型中各影響因素的回歸系數(shù).
運(yùn)用Matlab對上述指標(biāo)數(shù)據(jù)進(jìn)行多元線性回歸分析,結(jié)果見表5.
表5 回歸模型系數(shù)、系數(shù)置信區(qū)間與統(tǒng)計(jì)量
由圖3可知,樣本殘差均勻分布在合理的區(qū)間范圍內(nèi),未出現(xiàn)異常的數(shù)據(jù)觀測點(diǎn).R2=0.982 8,接近于1,表明模型擬合程度較好.F=152.120 5,p=0<0.05,說明模型的線性關(guān)系在95%的置信水平下顯著成立.
圖3 殘差杠桿圖
回歸模型為
y=-0.005 5+0.564 5x1+
0.622 1x2-0.392 8x3
(23)
分別將2013—2015年的指標(biāo)實(shí)際值與Elman神經(jīng)網(wǎng)絡(luò)輸出的指標(biāo)預(yù)測值帶入式(23),對常州機(jī)場客流量進(jìn)行預(yù)測并將結(jié)果反歸一化處理,分析比較不同模型的預(yù)測精度,結(jié)果見表6.
表6 常州機(jī)場旅客吞吐量預(yù)測結(jié)果對比
由表6可知,單純的多元線性回歸模型預(yù)測誤差率均大于15%,結(jié)合Elman神經(jīng)網(wǎng)絡(luò)指標(biāo)預(yù)測的多元線性回歸模型的平均誤差率為8%.其中2014年的預(yù)測誤差明顯大于其他年份.
2014年南京機(jī)場啟用T2航站樓,與新航站樓配套的停車場、地鐵機(jī)場線、長途大巴等公共交通設(shè)施齊全,大大提高了機(jī)場的服務(wù)能力.數(shù)據(jù)顯示,2015年南京祿口機(jī)場旅客增量為往年的3倍,可視為指標(biāo)數(shù)據(jù)增長的異常值,導(dǎo)致常州機(jī)場2014年的吞吐量預(yù)測結(jié)果出現(xiàn)較大誤差,符合實(shí)際情況.
對常州機(jī)場2016-2018年的旅客吞吐量預(yù)測結(jié)果見表7.
表7 常州機(jī)場2016-2018年旅客吞吐量預(yù)測結(jié)果
Elman神經(jīng)網(wǎng)絡(luò)因結(jié)構(gòu)中包含特殊的延時(shí)算子而具備記憶隱含層神經(jīng)元前一時(shí)刻輸出值的特性.模型通過修正前饋連接部分的連接權(quán)矯正并提高了預(yù)測精度,憑借神經(jīng)網(wǎng)絡(luò)良好的學(xué)習(xí)能力實(shí)現(xiàn)了多個(gè)指標(biāo)的同步預(yù)測,避免了傳統(tǒng)指標(biāo)預(yù)測方法造成的誤差累積,在此基礎(chǔ)上結(jié)合多元線性回歸模型取得了誤差相對較小的預(yù)測結(jié)果;然而目前的研究成果仍存在缺點(diǎn)和不足:由于部分指標(biāo)數(shù)據(jù)的獲取受到限制,本文僅考慮鄰近機(jī)場對客流的競爭,而地面交通(尤其高鐵)亦對民航旅客存在明顯的分流作用,對于民航與地面交通運(yùn)輸方式間的客流競爭關(guān)系,有待進(jìn)一步研究.