邢志偉,劉子碩,羅 謙+,文 濤,陳肇欣,代 軍
(1.中國民航大學 電子信息與自動化學院,天津 300300; 2.中國民用航空局第二研究所工程技術(shù)研究中心,四川 成都 610041)
近年來,智能綜合交通發(fā)展迅速,民航機場陸側(cè)綜合交通高效運行也成為行業(yè)關(guān)注的熱點問題[1]。相比國外迪拜、亞特蘭大等大型機場航班中轉(zhuǎn)率超過50%,國內(nèi)大型機場北京首都、廣州白云等機場航班中轉(zhuǎn)率只有約10%[2],國內(nèi)機場高比例的目的地直達進港旅客使得陸側(cè)換乘客流龐大,從而對陸側(cè)綜合交通資源的高效運行和協(xié)同調(diào)度提出更高的要求。對機場而言,要做好陸側(cè)資源協(xié)同調(diào)度的關(guān)鍵點之一就是應(yīng)實時準確掌控進港旅客的流動態(tài)勢。機場進港旅客到達口是旅客從航空換乘地面交通的關(guān)鍵節(jié)點,因此對到達口旅客人數(shù)進行短時預(yù)測是掌握進港旅客流動態(tài)勢的基礎(chǔ)。
對到達口旅客人數(shù)進行預(yù)測的關(guān)鍵是對旅客下機后的流動過程及態(tài)勢進行建模。在航班落地至旅客到達航站樓聚散大廳過程中,機位距離遠近直接影響旅客在航站樓內(nèi)的步行時間,因此機位距離是預(yù)測模型中的重要影響因素;分析旅客下機流程,進港旅客與其它交通樞紐相比多了提取行李環(huán)節(jié),因在行李提取過程中旅客提取行李的實際時間和數(shù)量難以采集,所以將行李總數(shù)作為影響旅客到達口人數(shù)預(yù)測的特征因素之一。根據(jù)旅客快速換乘的出行需求,航班落地、上輪擋、開艙門等時間信息決定了旅客何時能下機進入陸側(cè)換乘區(qū),在一定程度上影響了旅客的換乘心理和需求[3],使得旅客出行選擇和步行速度發(fā)生變化,這類時間信息可統(tǒng)一定義為航班信息時間以作用于預(yù)測模型。通過對上述旅客下機流動過程的特征信息量化建模后,可實現(xiàn)到達口旅客人數(shù)預(yù)測。
研究者們已經(jīng)提出了許多典型的客流預(yù)測模型,目前已經(jīng)在回歸模型[4,5]、機器學習模型[6,7]和混合模型[8,9]等方面取得了部分研究成果。在對進港旅客使用客流預(yù)測模型時發(fā)現(xiàn)不同航班旅客因存在步行距離、是否提取行李以及提取行李等待時間等因素的差異,因此不同航班旅客離開到達口規(guī)律存在較大差異。傳統(tǒng)回歸模型中,依靠歷史數(shù)據(jù)建立統(tǒng)計模型的方法實現(xiàn)客流預(yù)測精度難以提高;機器學習模型中的K近鄰算法可以通過篩選數(shù)據(jù)中的相關(guān)性數(shù)據(jù)樣本,減小無關(guān)歷史數(shù)據(jù)對預(yù)測的影響,以提高距離、行李提取等重要特征因素影響下的模型預(yù)測精度[10]??紤]到航站樓離港客流量短期的周期性變化易受到天氣、航班延誤等不確定因素影響,針對其復(fù)雜的非線性特點,以往有研究提出先用K近鄰計算相匹配的歷史航班,再用K近鄰實現(xiàn)離港人數(shù)預(yù)測的雙層K近鄰算法,提高了離港旅客短時預(yù)測精度[11]。林培群等[12]面對地鐵客流發(fā)展模式具有一定規(guī)律的特點,提出基于誤差變化率的計算方式,從而自動獲取合適K值提高預(yù)測精度。以上模型大多以客觀環(huán)境因素特征作為模型輸入,預(yù)測時忽略了時間導致的旅客主觀因素對旅客流動態(tài)勢的影響。
航班信息時間作為描述旅客主觀感受的抽象化特征,可以通過構(gòu)建時間價值函數(shù)的方式進行量化描述。時間價值函數(shù)最早由Kahneman等[13]提出,在金融經(jīng)濟學領(lǐng)域針對期望效用理論存在的整體風險預(yù)估不足,將隨時間的收益定義為凹函數(shù),損失定義為凸函數(shù),從而對某項投資整體做出風險計算。在交通領(lǐng)域,近些年學者們展開對出行者在時間約束下的感知研究[14-16]。宗剛等[17]在居民出行中借鑒時間價值函數(shù)理論對居民時間成本加以考慮,提出累積前景理論更適用于出行方式研究,實現(xiàn)了居民出行不同交通方式時間滿意度的整體感知計算。姚蘭[18]選取通勤者在出行方式選擇的兩個參照點:行程所用時間和行程所需費用,借鑒時間價值函數(shù)中的收益與損失概念解決了上班者在通勤過程中不同目的地導致的感知數(shù)值差異的計算問題。
基于上述對時間價值的研究,本文通過刻畫旅客對航班信息時間的感知模型,在傳統(tǒng)K近鄰算法的基礎(chǔ)上,平衡主要因素的影響得到加權(quán)歐式距離,最終建立基于航班信息時間價值函數(shù)的雙加權(quán)K近鄰模型實現(xiàn)對進港旅客到達口的人數(shù)預(yù)測。
根據(jù)上文對旅客下機后流動過程的影響因素分析,設(shè)計了如圖1所示的到達口旅客人數(shù)預(yù)測思路。首先針對旅客下機至到達口的整體流程,提取機位距離、行李總數(shù)、航班信息時間作為進港旅客到達口人數(shù)的影響特征,構(gòu)建航班信息時間價值函數(shù)。其次在傳統(tǒng)K近鄰算法的基礎(chǔ)上改善K值的量化方法,將行李總數(shù)與時間價值函數(shù)量化后的航班信息時間與機位距離輸入到改進的加權(quán)歐氏距離中,從而實現(xiàn)基于時間價值函數(shù)的雙加權(quán)K近鄰混合模型預(yù)測。
將進港航班信息時間類比影響旅客主觀心理變化的時間節(jié)點,航班的時間差異導致旅客感知數(shù)值發(fā)生變化,符合時間價值理論感知數(shù)值的變化準則,故將其作為航班信息時間特征的量化方法。假設(shè)進港航班的落地時間為ta, 上輪擋時間ts, 開艙門時間to, 第一位旅客步行至到達口時間tf與最后一位旅客步行至到達口時間tl為參考點時間。
定義國內(nèi)進港航班旅客在進港換乘過程中,旅客隨航班信息時間的心理感受和換乘需求變化的價值函數(shù)符合負值向正值過渡的分布規(guī)律,具有負值和正值感受非對稱的特征。
航班信息時間價值函數(shù)如圖2所示。
依據(jù)時間價值感知理論[19],旅客在ta與ts之間時,受到航班業(yè)務(wù)節(jié)點時間的約束旅客不具有主動權(quán),旅客想離開飛機的狀態(tài)需求受到制約,于是產(chǎn)生損失感受,因此為負區(qū)間;當飛機停下后,旅客具有了自己的主動權(quán)開始收拾行李、排隊下機,航班時間節(jié)點對旅客的下機需求約束逐漸弱化,旅客正值感受呈現(xiàn)上升趨勢;開艙門后旅客完全具有主動權(quán)而進入航站樓,因此旅客的時間價值達到最大值;下機后因提取行李或其它隨機因素(如尋找行李推車、接打電話等)影響旅客時間感知價值逐漸下降,當位于到達口時,旅客關(guān)注度由離開飛機轉(zhuǎn)移到交通換乘,航班時間信息對旅客的約束逐漸消失,旅客的航班時間感受價值趨向于0。為方便描述,定義Ⅰ區(qū)為飛機滑行損失區(qū),Ⅱ區(qū)為獲得上升區(qū),Ⅲ區(qū)為獲得下降區(qū)。
根據(jù)航班信息時間價值函數(shù)定義,借鑒時間約束下感知數(shù)值的計算方法[20],刻畫旅客從航班落地至達到出口的時間價值感知過程,得到旅客的時間價值函數(shù)如下
(1)
根據(jù)航班信息時間價值函數(shù)的定義,為了將旅客的正感知表示為凹函數(shù),負感知表示為凸函數(shù)得到0<αi≤1。 其中β表示損失規(guī)避程度,由前景理論的定義可知對于損失的感應(yīng)比獲得更敏感,所以Ⅰ區(qū)的斜率高于Ⅱ區(qū)。由之前總結(jié),開艙門前旅客因具有主動權(quán)正感知迅速上升與開艙門后旅客排隊下機正感知緩慢下降相比Ⅱ區(qū)比Ⅲ區(qū)斜率高,得到:β1>β2>β3>β4。
根據(jù)田麗君等[20]關(guān)于前景理論的探討,以及所給β參數(shù)的利用得到旅客在ti時到達出站口時間的感知數(shù)值
(2)
同理在時間tf后每隔n分鐘旅客到達出站口時間的感知數(shù)值也可求得。其中π-,π+分別是正感知與負感知所對應(yīng)的權(quán)重,為各部分的時間價值函數(shù)的數(shù)值與總時間價值函數(shù)數(shù)值的比值。
tf由機位距離M決定,定義旅客步行的平均速度v, 可得
從表1可知,對于所提取的特征量具有2種缺陷的樣本,神經(jīng)網(wǎng)絡(luò)完全能夠識別出缺陷的存在,而只具有某一種缺陷的樣本,神經(jīng)網(wǎng)絡(luò)存在識別錯誤。該錯誤主要是由于用于訓練的樣本數(shù)量不夠?qū)е聦W(wǎng)絡(luò)的訓練不足。綜合來看,神經(jīng)網(wǎng)絡(luò)的缺陷檢測率達到了80%,說明采用此方法對勺子缺陷進行檢測是可行的。
(3)
式中:Mi表示機位i至到達口的步行距離。
式(2)量化了航班信息時間以構(gòu)建航班信息時間價值函數(shù),將其與行李總數(shù)共同作為特征輸入到達口旅客人數(shù)預(yù)測模型。因為量化后的航班信息時間數(shù)值V(t) 與行李總數(shù)L(t) 對預(yù)測對象的比重是不同的,在構(gòu)建模型時需要考慮特征數(shù)值在樣本空間中的分布情況,因此本文設(shè)計了一種加權(quán)歐氏距離的方法量化特征權(quán)重。權(quán)重系數(shù)的定義如下
(4)
(5)
再根據(jù)加權(quán)歐氏距離得到預(yù)測值的K個近鄰后,傳統(tǒng)的K近鄰將此K個近鄰等權(quán)重看待,但距離小的近鄰值在預(yù)測中應(yīng)當占更大的權(quán)重,因此對K個近鄰采取帶權(quán)重的預(yù)測算法,得到基于時間價值的雙加權(quán)K近鄰模型(P-KNN)
(6)
式中:p(t) 表示t時刻到達口旅客的預(yù)測人數(shù),pi(t)(i=1,2,…,K) 表示在K個近鄰點中,第i個點所對應(yīng)歷史時刻到達口旅客人數(shù)。
表1 進港航班信息數(shù)據(jù)樣例
遠機位旅客下機后即乘坐擺渡車離開,與近機位直接從廊橋到達航站樓類比,中間沒有等待擺渡車時間,且兩輛擺渡車之間銜接緊密,因此只多了擺渡車運行時間。根據(jù)機場擺渡車運行服務(wù)水平評價,擺渡車的平均運行速度為20 km/h,可根據(jù)機場遠機位擺渡車運行距離的測量值計算得到不同遠機位擺渡車的運行時間。綜上根據(jù)以上初始數(shù)據(jù),對機位距離和航班信息時間特征進行量化。
假設(shè)旅客步行速度為1.2 m/s,設(shè)置預(yù)測時間跨度n=5 min,根據(jù)式(3)可計算出不同機位的tf, 根據(jù)表1可知ta、ts和to。 再根據(jù)航班信息時間價值函數(shù),分別計算到達口旅客時間價值感知數(shù)值。
最終得到近遠機位從tf開始,每隔5 min到達口旅客時間價值感知數(shù)值。以近機位為例,部分結(jié)果見表2。
表2 近機位旅客時間價值感知數(shù)值(部分)
通過測試數(shù)據(jù)對模型的K值選取進行了實驗測試,分析結(jié)果表明不同K值對模型精度的影響差異較大,如圖3所示。最終選取誤差最小的K=7作為模型參數(shù)。
以預(yù)測從tf后第5 min的人數(shù)為例,利用航班信息時間價值函數(shù)得到第5 min旅客時間感知數(shù)值以及第5 min行李總數(shù)動態(tài)化數(shù)值作為特征輸入,出站口的人數(shù)作為模型輸出。分別將近遠機位數(shù)據(jù)組的后20組數(shù)據(jù)作為測試組,剩余數(shù)據(jù)作為實驗組,得到20組測試航班中每個航班第5 min位于到達口的人數(shù),同理預(yù)測得到每間隔5 min的到達口人數(shù)。在以上預(yù)測數(shù)據(jù)的基礎(chǔ)上,選取近機位20組測試數(shù)據(jù)中表1樣例數(shù)據(jù)每5 min的預(yù)測結(jié)果進行組合,如圖4所示。
分析近機位到達口旅客人數(shù)預(yù)測圖4發(fā)現(xiàn),不同機位距離和行李數(shù)量的航班旅客在到達口的分布規(guī)律存在差異。究其原因,航班1、航班2因機位距離較近以及行李數(shù)量較小導致的行李處理時間短,使得不提取行李旅客與提取行李旅客短時間內(nèi)集中出站,因此圖4(a)、圖4(b)出現(xiàn)了單個高峰。而航班3、航班4因為機位距離較遠因此旅客集散過程更為離散,且航班行李數(shù)量較多導致行李處理時間較長,因此使得圖4(c)、圖4(d)不取行李旅客和提取行李旅客的分布規(guī)律在圖形中出現(xiàn)了兩個高峰。
遠機位旅客一般由擺渡車分兩批運送,時間分布較長。因第一批旅客到達航站樓后由于擺渡車在該機場送達位置距離到達口較近,因此與以上圖4(a)、圖4(b)近機位旅客分布規(guī)律相似,在短時間內(nèi)出現(xiàn)了單個高峰。隨著時間的推移,根據(jù)擺渡車運送距離和速度測算在第25 min~30 min處遠機位航班兩批旅客在到達口會發(fā)生客流重疊,于是遠機位航班旅客呈現(xiàn)出兩個相似高峰規(guī)律。如圖5所示。
針對近遠機位利用20組檢驗的預(yù)測與實際數(shù)據(jù)的值,使用均方根誤差RMSE和擬合優(yōu)度R2進行誤差分析,并增加了機器學習的支持向量機(SVR)預(yù)測模型進行對比誤差分析。以預(yù)測位于到達口較近的近機位旅客人數(shù)為例,計算基于時間價值的雙加權(quán)K近鄰模型的RMSE值以及擬合優(yōu)度R2的值與SVR模型和傳統(tǒng)的K近鄰模型對比效果如圖6、圖7所示。
從圖6、圖7可以分析得到,基于時間價值的雙加權(quán)K近鄰模型與傳統(tǒng)的K近鄰模型和SVR模型比較,均方根誤差RMSE的值最小且其性能平均提高了5.8%。同時擬合優(yōu)度R2的值最大且其擬合優(yōu)度提高了7.2%,顯示了雙加權(quán)的K近鄰算法具有良好的預(yù)測性。
通過對國內(nèi)某大型機場2019年1月~2019年4月期間的國內(nèi)航班進港信息進行分析,對單航班進港旅客到達口人數(shù)進行預(yù)測,最終得到以下研究成果:
(1)提取影響旅客到達口的因素并考慮對預(yù)測對象的比重不同,賦予因素不同的權(quán)重從而改進歐式距離,實現(xiàn)了K值選取方法的優(yōu)化;
(2)針對航班信息時間復(fù)雜和難以量化的問題,提出了進港航班旅客的時間感知價值刻畫方法;
(3)構(gòu)建基于進港航班信息時間價值函數(shù)的雙加權(quán)K近鄰混合模型,均方根誤差RMSE的性能和擬合優(yōu)度R2的值與其它方法相比均有所提高。
進港航班信息時間價值函數(shù)的雙加權(quán)K近鄰模型雖表現(xiàn)出較好的預(yù)測效果,但仍存在缺少特征數(shù)據(jù)、特征體系不完善等問題,未來,隨著空港交通體系的信息化發(fā)展不斷累積特征數(shù)據(jù),完善模型特征體系,從而進一步提升方法的有效性和適用性。