付保明 王 健 張 寧 徐 文
(1.東南大學智能運輸系統(tǒng)研究中心城市軌道交通研究所,210096,南京;2.南京地鐵建設有限責任公司,210008,南京;3.北京城建設計發(fā)展集團股份有限公司,100037,北京;4.蘇州市軌道交通集團有限公司,215004,蘇州//第一作者,助理工程師)
客流預測是基于時間序列的客流數(shù)據來預測未來某個時間段的客流量,通常將時間粒度小于15 min的客流預測稱為短時客流預測[1]。隨著軌道交通在我國的快速發(fā)展,軌道交通運營與管理面臨著新的機遇與挑戰(zhàn)。作為運營管理的基礎,短時客流預測與分析不僅能為客運組織安排提供可靠依據,并且能有效降低擁堵機率,提高服務水平,提升軌道交通車站乃至整個線網管理與服務能力[2]。
軌道交通短時客流受天氣等多種因素的影響,既表現(xiàn)出相對穩(wěn)定性,又有較強的不確定性??土黝A測的常用方法,如時間序列模型[3]、馬爾科夫模型、神經網絡[4]、支持向量機[5]等,存在樣本量較大、參數(shù)標定復雜等問題,且對短時客流不確定性的考慮不足。
云模型不僅考慮研究對象的隨機性,還能反映隨機性與模糊性之間的關聯(lián)性,同時具備實現(xiàn)定性趨勢與定量數(shù)值之間的轉換能力,已被廣泛運用于時間序列預測、方案決策評價等方面,并取得了良好的效果[6]。筆者在南京地鐵自動售檢票系統(tǒng)(Automatic Fare Collection,AFC)客流數(shù)據的基礎上,統(tǒng)計分析了線路短時進站客流規(guī)律,結合云模型的相關理論,構建了基于云模型的單條件多規(guī)則不確定性預測模型,利用該模型對南京地鐵2號線線路短時進站客流進行預測,并驗證了該模型的有效性。
城市軌道交通線路進站客流在1 d內隨城市生活的節(jié)奏呈動態(tài)變化。雖然各工作日短時客流整體變化趨勢相同,即它們的變化具有周期性規(guī)律,但由于生活中存在著許多無法預測的不確定性因素而影響著人們的出行,導致相同時段的短時客流量又存在一定的差異。因此,可用準周期性來描述線路工作日這種短時進站客流的時間分布規(guī)律。雙休日的客流時間分布特征雖與工作日相差較大,但也存在準周期性,并且兩者的準周期長度均為1 d。南京地鐵2號線某周工作日與雙休日以15 min為1個計時單元的進站客流量時間分布如圖1 a)、b)所示。
短時客流的準周期性表明了客流量與時間的密切關系。云模型能夠對客流量和時間進行有效的軟化分,建立時間、客流量定性概念與定量數(shù)據之間的不確定性轉化關系。同時,基于客流的準周期性,通過建立時間云與客流云之間的關聯(lián)關系,僅利用時間等簡單信息便可預測未來客流量的大小和置信區(qū)間等。
因此,利用云模型進行短時客流的預測,對樣本數(shù)據量的要求較低,且能充分考慮客流的不確定性,是一種切實可行的方法。
圖1 南京地鐵2號線進站客流時間分布(以15 min為1個計時單元)
對于軌道交通客流時間序列D:{(ti,qi)|0≤ti<t},其客流數(shù)據的準周期長度為 T(1 d),預測時間 ty可表示為 ty=t′+K·T。其中,t′∈[0,T],K 為整數(shù)。則客流數(shù)據可以分為歷史客流數(shù)據HD:{(ti,qi)|0≤ti<K·T}和當前趨勢客流數(shù)據CD:{(ti,qi)|K·T≤ti<t}。根據歷史客流數(shù)據生成歷史時間云以及客流云模型,根據當前趨勢客流數(shù)據生成當前趨勢云模型,并建立定性推理規(guī)則,以實現(xiàn)短時客流預測。
設論域U是一個用精確數(shù)值表示的集合且U={u},T是論域U上的某一定性概念。論域中的任意元素u對概念T的隸屬程度CT(u)∈[0,1]是一有穩(wěn)定傾向的隨機數(shù)。概念T的云模型是從論域U到區(qū)間[0,1]的映射[7]:
云模型 T(Ex,En,He)用期望值 Ex、熵 En及超熵He等3個參數(shù)來描述,將模糊性和隨機性完全集成在一起,從而構成定性概念和定量值相互間的映射。Ex表示最能代表概念T的點,它完全屬于該定性概念。En是概念T模糊度的度量,反映了該概念的不確定性。He也稱為熵的熵,反映了云的離散程度。
云發(fā)生器(Cloud Generate,CG)是指用軟件或者固化硬件實現(xiàn)云的生成算法,可分為正向云、逆向云、x-條件云、y-條件云發(fā)生器。正向云發(fā)生器和逆向云發(fā)生器相結合,即可實現(xiàn)定性與定量的隨機轉換。
2.2.1 歷史云
歷史云涵蓋了兩個云概念:歷史時間云和歷史客流云。其中,歷史時間云反映了歷史準周期客流在時間上的集聚狀態(tài),是對高峰期、低谷期等不確定性客流時間概念的描述,在具體的時間值與定性時間概念之間建立不確定性關系;歷史客流云則與時間云相對應,表明了各時間概念對應的客流量低、中、高等定性概念與具體客流量之間的關系。
對于歷史客流時間序列HD:{(ti,qi)|0≤ti<K·T},首先統(tǒng)計得到歷史客流每日平均時間分布,然后采用基于峰值的云變換算法[8]得到初始時間云概念模型,即:
式中:
g(x)——客流平均時間分布函數(shù);
fi(x)——基于云的概率密度期望函數(shù);
ci——幅度系數(shù);
m——變換后云的個數(shù);
ε——用戶定義的可允許的最大誤差。
通過云變換得到的時間云比較粗糙,相鄰云之間的相似度有可能過高,存在概念重復等不足,有必要采用考慮云的幅度系數(shù)影響的概念躍升方法[9]對云變換之后的概念進行簡化,形成意義更加清晰獨立的時間云概念。
依據正態(tài)云的“3En準則”確定各時間云對應的時間范圍,并根據該時間范圍內客流的變化情況確定歷史客流云的Ex、En以及He參數(shù)值,從而形成與各時間云相對應的歷史客流云模型。
2.2.2 當前客流趨勢云
對于當前趨勢客流CD:{(ti,qi)|K·T≤ti<t},依據短時客流時間序列客流數(shù)據相對穩(wěn)定的特性,采用無需確定度信息的逆向正態(tài)云算法[10],僅利用當前趨勢客流數(shù)據生成預測時間點所對應的當前客流云模型,以定義當前客流變化趨勢下,客流量與客流定性概念之間的不確定關系,稱為當前客流趨勢云。
2.2.3 預測云
軌道交通客流歷史云反映了客流的整體變化規(guī)律,不能完全表示當前客流細節(jié)變化情況,而當前客流趨勢云模型只反映了未來的可能性,不能產生精確的預測結果。因此有必要將歷史客流云與當前趨勢云進行合并,生成預測云。假設與當前趨勢云模型Ct(Ext,Ent,Het)對應的歷史客流云模型為Hi(Exi,Eni,Hei),則兩者采用加權算法合成的預測云模型Si(Exi,Eni,Hei)滿足:
由公式(3)可見,預測云模型同時考慮了客流的整體變化規(guī)律以及當前客流局部變化趨勢,更加精確地定義了未來短時時間內客流量與客流定性概念之間的存在關系。
將預測時間ty作為各個x-條件時間云發(fā)生器的輸入,輸出預測時間ty對各個時間云的隸屬度,然后選擇最大隸屬度對應的時間云作為其隸屬云,實現(xiàn)對預測時間ty的軟化分。
時間云與客流云之間可建立一一對應的關系,如軌道交通客流高峰期間的客流量大,低谷期間的客流量小等對應關系等。依據時間云與客流云之間的對應關系,可建立兩者的關聯(lián)規(guī)則:預測時間ty所隸屬的時間云Ti(Exi,Eni,Hei)與歷史客流云Hj(Exi,Eni,Hei)存在定性關聯(lián)規(guī)則“If TiThen Hj”如圖2所示。
圖2 基于云模型的關聯(lián)規(guī)則
在確定時間云、客流預測云以及關聯(lián)規(guī)則后,將時間云作為云模型關聯(lián)規(guī)則的規(guī)則前件,將客流預測云作為關聯(lián)規(guī)則的規(guī)則后件,并且分別將預測時間和預測客流作為規(guī)則前件的輸入及規(guī)則后件的輸出,建立單條件多規(guī)則發(fā)生器,即可實現(xiàn)短時客流的單條件多規(guī)則不確定性預測,該定性預測機理如圖3所示。
圖3 單條件多規(guī)則不確定性預測機理
由圖3可知,利用云模型進行短時客流預測所需的數(shù)據量較少,依據客流的準周期性,僅需上一個周期(即前一天)以及當前趨勢客流數(shù)據即可對當前短時時間段的客流量進行預測。但為減輕客流隨機性的干擾,將近期的歷史周期平均客流作為歷史客流周期客流,可進一步提高預測的精度。
選取南京地鐵2號線2013年12月9日至2013年12月22日期間運營時間為6:00~23:00,以15 min為1個計時單元的線路進站客流數(shù)據,共計952個樣本數(shù)據。由于工作日與雙休日的客流時間分布規(guī)律不同,需對兩者分別建模分析。本文只對工作日的客流建模進行分析(雙休日客流類似)。
首先將2013年12月9日至2013年12月19日期間普通工作日客流數(shù)據作為歷史客流,獲得工作日歷史平均客流時間分布曲線,利用基于峰值的云變換方法得到歷史客流時間分布基礎云模型。工作日歷史平均客流時間分布及時間云的概率密度期望函數(shù)如圖4a)所示。利用考慮云的幅度系數(shù)影響的概念躍升方法對初始時間云進行概念躍升,得到9個時間概念的云模型,如圖4b)所示。
將2013年12月19日6:00~9:00的客流作為當前趨勢客流,9:00之后各計時單位的客流作為待預測客流,依據本文建立的預測模型進行短時客流的預測。
由于模型本身的不確定性,預測系統(tǒng)相同的預測時間輸入會得到不同客流輸出。因此,本文在進行客流預測時采取多次輸入預測時間得到多個預測值,然后采用加權平均法獲得最終預測值;也可根據實際需求,依據多個預測值的分布得到客流預測區(qū)間。同時本文采用迭代預測法實現(xiàn)多個時間段客流量的預測,即迭代預測未來客流量并根據預測值迭代構造當前趨勢云,最終得到下一時刻的客流預測值。
采用ARIMA預測模型對客流量進行預測,并與云模型的預測結果進行對比,兩者的預測結果如圖5所示。
圖5 兩種預測方法預測值與實際值的對比(以15 min為1個計時單元)
為了評價預測效果,通過平均絕對偏差(EMAD)、誤差標準偏差(ESDE)以及平均絕對百分誤差(EMAPE)進行分析評價,計算方法如式(4)所示:
兩種預測方法對應評價指標值如表1所示。
表1 兩種預測方法評價指標對比
由表1可知,采用云模型預測方法的EMAD、ESDE及EMAPE指標值分別為184.8、229.1和3.33%,均優(yōu)于ARIMA預測模型??梢姡捎迷颇P瓦M行軌道交通短時客流預測是可行、有效的。
針對軌道交通短時客流的不確定特點,提出了基于云模型的單條件多規(guī)則軌道交通短時客流預測模型。該方法充分體現(xiàn)了預測中數(shù)據的模糊性和隨機性特征,在對實際客流數(shù)據的分析預測中,表現(xiàn)出了較高的預測精度??紤]到客流影響因素的多樣性,當外界發(fā)生突發(fā)情況時,模型的預測精度可能受到影響。因此,下一步主要考慮將影響客流的其他因素,如天氣、突發(fā)情況等納入預測模型,形成多條件多規(guī)則的短時客流預測模型,并與模糊神經網絡等智能算法相結合,進一步提高客流預測的精度。
[1] 陸海亭,張寧,黃衛(wèi),等.短時交通流預測方法研究進展[J].交通運輸工程與信息學報,2009,7(4):84.
[2] 王雪梅,張寧,張云龍.城市軌道交通短時客流預測體系框架及關鍵技術[J].交通運輸工程與信息學報,2013,11(2):107.
[3] 王奕,徐瑞華.基于周期時變特點的城市軌道交通短期客流預測研究[J].城市軌道交通研究,2010,13(1):46.
[4] 魯明旭,葉銀忠,馬向華.神經網絡在地鐵客流預測中的應用[J].機械研究與應用,2012,25(3):86.
[5] 周家中,張殿業(yè).基于空間加權的LS-SVM城市軌道交通車站客流量預測[J].鐵道學報,2014,36(1):1.
[6] 楊錦偉,肖新平,郭金海,等.基于少數(shù)據云推理的短時交通流預測模型[J].交通運輸系統(tǒng)工程與信息,2015,15(3):64.
[7] 蔣嶸,李德毅,陳暉.基于云模型的時間序列預測[J].解放軍理工大學學報,2000,1(5):13.
[8] 秦昆,王佩.基于云變換的曲線擬合新方法[J].計算機工程與應用,2008,44(23):56.
[9] 孟暉,王樹良,李德毅.基于云變換的概念提取及概念層次構建方法[J].吉林大學學報(工學版),2010,40(3):782.
[10] 陳昊,李兵,劉常昱.一種無確定度的逆向云算法[J].小型微型計算機系統(tǒng),2015,36(30):544.