李春曉 李海鷹 蔣 熙 許心越 趙阿群
(1.北京交通大學(xué)軌道交通控制與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室 北京 100044;2.北京交通大學(xué)交通運(yùn)輸學(xué)院 北京 100044;3.北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院 北京 100044)
基于廣義動(dòng)態(tài)模糊神經(jīng)網(wǎng)絡(luò)的短時(shí)車站進(jìn)站客流量預(yù)測(cè)
李春曉1,2李海鷹1蔣 熙1許心越1趙阿群3
(1.北京交通大學(xué)軌道交通控制與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室 北京 100044;2.北京交通大學(xué)交通運(yùn)輸學(xué)院 北京 100044;3.北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院 北京 100044)
軌道交通;廣義動(dòng)態(tài)模糊神經(jīng)網(wǎng)絡(luò);短時(shí)客流預(yù)測(cè);進(jìn)站量
隨著城市軌道交通進(jìn)入網(wǎng)絡(luò)化運(yùn)營(yíng)模式,線網(wǎng)規(guī)模和復(fù)雜性不斷增加,對(duì)城市軌道交通運(yùn)營(yíng)管理提出了更高的要求,短時(shí)客流預(yù)測(cè)不僅是運(yùn)營(yíng)管理與資源配置的基礎(chǔ)[1],還能為運(yùn)能分析及運(yùn)量匹配提供有效的數(shù)據(jù)支持。因此,實(shí)時(shí)準(zhǔn)確的短時(shí)客流預(yù)測(cè)是實(shí)現(xiàn)軌道交通系統(tǒng)高效、有序運(yùn)行的重要保障。
相比中長(zhǎng)期客流,短時(shí)客流具有更強(qiáng)的隨機(jī)性、高度非線性等特點(diǎn),使得傳統(tǒng)的預(yù)測(cè)方法如時(shí)間序列、非參數(shù)回歸模型等不適用于短時(shí)客流預(yù)測(cè)。短時(shí)客流預(yù)測(cè)通常集中在BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法的研究上,但它們存在以下問(wèn)題:BP神經(jīng)網(wǎng)絡(luò)對(duì)初始權(quán)值非常敏感,算法穩(wěn)定性差,收斂速度水平較低,網(wǎng)絡(luò)的泛化能力差[2];支持向量機(jī)則難以訓(xùn)練大規(guī)模的樣本數(shù)據(jù),存在多分類問(wèn)題求解困難的弊端,而軌道交通的客流數(shù)據(jù)量龐大,會(huì)耗費(fèi)大量機(jī)器內(nèi)存與運(yùn)算時(shí)間,故這類方法有很大的局限性[3]。
城市軌道交通車站小時(shí)進(jìn)站客流隨城市生活的節(jié)奏變化在一天內(nèi)呈動(dòng)態(tài)起伏狀分布,車站小時(shí)客流一般有5種分布類型[8]:?jiǎn)畏逍?、雙峰型、全峰型、突峰型和無(wú)峰型。由于軌道交通系統(tǒng)日常服務(wù)的通勤出行比例較高,工作日時(shí)遵從早出晚歸的規(guī)律,所以通常客流在一天內(nèi)呈雙峰型分布。
工作日與休息日的進(jìn)站客流分布有明顯區(qū)別:周一至周五的進(jìn)站量明顯高于休息日,并有明顯的早晚高峰現(xiàn)象,呈現(xiàn)很強(qiáng)的規(guī)律性,而休息日的進(jìn)站客流相對(duì)分散,分布比較均衡,如圖1所示。
圖1 北京地鐵2號(hào)線A站一周內(nèi)各日的分時(shí)進(jìn)站量
節(jié)假日也影響車站短時(shí)進(jìn)站客流分布,十一節(jié)假日期間的進(jìn)站量明顯小于前后兩周的進(jìn)站量。節(jié)假日期間部分市民選擇出去旅游,通勤客流也大大減少,如圖2所示。
圖2 北京地鐵13號(hào)線B站十一假期及前后兩周進(jìn)站量
同時(shí),突發(fā)事件如舉辦大型活動(dòng)、地鐵信號(hào)設(shè)備故障及天氣的驟然變化等也會(huì)對(duì)短時(shí)客流分布產(chǎn)生較大影響。如2013年12月北京地鐵13號(hào)線信號(hào)設(shè)備發(fā)生故障,當(dāng)日13號(hào)線全線客流較平日減少7.37%,約6.29萬(wàn)人次;2013年9月北京地鐵4號(hào)線ATS(自動(dòng)列車監(jiān)控系統(tǒng))工作站故障,當(dāng)日4號(hào)線客流較平日減少15.97%,約20萬(wàn)人次。
因此,在時(shí)間方面,客流受到節(jié)假日、工作日、雙休日及時(shí)段影響;從突發(fā)事件的角度,客流受到重大活動(dòng)、驟然天氣變化等不確定因素的影響。不確定因素會(huì)引起進(jìn)站客流的隨機(jī)波動(dòng),但總體上具有周期變化(如雙峰型)的規(guī)律。進(jìn)站客流曲線具有相似性的特點(diǎn)使得客流預(yù)測(cè)模型可以發(fā)現(xiàn)樣本數(shù)據(jù)規(guī)律,實(shí)現(xiàn)進(jìn)站量預(yù)測(cè)。
3.1 選擇模型輸入變量
選取影響客流分布的主要因素并將其量化后作為模型的輸入變量。變量維數(shù)過(guò)多會(huì)給網(wǎng)絡(luò)學(xué)習(xí)帶來(lái)不必要的麻煩,并可能造成預(yù)測(cè)精度的下降;變量維數(shù)過(guò)少,神經(jīng)網(wǎng)絡(luò)難以發(fā)現(xiàn)樣本的規(guī)律性。筆者采用5個(gè)影響因素作為系統(tǒng)的輸入變量,如表1所示。
表1 系統(tǒng)輸入變量及其標(biāo)定方法
圖3 GDFNN結(jié)構(gòu)
在輸入層,節(jié)點(diǎn)的個(gè)數(shù)為系統(tǒng)輸入變量的個(gè)數(shù),共有r個(gè)輸入變量,每個(gè)輸入變量xi(i= 1, 2,…,r)有u個(gè)隸屬函數(shù)uij(j= 1, 2,…,u)。在隸屬函數(shù)層,筆者采用高斯函數(shù)作為隸屬函數(shù),表示為:
(2)
輸出層的輸出是每一個(gè)輸入信號(hào)的疊加。輸出變量為
(3)
式中,ωj是結(jié)果參數(shù)或第j個(gè)規(guī)則的連接權(quán)。
1) 初始化系統(tǒng)預(yù)定義參數(shù)。
2) 輸入第1個(gè)樣本數(shù)據(jù)產(chǎn)生第1條模糊規(guī)則。
3) 輸入新的樣本數(shù)據(jù),計(jì)算當(dāng)前樣本與所有模糊規(guī)則的馬氏距離,找到最小值dmin,并計(jì)算實(shí)際輸出誤差ei。
4) 若滿足dmin>kd,則轉(zhuǎn)5);否則轉(zhuǎn)7)。其中,kd是與學(xué)習(xí)次數(shù)有關(guān)的設(shè)定值。
5) 若滿足ei>ke,則產(chǎn)生新規(guī)則,并計(jì)算出所有規(guī)則的重要性η;否則轉(zhuǎn)8)。其中,ke是與學(xué)習(xí)次數(shù)有關(guān)的設(shè)定值。
6) 若滿足η 7) 若滿足ei>ke,則調(diào)整高斯函數(shù)的寬度和結(jié)果參數(shù);否則轉(zhuǎn)8)。 8) 調(diào)整結(jié)果參數(shù)。 9) 觀測(cè)是否完成,若仍有數(shù)據(jù)則返回3),否則結(jié)束學(xué)習(xí)。 1) 根據(jù)影響客流分布的因素確定預(yù)測(cè)模型的輸入變量。 3) 對(duì)訓(xùn)練完成的網(wǎng)絡(luò),使用測(cè)試數(shù)據(jù)測(cè)試網(wǎng)絡(luò)的性能。 4) 使用預(yù)測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè),驗(yàn)證模型的有效性。 4.1 樣本數(shù)據(jù)選擇與預(yù)處理 樣本車站為:復(fù)興門站(兩線換乘站,進(jìn)出站客流有明顯潮汐特征)、西直門站(三線換乘站,交通樞紐)、回龍觀站(早高峰進(jìn)站客流大)。統(tǒng)計(jì)2013年9月20日至2013年12月27日每日各時(shí)段(以小時(shí)為單位)車站的進(jìn)站量,進(jìn)行實(shí)驗(yàn)。 訓(xùn)練數(shù)據(jù):2013年9月20日到2013年12月19日分時(shí)段的進(jìn)站量,共1 547個(gè)數(shù)據(jù)。 測(cè)試數(shù)據(jù):2013年12月20日到2013年12月24日分時(shí)段的進(jìn)站量,共85個(gè)數(shù)據(jù)。 預(yù)測(cè)數(shù)據(jù):2013年12月25日到2013年12月26日分時(shí)段的進(jìn)站量,共34個(gè)數(shù)據(jù)。 實(shí)驗(yàn)時(shí),采用高斯函數(shù)作為隸屬函數(shù),其最佳使用范圍為[0,1]。為避免原始數(shù)據(jù)過(guò)大造成網(wǎng)絡(luò)麻痹,并提高網(wǎng)絡(luò)泛化能力,需要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理后作為網(wǎng)絡(luò)的輸入(式4),并對(duì)網(wǎng)絡(luò)輸出進(jìn)行反歸一化處理(式5),得到預(yù)測(cè)值 (4) Y(t)=y(t)(maxX(t)-minX(t))+minX(t) (5) 式中,X(t)為原始數(shù)據(jù),x(t)為網(wǎng)絡(luò)輸入,y(t)為網(wǎng)絡(luò)輸出,Y(t)為預(yù)測(cè)數(shù)據(jù)。 4.2 網(wǎng)絡(luò)測(cè)試與訓(xùn)練 筆者對(duì)3個(gè)樣本車站均進(jìn)行了實(shí)驗(yàn),以復(fù)興門站為代表,對(duì)網(wǎng)絡(luò)訓(xùn)練進(jìn)行說(shuō)明。隨著樣本數(shù)據(jù)的增加,模糊規(guī)則在不斷變化,網(wǎng)絡(luò)結(jié)構(gòu)也隨之動(dòng)態(tài)調(diào)整,訓(xùn)練結(jié)束后共產(chǎn)生18條模糊規(guī)則,如圖4所示。 圖4 模糊規(guī)則產(chǎn)生與動(dòng)態(tài)變化過(guò)程 圖5為網(wǎng)絡(luò)訓(xùn)練過(guò)程中的實(shí)際輸出誤差,從圖中可以看出在訓(xùn)練初期網(wǎng)絡(luò)不穩(wěn)定,絕對(duì)誤差值和變化幅度都較大(最大為2 000人次),隨著訓(xùn)練的進(jìn)行,從第1 000組數(shù)據(jù)開始,誤差維持在0至200之間,網(wǎng)絡(luò)趨于穩(wěn)定。 圖5 網(wǎng)絡(luò)實(shí)際輸出誤差 網(wǎng)絡(luò)學(xué)習(xí)結(jié)束后,采用85個(gè)測(cè)試數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行穩(wěn)定性驗(yàn)證。圖6為測(cè)試數(shù)據(jù)的預(yù)測(cè)值和期望值對(duì)比圖,從圖中情況來(lái)看,期望值與預(yù)測(cè)值曲線擬合程度高。圖7為相對(duì)誤差圖,最大相對(duì)誤差值為8.00%,預(yù)測(cè)效果良好。 圖6 測(cè)試數(shù)據(jù)結(jié)果對(duì)比 圖7 測(cè)試數(shù)據(jù)相對(duì)誤差 4.3 預(yù)測(cè)結(jié)果性能分析 預(yù)測(cè)結(jié)果如圖8所示,預(yù)測(cè)值與期望值擬合程度較好。復(fù)興門站預(yù)測(cè)值相對(duì)誤差的絕對(duì)值最大為7.96%,最小為0.45%;西直門站預(yù)測(cè)值相對(duì)誤差的絕對(duì)值最大為7.04%,最小為0.04%;回龍觀站預(yù)測(cè)值相對(duì)誤差的絕對(duì)值最大為7.25%,最小為0.36%。 圖8 3座車站預(yù)測(cè)結(jié)果 表2 3種預(yù)測(cè)方法指標(biāo)比較 目前,由于訓(xùn)練數(shù)據(jù)僅包含兩個(gè)月的日常進(jìn)站客流數(shù)據(jù)和一年的節(jié)假日(十一假期)數(shù)據(jù),數(shù)據(jù)樣本量有限,導(dǎo)致模型預(yù)測(cè)的最大誤差為8%,但隨著進(jìn)站客流數(shù)據(jù)的豐富,網(wǎng)絡(luò)泛化能力加強(qiáng),預(yù)測(cè)精度會(huì)進(jìn)一步提高。 [2] 周開利, 康耀紅.神經(jīng)網(wǎng)絡(luò)模型與其MATLAB仿真程序設(shè)計(jì)[M].北京:清華大學(xué)出版社,2005. [3] 董升偉.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的軌道交通 短 時(shí) 客 流 預(yù)測(cè)方法研究[D].北京:北京交通大學(xué),2013. (編輯:王艷菊) Li Chunxiao1,2Li Haiying1Jiang Xi1Xu Xinyue1Zhao Aqun3 (1.State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing 100044;2.School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044;3.School of Computer and Science, Beijing Jiaotong University, Beijing 100044) Directing against the characteristics of unbalanced, highly nonlinear and dynamic short-term entrance passenger flow of rail transit, the paper presents a short-term entrance passenger flow forecast method based on generalized dynamic fuzzy neural networks(GD-FNN), which combines the logical reasoning ability of fuzzy technology with the self-learning ability of neural networks. The paper determines the main factors affecting the distribution of short-term passenger flow by analyzing the features of passenger flow with the data of Beijing metro stations; and then a forecast model has been established by using GD-FNN to predict the short-term entrance passenger flow; finally, several stations in Beijing rail transit are used as numerical examples to confirm that this model can precisely approximate to the practical data (maximum relative error is less than 8%) and has good stability compared with traditional neural networks. rail transit;generalized dynamic fuzzy neural networks;short-term passenger forecast;entrance passenger flow 李春曉,女,碩士研究生,從事城市軌道交通客流組織研究,14120844@bjtu.edu.cn 國(guó)家重點(diǎn)實(shí)驗(yàn)室自主課題(RCS2015ZZ002) U293.6 A4 案例分析
5 結(jié)語(yǔ)