李 郁,韓 松,婁永梅,張 寧
(1.北京全路通信信號研究設(shè)計(jì)院集團(tuán)有限公司,北京 100070;2.東南大學(xué)自動化學(xué)院,南京 210018;3.東南大學(xué)智能運(yùn)輸系統(tǒng)研究中心軌道交通研究所,南京 210018)
隨著國內(nèi)城市化進(jìn)程加快,城市人口急劇增加,軌道交通作為緩解城市交通擁堵的重要方式在國內(nèi)得到了大力推廣應(yīng)用,很多城市的軌道交通已進(jìn)入網(wǎng)絡(luò)化運(yùn)營階段,同時路網(wǎng)客流需求分布越來越復(fù)雜,對地鐵運(yùn)營組織及安全保障提出更高要求[1-2]。而運(yùn)營組織的核心是根據(jù)軌道交通客流的變化有效調(diào)配和使用系統(tǒng)資源,及時調(diào)整運(yùn)營策略,保證軌道交通安全完成運(yùn)輸任務(wù)[3]??土黝A(yù)測及分析作為運(yùn)營管理的基礎(chǔ),能夠?yàn)檎军c(diǎn)管理和應(yīng)急響應(yīng)提供決策依據(jù),同時也是軌道交通服務(wù)水平、系統(tǒng)運(yùn)行狀態(tài)評價的重要指標(biāo),實(shí)現(xiàn)不同場景下客流的準(zhǔn)確預(yù)測,可以及時了解各條線路的客流信息,輔助地鐵運(yùn)營部門制定合理的方案, 使軌道交通的運(yùn)營管理更加精細(xì)化[4-6]。
軌道交通客流預(yù)測的應(yīng)用開發(fā)按難易程度可分為3 類:商業(yè)軟件、利用專業(yè)工具軟件開發(fā)、自主開發(fā)。商業(yè)軟件無需使用者對其進(jìn)行任何開發(fā)操作,但目前還沒有經(jīng)過市場檢驗(yàn)并得到行業(yè)內(nèi)廣泛認(rèn)可的相關(guān)產(chǎn)品;自主開發(fā)既要求開發(fā)人員對軟件開發(fā)語言和開發(fā)環(huán)境有極高的熟練度,如:python、java 等,又要求開發(fā)人員具有深厚的客流預(yù)測理論和算法功底,所以此種開發(fā)方式一般情況下也不適用;而一些專業(yè)工具軟件如SPSS Modeler 集成了多種通用、成熟的算法和模型,可以在軌道交通網(wǎng)絡(luò)化運(yùn)營的初期,根據(jù)不同的客流類型進(jìn)行二次開發(fā),操作簡單,上手容易,非常適用于運(yùn)營工作人員。當(dāng)這些人員積累了足夠的經(jīng)驗(yàn)和理論儲備之后,可以進(jìn)行以本地特色需求為導(dǎo)向的自主研發(fā)。南京地鐵線網(wǎng)指揮中心客流預(yù)測模塊即是采用這種方式開發(fā),本文首先介紹SPSS Modeler 的開發(fā)環(huán)境,然后討論南京地鐵線網(wǎng)指揮中心客流預(yù)測模塊的開發(fā)過程。
SPSS Modeler 是一個數(shù)據(jù)挖掘工作平臺,它由SPSS 統(tǒng)計(jì)分析軟件與Clementine 數(shù)據(jù)挖掘軟件整合形成[7],擁有諸多行之有效的統(tǒng)計(jì)分析方法,充分利用計(jì)算機(jī)的運(yùn)算處理能力和圖形展現(xiàn)能力,將應(yīng)用、方法與工具有效結(jié)合,擁有直觀的操作界面、自動化的數(shù)據(jù)準(zhǔn)備和成熟的預(yù)測分析模型[8]。主要包含兩大類功能:數(shù)據(jù)功能和模型管理功能,下面分別介紹。
1)數(shù)據(jù)導(dǎo)入和導(dǎo)出
數(shù)據(jù)傳輸是處理客流數(shù)據(jù)的必要條件,SPSS Modeler 可以通過“源節(jié)點(diǎn)”系列功能與多方面來源的數(shù)據(jù)進(jìn)行導(dǎo)入或?qū)С觯畛S玫臄?shù)據(jù)來源是數(shù)據(jù)庫和存儲在本地或是服務(wù)器中的變量文件。也可與存儲在服務(wù)器中的變量文件建立連接,只需將該軟件的模式調(diào)整為相應(yīng)的服務(wù)器模式即可。
2)數(shù)據(jù)處理
數(shù)據(jù)的有效處理是保證客流預(yù)測準(zhǔn)確性、高效性的必要前提。運(yùn)用“記錄選項(xiàng)”系列功能對導(dǎo)入的多源數(shù)據(jù)進(jìn)行處理,包括“選擇”、“排序”、“匯總”、“合并”等處理方式,將原始的輸入數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為客流預(yù)測模型所需要的類型。
3)模型運(yùn)算功能
SPSS Modeler 提供的“建?!惫δ埽瑥膽?yīng)用方法可以分為回歸模型、分類模型和聚類模型。也可根據(jù)客流數(shù)據(jù)類型分為無監(jiān)督學(xué)習(xí)模型和有監(jiān)督學(xué)習(xí)模型。如:常見的時間序列模型,大都為單輸入單輸出的無監(jiān)督回歸模型。其他回歸預(yù)測方法多為多輸入單輸出的有監(jiān)督回歸模型。這些節(jié)點(diǎn)都已將算法集成好,直接連接使用即可。
4)圖形分析功能
該功能以圖形形式和分析指標(biāo)形式展現(xiàn)結(jié)果。其中圖形形式包括:折線圖,熱力圖,散點(diǎn)圖,分析指標(biāo)形式包括:誤差,線性相關(guān)等。通過此功能可對預(yù)測結(jié)果進(jìn)行分析,計(jì)算模型的可靠性指標(biāo)。
針對不同的客流預(yù)測類型應(yīng)開發(fā)專門的模型與其對應(yīng),因此對多種模型的管理是必不可少的。SPSS Modeler 中帶有模型管理功能模塊。開發(fā)人員構(gòu)建的客流預(yù)測模型可添加到此模塊中,可以完成以下一些操作。
1)模型注冊
利用此功能,可以將客流預(yù)測中的每種模型注冊到此管理模塊中,其中包括模型標(biāo)識信息、模型參數(shù)信息、模型調(diào)用信息。
2)模型查詢
使用者可以對已經(jīng)注冊的模型按照模型的分類、名稱、描述等進(jìn)行查詢。
3)模型維護(hù)
支持使用者新增、修改和刪除模型,對于已經(jīng)注冊的預(yù)測模型,可以對其屬性及參數(shù)進(jìn)行調(diào)整。
以南京地鐵線網(wǎng)指揮中心項(xiàng)目中的短時客流預(yù)測功能實(shí)現(xiàn)為例,討論客流預(yù)測模型在SPSS Modeler 中的數(shù)據(jù)連接、數(shù)據(jù)處理、預(yù)測建模以及完整運(yùn)行過程。
數(shù)據(jù)來源為存儲在數(shù)據(jù)庫中的實(shí)際客流數(shù)據(jù),首先需建立SPSS Modeler 與相應(yīng)數(shù)據(jù)庫的連接,通過“數(shù)據(jù)庫”節(jié)點(diǎn)可建立軟件與數(shù)據(jù)庫的連接,進(jìn)而可以從數(shù)據(jù)庫中的表選取相應(yīng)的客流數(shù)據(jù)。如圖1 所示。
圖1 SPSS Modeler與數(shù)據(jù)庫建立連接Fig.1 Establishing connection between SPSS Modeler and database
為使實(shí)際客流數(shù)據(jù)能有效進(jìn)行處理,在本預(yù)測中首先進(jìn)行數(shù)據(jù)篩選、進(jìn)行格式轉(zhuǎn)換以符合本預(yù)測模型中的數(shù)據(jù)輸入格式。例如:“選擇”節(jié)點(diǎn)可以對數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行篩選。如圖2 所示,可以遵循CLEM 語言構(gòu)建相應(yīng)的表達(dá)式,從而對源節(jié)點(diǎn)中傳來的數(shù)據(jù)進(jìn)行篩選,選擇符合客流預(yù)測條件歷史的數(shù)據(jù)。
本例使用時間序列模型進(jìn)行短時客流預(yù)測,在SPSS Modeler 中已集成好時間序列模型節(jié)點(diǎn),只需將處理好的數(shù)據(jù)傳輸?shù)侥P椭?,并設(shè)置模型參數(shù)即可,如圖3 所示。
圖2 選擇節(jié)點(diǎn)Fig.2 Node selection
圖3 時間序列模型參數(shù)設(shè)置Fig.3 Parameter configuration of time series model
一個完整的客流預(yù)測模型就是通過數(shù)據(jù)的導(dǎo)入、處理、模型運(yùn)算、分析,導(dǎo)出形成的,如圖4 所示,為短時客流預(yù)測模型。模型的運(yùn)行可分為手動運(yùn)行和自動運(yùn)行。
如圖5 所示為本次短時客流預(yù)測的輸出結(jié)果,內(nèi)容包含預(yù)測日期、站點(diǎn)編號、進(jìn)站量、出站量等。
圖4 短時客流預(yù)測模型Fig.4 Model for predicting short-term passenger flow
圖5 短時客流預(yù)測結(jié)果Fig.5 Predictions of short-term passenger flow
在南京線網(wǎng)指揮中心系統(tǒng)中,不僅需要短時客流預(yù)測模型,還需要其他多種客流預(yù)測模型及評估模型,對其進(jìn)行分類為:客流預(yù)測模型、元數(shù)據(jù)管理模型、評估模型、結(jié)果管理模型。如圖6 所示。
圖6 模型管理Fig.6 Model management
通過在南京線網(wǎng)指揮中心系統(tǒng)中的實(shí)際應(yīng)用,可對在SPSS Modeler 環(huán)境下開發(fā)客流預(yù)測模塊做出如下總結(jié)。
1)可進(jìn)行定時客流預(yù)測
短時客流預(yù)測或短期客流預(yù)測按計(jì)劃時間定時預(yù)測,可有效節(jié)省應(yīng)用開發(fā)人員的時間和精力。
2)開發(fā)靈活,使用簡便
利用SPSS Modeler 可根據(jù)業(yè)務(wù)需求開發(fā)不同類型的客流預(yù)測模型,操作簡單,使用靈活,可大大提升管理人員的工作效率。
3)預(yù)測結(jié)果可報表處理
客流預(yù)測模型可生成直觀的客流數(shù)據(jù),為運(yùn)營管理提供針對性的數(shù)據(jù)支持,面向管理人員并可以利用SPSS Modeler 生成并導(dǎo)出客流預(yù)測的報表和報告。