趙源
(同濟大學(xué) 道路與交通工程教育部重點實驗室,上海 201804)
近年來,城市人口快速增加,軌道交通已經(jīng)成為大眾出行首選的主要交通方式,具有安全性高、速度快、環(huán)保、容量大等多方面優(yōu)勢,越來越受到廣大乘客的歡迎。隨著城市軌道交通的發(fā)展與信息技術(shù)手段的進步,城市軌道交通的智慧運營已經(jīng)成為了城市軌道交通發(fā)展的重要方向,其中地鐵車廂滿載率是關(guān)系到運營管理的重要數(shù)據(jù)之一?,F(xiàn)有車廂滿載率一般采用車輛稱重或者票卡清分的方式而得到,計算得到的滿載率以分級的方式呈現(xiàn),表現(xiàn)方式較為粗獷,獲取的數(shù)據(jù)精度不足,不足以支撐智慧化、精細化的運營管理。如何利用科學(xué)可靠的技術(shù)實現(xiàn)地鐵車廂內(nèi)乘客均勻度的智能調(diào)控,促進智慧地鐵的發(fā)展,成為當(dāng)前研究的重要課題。
車廂滿載率是通過車廂額定載客量與實際載客量的比值來確定?,F(xiàn)有一些關(guān)于車廂滿載率的研究論文。如:文獻[1]中提出,通過對車輛定員概念進行分析,將車輛定員與擁擠度進行探討,得出車廂定員標(biāo)準(zhǔn)應(yīng)為6 人/平米;文獻[2]介紹了中國和美國對于滿載率的定義,運用對比分析和統(tǒng)計學(xué)方法,對公交車輛額定乘載人數(shù)進行修正,建立了新的滿載率計算模型,從而實現(xiàn)對公交線路車輛滿載率理論定義的修正;文獻[3]在基于視頻圖像分析的基礎(chǔ)上,利用卷積神經(jīng)網(wǎng)絡(luò)提出了一種地鐵列車車廂擁擠度識別方法;文獻[4]在北京地鐵4 號線的斷面區(qū)間車廂進行實地調(diào)研,從而獲取車廂立席密度,進一步得到車廂滿載率與乘客滿意度之間的關(guān)系,建立了乘客舒適度模型函數(shù)等等。
WIFI 探針是一種新型采集客流量的設(shè)備,其可以檢測到利用智能設(shè)備連接上WIFI 用戶的MAC 地址等信息,這些信息可記錄一定的身份識別功能且具有唯一性。WIFI 探針具有擴展性較強且信號傳輸不易受非視距誤差及多徑衰落影響等優(yōu)點。為解決當(dāng)前現(xiàn)有的地鐵車廂滿載率數(shù)據(jù)精度不夠的難題,本論文擬將使用WIFI 探針在地鐵車廂內(nèi)進行實地客流量檢測,通過與同日同車次的車廂稱重數(shù)據(jù)、斷面客流數(shù)據(jù)進行數(shù)據(jù)融合,得到列車車廂滿載率的估計值。
國外的軌道交通發(fā)展起步較早,關(guān)于客流數(shù)據(jù)的采集方面有了較為先進的研究,主要是將軍用視頻數(shù)據(jù)的采集與跟蹤思路引入行人數(shù)據(jù)采集管理中。國內(nèi)外客流數(shù)據(jù)的采集方法主要分為:人工調(diào)查統(tǒng)計法、自動檢票計票統(tǒng)計法、閉路監(jiān)視器觀察法、圖像處理技術(shù)法、無線電波監(jiān)測粗略預(yù)測法。
中國軌道交通發(fā)展起步較晚,但隨著科技的不斷進步,在軌道交通客流采集方面,也取得了較大的進步。圖像技術(shù)是目前適用范圍最廣的技術(shù)之一,在車站的使用頻率最高。但由于圖像識別設(shè)備價格較高,若在大范圍內(nèi)使用,將帶來高成本的壓力。紅外傳感器、壓力傳感器也是常用的客流采集技術(shù),但其只適合低密度客流量。比如,安裝在電梯處或者公交車的入口處,并不適用地鐵車站環(huán)境。目前,中國采用的軌道交通客流采集技術(shù)[5]有:超聲波定位采集技術(shù)、自動檢票機采集技術(shù)、人工采集技術(shù)等。各種客流采集技術(shù)的優(yōu)缺點詳見表1。
表1 客流采集技術(shù)對比表Tab.1 Passengers flow collection technology comparison table
數(shù)據(jù)挖掘[6-9]是指從大量的數(shù)據(jù)中,通過算法發(fā)現(xiàn)其中有用信息的過程。國外對于數(shù)據(jù)挖掘技術(shù)的研究起步較早,已有了較為廣泛的應(yīng)用。如電信、金融、體育、政府管理、醫(yī)療服務(wù)等領(lǐng)域。國內(nèi)雖起步較晚,但發(fā)展較快,近幾年的研究主要集中在學(xué)習(xí)算法方面。數(shù)據(jù)挖掘的理論基礎(chǔ)可以歸結(jié)到以下幾個方面:
(1)數(shù)據(jù)歸約;
(2)數(shù)據(jù)壓縮;
(3)模式發(fā)現(xiàn);
(4)概率理論;
(5)微觀經(jīng)濟觀點;
(6)歸納數(shù)據(jù)庫。
客流預(yù)測分為短時客流預(yù)測和長時客流預(yù)測,在長時間的研究成果中,形成了各自所適用的研究模型,其中ARIMA 模型和SVM 模型的使用較為廣泛。而ARIMA 模型被廣泛適用于客流的預(yù)測,運算步驟可以歸納為4 個階段:參數(shù)的預(yù)測、序列規(guī)則選擇、模型優(yōu)化及校驗??土鞯臏?zhǔn)確預(yù)測是提高軌道交通運營安全的關(guān)鍵,其中對客流數(shù)量的預(yù)測屬于交通量預(yù)測的重要組成部分。客流預(yù)測與預(yù)測模型主要有神經(jīng)網(wǎng)絡(luò)模型、計量模型、非線性系統(tǒng)理論模型等。
目前有關(guān)軌道交通列車車廂滿載率的研究,大都是在獲得客流量的基礎(chǔ)上,通過計算得到列車的滿載率。獲得客流量的方法,除了傳統(tǒng)的AFC 計數(shù)裝置和人工客流調(diào)查以外,基于高清視頻識別、紅外傳感器、熱敏傳感器等自動化客流采集技術(shù)日趨成熟。但是,由于高成本、覆蓋范圍小、精度低等問題而難以得到推廣和應(yīng)用。WIFI 探針、藍牙等技術(shù)已被用于各大商場客流數(shù)據(jù)采集以及車站站廳客流采集及擁堵點分析,但單項技術(shù)獲取的數(shù)據(jù)量精度仍然較低?,F(xiàn)有針對軌道交通列車滿載率的研究方法,主要有車廂稱重數(shù)據(jù)及票務(wù)清分數(shù)據(jù)。車廂稱重數(shù)據(jù)獲取的滿載率較為粗獷,精度不高;票務(wù)清分數(shù)據(jù)是根據(jù)AFC 刷卡數(shù)據(jù)所獲取的斷面客流量通過清分模型得到的,其準(zhǔn)確性也有待進一步提升。
目前上海軌道交通列車車廂實際滿載率的感知還處在研究階段,數(shù)據(jù)精度不高,尚具有一定的提升挖掘空間。
票務(wù)清分系統(tǒng)主要是通過清分模型,將運營過程中的票款收入,按照一定的規(guī)則分配到各運營線路上。票務(wù)清分系統(tǒng)模型通過乘客的進出站進行分配,得到乘客的出行路徑,進而得到線路的斷面客流。
清分方法的發(fā)展主要經(jīng)歷了以下幾個階段:
(1)人工分賬法;
(2)出站確認法;
(3)基于乘客出行路徑的清分方法。
其中,基于乘客出行路徑的清分方法主要包括3 種:最短路徑清分法、K 短路徑清分法和多路徑選擇概率清分算法。乘客出行路徑的清分方法的思路及適用情況詳見表2。
表2 乘客出行路徑的清分方法對比表Tab.2 Comparison table of classification methods for passengers walking routes
車廂稱重系統(tǒng)是通過安裝在車廂中的稱重傳感器,來檢測車廂中客流的一種裝置。稱重傳感器是一種將質(zhì)量信號轉(zhuǎn)變?yōu)榭蓽y量的電信號輸出的裝置。車廂稱重系統(tǒng)采集客流的基本原理為:車廂稱重系統(tǒng)通過稱重傳感器,將車廂內(nèi)采集到的數(shù)據(jù)進行存儲;當(dāng)軌道交通列車運行到站臺時,稱重系統(tǒng)自動連接站臺區(qū)域覆蓋的無線網(wǎng)絡(luò),并將所采集到的信息進行“車-地”傳輸;再通過線路(既有傳輸系統(tǒng)中百兆以太網(wǎng)通道)傳輸至線路側(cè)OCC(運行控制中心);由OCC 綜合前置網(wǎng)絡(luò)交換機,上傳至COCC(地鐵線網(wǎng)指揮中心)綜合前置網(wǎng)絡(luò)交換機,進入分析服務(wù)器。稱重系統(tǒng)客流數(shù)據(jù)采集過程如圖1 所示。
圖1 稱重系統(tǒng)客流數(shù)據(jù)采集過程Fig.1 Passengers flow data collection process of weighing system
上海軌道交通車廂稱重系統(tǒng)采集到的數(shù)據(jù)內(nèi)容包括:列車編號、車廂號、車廂舒適程度、車廂溫度、車廂載重、時間等信息,見表3。車廂稱重系統(tǒng)將車廂的擁擠度情況分為3 類:舒適、較擁擠、擁擠。
表3 上海軌道交通車廂稱重數(shù)據(jù)Tab.3 Weighing data of Shanghai metro carriages
WIFI 探針采用WLAN(無線局域網(wǎng))技術(shù)實現(xiàn),對于開啟或連接WIFI 的設(shè)備進行數(shù)據(jù)采集。采集原理為:AP 周期性地向四周發(fā)送BEACON(信標(biāo))幀,通知周圍的WIFI 設(shè)備(如手機、筆記本電腦等)AP 的存在;WIFI 設(shè)備也會周期的發(fā)送PROBE(探測)幀,其中包含WIFI 設(shè)備的MAC 地址(Medium Access Control)、信號強度(RSSI)等信息。當(dāng)AP 檢測到WIFI 設(shè)備傳送的PROBE 幀,即記錄WIFI 設(shè)備傳送的信息。因此,在WIFI 探針區(qū)域內(nèi)打開或連接WIFI 則可收集WIFI 設(shè)備信息。
在工作狀態(tài)下,對于開啟WIFI 功能或連接上WIFI 的電子設(shè)備,WIFI 探針能檢測其發(fā)送的信號且記錄生成數(shù)據(jù)文本,其中包括WIFI 設(shè)備MAC 地址、RSSI 和數(shù)據(jù)抓取的日期和時間等基礎(chǔ)信息。
將WIFI 探針數(shù)據(jù)進行清洗,得到數(shù)據(jù)形式見表4。
表4 WIFI 探針采集數(shù)據(jù)表Tab.4 WIFI probe collection data sheet
其中,MAC 表示W(wǎng)IFI 探針采集的MAC 地址(即手機MAC 地址);RSSI 代表WIFI 探針探測到的該幀的信號強度,可用于表征源設(shè)備與WIFI 探針間的距離(距離越近,信號強度值越趨近于0);WIFI_TIME 指WIFI 探針抓取智能設(shè)備WIFI 信號的時間。
通過以上的研究,實現(xiàn)了WIFI 探針數(shù)據(jù)的基本分析。為了準(zhǔn)確可靠地實現(xiàn)軌道交通列車車廂客流的預(yù)測,需建立基于采集的客流數(shù)據(jù)與實際數(shù)據(jù)間的預(yù)測模型。本文利用模型實現(xiàn)車廂客流實時預(yù)測,獲取短時車廂內(nèi)客流的動態(tài)情況。
長短時記憶神經(jīng)網(wǎng)絡(luò)(LSTM)[10]是循壞卷積神經(jīng)網(wǎng)絡(luò)(RNN)中的一種,常用于解決一般循環(huán)卷積網(wǎng)絡(luò)中處理長期依賴梯度彌散的問題。根據(jù)站內(nèi)客流量具有短時性與短期依賴性的特點,本文基于循環(huán)神經(jīng)網(wǎng)絡(luò)的機理,建立了長短時記憶神經(jīng)網(wǎng)絡(luò)的客流預(yù)測模型。
4.2.1 測試方案
實驗測試是在上海軌道交通列車車廂內(nèi)布設(shè)WIFI 探針,使用WIFI 探針采集列車運行過程中車廂中的客流量。由于列車在運行過程中,WIFI 探針會受到地面信號的干擾,為避免這種情況出現(xiàn),選取地下車站進行測試。為此,選取上海軌道交通11 號線上江蘇路站-桃浦新村站為測試站點;由于列車車頭及車尾處不易受到前后節(jié)車廂的干擾,因此選取列車車頭處車廂及其鄰近的兩節(jié)車廂作為測試對象。測試共需8 名工作人員參與:前兩節(jié)車廂內(nèi)分別為3 個人,其中2 人在同一節(jié)車廂的前后處,高舉手持WIFI探針采集乘客手機的MAC 地址,1 人在列車運行間隔的兩站中通過人工計數(shù)統(tǒng)計當(dāng)前車廂的客流量、拍照記錄客流量及記錄列車在每一站的停、發(fā)車時間;最后一節(jié)車廂內(nèi)設(shè)置兩人,在車廂的前后處高舉手持WIFI 探針,采集乘客手機的MAC 地址。
4.2.2 源數(shù)據(jù)預(yù)處理
利用WIFI探針采集的源客流數(shù)據(jù)建立客流量數(shù)據(jù)庫,根據(jù)設(shè)計過濾的算法進行布設(shè)4 探針點采集得到的源數(shù)據(jù)進行預(yù)處理。WIFI 探針A 的源數(shù)據(jù)處理前后的對比如圖2 所示。
圖2 WIFI 探針A 源數(shù)據(jù)過濾前后對比圖Fig.2 Comparison of WIFI probe A source data before and after filtering
從圖2 中可見:過濾前,采集得到的客流數(shù)據(jù)量大,且曲線走勢曲折,波動性較大,說明源數(shù)據(jù)并不符合實際客流數(shù)據(jù)的情況;過濾后,數(shù)據(jù)曲線在0-200 之間波動且走勢平緩,符合實際客流情況。由此說明了源數(shù)據(jù)預(yù)處理算法的有效性與必要性。同理,對其它4 個探針進行統(tǒng)一操作得到預(yù)處理的數(shù)據(jù)結(jié)果見表5。
表5 多探針采集數(shù)據(jù)與實際客流量Tab.5 Multi-probe data collection and actual passengers flow
4.2.3 數(shù)據(jù)處理與分析
通過以上數(shù)據(jù)分析,采集客流數(shù)據(jù)的80%作為網(wǎng)絡(luò)的訓(xùn)練樣本,20%實際客流量作為測試集,數(shù)據(jù)集樣例見表6。
表6 數(shù)據(jù)集樣例表Tab.6 Sample data set table
通過使用WIFI 探針數(shù)據(jù)、當(dāng)天同車次同一節(jié)車廂人工測試得到的實際客流,以及票務(wù)數(shù)據(jù)計算的滿載率進行對比分析,如圖3 所示。
圖3 滿載率對比分析圖Fig.3 Full load rate comparative analysis chart
4.2.4 基于長短時神經(jīng)網(wǎng)絡(luò)客流量預(yù)測模型
本文的LSTM 由輸出層、隱含層與輸出層組成。其中根據(jù)數(shù)據(jù)的特性設(shè)置,設(shè)置相應(yīng)的初始參數(shù)見表7。
表7 LSTM 網(wǎng)絡(luò)基本參數(shù)設(shè)置Tab.7 LSTM network basic parameter settings
將多源數(shù)據(jù)與實際客流量建立LSTM 神經(jīng)網(wǎng)絡(luò),在python 環(huán)境中實現(xiàn)訓(xùn)練。神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程如圖4 所示:
圖4 LSTM 訓(xùn)練誤差曲線Fig.4 LSTM training error curve
從圖4 中可見,剛開始時,誤差曲線下降較快,在500 次訓(xùn)練后,訓(xùn)練的數(shù)據(jù)明顯減慢,在3 000次訓(xùn)練誤差值基本接近預(yù)設(shè)定的誤差值1*10-6。預(yù)測結(jié)果如圖5 所示。
圖5 LSTM 模型預(yù)測結(jié)果圖Fig.5 LSTM model prediction result
本文基于目前城市軌道交通車輛面臨高峰客流而易產(chǎn)生擁擠等安全隱患及缺乏有效的客流量采集手段的背景下,引用新型的采集設(shè)備——WIFI 探針在車輛上進行客流數(shù)據(jù)的采集,詳細說明了WIFI探針的原理及在軌道交通車廂內(nèi)采集客流數(shù)據(jù)的布設(shè)方案。通過對比WIFI 探針數(shù)據(jù)與同日同時段的票務(wù)清分數(shù)據(jù),以及人工檢測的實際客流數(shù)據(jù),根據(jù)客流采集數(shù)據(jù)的特征,選擇LSTM 長短時記憶神經(jīng)網(wǎng)絡(luò),建立客流數(shù)據(jù)的預(yù)測模型,數(shù)據(jù)的預(yù)測精度達到較高水平。