劉東輝 肖 雪 張 玨
(1.吉林警察學院信息工程系 長春130000;2.吉林大交通學院 長春130021;3.杭州市公安局交通警察支隊 杭州310000)
隨著機動車保有量飛速增長,停車資源供需關(guān)系嚴重失衡。面對現(xiàn)有停車資源難以滿足停車需求,以及現(xiàn)有停車資源難以得到有效利用等停車困境,智能停車誘導系統(tǒng)能夠針對每個出行者的停車需求精準高效地提供停車輔助決策和路徑誘導,因此有效減少了因?qū)ふ彝\囄欢旭傇诘缆飞系能囕v,被廣泛認為能夠緩解停車難問題[1-2]。其中停車信息是該系統(tǒng)得以成功實施的關(guān)鍵與基礎(chǔ),也是其他停車系統(tǒng)與模型的重要輸入,因此,準確地預(yù)測停車需求信息變得十分重要。
停車需求預(yù)測分為短時預(yù)測和長時預(yù)測,長時指的是以年為單位進行的宏觀需求預(yù)測,多用于制定停車政策與停車規(guī)劃[3]。短時停車需求預(yù)測則著眼于日內(nèi)停車需求的變化,即當前時刻和未來某時刻的停車需求,文中研究的停車需求預(yù)測方法主要應(yīng)用于智能停車誘導系統(tǒng),屬于短時停車需求預(yù)測。
短時停車需求預(yù)測方法主要分為2種:①從停車基礎(chǔ)過程出發(fā),將停車場內(nèi)車輛到達和離開過程描述為車輛排隊過程;②基于假設(shè)的到達和離開規(guī)律分析未來時刻停車需求[4-5]。根據(jù)實際觀測到的數(shù)據(jù),車輛到達與離開過程通常被抽象為泊松分布,由此可獲得停車狀態(tài)轉(zhuǎn)移概率,建立基于經(jīng)典馬爾可夫生滅過程的停車狀態(tài)轉(zhuǎn)移概率矩陣[6]。該方法無法同時估計到達率與離開率參數(shù),無法完整地描述車輛到達與離開過程與停車需求之間的關(guān)系。
得益于先進的檢測與存儲設(shè)備,獲取長時間、大規(guī)模的連續(xù)停車數(shù)據(jù)變得越來越容易,使得統(tǒng)計和機器學習方法能夠在停車需求預(yù)測方面得以應(yīng)用,包括簡單回歸模型[7]、混沌時間序列分析[8]、多變量時空回歸[9]、聚類[10]、神經(jīng)網(wǎng)絡(luò)[11],其中神經(jīng)網(wǎng)絡(luò)強大的數(shù)據(jù)擬合能力受到了學者們的廣泛研究。神經(jīng)網(wǎng)絡(luò)在停車需求預(yù)測精度很大程度上受神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的影響,如輸入節(jié)點的數(shù)量,輸入層、隱藏節(jié)點的數(shù)量,學習速率和動量等,這啟發(fā)了學者們新的研究方向,通過改進神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu)來提高預(yù)測精度。包括采用智能優(yōu)化算法優(yōu)化網(wǎng)絡(luò)參數(shù)[12],利用小波函數(shù)對停車數(shù)據(jù)時間序列分解與重構(gòu)[13],采用相空間重構(gòu)技術(shù)建立理論預(yù)測模型,采用動態(tài)反饋神經(jīng)網(wǎng)絡(luò)——Elman神經(jīng)網(wǎng)絡(luò)訓練預(yù)測模型[14-15]。雖然該方法理論上能夠獲得較好的預(yù)測精度,但該類方法的預(yù)測過程屬于不可見的黑盒過程,仍然無法獲得準缺的停車規(guī)律;此外,在預(yù)測的過程中通常將停車數(shù)據(jù)無差別地輸入到預(yù)測模型當中,忽視了停車規(guī)律的動態(tài)變化特性,減弱了模型對于停車規(guī)律的挖掘與識別。
基于以上研究的現(xiàn)狀與不足,考慮停車場內(nèi)車輛到達和離開規(guī)律動態(tài)變化特性,研究了1種可變停車需求預(yù)測區(qū)間與預(yù)測間隔方法;在此基礎(chǔ)上,采用LSTM網(wǎng)絡(luò)為基礎(chǔ)框架預(yù)測停車需求,并利用改進的粒子群算法進行優(yōu)化,針對單一建筑類型停車場,對停車場到達車輛與離開車輛進行分析,以預(yù)測停車需求。
各類停車需求預(yù)測模型的預(yù)測效果影響因素主要包括:①模型結(jié)構(gòu);②訓練數(shù)據(jù)。以往研究大多專注于優(yōu)化模型結(jié)構(gòu),往往強調(diào)數(shù)據(jù)體量的作用,卻忽略了數(shù)據(jù)質(zhì)量的影響。在停車需求預(yù)測方法中,通常假定以5 min或15 min作為停車需求預(yù)測單位時間間隔的劃分,但停車系統(tǒng)是動態(tài)且復雜多變的,缺乏對停車過程的分析,而人為地認定后續(xù)時刻停車需求只受前5 min或15 min的停車需求影響缺乏依據(jù)。
因此,考慮到停車狀態(tài)變化過程對模型預(yù)測結(jié)果的重要影響,即停車需求的時變性與波動性隨車輛到達和離開過程的變化而變化,故提出通過估計停車到達率和離開率來識別數(shù)據(jù)預(yù)測區(qū)段與間隔的思路,從而提高預(yù)測模型學習質(zhì)量與預(yù)測精度。
停車狀態(tài)變化本質(zhì)上是以停車到達率和離開率為基礎(chǔ)的概率轉(zhuǎn)移結(jié)果,即從1個狀態(tài)到另1個狀態(tài)的隨機過程,具備無后效性與隨機性,當時間間隔無限小時,停車狀態(tài)的變化可視為馬爾可夫生滅過程,服從馬爾可夫的狀態(tài)變化規(guī)律。
馬爾可夫生滅過程規(guī)定[16],同一時刻停車狀態(tài)只能向臨近狀態(tài)轉(zhuǎn)移,即停車狀態(tài)只有3種變化方式:停車數(shù)增加1、減少1或不變。假設(shè)單位時間內(nèi)停車到達率為λ,停車離開率為p,停車狀態(tài)生滅過程轉(zhuǎn)移概率見式(1)~(4)。
其他情況見式(4)。
式中:h為無窮小的時間間隔;ο(h)為時間間隔h的高階無窮小量。當停車場車輛到達過程符合泊松分布,離開過程符合二項分布時,以馬爾可夫過程為基礎(chǔ),通過代數(shù)變換,在停車到達率和離開率一定的情況下,可得到停車狀態(tài)隨時間變化。
式中:E0為停車場內(nèi)初始車輛數(shù);t為時間序列數(shù)據(jù)。
通過式(5)可知,停車狀態(tài)在時間和空間上的波動性本質(zhì)上是隨時間變化的停車到達率與離開率的變化,即到達率與離開率為定值的時段內(nèi),停車場具有相似的停車規(guī)律。依據(jù)停車到達率與離開率劃分預(yù)測區(qū)段具體流程見圖1。
圖1 停車預(yù)測時段迭代流程圖Fig.1 Iteration flow for the parking forecast period
有N天的歷史數(shù)據(jù),可得到N天停車數(shù)據(jù)均值,假設(shè)一定時間段內(nèi)停車達到率λ、離開率P是恒定的,通過式(5),擬合歷史停車數(shù)均值隨時間變化的函數(shù),迭代求解不同停車達到率λ、離開率P組合的時段。
停車趨勢的變化一般發(fā)生在停車數(shù)隨時間變化曲線的拐點,該點左右導數(shù)符號相反。設(shè)第l點為曲線的第1個轉(zhuǎn)折點,該點時刻為tl,初始時刻為t0,Δt為迭代單位長度,在時間段內(nèi)擬合曲線,若擬合優(yōu)度判定系數(shù)R2≥0.9,則更新tl=tl+Δt,直到R2<0.9,輸出時間段[t0,tl];若R2<0.9,更 新tl=tl-Δt,直到滿足R2≥0.9,輸出時間段[t0,tl]。下1次迭代則將上1次迭代最后1個時刻作為初始時刻,找出下1個曲線轉(zhuǎn)折點作為初始曲線擬合時刻,重復上述步驟,直到找出所有的停車達到率、離開率組合,每1個參數(shù)組合代表1個預(yù)測時段。
在不同停車到達率和離開率時段內(nèi),單位時間內(nèi)到達和離開的車輛數(shù)也不同,故預(yù)測間隔也隨之變化。以單位時間內(nèi)感知到1輛車的變化為原則,建立預(yù)測間隔與到達率與離開率之間的關(guān)系,見式(6)。
式中:Δt為初始時計算到達率和離開率的時間間隔。
文章采用改進的LSTM神經(jīng)網(wǎng)絡(luò)來預(yù)測停車需求,通過調(diào)整模型結(jié)構(gòu)和參數(shù)來提高停車需求的預(yù)測精度。
LSTM通過遺忘門、輸入們和輸出門3種門控邏輯架構(gòu)可學習網(wǎng)絡(luò)訓練過程當中任意時刻的信息,有效提高了網(wǎng)絡(luò)的學習能力和表征能力[17],網(wǎng)絡(luò)拓撲結(jié)構(gòu)見圖2。
圖2 LSTM網(wǎng)絡(luò)隱含層拓撲結(jié)構(gòu)Fig.2 Hidden layer topology of the LSTM network
遺忘門決定從單元狀態(tài)中保留的信息;輸入門決定單元狀態(tài)更新的信息;輸出門在單元狀態(tài)的基礎(chǔ)上決定輸出的信息,各門分別是單獨的BP網(wǎng)絡(luò),更新規(guī)則見式(7)~(9)。
為提高模型的學習效率,避免模型權(quán)重較小時模型學習效率低的問題,采用交叉熵代價函數(shù)作為輸出神經(jīng)元的代價函數(shù)[18]。權(quán)重更小意味著網(wǎng)絡(luò)的預(yù)測結(jié)果不會隨輸入的改變而產(chǎn)生強烈的變化,故為避免模型在訓練過程中出現(xiàn)的過擬合問題,同時提高預(yù)測模型的泛化與預(yù)測能力,考慮在代價函數(shù)中加入1個權(quán)重衰減項,其形式為所有權(quán)重平方和平均值項,用以懲罰過大的網(wǎng)絡(luò)權(quán)重,引入規(guī)范化參數(shù)d,用以調(diào)整規(guī)范化項在代價函數(shù)中的比重,見式(10),式中第1項為交叉熵項,第2項為權(quán)重規(guī)范化項。
粒子群優(yōu)化算法的基本思想是利用群體中個體對信息的共享,使得整個群體的運動在問題求解空間中產(chǎn)生從無序到有序的求最優(yōu)解的過程,在函數(shù)優(yōu)化、圖像處理、大地測量等眾多領(lǐng)域都得到了廣泛的應(yīng)用[19-20]。
本文利用粒子群算法函數(shù)優(yōu)化的功能,采用粒子群算法優(yōu)化LSTM網(wǎng)絡(luò)訓練初始參數(shù)。該過程中,每個粒子均為網(wǎng)絡(luò)預(yù)測輸出的1個基本可行解,粒子的位置即為長短期記憶神經(jīng)網(wǎng)絡(luò)的連接權(quán)值和閾值組成的向量。每個粒子依靠位置和迭代速度決定下1次飛行的位置和速度,迭代標準為LSTM網(wǎng)絡(luò)代價函數(shù),見式(10)。
粒子群算法更新規(guī)則見式(11)~(14)。
通過粒子群算法獲得網(wǎng)絡(luò)訓練初始參數(shù)后,進行長短期記憶神經(jīng)網(wǎng)絡(luò)訓練與預(yù)測過程,具體預(yù)測流程見圖3。
圖3 LSTM網(wǎng)絡(luò)訓練與預(yù)測流程圖Fig.3 Training and prediction flow of the LSTMnetwork
吉林大學南嶺校區(qū)位于長春市南關(guān)區(qū),屬于教育用地,內(nèi)部規(guī)劃停車位共720個,停車需求以教職工車輛為主,社會車輛為輔。筆者選取該校區(qū)2019年6月17日—23日為期1周的停車數(shù)據(jù)作為模型訓練集,保證了數(shù)據(jù)的一般性。選取2019年6月25日(星期二)和6月29日(星期六)作為驗證集,對模型預(yù)測能力及有效性進行評價。
圖4為6月17日—30日期間停車場內(nèi)的各時刻的停車數(shù)??紤]到教育用地的工作特征,18:00—次日06:00間,無明顯停車需求變化趨勢,且屬于夜間停車范疇,故實例驗證中不考慮該時段的停車需求變化。與一般用地停車規(guī)律相似,該校區(qū)停車規(guī)律在工作日和非工作存在明顯的不同,除星期一初始停車數(shù)較少外,工作日與非工作日內(nèi)均具有相似的波動性和規(guī)律性,故可按工作日和非工作分別確定預(yù)測間隔和時刻。
圖4 6月17日—6月23日06:00—18:00時刻場內(nèi)停車數(shù)Fig.4 Number of parking spaces inside from 6:00 to 18:00 on June 17-23
按工作日與非工作日,依據(jù)1.2中提出的方法確定不同停車趨勢時段。根據(jù)式(5),通過實際停車數(shù)據(jù)擬合得到停車到達率和離開率。依據(jù)式(6),計算不同時段停車需求預(yù)測間隔。為簡化計算,提高預(yù)測效率,預(yù)測間隔計算結(jié)果取去掉小數(shù),最大預(yù)測間隔設(shè)為5 min,最小預(yù)測間隔設(shè)為1 min。非工作日停車到達率、離開率、預(yù)測時段與時間間隔計算結(jié)果見表1,工作日停車到達率、離開率、預(yù)測時段與時間間隔計算結(jié)果見表2。
表1 非工作日預(yù)測時間間隔Tab.1 Interval of forecast on non-working days
表2 工作日預(yù)測時間間隔Tab.2 Interval of forecast on working days
由表1~2可見,工作日與非工作日預(yù)測間隔劃分大體相似,但停車到達率與離開率均不相同,可能是因為部分教職工除工作日教學工作外,周末仍需來校辦公,而其工作時間與工作日具有相似性。同時由圖4可見,工作日與非工作日數(shù)量波動性上具有較大差異,時間波動性上卻具有相似性,無論是工作日還是非工作日,預(yù)測間隔除上午為5 min外,其他時間預(yù)測間隔均為1 min。
經(jīng)多次測試訓練,粒子群算法的粒子總數(shù)初值取200時較為合適,循環(huán)次數(shù)取300次,適應(yīng)值系數(shù)設(shè)定為10-3,w=2,c=1,vmax=5。
結(jié)合粒子群算法的LSTM網(wǎng)絡(luò)門控制器均設(shè)置為3層網(wǎng)絡(luò),輸入層設(shè)置為3,經(jīng)過多次測試確定隱含層個數(shù)為3。學習速率參數(shù)確定為0.025,收斂誤差與粒子群最優(yōu)適應(yīng)度相同。為了在相同的訓練次數(shù)下比較LSTM網(wǎng)絡(luò)模型與粒子群LSTM網(wǎng)絡(luò)模型的預(yù)測精度,單獨使用LSTM網(wǎng)絡(luò)模型預(yù)測時的迭代學習次數(shù)為:種群規(guī)模×進化次數(shù)×神經(jīng)網(wǎng)絡(luò)正向更新時的迭代次數(shù)=50×200×10=10 000次。
根據(jù)以上所述的參數(shù)設(shè)置,計算得到工作日和非工作日粒子群長短期神經(jīng)網(wǎng)絡(luò)(PSO-LSTM)、長短期神經(jīng)網(wǎng)絡(luò)(LSTM)、前饋神經(jīng)網(wǎng)絡(luò)(BP)、小波神經(jīng)網(wǎng)絡(luò)(WNN)的平均絕對誤差(MAE)和均方誤差(MSE),結(jié)果見表3和圖5~8。
表3 誤差對比表Tab.3 Comparison of errors輛
從表3和圖5~8中可以看出,PSO-LSTM模型與普通LSTM網(wǎng)絡(luò)、BP網(wǎng)絡(luò),以及小波神經(jīng)網(wǎng)絡(luò)相比,具有更高的預(yù)測精度,工作日與非工作日平均絕對誤差分別為2.53輛和2.32輛,均方誤差分別為11.89輛和10.89輛,應(yīng)用于停車需求短時預(yù)測具有較好的預(yù)測效果,增加了停車需求預(yù)測的可靠性。
基于馬爾可夫生滅過程,以停車到達率與離開率為基礎(chǔ),研究了停車需求預(yù)測時段與間隔劃分方法,建立了基于粒子群和LSTM網(wǎng)絡(luò)的組合預(yù)測模型。以吉林大學南嶺校區(qū)的停車數(shù)據(jù)為例,驗化網(wǎng)絡(luò)參數(shù),消除了初始訓練參數(shù)對模型預(yù)測精度的影響,與其他預(yù)測模型相比,提出的組合預(yù)測模型的預(yù)測誤差最小,精度最高。模型中部分參數(shù)的選取采用了直接賦值的方法,將來可考慮采用其他方法確定參數(shù)值。此外,隨著智能停車檢測設(shè)備的普及與停車大數(shù)據(jù)的開源應(yīng)用,將進一步獲取其他用地類型的停車數(shù)據(jù)以驗證所提出模型的有效性和普適性。
圖5工作日PSO-LSTM模型、LSTM模型、BP模型、小波模型預(yù)測值Fig.5 Absolute error values of PSO-LSTM NN,LSTM NN,BP NN,and WNN on working days
圖6工作日PSO-LSTM模型、LSTM模型、BP模型、小波模型絕對誤差值Fig.6 The absolute error values of PSO-LSTMNN,LSTM NN,BP NN and WNN on working days
圖7非工作日PSO-LSTM模型、LSTM模型、BP模型、小波模型預(yù)測值Fig.7 Predicted values of PSO-LSTMNN,LSTM NN,BP NN,and WNN on non-working days
圖8非工作日PSO-LSTM模型、LSTM模型、BP模型、小波模型絕對誤差值Fig.8 Absolute error values of the PSO-LSTM NN,LSTMNN,BP NN,and WNN on non-working days