馮 微 陳 紅 張兆津 邵海鵬
(1.長安大學公路學院 西安 710064; 2.武威職業(yè)學院電子信息工程系 甘肅 武威 733000)
對城市道路交通流參數(shù)進行實時、快速和準確預測是智能交通系統(tǒng)控制與誘導的核心工作。短時交通流參數(shù)預測近年來已發(fā)展成為交通工程領域中的研究熱點之一。盡管眾多學者提出的短時交通流預測模型之間各有差異,但總體上能夠分為時間序列[1]、概率圖模型[2]、非參數(shù)統(tǒng)計[3]及組合模型等方法。時間序列法基于以往的歷史數(shù)據(jù),通過探尋交通流隨時間變化的模式進行預測。J Xue等[4]運用混沌時間序列分析方法,對交通流數(shù)據(jù)進行相空間重構,提出最鄰近點的兩步優(yōu)化選擇方法,提高了預測精度。貝葉斯網(wǎng)絡作為一類常用概率圖模型,在短時交通流參數(shù)預測方面也得以深入發(fā)展。S Sun等[5]對城市路網(wǎng)中鄰近路段上的交通流參數(shù)進行預測,將貝葉斯網(wǎng)絡中的鄰近概率分布構建成為高斯混合模型,并通過競爭期望最大化算法進行求解,獲取預測結果;J Wang等[6]提出了一種新的貝葉斯網(wǎng)絡組合預測方法,結合熵的灰色關聯(lián)性對歷史交通流量之間的相關性進行分析,并利用組合模型預測短時交通流參數(shù)。為了更有效地解決交通流的非線性、復雜性和不確定性特點,非參數(shù)統(tǒng)計方法中的神經(jīng)網(wǎng)絡[7]、支持向量機[8-9]、隨機微分方程[10]等方法也逐漸被運用到短時交通流預測中來。
在這些研究的基礎之上,學者們又對眾多模型進行有效組合,旨在提高預測的準確性和效率。李松等[11]利用改進粒子群算法對BP神經(jīng)網(wǎng)絡的權值和閾值進行優(yōu)化,通過自適應變異算子改善粒子群算法的尋優(yōu)性能,實現(xiàn)對短時交通流更好的非線性擬合能力;G Fusco等[12]將貝葉斯網(wǎng)絡與BP神經(jīng)網(wǎng)絡進行融合,并采用浮動車數(shù)據(jù),在城市大規(guī)模路網(wǎng)中進行交通流預測;梅朵等[13]將遺傳算法中的交叉和變異因子引入粒子群算法進行改進,用以優(yōu)化支持向量機的參數(shù),提高了預測精度。
以上短時交通流預測大多為“淺層學習”方法,而城市道路交通復雜系統(tǒng)中道路條件、交通需求、天氣狀況等因素以非線性方式相聯(lián)系,導致“淺層學習”方法在實際應用中容易出現(xiàn)預測結果不穩(wěn)定、精度不高等情況。深度學習作為一種數(shù)據(jù)驅動型的多層表示學習方法,能夠克服“淺層學習”的過擬合、局部最優(yōu)解以及需要人工提取特征等問題[14],近年來在交通大數(shù)據(jù)的挖掘和處理方面取得了較大的進展,提高了預測精度和效率。
在短時交通流預測方面,Y Lyu等[15]應用自動編碼器的深層模型和交通大數(shù)據(jù)預測交通流參數(shù);羅向龍等[16]利用差分去除交通流量數(shù)據(jù)的趨勢向,并結合深度置信網(wǎng)絡和支持向量回歸模型對交通流量進行預測;羅文慧等[17]在深度學習模型底層運用卷積神經(jīng)網(wǎng)絡提取交通流特征,并將提取結果輸入到支持向量機中進行流量預測;王祥雪等[18]利用深度學習工具TensorFlow的Keras,構建了基于長短時記憶循環(huán)神經(jīng)網(wǎng)絡(long short-term memory recurrent neural network, LSTM-RNN)的深度學習模型,并預測交通流中的速度參數(shù)。
目前國內外學者利用深度學習對短時交通流的應用主要集中在流量和速度預測方面,對占有率預測的研究較少。在對流量和速度進行預測時,往往直接將數(shù)據(jù)輸入到深度學習網(wǎng)絡的底層結構中,對網(wǎng)絡在二值和連續(xù)實值輸入量適用性方面的考慮較少,大部分預測結果也多為單個道路橫斷面上多個時刻的預測值。地點車速分布具有空間和時間上的共同特征,除了需要在多個時刻上進行分析之外,也側重于空間中多條路段上的橫向對比,因此地點車速預測往往要求一次輸出結果中包含多條路段的預測值。本文選取高斯-伯努利受限波爾茲曼機(Gauss-Bernoulli restricted Boltznann machine, GBRBM)輸入連續(xù)實值,并利用Softmax回歸模型來準確預測多輸出值,對深度置信網(wǎng)絡進行堆疊和改進;提出一種基于GBRBM-DBN網(wǎng)絡結構的多路段多時刻地點車速預測方法,對地點車速的時空特征進行提取和分析;利用大規(guī)模路網(wǎng)實測數(shù)據(jù)對所提網(wǎng)絡模型進行訓練,以期達到良好的預測性能和準確的預測結果。
受限波爾茲曼機(restricted Boltznann machine, RBM)是一種典型的二層神經(jīng)網(wǎng)絡,包含一個可視層和一個隱含層[19],見圖1,在RBM網(wǎng)絡結構中,可視層v與隱含層h之間的神經(jīng)元相互連接,連接權重為w,而層內的神經(jīng)元之間相互獨立。
圖1 受限波爾茲曼機示意圖Fig.1 RBM schematic diagram
一般采用吉布斯采樣法對RBM網(wǎng)絡進行訓練。根據(jù)Hinton等提出的對比離差算法,只需迭代k次吉布斯采樣步驟即可得到對模型的估計,通常k=1[20-21]。
圖2 DBN網(wǎng)絡結構Fig.2 DBN network structure
2.1.1 輸入層結構設計
傳統(tǒng)RBM中采用伯努利-伯努利波爾茲曼機(Bernoulli-Bernoulli restricted Boltznann machine, BBRBM)結構,可視層和隱含層神經(jīng)元均為二值分布,即0或1。但是道路交通流參數(shù)的觀測值為連續(xù)的實數(shù),若將其直接轉換成二進制數(shù)據(jù),則會損失大量的速度特征。因此,應用DBN結構對道路交通中的地點車速進行預測時,需先對傳統(tǒng)RBM結構進行改進,使其輸入層適用于地點車速數(shù)據(jù)的連續(xù)實值這一特征。
本文中選擇將高斯(可視層)-伯努利(隱含層)波爾茲曼機加入到傳統(tǒng)BBRBM結構中,這是因為GBRBM結構中加入了高斯噪音的連續(xù)值,其可視層能夠輸入實值隨機變量。
2.1.2 輸出層回歸模型設計
DBN網(wǎng)絡結構對輸入層中的地點車速數(shù)據(jù)進行充分學習后,能夠輸出數(shù)據(jù)特征。要對多個路段在未來多個時刻的地點車速進行預測,還需在DBN結構的頂層加入回歸模型。Softmax回歸模型可以將輸入的向量映射為多個路段上地點車速預測值的得分,再將得分映射到概率域。通過使用交叉熵損失,將誤差的負對數(shù)似然概率最小化,得到誤差最小時該預測值的概率。相比支持向量回歸,更加適合本文中的多路段多時刻地點車速預測問題,因此,在本文預測模型框架設計過程中,選擇Softmax回歸模型對地點車速進行預測。
2.1.3 GBRBM-DBN結構的框架構成
基于以上分析,通過對BBRBM改進、堆疊以及在DBN頂層加入Softmax回歸模型,得到本文中基于GBRBM-DBN的多路段多時刻地點車速預測模型框架。預測模型底層為GBRBM結構,用于輸入地點車速連續(xù)值數(shù)據(jù);其他層均采用BBRBM,共同自下而上堆疊構成改進的DBN架構,用于地點車速的無監(jiān)督逐層訓練;經(jīng)過有監(jiān)督的參數(shù)優(yōu)化微調后,得到GBRBM-DBN網(wǎng)絡自動學習到的地點車速數(shù)據(jù)的高層抽象特征;進一步在頂層加入Softmax回歸模型,將GBRBM-DBN模型學習到的數(shù)據(jù)特征作為新的輸入,用于預測多個路段在未來多個時刻的地點車速。預測模型結構見圖3,圖中:Y為Softmax回歸模型的輸出矩陣;n為隱含層層數(shù)。
圖3 GBRBM-DBN網(wǎng)絡結構Fig.3 GBRBM-DBN network structure
對城市道路上的地點車速進行觀測與統(tǒng)計,能夠發(fā)現(xiàn)其具有空間和時間兩方面的特征??臻g上,從整個城市路網(wǎng)的角度來看,不同觀測點的地點車速存在快慢不同的現(xiàn)象,特別是城市快速路和主干路,由于其斷面所處地理位置周邊的土地利用性質、車道數(shù)、縱斷面線型等條件的差異,導致不同的車速在空間上呈現(xiàn)出一定的規(guī)律性;時間上,同一觀測點的地點車速在一天中的變化受到交通流量、交通組成及管理方式等的影響,同樣呈現(xiàn)出一定波動性,在較短時間統(tǒng)計粒度下,下一時段的地點車速與上一時段地點車速存在一定傳遞性,可以對上一時段速度進行學習,進而推斷出下一時段地點車速。
根據(jù)2.2節(jié)中對地點車速數(shù)據(jù)的時空特征分析,要同時對未來多個路段上多個時刻的地點車速進行預測,需要在定義預測模型的輸入及輸出矩陣時,考慮空間和時間特征的表達。
2.3.1 輸入矩陣
空間上,用sp,t表示城市路網(wǎng)中第p個觀測點在t時刻采集到的地點車速(單位:km/h),則m個觀測點在t時刻的速度輸入矩陣可表示為
St=(s1,t,s2,t,…,sp,t,…,sm,t)T,
p=1,2,…,m
(1)
時間上,為了探索地點車速在連續(xù)多天內的特征,采用以1 d為基本單位的預測模型,時間粒度為10 min,因此輸入矩陣S可以表示為
S=(S1,S2,…,Sq,…,Sl),q=1,2,…,l
(2)
其中,l可以根據(jù)具體天數(shù)的計算結果而靈活改變。
2.3.2 輸出矩陣
設輸入矩陣經(jīng)過GBRBM-DBN模型學習后的輸出矩陣為O,則有
O=u(S)
(3)
式中:u(S)為深度學習函數(shù),本文中為GBRBM-DBN模型。
地點車速預測模型的輸出矩陣中同樣需要表征不同路段和不同時刻的地點車速預測值,設Softmax回歸模型的輸出矩陣為Y=(y1,y2,…,yp,…,ym),則有
yp(t+Δt)=f(O)
(4)
式中:yp為觀測點p在t+Δt時刻的地點車速(單位:km/h),p=1,2,…,m;f(O)為預測模型,本文中為Softmax回歸模型。
本文中GBRBM-DBN預測模型的訓練過程包括向前傳播和向后傳播兩個過程,各自訓練方法如下。
2.4.1 向前傳播中的吉布斯采樣法
設RBM中的可視層神經(jīng)元為v,隱含層神經(jīng)元為h,數(shù)目分別為I、J,即?i,j,都有vi∈{0,1},hj∈{0,1}。對于給定的一組(v,h)狀態(tài),得到RBM的能量函數(shù)E為
(5)
式中:θ為RBM的參數(shù),θ=(ωij,ai,bj);ωij為可視層神經(jīng)元i與隱含層神經(jīng)元j之間的連接權重;ai、bj分別為可視層、隱含層神經(jīng)元的偏置。
基于上式,得到RBM在(v,h)狀態(tài)下的聯(lián)合概率分布P(v,h|θ)和可視層神經(jīng)元v的分布P(v|θ)分別為
(6)
(7)
(8)
式中:Z(θ)為歸一化因子。
由于RBM結構中可視層、隱含層內部無連接,即各可視層神經(jīng)元、各隱含層神經(jīng)元之間的激活狀態(tài)是相互獨立的,則可得到第i個可視層神經(jīng)元、第j個隱含層神經(jīng)元的條件概率分布分別為
(9)
(10)
式中:σ(·)為sigmoid函數(shù)。
2.4.2 向后傳播中的梯度下降法
本文預測模型中反向傳播采用隨機梯度下降(stochastic gradient descent, SGD)+動量算法。SGD算法表達式為
xt+1=xt-ηtgt
(11)
式中:xt為計算梯度時第t步的位置;ηt為步長;gt為隨機梯度。
本文中基于GBRBM-DBN的地點車速預測模型的訓練過程如下,其技術流程見圖4。
1)根據(jù)地點車速數(shù)據(jù)特征,構造輸入矩陣S。
2)將S輸入底層的GBRBM可視層,根據(jù)第i個可視層神經(jīng)元的條件概率分布將GBRBM可視層中生成的輸出作為下一個RBM隱含層的輸入,并通過無監(jiān)督貪心算法獲取認知權重。
3)重復步驟(2),對大量無標簽數(shù)據(jù)逐層進行吉布斯采樣,向上直到生成模型所需的隱含層數(shù)量為止(頂部兩層除外),對RBM進行預訓練求出每一層的認知權重。
4)頂部兩層RBM向下進行有監(jiān)督的BP算法微調,根據(jù)下式中權值更新準則獲得生成權重,即對網(wǎng)絡參數(shù)進行優(yōu)化
Δωij=Edata(vihj)-Emodel(vihj)
(12)
式中:Edata(vihj)、Emodel(vihj)分別為觀測數(shù)據(jù)訓練集、模型定義的期望。
網(wǎng)絡偏置ai、bj的更新規(guī)則與ωij類似。
5)將GBRBM-DBN學習到的地點車速特征輸入Softmax回歸模型進行多個路段在未來多個時刻的地點車速預測。
圖4 預測模型訓練流程Fig.4 Training process of prediction model
本文試驗中使用的交通流數(shù)據(jù)集來源于OpenITS聯(lián)盟的OpenData模塊,由中山大學提供(數(shù)據(jù)來源網(wǎng)址:http://www.openits.cn/openData2/792.jhtml)。此數(shù)據(jù)集為大規(guī)模路網(wǎng)中的實測車速數(shù)據(jù)集,空間上涵蓋了廣州市214條路段,時間跨度為2個月,時間窗為10 min,1條路段每天產(chǎn)生的數(shù)據(jù)量為144條,數(shù)據(jù)集說明見表1。
試驗中選取60條路段、60 d的數(shù)據(jù),共計518 400條實測地點車速。前50 d所有路段的數(shù)據(jù)用于訓練,后10 d所有路段的數(shù)據(jù)用于測試。將60條路段1 d中的所有地點車速作為1組數(shù)據(jù)(數(shù)據(jù)量為8 640條),得到訓練集數(shù)據(jù)量和測試集數(shù)據(jù)量分別為50組(432 000條)、10組(86 400條)。
鑒于Matlab軟件強大的矩陣處理能力,本次試驗在Matlab R2014a平臺中通過編程完成。
表1 數(shù)據(jù)集說明Tab.1 Data set discription
經(jīng)核查和計算,試驗數(shù)據(jù)集中的實測地點車速最大為93.83 km/h,最小為1.05 km/h,均值為39.09 km/h,標準差為10.74 km/h,可以看出:原始數(shù)據(jù)之間的差異過大,這樣容易導致網(wǎng)絡迭代收斂的速度變慢。在深度置信網(wǎng)絡中,數(shù)據(jù)間差異越小,越能更好地適應網(wǎng)絡中激活函數(shù)的要求,提高網(wǎng)絡迭代收斂速度。因此在訓練網(wǎng)絡之前,需要對所有數(shù)據(jù)進行歸一化處理。
訓練集中數(shù)據(jù)量較大,以路段1在2016年8月3日(周三)、8月6日(周六)的全天地點車速為例,歸一化前的數(shù)據(jù)樣本分布分別見圖5(a)、6(a),可以看出:地點車速在8:00~11:00,18:00~20:00時段內有明顯的下降,且8月3日工作日的地點車速分布比8月6日周末的波動性更加顯著。采用Matlab中premnmx語句進行歸一化后的結果見圖5(b)、6(b),數(shù)據(jù)分布在[-1,1]。
圖5 8月3日路段1地點車速分布Fig.5 Spot speed distribution in road-1 on August 3rd
圖6 8月6日路段1地點車速分布Fig.6 Spot speed distribution in road-1 on August 6th
本文選取2個最常見的性能指標參數(shù)用于衡量網(wǎng)絡的優(yōu)劣,分別為平均絕對誤差(MAE)和平均相對誤差(MRE),計算方法為
(13)
(14)
式中:sreal,i為實際地點車速,km/h;spre,i為預測地點車速,km/h。
深度學習網(wǎng)絡訓練過程中,需要對網(wǎng)絡參數(shù)進行反復調試。設計本次試驗中GBRBM-DBN網(wǎng)絡結構參數(shù)調節(jié)的邏輯框架見圖7。
圖7 GBRBM-DBN網(wǎng)絡參數(shù)調節(jié)過程Fig.7 Parameters adjustment process in GBRBM-DBN network
3.4.1 網(wǎng)絡輸入、輸出神經(jīng)元數(shù)量的確定
由于本文試驗中分別選取了50天、10天內各個路段的實測地點車速作為訓練集和測試集,因此確定網(wǎng)絡中的輸入和輸出神經(jīng)元數(shù)量分別為50和10。
3.4.2 網(wǎng)絡結構的確定
網(wǎng)絡結構包括網(wǎng)絡深度、每一個隱含層中神經(jīng)元的數(shù)量及其內部的參數(shù)。設計4種不同的網(wǎng)絡結構,見表2。各層神經(jīng)元數(shù)量經(jīng)反復測試后可知少于200時網(wǎng)絡性能良好;同時為了防止過擬合現(xiàn)象,添加dropout層,并將隨機斷開的比例設定為20%。激活函數(shù)選擇tanh函數(shù),即雙曲正切函數(shù),用于將數(shù)據(jù)變換到[-1,1]區(qū)間,可以與輸入矩陣中的歸一化數(shù)據(jù)范圍保持一致。經(jīng)測試發(fā)現(xiàn),每一層的迭代次數(shù)增大到120次之后,網(wǎng)絡運行速度明顯變慢,故設定迭代次數(shù)為100次。Batchsize設定為100,即每用100個樣本就調整一次權重。
根據(jù)圖8中4種網(wǎng)絡結構的性能指標結果對比,選擇方案3,即7層深度的網(wǎng)絡結構,此時MAE和MRE值最低,說明網(wǎng)絡預測性能最佳,同時確定各隱含層的神經(jīng)元數(shù)量為{50,100,200,50,100,50,10}。
表2 不同結構的GBRBM-DBN網(wǎng)絡模型Tab.2 Different structures for GBRBM-DBN network structure
圖8 不同結構網(wǎng)絡模型的性能指標對比Fig.8 Performance indicators comparison of network models with different structures
3.4.3 神經(jīng)網(wǎng)絡函數(shù)中的參數(shù)調試
除了初始化DBN網(wǎng)絡中的權值和偏置用于執(zhí)行無監(jiān)督學習過程,還需要對網(wǎng)絡頂層中的有標簽數(shù)據(jù)進行有監(jiān)督學習,此時需調用神經(jīng)網(wǎng)絡函數(shù)。在神經(jīng)網(wǎng)絡參數(shù)調節(jié)過程中,確定節(jié)點數(shù)為10,選擇tanh函數(shù)作為激活函數(shù)。對迭代次數(shù)進行調試,結果顯示當?shù)螖?shù)大于某一個數(shù)量時,DBN測試結果沒有太大變化。證明在GBRBM-DBN網(wǎng)絡的預訓練過程中,相關參數(shù)的調整已經(jīng)近乎較優(yōu)的判斷。經(jīng)反復調試后確定其他參數(shù)值,即學習率為0.08,迭代次數(shù)為20,batchsize為100。
GBRBM-DBN網(wǎng)絡訓練好后,對第51~60 d(共計1 440個時間窗)60條路段的地點車速進行預測,預測結果見圖9,運算時間在30 s以內,能夠達到時效要求。圖中橫坐標為預測的時間樣本點,縱坐標表示樣本點對應的地點車速,灰色圓圈為實際地點車速,黑色星號為預測地點車速,可以看出:黑色星號表示的預測數(shù)據(jù)大部分都落在了灰色圓圈所表示的實際數(shù)據(jù)所組成的區(qū)域內,說明本文中建立的GBRBM-DBN模型能夠實現(xiàn)對多個路段上多個時刻地點車速變化趨勢的預測,特別是對于速度分布中的高峰值,預測效果良好。但是當車速低于17 km/h時,模型的預測效果并不十分理想,分析其原因在于訓練集中低于17 km/h的車速數(shù)據(jù)量過少,模型沒有充分學習到低車速值的特征。
圖9 預測值與實際值對比Fig.9 Comparison of predicted and actual values
輸出10天預測結果誤差得到表3,計算后得到MAE和MRE的平均值分別為4.67 km/h、13.4%。
為了探索本文建立的GBRBM-DBN深層網(wǎng)絡結構性能,將本文預測結果與其他試驗方案預測結果進行對比。
1)與BP神經(jīng)網(wǎng)絡的對比。運用“淺層學習”中經(jīng)典的BP神經(jīng)網(wǎng)絡對地點車速進行預測。設置BP神經(jīng)網(wǎng)絡中輸入、輸出神經(jīng)元個數(shù)分別為50和10,迭代次數(shù)為1 000次,激活函數(shù)為sigmoid函數(shù)。試驗發(fā)現(xiàn),由于訓練集中的數(shù)據(jù)量過大,導致BP神經(jīng)網(wǎng)絡無法預測出結果,分析原因為“淺層學習”網(wǎng)絡結構簡單、神經(jīng)元個數(shù)少,無法完成大規(guī)模數(shù)據(jù)之間非線性關系的學習。說明當需要對大規(guī)模數(shù)據(jù)的特征進行提取時,應選擇深層網(wǎng)絡模型。
表3 10天預測結果的MAE和MRETab.3 MAE and MRE values for prediction results in 10 days
2)與長短時記憶循環(huán)神經(jīng)網(wǎng)絡的對比。長短時記憶循環(huán)神經(jīng)網(wǎng)絡也是一種應用廣泛的深度學習模型,能夠對時序數(shù)據(jù)中的特征進行長時間記憶。應用LSTM-RNN模型對試驗中的實測地點車速進行預測,經(jīng)調試得到網(wǎng)絡結構為5層,迭代次數(shù)為600次,每次迭代權重調整比例為0.01。預測得到MAE為6.31 km/h,MRE為15.4%。與本文中建立的GBRBM-DNB預測模型結果進行對比后發(fā)現(xiàn),盡管LSTM-RNN模型所得結果精度與GBRBM-DBN模型相差不大,但是運用MATLAB平臺對這2種深度學習模型進行預測時,LSTM-RNN模型所用時間超過20 min,時效性明顯不如本文建立的GBRBM-DBN預測模型。究其原因為,LSTM-RNN模型中的循環(huán)單元需要對輸入數(shù)據(jù)進行循環(huán)重構,增加了預測模型的時間復雜度,因此對大規(guī)模數(shù)據(jù)進行預測時,LSTM-RNN模型并不適合在MATLAB平臺中應用。
3)與“深層網(wǎng)絡+小規(guī)模數(shù)據(jù)”的對比。為探尋數(shù)據(jù)規(guī)模大小對深層網(wǎng)絡模型預測結果的影響,選擇文獻[22]中預測結果與本文試驗結果進行對比。文獻[22]中針對5條路段,選取了30天交通流量數(shù)據(jù),時間窗為15 min,輸入數(shù)據(jù)為5條路段上2個時間段的交通流量,共計10個輸入,網(wǎng)絡結構為{10,12,10,8,6,4},數(shù)據(jù)量共計14 400條,明顯小于本文試驗中518 400條的數(shù)據(jù)規(guī)模。對比結果見表4,可以看到本文所提模型的預測誤差更小,MAE減小10.13 km/h,MRE減小14.5%。分析原因為,在“深層網(wǎng)絡+小規(guī)模數(shù)據(jù)”組合中,由于數(shù)據(jù)規(guī)模小,同時為了防止出現(xiàn)過擬合現(xiàn)象,需要將輸入層和隱含層的神經(jīng)元數(shù)量限定在一定范圍內,從而導致深層網(wǎng)絡模型在提高預測精度方面的優(yōu)勢并沒有充分發(fā)揮出來。
表4 兩種網(wǎng)絡的性能指標對比Tab.4 Comparison of performance indicators of two networks
4)不同訓練集和測試集數(shù)據(jù)比例劃分的對比。對GBRBM-DBN深層網(wǎng)絡模型中訓練集和測試集的數(shù)據(jù)量比例重新進行劃分,分為“40組訓練集+20組測試集”、“30組訓練集+30組測試集”兩種情況,用以測試模型在此方面的適應性。預測結果分別見圖10、11,可以看出:當改變訓練集和測試集數(shù)據(jù)比例后,GBRBM-DBN模型仍然能夠較為準確地對多個路段上多個時刻的地點車速變化趨勢做出預測,并且減少訓練集數(shù)據(jù)后,模型對低車速值的預測能力得以提升。分析原因在于:訓練集數(shù)據(jù)減少的過程中相當于提高了低車速占訓練集數(shù)據(jù)量的比例,促進模型加強了對低車速數(shù)據(jù)的學習,進而提取到了低車速的特征,并通過Softmax回歸模型進行了準確預測。
圖10 “40組訓練集+20組測試集”預測結果Fig.10 Prediction results of “40 groups train data and 20 groups test data”
圖11 “30組訓練集+30組測試集”預測結果Fig.11 Prediction results of “30 groups train data and 30 groups test data”
將3種訓練集、測試集劃分方式的預測結果性能指標進行對比,見表5,可以發(fā)現(xiàn):隨著訓練集數(shù)據(jù)量比例的下降,MAE的變化較小,浮動在1.64 km/h以內,MRE僅增大了7.3%,說明誤差分布較為穩(wěn)定。試驗證明GBRBM-DBN模型在選擇訓練集和測試集的數(shù)據(jù)量比例時,具有一定的靈活性,能夠適應訓練集和測試集中數(shù)據(jù)量的變化。同時在訓練集較少(占總體數(shù)據(jù)50%)時,GBRBM-DBN模型仍然能夠挖掘大規(guī)模地點車速數(shù)據(jù)的本質特征,取得較高的預測精度。分析其原因在于:模型中高斯-伯努利層保留了原始數(shù)據(jù)中連續(xù)實值的輸入,為預測模型提供了大量有效的數(shù)據(jù)特征,提高了深層網(wǎng)絡模型的學習程度。
表5 3種訓練集和測試集數(shù)據(jù)比例劃分的性能指標對比Tab.5 Comparison of performance indicators in three dataproportions between training data and test data
綜合以上分析得出,深層網(wǎng)絡模型中的網(wǎng)絡結構會對預測結果產(chǎn)生明顯的影響;深層網(wǎng)絡模型適用于大規(guī)模數(shù)據(jù)預測。當選取合適的網(wǎng)絡深度、神經(jīng)元節(jié)點及網(wǎng)絡其他參數(shù),運用大規(guī)模數(shù)據(jù)對多路段多時刻的地點車速預測過程中,對訓練集、測試集數(shù)據(jù)量比例進行適度調整時,本文建立的GBRBM-DBN預測模型仍然具有較強的特征學習能力和較高的預測精度。
1) 運用大規(guī)模實測數(shù)據(jù)訓練模型以探尋最優(yōu)的深層網(wǎng)絡結構,當網(wǎng)絡輸入、輸出神經(jīng)元數(shù)量分別為50和10,網(wǎng)絡深度為7層,迭代次數(shù)為100次時,平均絕對誤差為4.67 km/h,平均相對誤差為13.4%,網(wǎng)絡預測性能最佳。
2) 通過與傳統(tǒng)神經(jīng)網(wǎng)絡、長短時記憶循環(huán)神經(jīng)網(wǎng)絡、“深度結構+小規(guī)模數(shù)據(jù)”以及不同訓練集、測試集數(shù)據(jù)量比例的預測結果進行對比,驗證了本文模型在多路段多時刻的地點車速預測方面具有更好的準確性、時效性和泛化性,對地點車速高峰、低谷值的預測結果也更優(yōu)。
3)本文所提模型未考慮對地點車速產(chǎn)生影響的因素,如天氣狀況、車型分布等,下一步將結合多源數(shù)據(jù)融合進行研究。