曹渝
(廣州杰賽通信規(guī)劃設(shè)計(jì)院有限公司,廣東 廣州 510310)
交通狀態(tài)短時(shí)預(yù)測(cè)是指基于動(dòng)態(tài)獲取的道路交通參數(shù)-道路狀態(tài)數(shù)據(jù)的時(shí)間序列推測(cè)未來(lái)短時(shí)間段的交通流狀態(tài)[1]。交通預(yù)測(cè)技術(shù)基于先進(jìn)的交通狀態(tài)監(jiān)測(cè)手段,通過(guò)實(shí)時(shí)提取現(xiàn)有交通道路的交通參數(shù),結(jié)合具有實(shí)時(shí)性的預(yù)測(cè)模型,實(shí)現(xiàn)未來(lái)時(shí)間段交通道路的短時(shí)預(yù)測(cè)。交通狀態(tài)的預(yù)測(cè)研究已經(jīng)有不少的理論和方法,既有根據(jù)規(guī)則進(jìn)行相關(guān)統(tǒng)計(jì)分析的預(yù)測(cè)模型,也有采用人工智能技術(shù)的智能分析方法。
典型的統(tǒng)計(jì)分析模型有:孫曉亮[2]采用熵的方法實(shí)現(xiàn)短時(shí)交通狀態(tài)的預(yù)測(cè);王新穎[3]利用非參數(shù)回歸模型實(shí)現(xiàn)交通狀態(tài)的回歸預(yù)測(cè);鄭建湖[4]則采用馬爾科夫鏈,結(jié)合車(chē)輛的初始交通狀態(tài)、轉(zhuǎn)移概率以及下一時(shí)刻車(chē)輛的交通狀態(tài)構(gòu)建短時(shí)交通狀態(tài)預(yù)測(cè)模型。
人工智能分析模型有:盛春陽(yáng)[5]等人采用貝葉斯網(wǎng)絡(luò)計(jì)算交通參數(shù)之間的條件概率來(lái)預(yù)測(cè)各種交通狀態(tài)發(fā)生的概率;錢(qián)民[6]采用定性動(dòng)態(tài)概率網(wǎng)絡(luò)構(gòu)建的交通狀態(tài)預(yù)測(cè)模型,計(jì)算各路口發(fā)生擁堵的可能性;陶麗[7]利用改進(jìn)小波神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)交通狀態(tài)的預(yù)測(cè)。
統(tǒng)計(jì)的分析方法相對(duì)簡(jiǎn)單,卻無(wú)法反映動(dòng)態(tài)的交通狀態(tài)變化的特征;人工智能分析的方法具有學(xué)習(xí)特征,能夠反映動(dòng)態(tài)的交通狀態(tài)變化的特點(diǎn),但是其需要龐大的訓(xùn)練庫(kù)以保證算法的精度。考慮到現(xiàn)在多種終端數(shù)據(jù)融合遇到的各種困難,本文采用通信移動(dòng)用戶的數(shù)據(jù)作為交通參數(shù)提取的數(shù)據(jù)源,通過(guò)分析移動(dòng)用戶的出行特征提取其實(shí)時(shí)的交通參數(shù),然后再利用小波神經(jīng)網(wǎng)絡(luò)的方法構(gòu)建交通狀態(tài)預(yù)測(cè)模型,實(shí)現(xiàn)交通狀態(tài)的短時(shí)預(yù)測(cè)。
小波分析克服了傅里葉處理非平穩(wěn)信號(hào)的缺陷,它不僅能夠獲取一段信號(hào)包含的頻率成分,還能采用有限長(zhǎng)的會(huì)衰減的小波基構(gòu)建靈活可變的時(shí)間-頻率窗,實(shí)現(xiàn)了信號(hào)的時(shí)頻分析,也就是信號(hào)在各個(gè)時(shí)刻的瞬時(shí)頻率及其幅值[8]。
小波分析的基本思想是伸縮和平移。其公式為:
其中,尺度a控制小波函數(shù)的伸縮,平移量τ控制小波函數(shù)的平移。尺度對(duì)應(yīng)于頻率,而平移量對(duì)應(yīng)于時(shí)間。
小波分析作為一種新的時(shí)頻信息方法,它可以采用小波基,將不同頻率和尺度的信號(hào)通過(guò)不同的伸縮和平移分離出來(lái),因此可高效分離不同類(lèi)型的信號(hào),且在信息轉(zhuǎn)換的過(guò)程中無(wú)信息的損失和扭曲。
前饋型神經(jīng)網(wǎng)絡(luò)用于處理復(fù)雜的非線性分類(lèi)情況。復(fù)雜的非線性分類(lèi)會(huì)出現(xiàn)組合爆炸式高階輸入,而前饋式神經(jīng)網(wǎng)絡(luò)采用參數(shù)矩陣確定方法對(duì)樣本進(jìn)行預(yù)測(cè),得出樣本的分類(lèi)結(jié)果。
前饋神經(jīng)網(wǎng)絡(luò)是一種單向神經(jīng)網(wǎng)絡(luò),各神經(jīng)元從輸入層開(kāi)始,接收上一級(jí)輸入,并輸出至下一級(jí),直到輸出層。同一層的神經(jīng)元之間沒(méi)有任何聯(lián)系,層間信息的傳遞只沿一個(gè)方向進(jìn)行。因此,前饋式神經(jīng)網(wǎng)絡(luò)的前饋僅僅用于計(jì)算網(wǎng)絡(luò)的輸出,并不對(duì)網(wǎng)絡(luò)的參數(shù)矩陣進(jìn)行調(diào)整。
典型的前饋神經(jīng)網(wǎng)絡(luò)是BP神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)又稱(chēng)為連接權(quán)調(diào)整采用反向傳播學(xué)習(xí)算法的前饋神經(jīng)網(wǎng)絡(luò)。其權(quán)值和閾值的調(diào)整恰恰是通過(guò)誤差反向計(jì)算方式實(shí)現(xiàn)的。在模型的訓(xùn)練階段,采用多層網(wǎng)絡(luò)的方法計(jì)算出整個(gè)樣本數(shù)據(jù)的總誤差,然后從輸出層網(wǎng)向前推,一般采用梯度下降法逐層求出每一層神經(jīng)元的閾值和權(quán)值的調(diào)整量,循環(huán)迭代,當(dāng)網(wǎng)絡(luò)參數(shù)滿足算法設(shè)定的要求則停止運(yùn)算。
圖1直觀展示了典型的三層神經(jīng)網(wǎng)絡(luò)模型向前傳播的例子。左邊的Layer L1代表網(wǎng)絡(luò)的輸入層,“+1”表示輸入層的偏置節(jié)點(diǎn),第二層Layer L2代表網(wǎng)絡(luò)的隱含層,第三層Layer L3代表網(wǎng)絡(luò)的輸出層。
最典型的神經(jīng)網(wǎng)絡(luò)是BP神經(jīng)網(wǎng)絡(luò),其輸入輸出的
圖1 典型的神經(jīng)網(wǎng)絡(luò)模型
映射關(guān)系為:
反向計(jì)算的本質(zhì)是根據(jù)輸出層與實(shí)際結(jié)果的總誤差,通過(guò)隱含層的神經(jīng)元調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值。因此反向計(jì)算的算法流程:
(1)進(jìn)行前饋傳播計(jì)算,利用前向傳播公式,得到各Layer L2,Layer L3,…,Layer Ln(輸出層)的激活值。
為了簡(jiǎn)化模型,以下僅介紹具有一層隱含層的前向傳播計(jì)算方式。隱含層中n個(gè)神經(jīng)元的表達(dá)式為:
輸出層的神經(jīng)元表達(dá)式為:
那么,如果存在多層隱含層的神經(jīng)網(wǎng)絡(luò),前饋傳播的步驟為:
(2)設(shè)定目標(biāo)函數(shù),給定一個(gè)包含樣本的訓(xùn)練集,目標(biāo)函數(shù)為:
(3)采用梯度下降方法最小化J(W,b),參數(shù)更新方式為:
反向計(jì)算的權(quán)值和閾值更新關(guān)鍵在于
根據(jù)鏈?zhǔn)椒▌t可得:
其中,
定義殘差為:
同理:
(4)經(jīng)過(guò)權(quán)值和閾值的更新,得到的輸出層與實(shí)際結(jié)果的總誤差小于設(shè)定的條件,則停止計(jì)算,否則,繼續(xù)返回第二步進(jìn)行參數(shù)更新,直到滿足條件為止。
通過(guò)上述的分析可知,BP網(wǎng)絡(luò)的誤差空間是一個(gè)形狀極為復(fù)雜的N維曲面,該曲面上的每個(gè)點(diǎn)的“高度”對(duì)應(yīng)于神經(jīng)網(wǎng)絡(luò)的總誤差,每個(gè)點(diǎn)的坐標(biāo)向量對(duì)應(yīng)著N個(gè)神經(jīng)元的權(quán)值。圖2為一個(gè)神經(jīng)網(wǎng)絡(luò)二維誤差空間的示意圖,從圖2可知,當(dāng)權(quán)值在誤差空間的平坦區(qū)域時(shí),誤差下降緩慢,影響收斂速度。除此以外,由于引進(jìn)了sigmoid函數(shù),誤差對(duì)權(quán)值的梯度變化小(接近于零),這種情況使得訓(xùn)練經(jīng)常陷入某個(gè)局部極小點(diǎn),從而使訓(xùn)練無(wú)法收斂于給定誤差。
針對(duì)上述神經(jīng)網(wǎng)絡(luò)存在的缺點(diǎn),采用小波基函數(shù)取代sigmoid函數(shù)來(lái)優(yōu)化網(wǎng)絡(luò)參數(shù)和誤差空間,這種以小波基作為模式識(shí)別的特征函數(shù),采用小波基以及輸入向量的內(nèi)積進(jìn)行加權(quán)實(shí)現(xiàn)輸入層的特征提取,結(jié)合了小波特有的時(shí)頻局域化的特征以及神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)功能,實(shí)現(xiàn)了具有較強(qiáng)的非線性擬合能力和較好的收斂速度。
因此,小波神經(jīng)網(wǎng)絡(luò)的輸入-輸出映射可以表現(xiàn)為:
圖2 神經(jīng)網(wǎng)絡(luò)二維誤差空間
其中,ψ(.)為函數(shù)的母小波基函數(shù),尺度ai控制小波函數(shù)的伸縮,平移量bi控制小波函數(shù)的平移,wi是網(wǎng)絡(luò)神經(jīng)元的連接權(quán)值,N為母小波的數(shù)目。
本文采用保定某運(yùn)營(yíng)商提供的2015年3月1日至2015年12月30日移動(dòng)用戶的通話和流量詳單數(shù)據(jù),該數(shù)據(jù)大小為300 G,包含50多萬(wàn)用戶發(fā)生業(yè)務(wù)的位置切換及位置更新的相關(guān)信息,選擇實(shí)驗(yàn)范圍為主城區(qū)某一條主干道總長(zhǎng)15 km的道路。
首先,根據(jù)移動(dòng)用戶發(fā)生業(yè)務(wù)的通信信號(hào)特征,把移動(dòng)用戶的軌跡定位到10 m×10 m的網(wǎng)格中;然后根據(jù)出行數(shù)據(jù)的時(shí)間戳算出移動(dòng)用戶在一段位移中的速度和加速度。由于移動(dòng)通信的信號(hào)有不穩(wěn)定的特點(diǎn),很可能剛切換過(guò)來(lái)的基站的信號(hào)又變?nèi)?,手機(jī)又開(kāi)始往回切換,從而造成“乒乓效應(yīng)”。這兩個(gè)值相差越大,“乒乓效應(yīng)”發(fā)生的可能性就越小。但太大又可能造成手機(jī)在合適的時(shí)候無(wú)法使用下一基站通話。因此,針對(duì)移動(dòng)用戶的出行數(shù)據(jù),本文需要對(duì)“兵乓切換”的數(shù)據(jù)進(jìn)行剔除。
移動(dòng)用戶的位置數(shù)據(jù)、速度數(shù)據(jù)以及加速度數(shù)據(jù)如表1所示。
針對(duì)表1采集的速度、加速度數(shù)據(jù),把疑似發(fā)生“兵乓切換”效應(yīng)的數(shù)據(jù)進(jìn)行剔除。如:該用戶在起始時(shí)間為201501082153發(fā)生的速度為41.6 m/s,相當(dāng)于150 km/h,該速度已經(jīng)超過(guò)主干道的合理速度,因此需要剔除該類(lèi)異常數(shù)據(jù)。
基于交通流數(shù)據(jù)的短時(shí)預(yù)測(cè)就是充分借助各種交通流采集設(shè)備提供的源數(shù)據(jù),采用相關(guān)的模型,從源數(shù)據(jù)中發(fā)現(xiàn)各種交通狀態(tài)發(fā)生的規(guī)律。因此,要實(shí)現(xiàn)交通狀態(tài)預(yù)測(cè),首先需要對(duì)采集到的數(shù)據(jù)進(jìn)行預(yù)處理,并提取能夠反映交通流特征的交通參數(shù);然后選用合適的模型,在模型中輸入預(yù)測(cè)的樣本數(shù)據(jù),預(yù)測(cè)下一個(gè)時(shí)間段的交通狀態(tài)。交通狀態(tài)預(yù)測(cè)的基本流程如圖3所示:
圖3 交通狀態(tài)預(yù)測(cè)的基本流程
本文選取交通流的參數(shù)-速度和加速度作為輸出對(duì)象,交通狀態(tài)(擁堵、擁擠、輕度擁擠、暢通)為預(yù)測(cè)對(duì)象。隨機(jī)抽取移動(dòng)用戶出行樣本1 872個(gè)作為訓(xùn)練樣本,剩下1 873個(gè)作為預(yù)測(cè)檢驗(yàn)樣本。本文分別采用小波神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)兩個(gè)模型進(jìn)行實(shí)驗(yàn),模型的相關(guān)參數(shù)如表2所示:
表2 小波神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)模型的參數(shù)
本次實(shí)驗(yàn)采用matlab工具進(jìn)行仿真,第一次實(shí)驗(yàn)采用學(xué)習(xí)速率(又稱(chēng)為修正權(quán)值的學(xué)習(xí)速率)為0.07,隱形節(jié)點(diǎn)和迭代次數(shù)可參照表2,本文隨機(jī)抽取訓(xùn)練數(shù)據(jù)10遍,小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè)的總時(shí)間平均為107 s;BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè)的總時(shí)間平均為178 s,均滿足交通狀態(tài)5分鐘更新一次的要求。每一遍的訓(xùn)練集和測(cè)試集的正確率如圖4、圖5所示:
表1 移動(dòng)用戶出行數(shù)據(jù)的采集和交通參數(shù)提取
圖4 小波神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)仿真結(jié)果的準(zhǔn)確率示意圖(學(xué)習(xí)速率0.07)
第二次實(shí)驗(yàn)采用學(xué)習(xí)速率是第一次的10倍,為0.7,隱含層節(jié)點(diǎn)和迭代次數(shù)與第一次的一致,同樣抽取訓(xùn)練數(shù)據(jù)10次,小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè)的總時(shí)間約為38 s,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè)的總時(shí)間約為46 s,小波神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)時(shí)間基本滿足5分鐘更新一次的要求。其訓(xùn)練集和測(cè)試集的正確率如圖6、圖7所示:
圖5 BP神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)仿真結(jié)果的準(zhǔn)確率示意圖(學(xué)習(xí)速率0.07)
圖6 小波神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)仿真結(jié)果的準(zhǔn)確率示意圖(學(xué)習(xí)速率0.7)
通過(guò)本實(shí)驗(yàn)的仿真可知,在最大迭代次數(shù)設(shè)定的情況下,無(wú)論是神經(jīng)網(wǎng)絡(luò)還是BP神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)速率跟收斂時(shí)間成反比,與精度成正比,反之亦然。該實(shí)驗(yàn)更能夠說(shuō)明,如果循環(huán)次數(shù)設(shè)定,學(xué)習(xí)速率過(guò)小,神經(jīng)網(wǎng)絡(luò)sigmoid函數(shù)在計(jì)算的過(guò)程誤差對(duì)權(quán)值的梯度變化小,容易陷入某個(gè)局部極小點(diǎn)使得擬合能力降低。
本文通過(guò)對(duì)比得知,在參數(shù)一致情況下,小波神經(jīng)網(wǎng)絡(luò)無(wú)論在非線性擬合能力還是在收斂速度上都優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。因此,小波神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)交通狀態(tài)的性能以及拓展性比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)更佳。
本文利用移動(dòng)用戶的出行數(shù)據(jù)提取交通參數(shù),分別采用小波神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行交通狀態(tài)的預(yù)測(cè)。實(shí)驗(yàn)表明,在參數(shù)一致的情況下,小波神經(jīng)網(wǎng)絡(luò)采用小波基取代sigmoid函數(shù)來(lái)優(yōu)化神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性擬合能力和較好的收斂速度,而且隨著數(shù)據(jù)量的擴(kuò)展,小波神經(jīng)網(wǎng)絡(luò)具有更大擴(kuò)展性的優(yōu)勢(shì)。智能交通系統(tǒng)擁有海量的交通參數(shù),可借助小波神經(jīng)網(wǎng)絡(luò)進(jìn)行交通狀態(tài)的短時(shí)預(yù)測(cè),以實(shí)現(xiàn)整個(gè)城市范圍的交通狀態(tài)的短時(shí)預(yù)測(cè)。
[1] Fangce Guo, Polak J W. Comparison of modeling approaches for short term traffic prediction under normal and abnormal condition[C]//13th Intelligent Transportation Systems(ITSC) International IEEE Conference 2010. IEEE, 2010: 1209-1214.
[2] 孫曉亮. 面向城市快速路的道路交通狀態(tài)預(yù)測(cè)方法的研究[D]. 北京: 北京交通大學(xué), 2009.
[3] 王新穎. 基于網(wǎng)格的短時(shí)交通狀態(tài)預(yù)測(cè)研究[D]. 長(zhǎng)春:吉林大學(xué), 2010.
[4] 鄭建湖,林小惠,鄭禮席,等. 基于馬爾可夫鏈模型的交通擁擠狀態(tài)預(yù)測(cè)[J]. 交通標(biāo)準(zhǔn)化, 2012(22): 76-79.
[5] 盛春陽(yáng),張?jiān)? 基于貝葉斯網(wǎng)絡(luò)模型的交通狀態(tài)預(yù)測(cè)[J].公路與汽運(yùn), 2008(1): 29-31.
[6] 錢(qián)民,唐克生. 基于定性動(dòng)態(tài)概率網(wǎng)絡(luò)的交通狀態(tài)預(yù)測(cè)及改進(jìn)[J]. 云南大學(xué)學(xué)報(bào): 自然科學(xué)版, 2012,34(2):165-168.
[7] 陶麗. 基于改進(jìn)小波神經(jīng)網(wǎng)絡(luò)模型的交通流預(yù)測(cè)研究[D]. 上海: 上海工程技術(shù)大學(xué), 2015.
[8] 章文俊. 小波神經(jīng)網(wǎng)絡(luò)算法及其船舶運(yùn)動(dòng)控制應(yīng)用研究[D]. 大連: 大連海事大學(xué), 2014.
[9] 趙娜,袁家斌,徐晗. 智能交通系統(tǒng)綜述[J]. 計(jì)算機(jī)科學(xué),2014,41(11): 7-11.
[10] 吳忠金. 基于車(chē)聯(lián)網(wǎng)的城市道路交通狀態(tài)識(shí)別算法研究[D]. 廣州: 華南理工大學(xué), 2012. ★