余萍
【摘要】? ? ?隨著無線網絡的大量普及,人們生活中產生大量的無線網絡信令數據,找出其中的共同規(guī)律,研究人員可以借此規(guī)律來建立城市交通模型。其中,組歸一化網格循環(huán)網絡和卷積神經網絡在構建模型中起主導作用。組歸一化處理能提升模型的數據源規(guī)模和收斂速度,簡化內部程序循環(huán)的計算過程,解決傳統(tǒng)模型計算量大的問題,通過記憶單元對所需數據進行存儲和更新。針對噪聲數據,對數據集進行網格化和篩選,以規(guī)避噪聲數據的影響。卷積神經網絡具有更好的用戶分類性能,提高了識別率。
【關鍵詞】? ? 無線網絡信令? ? 組歸一化? ? 卷積神經網絡
引言:
在大力的發(fā)展無線網絡的同時,城市交通網絡的流量也隨著增加。掌握實時、準確的交通流量對于城市管理與人們出行服務尤為重要。傳統(tǒng)居民的出行問卷調查容易受到受訪者主觀意識影響,也存在支出高、回報率低、工作量大、處理時間長等問題。移動信令數據正好解決了這些問題。本文研究移動信令在城市交通模型構建中的價值。
一、移動信令的特點與價值
1.1移動信令的特點
城市的土地資源有限,城市交通堵塞問題日趨嚴重,而信息技術應用于交通是大勢所趨的。為了改善現狀,通過移動信令建立城市交通模型是最合適的方法,而移動信令采集方便、實時、覆蓋范圍廣、目標明確。最開始采集的移動信令數據冗余,通過對移動信令數據進行數據預處理,將重復、有缺失和不符合規(guī)則的數據進行刪除和修改,最后才能獲得有效準確的移動信令。
數據網絡的不斷普及,人們能迅速的統(tǒng)計移動信令,并通過移動信令及時的掌握居民的交通動態(tài),實時了解城市當前交通狀態(tài)。國內聯通、移動和電信運營商的無線網絡信令幾乎形成了全國覆蓋,移動信令可以準確記錄每個用戶的出行行為軌跡,系統(tǒng)可以根據以往的出行軌跡和最新的交通動態(tài)為出行者推薦最佳路線。
1.2移動信令的價值體現
通過對用戶的移動信令數據的進一步分析,可以得到人口密度、人口流動變化等有效信息。分析的結果對于人們的出行軌跡、擁堵預測和交通規(guī)劃提供了可靠的參考。根據經過處理后的移動信令,通過熱力圖和散點圖了解人們的出行頻率,實時了解各地的人流量,并獲得城市人群熱力分布和當前道路的通行情況,如該區(qū)域的擁堵情況、高峰時段和異常聚集。然后,根據之前獲得到的人口密度信息和每日人流量密度變化,剔除特殊路況等信息,為出行者提出最優(yōu)的路線。通過數據的變化,可以清楚的知道這個地方每天的人流量高峰點,并對用戶步行或者使用交通工具出行進行判斷,對用戶的出行方式進行標簽化。交通出行方式的識別對城市的交通規(guī)劃、智能交通系統(tǒng)的運行、精確的推薦和各地的服務等是至關重要的。而對于人流量高峰時期,也可以做出更好的道路行程安排。同時,以人流量變化模型作為理論依據,結合人群密度和時間的關系,可以減少踩踏和擁擠事故。
二、移動信令在城市交通模型構建中的價值實現思路
2.1理論依據
無線信令數據的收集不受被調查者的人為影響,能夠更加精準地、完整地統(tǒng)計被調查者的出行信息。同時,它還具有統(tǒng)計速度快、信息準確性高、數據量大等優(yōu)點,成為獲取人們出行軌跡信息的有效新途徑。目前,國內外有大量基于移動信令行程鏈提取和行程模式分析的研究成果,但在移動信令的數據清洗和現實生活中利用方面的研究成果較少。近年來,國內外學者為預測交通流量的短期狀況,提出了關于時間序列的預測方法,但時序數據要求平穩(wěn)或差分后平穩(wěn)。如果是非平穩(wěn)數據,則不能發(fā)現它的規(guī)律,本質上,這種方法只能獲取其數據的線性關系。這種時序預測技術可以處理正常情況下的數據。
然而,在現實中,時間序列數據通常是沒有規(guī)律的,容易受到外部因素的影響,使交通流量模型預測的精確度受到了極大挑戰(zhàn)。傳統(tǒng)獲取用戶流量信息的方法是采用問卷調查或電話采訪的方式,這種方法通常存在耗時昂貴、信息不完整等問題。這時就需要一種低成本和采集信息完整的方法,比如移動信號數據。為了收集不同地區(qū)的移動信令數據,中國在各地建立了大量的網絡基站。隨著基站設備的更新換代,無線網絡的全球覆蓋,基站能夠迅速收集到各地用戶的信令數據信息。因此,通過移動信令建立城市交通模型尤為重要和方便。
2.2模型構建
組歸一化網格循環(huán)網絡模型結合了無線信令交通流量數據詳細特性,并借鑒傳統(tǒng)機器學習算法和深度學習算法的優(yōu)缺點,網格化操作更精確地找出并標出模型的關鍵信息,降低了信息冗余帶來的損失。模型的具體構建流程分為 5個部分:
1.收集所研究的交通流量數據。
2.對數據進行清洗,如填充缺失值、處理異常值、刪除冗余數據等。
3.將清洗后的交通流量數據進行分組,并對分組的數據編碼和組歸一化操作。
4.將編碼處理后的數據分成訓練樣本和測試樣本。
5.將訓練樣本和測試樣本分別帶入循環(huán)網絡模型(RN)和網格循環(huán)網絡模型(GRN)。
交通流量的信令數據雖然經過了數據預處理,但依然會存在無效的數據。而卷積神經網絡可以通過局部連接來處理這類數據。卷積神經網絡的處理過程分為兩個過程:一個過程是無線信令由低層次向高層次傳播的過程;另一個過程是當前輸出的結果不符合預期時,將誤差從高層次傳播到低層次的過程,步驟為:
1.行權值的初始化。
2.數據經過卷積層、池化層、全連接層的向前傳播得到結果。
3.結果與目標值之間的誤差。
4.當誤差大于我們的目標值時,將誤差傳回數據庫中,依次求得全連接層,池化層層,卷積層的誤差。這些誤差可以理解為對于數據庫的總誤差,當誤差等于或小于我們的目標值時,結束數據運行。
5.誤差進行權值更新。模型運行原理如圖1所示。
2.3識別系統(tǒng)
卷積神經網絡是一種用于圖像整理歸類的神經網絡,它可以對輸入圖像的一部分進行卷積運算。卷積神經網絡的主干由若干個卷積層、激活層、池化層以及Dropout組成。卷積層的作用是使數據可以在特征圖上滑動,并將一維特征圖轉化為三維特征圖輸出;到卷積層輸出之后,使用 Re LU 激活函數;最后,卷積層輸出的特征圖通過池化層進行壓縮。卷積神經網絡的顯著特點是可以接受高度、寬度和深度三個維度的輸入。先將圖片輸入,經過卷積層,會產生很多的特征圖,是輸入圖片經過特征探測器生成的圖片,在此基礎上可以加上線性激活層,增加非線性性,之后,通過池化層處理壓縮,得到維度更小的特征圖。最后,通過全連接堆疊成卷積神經網絡模型。卷積神經網絡模型和其他模型相比,有更大的優(yōu)勢,它在數據準確率和數據回收率兩個方面上也同樣具有優(yōu)勢。卷積神經網絡模型的預測準確性遠遠大于其他模型。在樣本數量相對均衡的前提下,準確率和回收率都能很好地展示出卷積神經網絡模型在交通出行方式識別方面的性能。
2.4性能優(yōu)化
通常,組歸一化網格循環(huán)網絡會將數據分成小批量進行處理,這樣往往導致了迭代次數的增加,而得不到最優(yōu)解。因此,選擇正確的優(yōu)化器、正則化和訓練周期能得到準確的結果。優(yōu)化器的合理選用對交通流量預測模型至關重要,Momentum 優(yōu)化器、RMSprop 優(yōu)化器和Adam 優(yōu)化器等是比較受歡迎的優(yōu)化器。Momentum 優(yōu)化器對梯度運動指數的加權平均可以減小梯度擺動幅度;RMSprop 優(yōu)化器可以通過求相似梯度的平均值來自動地調整學習率;Adam 優(yōu)化器每次迭代時參數的學習率固定在一定范圍內。卷積神經網絡的性能優(yōu)化也可以選取合適的優(yōu)化器、正則化和迭代周期。正則化的選擇也同樣影響著交通流量預測模型的性能。L1 正則化,在城市交通模型的損失函數中加各入參數的絕對值;L2 正則化,在城市交通模型中的損失函數中加各入個參數平方和的開方;Dropout 正則化隨機地將某層的一些輸出特征設置為 0。其中 Dropout 正則化主要通過其數據的結果比率影響組歸一化網格循環(huán)網絡的交通流量預測模型。
三、注意問題
無線網絡全世界的大量普及,造成移動信令的收集繁雜,組歸一化網格循環(huán)和卷積神經網絡所需硬件的精密,數據預處理所需要的程序代碼復雜。數據的清洗并不能達到要求,同時,關于交通方式和國家法律的改變,不能及時更新造成數據錯誤。移動信令建立的城市交通模型并不具有很強的保密性和嚴謹性,無線網絡的癱瘓很容易導致城市交通擁堵,從而,造成一系列的損失。組歸一化網格循環(huán)和卷積神經網絡所構建的模型并不能適用所有地區(qū),無法處理一些人為造成的影響。同時也不能對小范圍進行數據采集,構建交通模型。
四、結束語
無線網絡的大量普及是一種常態(tài),將無線網絡中的移動信令應用到城市交通模型構建,以便實時了解城市交通問題,及時應對交通擁堵帶來的麻煩,記錄人們出行方式與路線,提供最佳的出行路線。然而數據的采集需要精密的儀器和設備,需要加強技術人員的培養(yǎng),設備和國家的支持,同時還要根據不同的地區(qū),采用不同的模型構建方法。
參? 考? 文? 獻
[1] 邱莉萍,鄧拓.基于手機信令的人群密度分析與交通規(guī)劃研究.
[2] 暴建民,翟英明.蔣研基于云平臺的電動汽車充電設備管理系統(tǒng)201911239706.6,2019.12.06.
[3] 暴建民,翟英明,丁飛.基于組歸一化和網格化協同的交通流預測方法202010011994.2,2020.01.06.