黃柏然
廣西博聯(lián)信息通信技術(shù)有限責(zé)任公司
基于數(shù)據(jù)挖掘技術(shù)的交通流量分析
黃柏然
廣西博聯(lián)信息通信技術(shù)有限責(zé)任公司
交通流量預(yù)測是研究智能交通系統(tǒng)的重要課題,通過交通流量預(yù)測方法對相關(guān)數(shù)據(jù)進(jìn)行建模,預(yù)測未來交通流量,進(jìn)一步更好地制定忙時交通分流預(yù)案,配備合適的運(yùn)營資源。本文闡述了數(shù)據(jù)挖掘技術(shù)的主要方法以及交通流量預(yù)測與BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的主要步驟,對基于數(shù)據(jù)挖掘技術(shù)的交通流量進(jìn)行了探討分析。
數(shù)據(jù)挖掘技術(shù);交通流量預(yù)測;BP神經(jīng)網(wǎng)絡(luò)模型;Matlab軟件
隨著城市建設(shè)的不斷推進(jìn),促進(jìn)了交通運(yùn)輸?shù)陌l(fā)展,同時交通擁堵和事故、環(huán)境污染以及能源消耗問題越來越嚴(yán)重。為了保障交通運(yùn)輸?shù)慕】蛋l(fā)展,必須加強(qiáng)交通流量預(yù)測的分析。
數(shù)據(jù)挖掘技術(shù)的主要方法:(1)聚類分析法。聚類分析是通過將數(shù)據(jù)對象進(jìn)行聚類分組,然后形成板塊,將毫無邏輯的數(shù)據(jù)變成了有聯(lián)系性的分組數(shù)據(jù),然后從其中獲取具有一定價值的數(shù)據(jù)內(nèi)容進(jìn)行進(jìn)一步的利用。由于這種分析方法不能夠較好的就數(shù)據(jù)類別、屬性進(jìn)行分類,所以聚類分析法一般都運(yùn)用在心理學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)識別等方面。(2)人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)是通過大批量的數(shù)據(jù)進(jìn)行分析,而這種數(shù)據(jù)分析方式本身是建立在一定的數(shù)據(jù)模型基礎(chǔ)上的,因此通常都可以隨時根據(jù)數(shù)據(jù)需求進(jìn)行分類,所以人工神經(jīng)網(wǎng)絡(luò)也是當(dāng)下數(shù)據(jù)挖掘技術(shù)中最常用的一種數(shù)據(jù)分析方式之一。(3)關(guān)聯(lián)性分析法。有時數(shù)據(jù)本身存在一定的隱蔽性使得很難通過普通的數(shù)據(jù)分析法進(jìn)行數(shù)據(jù)挖掘和利用,這就需要通過關(guān)聯(lián)性分析法完成對于數(shù)據(jù)信息的關(guān)聯(lián)性識別,來幫助人力完成對于數(shù)據(jù)分辨的任務(wù),這種數(shù)據(jù)分析方法通常是帶著某種目的性進(jìn)行的,因此比較適用于對數(shù)據(jù)精準(zhǔn)度相對較高的信息管理工作。(4)特征性數(shù)據(jù)分析法。網(wǎng)絡(luò)數(shù)據(jù)隨著信息時代的到來變成了數(shù)據(jù)爆炸式,其數(shù)據(jù)資源十分廣泛并且得到了一定的普及,如何就網(wǎng)絡(luò)爆炸式數(shù)據(jù)進(jìn)行關(guān)于特性的分類就成為了當(dāng)下數(shù)據(jù)整理分類的主要內(nèi)容。在上文中提到的人工神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分析也屬于這其中的一種,此外還有很多方法都是通過計(jì)算機(jī)來進(jìn)行虛擬數(shù)據(jù)的分類,尋找數(shù)據(jù)之間存在的普遍規(guī)律性完成數(shù)據(jù)的特性分析從而進(jìn)行進(jìn)一步分類。
1、交通流量預(yù)測的分析?,F(xiàn)有短時交通流量預(yù)測方法大致可以分為:第一、以數(shù)理統(tǒng)計(jì)和微積分等傳統(tǒng)數(shù)學(xué)和物理方法為基礎(chǔ)的,其主要包括早期的歷史平均模型,自回歸滑動平均模型(ARMA),以及后來研究的更復(fù)雜、更精度的多元回歸模型,Kalman濾波模型,ARIMA模型等;第二、無數(shù)學(xué)模型的預(yù)測方法,其需要自己建立新的算法來實(shí)現(xiàn),主要方法有非參數(shù)回歸,譜分析法,基于小波理論的方法,神經(jīng)網(wǎng)絡(luò)等。
2、BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的主要步驟。BP神經(jīng)網(wǎng)絡(luò)模型把一組樣本的I/O的輸入輸出問題轉(zhuǎn)化一個非線性優(yōu)化的問題,其實(shí)際是優(yōu)化中梯度下降法。假如把這種神經(jīng)網(wǎng)絡(luò)的看作是從輸入層到輸出層的映射,則這個映射是一個高度非線性得關(guān)系。
首先是要對訓(xùn)練樣本進(jìn)行選取和預(yù)處理,結(jié)合研究狀況以及目標(biāo),選取合適的訓(xùn)練樣本和檢驗(yàn)樣本,由于BP神經(jīng)網(wǎng)絡(luò)各層轉(zhuǎn)換函數(shù)以及學(xué)習(xí)規(guī)則是不同的,所以在輸入樣本之前要對輸入的樣本作預(yù)處理;然后再去確定建造BP網(wǎng)絡(luò)的結(jié)構(gòu),這包括變量的選取,隱層和隱層節(jié)點(diǎn)數(shù)的選取等問題;把輸入樣本輸入到BP神經(jīng)網(wǎng)絡(luò)模型中,再進(jìn)行仿真訓(xùn)練;而后預(yù)測出該網(wǎng)絡(luò)的輸出值,再拿該期望值與實(shí)際輸出進(jìn)行比較,根據(jù)誤差去反復(fù)的修改誤差,從而改變權(quán)值以及閾值,直到誤差一個可接受的范圍,完了再用檢驗(yàn)樣本進(jìn)行對比,判斷結(jié)果;然后對結(jié)果進(jìn)行比較分析,最后認(rèn)可該網(wǎng)絡(luò)模型的算法,就可以對未來交通流量進(jìn)行精確地預(yù)測。
BP神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì):首先是對模型的建立、數(shù)據(jù)采集并且預(yù)處理,然后對輸入到模型特征向量的數(shù)據(jù)進(jìn)行預(yù)測、通過預(yù)測的數(shù)值去判斷是否符合實(shí)際數(shù)值等。該模型網(wǎng)絡(luò)的建立是整個系統(tǒng)是否成功的關(guān)鍵,并且只要選擇的數(shù)據(jù)完備、可靠、準(zhǔn)確,才有可能得到符合預(yù)測的網(wǎng)絡(luò)模型。數(shù)據(jù)的采取需要有實(shí)時的數(shù)據(jù)采集系統(tǒng)。事實(shí)上預(yù)處理的過程要求根據(jù)數(shù)據(jù)的實(shí)際情況進(jìn)行預(yù)處理,本文研究的交通流量數(shù)據(jù)都是來自交通監(jiān)控部門,故具有完備的、一致的,因此要首先要對其進(jìn)行數(shù)據(jù)變換。對于系統(tǒng)的輸出數(shù)值是否滿足實(shí)際數(shù)值,只要將其所得到的預(yù)測值和數(shù)學(xué)期望值進(jìn)行比較,所得的數(shù)值滿足在數(shù)學(xué)期望值的附近且其誤差值小于預(yù)先設(shè)定的誤差值時,就可以認(rèn)為該系統(tǒng)可以成功預(yù)測交通流量,可以先把它記下來;反之,認(rèn)為將得不到合適的數(shù)值,需要不斷的改變權(quán)值。
對輸入到網(wǎng)絡(luò)模型特征向量數(shù)據(jù)進(jìn)行預(yù)測:首先建立合適的網(wǎng)絡(luò)模型,將對應(yīng)的交通流量的特征向量數(shù)據(jù)預(yù)處理后,輸入到網(wǎng)絡(luò)進(jìn)行訓(xùn)練,仿真訓(xùn)練結(jié)束后,用檢驗(yàn)樣本的特征向量進(jìn)行檢驗(yàn),然后用最后一組數(shù)據(jù)對該模型測試,分析其模型的實(shí)際是否有效,判斷其是否是符合實(shí)際交通流量預(yù)測的模型。只要特征向量的數(shù)值的選擇較為合適,就有可能建立起較為合適的模型,可以用此來對交通流量進(jìn)行預(yù)測。所以BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于交通流量的預(yù)測中是可行的。
應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測模型建立可以知道,在應(yīng)用BP神經(jīng)網(wǎng)絡(luò)解決現(xiàn)實(shí)存在的問題中,網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的確定,訓(xùn)練算法和參數(shù)的選取,只能通過大量的科學(xué)實(shí)驗(yàn),最后通過計(jì)算獲得,這占用了大量編程人員的大量時間和精力,然而Matlab軟件提供了這些便捷,其提供了現(xiàn)成的神經(jīng)網(wǎng)絡(luò)工具箱,即是它擁有這方面大量地函數(shù)庫。Matlab軟件的神經(jīng)網(wǎng)絡(luò)工具箱應(yīng)該是囊括了現(xiàn)在所有的網(wǎng)絡(luò)模型,例如:徑向基函數(shù)網(wǎng)絡(luò),BP網(wǎng)絡(luò),線性網(wǎng)絡(luò),感知器等等網(wǎng)絡(luò)模型。對于這些模型,Matlab軟件中的庫函數(shù)提供了大量地算法模型。
城市化建設(shè)進(jìn)程的加快,使得交通運(yùn)輸問題日趨增多;而交通流量的預(yù)測可以對現(xiàn)有的交通設(shè)施進(jìn)行合理利用,有效緩解交通擁堵現(xiàn)象,降低交通事故發(fā)生率,從而保障交通運(yùn)輸?shù)氖孢m安全。
[1]陳建偉,李麗坤.數(shù)據(jù)挖掘技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2016(01)
[2]段冰.基于DE-BP神經(jīng)網(wǎng)絡(luò)模型的旅游客源預(yù)測[J].價值工程,2010(34)
[3]高海峰.智能交通系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用,2016(05)