亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        交通流缺失數(shù)據(jù)處理方法比較分析*

        2018-05-23 02:45:07孟鴻程陳淑燕
        交通信息與安全 2018年2期
        關(guān)鍵詞:交通流檢測器車道

        孟鴻程 陳淑燕

        (東南大學(xué)交通學(xué)院 南京 210096)

        0 引 言

        在交通工作者進行交通分析時,交通數(shù)據(jù)的采集必不可少。交通流數(shù)據(jù)對于交通狀況研究可起到較大的作用,交通調(diào)查中所采集數(shù)據(jù)的質(zhì)量對于交通研究工作及后續(xù)的決策存在著較大的影響。交通流數(shù)據(jù)的采集可能會受到影響,例如,地基沉陷或施工導(dǎo)致的檢測器失靈、線圈檢測器故障或者通信信號終端導(dǎo)致信息未能傳輸、人為處理錯誤,采集到的數(shù)據(jù)很有可能產(chǎn)生缺失問題。若不能夠給予缺失數(shù)據(jù)足夠的重視,未能正確處理缺失數(shù)據(jù),那么可能會獲得錯誤的研究結(jié)果,不利于后續(xù)研究工作的開展。因此如何處理交通流缺失數(shù)據(jù)是研究者所需要面對的問題,正確地處理交通流數(shù)據(jù)缺失對于相關(guān)交通研究工作具有重要意義。處理好交通流缺失數(shù)據(jù)問題,將給接下來的交通分析,交通規(guī)劃與設(shè)計奠定良好基礎(chǔ)。

        目前,交通流數(shù)據(jù)缺失的處理主要是采取修復(fù)而不是刪除的方法,雖然刪除最為簡易,但是很可能會造成有用信息的缺失,也會增加后續(xù)數(shù)據(jù)處理的難度,所以大多數(shù)的處理方法都考慮對缺失數(shù)據(jù)進行修復(fù)。交通流缺失數(shù)據(jù)的修復(fù)方法主要有3種[1]。

        1) 基于時間相關(guān)性的數(shù)據(jù)修復(fù)。時間相關(guān)性是指缺失數(shù)據(jù)與歷史上某時刻的交通流數(shù)據(jù)具有某些程度的聯(lián)系。胡偉超等[2]對傳感器采集的實時交通流數(shù)據(jù)采取了錯誤識別、補充修復(fù),使用短時交通流預(yù)測的方法對數(shù)據(jù)缺失情況采取了措施,其中包含了歷史平均法。Smith等[3]利用歷史數(shù)據(jù)并采用啟發(fā)式算法和統(tǒng)計估算方法對缺失數(shù)據(jù)進行了處理。Tang等[4]提出了模糊C均值的插補方法與遺傳算法相結(jié)合的混合方法,并與指數(shù)平滑法等方法進行了比較,最終發(fā)現(xiàn)該方法對于論文所采用的交通流缺失數(shù)據(jù)的修復(fù)具有良好的處理效果。Tan等[5]提出了一種基于張量的交通缺失數(shù)據(jù)補齊方法,這種方法不僅繼承了基于矩陣模式的估計缺失點的插補方法的優(yōu)勢,而且很好地挖掘了交通數(shù)據(jù)的多維固有相關(guān)性。

        2) 基于空間相關(guān)性的數(shù)據(jù)修復(fù)。空間相關(guān)性是指交通流數(shù)據(jù)在道路不同地點之間有著某些聯(lián)系[6]。Xiao等[7]利用浮動車數(shù)據(jù)和控制計劃對缺失數(shù)據(jù)進行修復(fù),其中考慮了采用相鄰車道的交通流數(shù)據(jù)進行修復(fù)。郭敏等[8]提出了基于灰色殘差GM(1,N)模型的交通流數(shù)據(jù)修復(fù)算法,但該方法僅限于道路交叉口的數(shù)據(jù)缺失情況,并且針對檢測器的布設(shè)還有一定的要求?;诳臻g相關(guān)性進行修復(fù)的方法包含著較好的效果,然而有時候并不能適用。例如當(dāng)缺失數(shù)據(jù)附近車道或檢測器采集數(shù)據(jù)也同樣缺失的時候。因此這種修復(fù)方法要求空間上有某些聯(lián)系的數(shù)據(jù)。

        3) 基于時空相關(guān)性的數(shù)據(jù)修復(fù)??紤]到基于時間相關(guān)性或空間相關(guān)性的數(shù)據(jù)修復(fù)方法的不足,孫玲等[1]考慮相關(guān)性理論,采用了基于交通流時空相關(guān)特性的數(shù)據(jù)修復(fù)算法。并運用Vissim進行了仿真,建立了模型,利用仿真模型獲得的數(shù)據(jù)對缺失數(shù)據(jù)進行了修復(fù),并分析修復(fù)結(jié)果。金盛[9]考慮采用二元線性回歸方法對缺失數(shù)據(jù)進行修復(fù),根據(jù)不同檢測器采集數(shù)據(jù)與缺失數(shù)據(jù)的相關(guān)關(guān)系建立了多個回歸方程,并根據(jù)它們的計算結(jié)果選取中值作為替代值。金逸文[10]在對交通流異常數(shù)據(jù)的修復(fù)中,提出了基于曲面重構(gòu)的修復(fù)方法。Li等[11]提出了以KPPCA代替PPCA的方法對缺失數(shù)據(jù)進行修復(fù),最終發(fā)現(xiàn)考慮了時空相關(guān)性的KPPCA方法對于缺失數(shù)據(jù)的修復(fù)表現(xiàn)更好。

        對于交通流缺失數(shù)據(jù)的具體處理方法有以下幾種:胡偉超等[2]提出的歷史數(shù)據(jù)法、移動平均法、指數(shù)平滑法和自適應(yīng)指數(shù)平滑法;劉璐[12]分析在多尺度下路網(wǎng)的空間相關(guān)性和浮動車數(shù)據(jù)的時間相關(guān)性,應(yīng)用多元線性回歸模型。郭敏等[8]提出了基于灰色殘差GM(1,N)模型的交通流數(shù)據(jù)修復(fù)算法;王曉原等[13]提出了一種基于粗集理論的缺失數(shù)據(jù)補齊方法。陳楊等[14]提出了一種基于平衡指數(shù)平滑的交通流數(shù)據(jù)預(yù)測方法。袁媛等[15]提出一種基于最小二乘支持向量機(least squares support vector machines,S-SVM)的交通流時間序列數(shù)據(jù)修補模型。目前對于各種數(shù)據(jù)修復(fù)方法的比較分析較少,筆者考慮基于時間相關(guān)性、空間相關(guān)性和時空相關(guān)性的數(shù)據(jù)修復(fù)方法。通過人工制造數(shù)據(jù)缺失,將修復(fù)完成的數(shù)據(jù)與實測數(shù)據(jù)進行對比,從而對各種修復(fù)方法的修復(fù)結(jié)果進行比較分析。

        1 交通流缺失數(shù)據(jù)修復(fù)方法

        1.1 基于時間相關(guān)性的數(shù)據(jù)修復(fù)

        基于時間相關(guān)性的數(shù)據(jù)修復(fù)方法主要有2種,分別考慮歷史數(shù)據(jù)或時間序列并且有著各自的優(yōu)勢和缺陷?;跉v史數(shù)據(jù)的修復(fù)方法考慮了交通流數(shù)據(jù)存在的周期性,例如,1周或1個月內(nèi)的交通流呈現(xiàn)出某種循環(huán)的特性。

        交通流數(shù)據(jù)從根本上而言可以被視為時間序列數(shù)據(jù),所以,基于時間序列的各種修復(fù)方法都能夠應(yīng)用于缺失數(shù)據(jù)的修復(fù)[2]。時間序列方法優(yōu)點在于簡單并且容易操作,對于利用計算機處理大量交通流數(shù)據(jù)具有良好的效果。其缺點在于只能處理短期數(shù)據(jù)而無法處理長期數(shù)據(jù)。對于短期內(nèi)的數(shù)據(jù)缺失問題,能夠采用這種方法開展修復(fù)工作[16]。

        時間序列法原理如下:一方面,事物的發(fā)展具有一定的趨勢,而這種趨勢在數(shù)據(jù)上也可以在一定程度上表現(xiàn)出來,因此可以利用這種趨勢對缺失的數(shù)據(jù)進行處理。另一方面,考慮到數(shù)據(jù)變化并非遵循特定的趨勢,也存在著一定的隨機性,可以利用歷史數(shù)據(jù)進行處理[17]。存在著時間序列的交通流數(shù)據(jù)都可以采用該方法進行缺失值修復(fù),尤其當(dāng)數(shù)據(jù)缺失率較低的時候,能夠獲得良好的修復(fù)性能。但是當(dāng)數(shù)據(jù)在某時間段或某天連續(xù)缺失的時候,該方法就無法用于數(shù)據(jù)修復(fù)。

        1) 歷史數(shù)據(jù)法??紤]到交通流數(shù)據(jù)表現(xiàn)出明顯的周期性,所以可以利用歷史數(shù)據(jù)進行修復(fù)。歷史數(shù)據(jù)法具有一定的優(yōu)點,例如:簡單易行,數(shù)據(jù)處理也較為快捷,所獲得的結(jié)果也具有較高的可信度。但是這種方法也存在著一些問題,無法反映交通流的真實變化情況,由于歷史數(shù)據(jù)是經(jīng)過平滑后的,因此,也不能維持?jǐn)?shù)據(jù)的一些自然波動特性,尤其無法克服隨機干擾的影響[18]。

        2) 移動平均法。在統(tǒng)計學(xué)上,移動平均是利用整體數(shù)據(jù)對某一部分的數(shù)據(jù)進行預(yù)測,從而獲得較為完整的數(shù)據(jù)??紤]采用一次N元移動平均法對缺失數(shù)據(jù)進行補齊,見式(1)。

        (1)

        式中:St為t時間上的預(yù)測值;Xt為t時間上的實際觀測值;N為取平均的數(shù)據(jù)個數(shù)。

        移動平均法對系統(tǒng)變化的反應(yīng)快慢由觀測值的數(shù)量N決定。當(dāng)N減小時,預(yù)測系統(tǒng)的反應(yīng)速度會變快,但是會更容易受到干擾,導(dǎo)致預(yù)測的精度降低。

        3) 指數(shù)平滑法。指數(shù)平滑法是一種基于平滑時間序列數(shù)據(jù)的經(jīng)驗法則。一次指數(shù)平滑法的數(shù)學(xué)模型見式(2)。

        St+1=αXt+(1-α)St=St+α(Xt-St)

        (2)

        式中:St為t時間上的預(yù)測值;Xt為t時間上的實際觀測值;α為系數(shù),0<α<1。

        St具有追溯性,可以來自St-t+1,包括所有的數(shù)據(jù)。在這個過程中,平滑常數(shù)呈指數(shù)下降,因此,被稱為指數(shù)平滑。指數(shù)平滑常數(shù)是關(guān)鍵。平滑常數(shù)α趨于1,正向?qū)嵵禃暂^高的速度降低到當(dāng)前周期的平滑值。平滑常數(shù)α趨于0,則正向值的實際值變化就會越慢。所以,時間序列表現(xiàn)為比較穩(wěn)定的狀態(tài)時,考慮選取較小的α。而在時間序列并非表現(xiàn)為穩(wěn)定狀態(tài)時,應(yīng)采取相對大的α值,從而避免太過于關(guān)注預(yù)測值。

        4) 線性回歸法。在統(tǒng)計模型中,回歸分析是估計變量之間關(guān)系的一個統(tǒng)計過程。當(dāng)關(guān)注于因變量(或“標(biāo)準(zhǔn)變量”)和自變量(或“預(yù)測因子”)它們的關(guān)系時,它包含了若干變量的建模和數(shù)據(jù)分析的技術(shù)。更具體地說,回歸分析有助于明確關(guān)鍵數(shù)值的因變量在改變的時候,所有獨立變量改變的情況。

        在回歸分析中,僅僅只有一個因變量并且只有1個自變量的時候,稱這樣的為一元回歸分析。而當(dāng)只有一個因變量但是卻有多個自變量的時候,稱其為多元回歸分析。除此之外,因變量與自變量之間也存在這關(guān)系,當(dāng)這種關(guān)系表現(xiàn)為線性關(guān)系的時候,稱為線性回歸分析,否則稱為非線性回歸分析。筆者將采用多元線性回歸模型進行預(yù)測。

        1.2 基于空間相關(guān)性的數(shù)據(jù)修復(fù)

        本文所研究的空間相關(guān)性是指缺失數(shù)據(jù)所在檢測器與相鄰檢測器檢測數(shù)據(jù)的關(guān)系,缺失數(shù)據(jù)所在車道與相鄰車道交通流數(shù)據(jù)的關(guān)系。這種方法考慮了不同的車道之間表現(xiàn)出的交通流數(shù)據(jù)的聯(lián)系,所以能夠利用其他車道的數(shù)據(jù)對缺失數(shù)據(jù)采取補齊措施。該方法避免了時間相關(guān)預(yù)測不能反映實際交通狀況的弱點,提高了預(yù)測數(shù)據(jù)的實時性。同樣,也可以利用類似的方法根據(jù)相鄰線圈檢測器的交通流數(shù)據(jù)補齊缺失數(shù)據(jù)。

        1.2.1 相鄰車道修復(fù)法

        缺失數(shù)據(jù)為某車道某分鐘的交通流數(shù)據(jù)缺失,所以可以考慮利用缺失數(shù)據(jù)所在車道相鄰車道的交通流數(shù)據(jù)對缺失數(shù)據(jù)進行修復(fù)。待補齊的交通流數(shù)據(jù)與相鄰車道的交通流數(shù)據(jù)之間存在一定的相關(guān)關(guān)系,所以可以利用相鄰車道的交通流數(shù)據(jù)進行修復(fù)。具體來說可以考慮3種方法。

        1) 相鄰車道平均。這種修復(fù)方法中考慮直接采用2個相鄰車道采集的車道占有率數(shù)據(jù)的平均值作為修復(fù)值,替換缺失的車道占有率數(shù)據(jù)。

        2) 相鄰車道回歸。不同車道的交通流數(shù)據(jù)對于缺失數(shù)據(jù)所在車道交通流數(shù)據(jù)的影響程度不同,所以考慮采用多元線性回歸方法進行修復(fù)。以缺失數(shù)據(jù)為因變量,相鄰車道數(shù)據(jù)為自變量,對缺失數(shù)據(jù)進行修復(fù)。

        3) 相鄰車道加權(quán)??紤]相鄰車道的車道速度以及速度與占有率的關(guān)系[19],給不同車道的數(shù)據(jù)賦予一定的權(quán)重,對缺失數(shù)據(jù)進行修補。不同車道的交通流數(shù)據(jù)對于缺失數(shù)據(jù)所在車道交通流數(shù)據(jù)的影響程度不同,而車道占有率數(shù)據(jù)與車道速度存在一定的線性關(guān)系,所以可以利用相鄰車道的車道速度數(shù)據(jù)給不同車道的占有率數(shù)據(jù)賦予一定的權(quán)重,從而使不同車道的交通流數(shù)據(jù)對缺失數(shù)據(jù)所在車道的交通流數(shù)據(jù)的影響程度產(chǎn)生差異,這種方法對數(shù)據(jù)的修復(fù)效果會更優(yōu)于僅僅利用平均值進行修復(fù)的方法。

        1.2.2 相鄰檢測器修復(fù)法。

        同一車道相鄰檢測斷面的交通流數(shù)據(jù)之間也存在著一定的相關(guān)關(guān)系,所以可以利用相鄰檢測器所采集的交通流數(shù)據(jù)進行修復(fù)。

        1) 相鄰檢測器平均。某檢測器的交通流數(shù)據(jù)缺失,可以考慮直接采用該檢測器的2個相鄰檢測器檢測數(shù)據(jù)的平均值作為替換值對缺失數(shù)據(jù)進行修補。因為它們采集的數(shù)據(jù)與缺失數(shù)據(jù)之間的聯(lián)系最為密切,利用它們的平均值進行修補具有簡單而高效的優(yōu)點。

        2) 相鄰檢測器回歸。利用平均值進行修復(fù)的方法雖然簡單并且能夠取得一定的修復(fù)效果,但是缺點在于未能考慮2個相鄰檢測器與缺失數(shù)據(jù)所在檢測器各自之間的關(guān)系。因為2個相鄰檢測器的數(shù)據(jù)對于缺失數(shù)據(jù)的影響程度不同,所以考慮利用回歸方法對缺失數(shù)據(jù)進行修復(fù)。

        如果采用一元線性回歸模型進行修復(fù),即僅考慮了待修復(fù)數(shù)據(jù)所在檢測器相關(guān)關(guān)系最大的檢測器所檢測的數(shù)據(jù),這種方法忽視了不同檢測器與待修復(fù)數(shù)據(jù)所在檢測器的相關(guān)關(guān)系是不同的,所以應(yīng)當(dāng)考慮采用多元線性回歸進行數(shù)據(jù)修復(fù)。多元線性回歸能夠綜合考慮相鄰多個檢測器所檢測到的交通流數(shù)據(jù),避免了一元線性回歸的不全面性,這樣進行修復(fù)的結(jié)果也相對更好。

        采用多元線性回歸模型進行修復(fù),需要考慮元數(shù),即自變量的個數(shù)。根據(jù)金逸文[10]的研究,當(dāng)元數(shù)大于2之后,元數(shù)的增加對于預(yù)測結(jié)果的優(yōu)化并沒有更明顯有效的影響,所以考慮采用二元線性回歸模型對缺失數(shù)據(jù)進行修復(fù)。利用相鄰檢測器檢測數(shù)據(jù)作為自變量,缺失數(shù)據(jù)所在檢測器檢測數(shù)據(jù)作為因變量,進行缺失數(shù)據(jù)插補。

        1.3 基于時空相關(guān)性的數(shù)據(jù)修復(fù)

        上述2種數(shù)據(jù)修復(fù)方法各有自己的優(yōu)勢和缺陷。時間序列方法簡單快速,對于大數(shù)據(jù)集比較適用,然而該方法無法預(yù)測長期數(shù)據(jù)。空間相關(guān)的方法可以反映實際交通狀況的問題,但是難以反映交通流量隨著時間改變并不均勻的情況。因此考慮結(jié)合2種方法,采用基于時空相關(guān)性的數(shù)據(jù)修復(fù)方法。

        在基于時空相關(guān)性的數(shù)據(jù)修復(fù)方法中,不僅要考慮交通流數(shù)據(jù)的時間相關(guān)性,也要考慮交通流數(shù)據(jù)的空間相關(guān)性,即同時考慮不同日期、相鄰車道和相鄰檢測器采集的交通流數(shù)據(jù)。交通數(shù)據(jù)是描述人、車、路之間的動態(tài)關(guān)系的數(shù)據(jù),因此交通流數(shù)據(jù)本質(zhì)上存在著時間和空間的相關(guān)性。一方面,由于空間地理位置的特性,某條路段的車輛速度與其相鄰路段的車輛速度密切相關(guān),所以便具有了空間相關(guān)性;另一方面,出行狀況存在相似情況,歷史數(shù)據(jù)前后時間段的相似性,便是在時間上的相關(guān)性[1]。

        在利用檢測器獲得數(shù)據(jù)進行修復(fù)時,不同檢測器所獲得的數(shù)據(jù)對缺失數(shù)據(jù)的影響程度存在著差異,因而它們與待修復(fù)數(shù)據(jù)之間的相關(guān)關(guān)系不同,所以考慮采用多元回歸模型以獲得參考數(shù)據(jù)之間更高的穩(wěn)定性。

        1.3.1 相關(guān)系數(shù)

        相關(guān)系數(shù)是量化相關(guān)性和依賴性類型的數(shù)字,意味著基本統(tǒng)計中2個或更多個數(shù)值之間的統(tǒng)計關(guān)系。對于二維隨機變量(X,Y),采用相關(guān)系數(shù)R這一參數(shù)來衡量X與Y之間的線性關(guān)系。定義R如下。

        (3)

        1.3.2 相關(guān)序列選擇

        為了對缺失數(shù)據(jù)進行補齊,需要尋找和缺失數(shù)據(jù)相關(guān)性最大的數(shù)據(jù)來源,并根據(jù)它們之間的相關(guān)關(guān)系,對缺失數(shù)據(jù)進行補齊。所以應(yīng)當(dāng)尋找與缺失數(shù)據(jù)相關(guān)性最大的數(shù)據(jù),可以從時間和空間方向出發(fā)。從時間相關(guān)性角度來看,和等待補齊的缺失數(shù)據(jù)相關(guān)關(guān)系較高的數(shù)據(jù)通常是附近時段或者距離不超過2 d和以1周為周期的最近2周的相同時段的數(shù)據(jù);從空間相關(guān)性角度出發(fā),最好的必然是前后2個相鄰斷面以及同一個檢測斷面上的相鄰車道的數(shù)據(jù)。

        1.3.3 缺失數(shù)據(jù)補齊

        利用已選擇數(shù)據(jù)與缺失數(shù)據(jù)的相關(guān)關(guān)系計算不同數(shù)據(jù)為了修復(fù)缺失數(shù)據(jù)的權(quán)重,并利用權(quán)重值完成對缺失數(shù)據(jù)的修復(fù)。與缺失數(shù)據(jù)時間相關(guān)、空間相關(guān)的數(shù)據(jù)為X1,X2,…,Xj,時空相關(guān)數(shù)據(jù)的相關(guān)序列與缺失數(shù)據(jù)序列的相關(guān)權(quán)重mi為[1]

        (4)

        計算得到缺失數(shù)據(jù)的替代值Y為

        (5)

        2 實例分析

        2.1 數(shù)據(jù)特征

        本文選取了美國加利福尼亞州I-880高速公路作為研究對象,選取了I-880高速公路上一段長約為54 km(34 mile)的路段,其中存在71組線圈檢測器,相鄰檢測器的平均距離約為0.8 km[20]。每組線圈檢測器的采集間隔是30 s,采集了交通流量、速度和車道的占有率。線圈檢測器采集的數(shù)據(jù)被完整地傳輸?shù)郊又莨肪?Caltrans)的高速公路交通評估系統(tǒng)中(performance measurement system,PeMS),PeMS系統(tǒng)是由加州大學(xué)伯克利分校的道路智能交通實驗室、加州公路局以及加州伯克利交通部門等單位共同研發(fā)管理,記錄了加州高速公路上約20年的高精度交通流數(shù)據(jù)[20]。

        從PeMS系統(tǒng)中獲取的一個名為d04_text_station_raw_2010_08_31的txt文件,其中d04表示加州舊金山海灣地區(qū),即I-880高速公路所在地區(qū),station_raw代表采集間隔為30 s的原始交通流數(shù)據(jù),2010_08_31代表數(shù)據(jù)采集的時間,該文件中某1行的數(shù)據(jù)為“08/31/2010 00:00:24,400006,0,0,0,3,0.0183,71,3,0.0189,71,3,0.0233,78”,它們分別代表時間,檢測器編號,各車道車輛數(shù)、占有率和速度。

        由于原始采集的數(shù)據(jù)存在著一定的問題,需要對原始數(shù)據(jù)進行數(shù)據(jù)篩選,剔除原始數(shù)據(jù)中的異常值。之后人工制造數(shù)據(jù)缺失,并采用多種處理方法修復(fù)缺失數(shù)據(jù)。獲得了較為完整的交通流數(shù)據(jù)后,就可以對交通流數(shù)據(jù)進行修復(fù)。

        2.2 指標(biāo)選擇

        解決缺失數(shù)據(jù)的方法各有其優(yōu)缺點。一個良好的數(shù)據(jù)修復(fù)方法應(yīng)該能夠保證修復(fù)后的數(shù)據(jù)比較符合交通流的實際狀況,并且不影響變量之間的關(guān)系,修復(fù)結(jié)果與實際情況不產(chǎn)生大的偏差。應(yīng)當(dāng)對補齊后的交通流數(shù)據(jù)與真實測量得到的交通流數(shù)據(jù)進行比較,為此,需要考慮對一些指標(biāo)采取計算的過程,如中位數(shù),均值和標(biāo)準(zhǔn)差,也可比較誤差、平均絕對誤差、平均相對誤差、均方誤差、平均絕對百分比誤差、均方百分比誤差和精度等。

        測量值和真實值之間的差異稱為誤差。由于假設(shè)的缺失值為某分鐘的數(shù)據(jù),存在數(shù)值為0的數(shù)據(jù),故放棄相對誤差等指標(biāo),而選取平均絕對誤差、均方誤差和最大絕對誤差3項指標(biāo)進行比較。通過比較采用各種數(shù)據(jù)處理方法補齊后的交通流數(shù)據(jù)的各項指標(biāo),可以對各種缺失數(shù)據(jù)補齊方法做出一定的評價,尋找更加適合本文所選用交通流數(shù)據(jù)的補齊方法。

        2.2.1 平均絕對誤差

        平均絕對誤差(mean absolute error,MAE)是測量值與測量值算術(shù)平均值誤差的絕對值的平均值。平均絕對誤差可以較好地反應(yīng)出修復(fù)的數(shù)值誤差的真實狀態(tài)。計算見式(6)。

        (6)

        式中:xt為t時刻的預(yù)測值;yt為t時刻的實際測量值;N是樣本數(shù)量。

        2.2.2 均方誤差(mean squared error,MSE)

        均方誤差定義為測量值平方平均值的平方根。計算見式(7)。

        (7)

        式中:xt為t時刻的預(yù)測值;yt為t時刻的實際測量值;N為樣本數(shù)量。

        2.2.3 最大絕對誤差

        最大絕對誤差(max absolute error, MAXE)是所有單個觀測值與算術(shù)平均值的偏差的絕對值中的最大值。最大絕對誤差計算見式(8)。

        MAXE=max|yt-xt|

        (8)

        式中,xt是t時刻的預(yù)測值,yt是t時刻的實測值。

        2.3 修復(fù)結(jié)果

        利用各種修復(fù)方法所修復(fù)結(jié)果的誤差見表1。

        2.4 修復(fù)結(jié)果評價

        平均絕對誤差和均方誤差反映修復(fù)數(shù)據(jù)總體的修復(fù)效果,修復(fù)結(jié)果中這2項指標(biāo)低的修復(fù)方法說明它們的修復(fù)效果較好,適合于修復(fù)較多數(shù)據(jù)缺失的情況。而最大絕對誤差這項指標(biāo)對于以上兩項指標(biāo)則有一定的借鑒意義,對于修復(fù)結(jié)果中最大絕對誤差較大的數(shù)據(jù)修復(fù)方法,也不應(yīng)考慮采用。所以在最終的評價過程中,應(yīng)該綜合考慮平均絕對誤差、均方誤差和最大絕對誤差3項指標(biāo)對最后各種修復(fù)方法獲得的結(jié)果進行計算。

        表1 修復(fù)結(jié)果

        根據(jù)修復(fù)結(jié)果,可以得出如下結(jié)論。

        1) 對于本文所采用的交通流數(shù)據(jù),指數(shù)平滑法的修復(fù)效果較好??梢娺x取丟失數(shù)據(jù)最近相鄰時刻的數(shù)據(jù)進行修復(fù)效果最好,優(yōu)于選取相鄰日期、車道或檢測器的數(shù)據(jù)。

        2) 歷史數(shù)據(jù)法對于本文中缺失數(shù)據(jù)的修復(fù)結(jié)果較好,表明交通流數(shù)據(jù)確實存在著一定的周期性。

        3) 指數(shù)平滑法中,α取值越小,預(yù)測結(jié)果越準(zhǔn)確,可見對于本文的數(shù)據(jù)進行修復(fù)時,不必對前次預(yù)測的誤差作較大的調(diào)整。

        4) 移動平均法的N取值為6時,即考慮了1周內(nèi)的值對數(shù)據(jù)進行修補,故修復(fù)結(jié)果明顯優(yōu)于N=3或N=5的修復(fù)方法,并且優(yōu)于以月為周期的修復(fù)結(jié)果。

        5) 對已有數(shù)據(jù)進行回歸分析優(yōu)于直接取均值的修復(fù)方法,不論是對于時間序列還是基于空間相關(guān)性的修復(fù)方法。

        6) 對于最終的修復(fù)結(jié)果,所得平均絕對誤差和均方誤差較小的修復(fù)方法,其最大絕對誤差不一定小,需綜合考慮3項評價指標(biāo)。

        7) 綜合考慮3項評價指標(biāo)發(fā)現(xiàn)利用相鄰車道數(shù)據(jù)加權(quán)平均和α=0.1的指數(shù)平滑法最適用于本文所采用數(shù)據(jù)的缺失值修復(fù)。

        4 結(jié)束語

        筆者考慮到數(shù)據(jù)采集過程中產(chǎn)生的交通流數(shù)據(jù)缺失問題,采用了基于時間相關(guān)性、空間相關(guān)性和時空相關(guān)性的數(shù)據(jù)修復(fù)方法對缺失數(shù)據(jù)進行了修復(fù),并對于修復(fù)后的數(shù)據(jù),計算它們的平均絕對誤差、均方誤差和最大絕對誤差3項指標(biāo),根據(jù)這3項指標(biāo)對各種方法的修復(fù)結(jié)果進行了評價,最終發(fā)現(xiàn)利用相鄰車道數(shù)據(jù)加權(quán)平均和α=0.1的指數(shù)平滑法最適用于本文所采用數(shù)據(jù)的缺失值修復(fù)。本文后續(xù)的研究考慮采用缺失率較高的數(shù)據(jù)或者其他較為復(fù)雜的修復(fù)方法進行修復(fù),例如基于張量的數(shù)據(jù)修復(fù)方法。

        參考文獻

        References

        [1] 孫 玲,劉 浩,牛樹云.考慮時空相關(guān)性的固定檢測缺失數(shù)據(jù)重構(gòu)算法[J].交通運輸工程學(xué)報,2010(5):121-126.

        SUN Ling, LIU Hao, NIU Shuyun. Missing data reconstruction algorithm of fixed detection considering spatial-temporal correlation[J]. Journal of Traffic and Transportation Engineering,2010(5):121-126. (in Chinese)

        [2] 胡偉超,劉君叢,浩 哲,等.實時交通流數(shù)據(jù)缺失修復(fù)方法對比研究[C].第八屆中國智能交通年會,合肥:中國智能交通協(xié)會,2013.

        HU Weichao, LIU Juncong, HAO Zhe, et al. A comparative study of real-time traffic flow missing data repair methods[C]. The 8thChina Intelligent Transportation Annual Conference, Hefei, China: China Intelligent Transportation System Association, 2013. (in Chinese)

        [3] SMITH B, SCHERER W, CONKLIN J. Exploring imputation techniques for missing data in transportation management systems[J]. Transportation Research Record: Journal of the Transportation Research Board,2003(1836):132-142.

        [4] TANG Jinjun, ZHANG Guohui, WANG Yinhai, et al. A hybrid approach to integrate fuzzy C-means based imputation method with genetic algorithm for missing traffic volume data estimation[J]. Transportation Research Part C: Emerging Technologies,2015(51):29-40.

        [5] TAN Huachun, FENG Guangdong, Feng Jianshuai, et al. A tensor-based method for missing traffic data completion[J]. Transportation Research, Part C: Emerging Technologies,2013,28(3):15-27.

        [6] 袁 媛,邵春福,林秋映,等.基于RBF神經(jīng)網(wǎng)絡(luò)的交通流數(shù)據(jù)修復(fù)研究[J].交通運輸研究,2016,2(5):46-52.

        YUAN Yuan, SHAO Chunfu, LIN Qiuying, et al. Research on traffic flow data restoration based on RBF neural network[J]. Transport Research,2016,2(5):46-52. (in Chinese)

        [7] XIAO Xiao, CHEN Yusen, YUAN Yufei. Estimation of missing flow at junctions using control plan and floating car data[J]. Transportation Research Procedia,2015(10):113-123.

        [8] 郭 敏,藍(lán)金輝,李娟娟,等.基于灰色殘差GM(1,N)模型的交通流數(shù)據(jù)恢復(fù)算法[J].交通運輸系統(tǒng)工程與信息,2012(1):42-47.

        GUO Min, LAN Jinhui, LI Juanjuan, et al. Traffic flow data recovery algorithm based on Grey residual GM (1, N) model[J]. Journal of Transportation Systems Engineering and Information Technology,2012,12(1):42-47. (in Chinese)

        [9] 金 盛.環(huán)形線圈檢測器交通數(shù)據(jù)預(yù)處理方法研究[D].長春:吉林大學(xué),2007.

        JIN Sheng. Research on traffic data preprocessing method of loop coil detector[D]. Changchun: Jilin University,2007. (in Chinese)

        [10] 金逸文.城市快速路交通流數(shù)據(jù)修復(fù)方法研究[D].上海:上海交通大學(xué),2008.

        JIN Yiwen. Research on traffic flow data restoration in urban expressway[D]. Shanghai: Shanghai Jiaotong University,2008. (in Chinese)

        [11] LI L, LI Y, LI Z. Efficient missing data imputing for traffic flow by considering temporal and spatial dependence[J]. Transportation Research Part C: Emerging Technologies,2013(34):108-120.

        [12] 劉 璐.基于多元線性回歸模型的缺失浮動車數(shù)據(jù)填充研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2015.

        LIU Lu. Research on filling of missing floating vehicles data based on multiple linear regression model[D]. Harbin: Harbin Institute of Technology,2015. (in Chinese)

        [13] 王曉原,吳 芳,樸基男.基于粗集理論的交通流丟失數(shù)據(jù)補齊方法[J].交通運輸工程學(xué)報,2008(108):91-94.

        WANG Xiaoyuan, WU Fang, PIAO Jinan. Traffic flow missing data compensation method based on rough set theory[J]. Journal of Traffic and Transportation Engineering,2008(5):91-94,108. (in Chinese)

        [14] 陳 楊,劉光勇,唐海周,等.一種基于平衡指數(shù)平滑的交通流數(shù)據(jù)預(yù)測方法[J].現(xiàn)代計算機(專業(yè)版),2014(20):45-48.

        CHEN Yang, LIU Guangyong, TANG Haizhou, et al. A traffic flow data prediction method based on equilibrium exponential smoothing[J]. Modern Computer,2014(20):45-48. (in Chinese)

        [15] 袁 媛,邵春福,林秋映,等.交通流缺失數(shù)據(jù)的修補技術(shù)探究[J].中國公共安全(學(xué)術(shù)版),2016(4):70-76.

        YUAN Yuan, SHAO Chunfu, LIN Qiuyin, et al. Research on the repair technology of traffic flow missing data[J]. China Public Security(Academy Edition),2016(4):70-76. (in Chinese)

        [16] 孫 亞.ITS采集交通信息缺失數(shù)據(jù)修復(fù)策略及模型研究[J].黑龍江科技信息,2013(15):34-36.

        SUN Ya. Missing data repair strategy and model research of traffic information collected by ITS[J]. Heilongjiang Science and Technology Information,2013(15):34-36. (in Chinese)

        [17] 王 煒,陸 建.道路交通工程系統(tǒng)分析方法[M].2版.北京:人民交通出版社,2011.

        WANG Wei, LU Jian. Road traffic engineering system analysis method[M].2nded. Beijing: People′s Communications Press,2011. (in Chinese)

        [18] 徐健銳,李星毅,施化吉,等.處理缺失數(shù)據(jù)的短時交通流預(yù)測模型[J].計算機應(yīng)用,2010,30(4):1117-1120,1124.

        XU Jianrui, LI Xingyi, SHI Huaji, et al. Short time traffic flow prediction model for processing missing data[J]. Journal of Computer Applications,2010,30(4):1117-1120,1124. (in Chinese)

        [19] 王英會.高速公路交通流異常數(shù)據(jù)識別及修復(fù)方法研究[D].北京:北京交通大學(xué),2015.

        WANG Yinghui. Research on abnormal data identification and repair methods of highway traffic flow[D]. Beijing: Beijing Jiaotong University,2015. (in Chinese)

        [20] 徐鋮鋮.高速公路交通流運行狀態(tài)與交通安全關(guān)系研究[D].南京:東南大學(xué),2014.

        XU Chengcheng. Research on the relationship between traffic flow status and traffic safety of freeway traffic flow[D]. Nanjing: Southeast University, 2014. (in Chinese)

        猜你喜歡
        交通流檢測器車道
        北斗+手機實現(xiàn)車道級導(dǎo)航應(yīng)用
        避免跟車闖紅燈的地面車道線
        淺談MTC車道改造
        車道微波車輛檢測器的應(yīng)用
        交通流隨機行為的研究進展
        一種霧霾檢測器的研究與設(shè)計
        路內(nèi)停車對交通流延誤影響的定量分析
        低速ETC/MTC混合式收費車道的設(shè)計與實現(xiàn)
        具有負(fù)壓力的Aw-Rascle交通流的Riemann問題
        一體化火焰檢測器常見故障分析
        河南科技(2014年22期)2014-02-27 14:18:12
        麻豆精品国产免费av影片| 亚洲综合一区无码精品| 最新无码国产在线播放| 538在线视频| 91精品国产综合久久精品密臀| 日韩夜夜高潮夜夜爽无码| 国产成年女人特黄特色毛片免| 中文字幕无码专区一VA亚洲V专| 日韩精品不卡一区二区三区 | 老太脱裤子让老头玩xxxxx| 亚洲熟妇无码av不卡在线播放| 超清无码AV丝袜片在线观看| 在线观看免费不卡网站| 在办公室被c到呻吟的动态图 | 亚洲a无码综合a国产av中文| 久久久久女人精品毛片| 国产一区二区三区啪| 麻豆av在线免费观看精品| 亚洲av无码国产精品色| 熟妇的荡欲色综合亚洲| 手机看片国产日韩| 午夜一区二区三区免费观看| 天天躁日日躁狠狠躁av麻豆| 把插八插露脸对白内射| 国产中文久久精品| 久久精品国产熟女亚洲av麻豆| 中文字幕网伦射乱中文| 国产av日韩a∨亚洲av电影| 人妻丝袜中文字幕久久| 美女主播网红视频福利一区二区| 免费久久人人爽人人爽av| 91综合在线| 日本精品av中文字幕| 色哟哟最新在线观看入口| 久久婷婷国产剧情内射白浆| 国产精品亚洲av网站| 国产av一级黄一区二区三区| 日本人与黑人做爰视频网站| 色欲AV无码久久精品有码| 日本一区二区三级免费| 少妇性bbb搡bbb爽爽爽|