摘" 要: 隨著高速公路網(wǎng)絡(luò)的規(guī)模擴(kuò)展和智能交通系統(tǒng)的不斷完善,交通流預(yù)測在提高道路資源利用效率和緩解交通擁堵方面起著至關(guān)重要的作用?,F(xiàn)有的預(yù)測方法往往忽視了天氣特征動態(tài)變化對交通流的影響,故文中旨在運(yùn)用集成深度學(xué)習(xí)模型來探索天氣特征對高速公路交通流的影響。利用隨機(jī)森林算法從歷史交通流量和天氣數(shù)據(jù)中提取出相關(guān)性較高的天氣特征,采用粒子群優(yōu)化算法對長短期記憶神經(jīng)網(wǎng)絡(luò)模型的超參數(shù)進(jìn)行優(yōu)化,構(gòu)建一個融合天氣特征數(shù)據(jù)的深度學(xué)習(xí)預(yù)測框架,將經(jīng)過篩選的天氣特征序列輸入至預(yù)測框架模型中進(jìn)行訓(xùn)練和預(yù)測。通過真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)驗(yàn)證了所提方法的有效性和泛化能力。實(shí)驗(yàn)結(jié)果表明,所提的集成深度學(xué)習(xí)方法相比現(xiàn)有的深度學(xué)習(xí)方法具有更好的擬合度、預(yù)測精度和穩(wěn)定性,能夠更準(zhǔn)確地捕捉天氣特征動態(tài)變化對交通流的影響。
關(guān)鍵詞: 智能交通系統(tǒng); 高速公路交通流預(yù)測; 天氣特征; 集成深度學(xué)習(xí); 隨機(jī)森林算法; 粒子群優(yōu)化算法; 長短期記憶神經(jīng)網(wǎng)絡(luò); 超參數(shù)優(yōu)化
中圖分類號: TN929.5?34; U491.1+4" " " " " " " 文獻(xiàn)標(biāo)識碼: A" " " " " " " " " " "文章編號: 1004?373X(2025)08?0164?09
Research on highway traffic flow prediction based on weather characteristics
YUAN Hui1, XIE Qing1, JI Mingjun2, WU Weichang1, ZENG Bin1, JI Shengzhong2
(1. China Railway Southern Investment Group Co., Ltd., Shenzhen 529566, China;
2. College of Transportation Engineering, Dalian Maritime University, Dalian 116026, China)
Abstract: With the scale expansion of highway networks and the continuous improvement of intelligent transportation systems, traffic flow prediction plays a crucial role in enhancing road resource utilization and alleviating traffic congestion. Existing prediction methods often overlook the impact of dynamic weather feature changes on traffic flow. The integrated deep learning model is used to explore the influence of weather features on highway traffic flow. The random forest algorithm is used to extract highly correlated weather features from historical traffic flow and weather data. The particle swarm optimization algorithm is used to optimize the hyperparameters of long short?term memory (LSTM) neural networks. A deep learning prediction framework fusing weather feature data is constructed, and the screened weather feature sequences are input into the prediction framework model for training and prediction. The experiments on real datasets verify the effectiveness and generalization ability of the proposed method. The experimental results show that the proposed integrated deep learning method can exhibit better fitting accuracy, prediction precision, and stability compared to existing deep learning methods. It can more accurately capture the impact of dynamic weather feature changes on traffic flow.
Keywords: intelligent transportation system; highway traffic flow prediction; weather feature; integrated deep learning; random forest algorithm; particle swarm optimization algorithm; LSTM neural network; hyper?parameter optimization
0" 引" 言
隨著交通系統(tǒng)的不斷發(fā)展和城市化進(jìn)程的迅猛加速,高速公路作為重要的交通基礎(chǔ)設(shè)施之一,承擔(dān)著日益增長的交通流量和運(yùn)輸需求。然而,高速公路交通流的穩(wěn)定性和安全性受到多種因素的影響,其中天氣因素作為外部環(huán)境因素之一,對交通流的行為和交通系統(tǒng)的運(yùn)行產(chǎn)生了顯著影響。特別是在惡劣天氣條件下,如能見度降低、降水天氣、強(qiáng)風(fēng)等,交通流的運(yùn)行狀態(tài)可能會受到較大影響,導(dǎo)致交通事故頻發(fā)和交通擁堵現(xiàn)象加劇。因此,深入研究天氣特征對高速公路交通流的影響,對于提高交通系統(tǒng)的安全性、高效性具有重要意義,并且提前預(yù)測交通狀態(tài)是交通管理系統(tǒng)與規(guī)劃的科學(xué)依據(jù)[1]。交通流預(yù)測領(lǐng)域研究方法的發(fā)展經(jīng)過了時間序列模型、濾波類模型以及二者的結(jié)合[2?4],傳統(tǒng)機(jī)器學(xué)習(xí)模型[5?7]到深度學(xué)習(xí)模型[8?9]三代歷程,呈現(xiàn)出由淺入深,從線性到非線性,建模復(fù)雜性增加的趨勢[10]。在天氣特征變化對交通流的影響及預(yù)測的研究中,早期的研究主要關(guān)注單一天氣因素對交通流的影響,文獻(xiàn)[11]研究了冬季暴風(fēng)雪等惡劣天氣對交通需求、交通安全和交通流之間的影響;文獻(xiàn)[12]研究了寒冷天氣和降雪對每日和每小時交通流量變化的影響。這些研究為理解天氣因素對交通流的影響提供了幫助。
隨著研究的深入,越來越多的學(xué)者開始關(guān)注多種天氣因素綜合影響下的交通流預(yù)測問題。一些研究者嘗試將天氣因素與交通流量數(shù)據(jù)相結(jié)合,建立了一些綜合考慮多種天氣特征的交通流預(yù)測模型。文獻(xiàn)[13]研究了多天氣特征的高速公路交通流預(yù)測模型;文獻(xiàn)[14]研究了考慮天氣影響的高速公路交織區(qū)交通運(yùn)行狀態(tài)識別;文獻(xiàn)[15]研究了雨、雪、霧等高原山區(qū)常見惡劣天氣對高速公路交通流特征的影響。然而,這些模型往往忽視了天氣特征之間的復(fù)雜關(guān)系,導(dǎo)致模型預(yù)測精度不高。
近年來,一些研究開始嘗試引入機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù),以提高交通流預(yù)測模型的精度和泛化能力。長短期記憶(Long Short?Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)作為一種適用于時序數(shù)據(jù)建模的深度學(xué)習(xí)模型,受到了廣泛關(guān)注[16]。文獻(xiàn)[17]基于VMD?ISSA?LSTM對短時交通流進(jìn)行預(yù)測。文獻(xiàn)[18]通過粒子群優(yōu)化(Particle Swarm Optimization, PSO)算法和LSTM深度學(xué)習(xí)預(yù)測模型來對高速公路短時交通流進(jìn)行精準(zhǔn)預(yù)測,以提高預(yù)測準(zhǔn)確性。文獻(xiàn)[19]設(shè)計一種基于ConvLSTM網(wǎng)絡(luò)且融合時空關(guān)聯(lián)性和外部因素的交通流預(yù)測模型,以提高高速公路關(guān)鍵節(jié)點(diǎn)交通流預(yù)測的準(zhǔn)確性。文獻(xiàn)[20]采用了一種AE自編碼器與深度長短期記憶網(wǎng)絡(luò)相結(jié)合的組合模型,并引入改進(jìn)的自適應(yīng)矩估計算法對交通流進(jìn)行預(yù)測。然而,現(xiàn)有研究大多忽視了天氣因素對模型的影響,缺乏對天氣特征的全面考慮。
本文旨在基于集成深度學(xué)習(xí)混合算法,研究動態(tài)天氣特征對高速公路交通流的影響。首先,使用隨機(jī)森林(Random Forest, RF)算法對天氣特征進(jìn)行篩選,選擇影響交通流的主要天氣特征因素,刪除冗余特征。隨后,利用PSO對LSTM神經(jīng)網(wǎng)絡(luò)模型的超參數(shù)進(jìn)行優(yōu)化,以提高模型的預(yù)測精度和泛化能力。采用PSO?LSTM(Particle Swarm Optimization ? Long Short?Term Memory)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行交通流預(yù)測,結(jié)合選取的天氣特征,以實(shí)現(xiàn)對不同天氣條件下交通流量和交通擁堵情況的準(zhǔn)確預(yù)測。本研究通過RF?PSO?LSTM(Random Forest ? Particle Swarm Optimization ? Long Short?Term Memory)集成深度學(xué)習(xí)方法,填補(bǔ)現(xiàn)有研究的空白,為高速公路交通管理和規(guī)劃提供新的思路和方法,交通管理部門根據(jù)不同天氣條件下的交通流狀況,提前采取相應(yīng)的交通管理措施,以提高道路交通的安全性和流暢性。
1" 基本原理及方法
1.1" RF算法
本文針對天氣因素影響下的高速公路交通流進(jìn)行預(yù)測研究。神經(jīng)網(wǎng)絡(luò)輸入天氣特征中可能包含大量冗余特征或者無關(guān)特征,會增加LSTM神經(jīng)網(wǎng)絡(luò)模型對特征相關(guān)性的處理難度,并可能引入額外的噪聲和干擾,影響模型的性能,造成模型無法訓(xùn)練或者泛化能力下降。RF算法通過基于樹的特征重要性評估方法評估每個天氣特征對于模型的重要性,可以直觀地了解每個天氣特征對于模型預(yù)測的貢獻(xiàn)程度,從而更好地進(jìn)行特征選擇和解釋。RF算法在構(gòu)建多棵決策樹并進(jìn)行集成時,具有抗過擬合能力,通過對多個模型進(jìn)行集成,該算法可以減少單個模型的過擬合風(fēng)險,提高模型的泛化能力。
在RF算法的基礎(chǔ)上,利用平均不純度減少的思想對所有特征進(jìn)行關(guān)聯(lián)性分析。通過計算RF算法構(gòu)建過程中各個特征的平均不純度下降值來對特征的重要程度進(jìn)行排序,重要特征引起的不純度下降得高。
RF算法決策樹生成步驟如下。
式中[Ix]為指示函數(shù)。
1.2" PSO?LSTM優(yōu)化算法
LSTM神經(jīng)網(wǎng)絡(luò)模型是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種變體,循環(huán)神經(jīng)網(wǎng)絡(luò)隱藏層中運(yùn)用LSTM單元進(jìn)行替換。其中LSTM存在記憶細(xì)胞,借助記憶細(xì)胞的數(shù)據(jù)信息能夠高效地獲取長距離依賴信息,可以避免存在的梯度消失問題,但是其訓(xùn)練過程中仍然存在最優(yōu)超參數(shù)如何選擇的問題。
LSTM神經(jīng)網(wǎng)絡(luò)模型中包括眾多超參數(shù),隱藏層神經(jīng)元的數(shù)量和學(xué)習(xí)率對模型的性能和能力至關(guān)重要。隱藏層神經(jīng)元的數(shù)量直接影響了模型的表征能力和信息處理能力。選擇合適數(shù)量的隱藏層神經(jīng)元是防止過擬合和欠擬合的關(guān)鍵。初始學(xué)習(xí)率決定了模型在訓(xùn)練過程中參數(shù)更新的速度。合適的初始學(xué)習(xí)率可以加速模型的收斂,使其在更短的時間內(nèi)達(dá)到最優(yōu)解。因此,選擇合適的隱藏層神經(jīng)元個數(shù)和初始學(xué)習(xí)率是優(yōu)化 LSTM神經(jīng)網(wǎng)絡(luò)性能的關(guān)鍵因素。
通過PSO智能優(yōu)化算法搜尋不同的參數(shù)組合,并根據(jù)驗(yàn)證集的性能選擇最佳的參數(shù)設(shè)置,提高模型的性能和泛化能力。PSO?LSTM神經(jīng)網(wǎng)絡(luò)模型的思想主要是利用PSO優(yōu)化算法對LSTM神經(jīng)網(wǎng)絡(luò)模型的隱藏層神經(jīng)元個數(shù)與初始學(xué)習(xí)率等超參數(shù)進(jìn)行優(yōu)化,以提高高速公路交通流的預(yù)測性能。PSO?LSTM神經(jīng)網(wǎng)絡(luò)模型具體運(yùn)行步驟如下。
1) 建立LSTM模型,確定所述LSTM模型中需要通過PSO優(yōu)化的超參數(shù),包括隱藏層神經(jīng)元個數(shù)和初始學(xué)習(xí)率。
2) 對超參數(shù)進(jìn)行編碼,即將兩個超參數(shù)劃定為兩個種群,并設(shè)定兩個超參數(shù)的取值范圍。
3) 將均方歸一化誤差函數(shù)設(shè)定為PSO算法的適應(yīng)度函數(shù),適應(yīng)度函數(shù)公式如下:
式中:MSE表示均方歸一化誤差;[n]表示訓(xùn)練集數(shù)據(jù)數(shù)量;[Yi]表示實(shí)際高速公路交通流;[Yi]表示預(yù)測高速公路交通流。
4) 設(shè)置PSO算法中的參數(shù),初始化種群中粒子個體的位置和速度,進(jìn)行粒子的迭代尋優(yōu)。
式中:[vki]表示第[i]個粒子在第[k]次迭代中的速度;[ω]是慣性權(quán)重;[c1]、[c2]代表學(xué)習(xí)因子;[pbestki]與[gbestki]分別表示第[i]個粒子在第[k]次迭代中的個體最佳位置與全局最佳位置;[xki]表示第[i]個粒子在第[k]次迭代中的位置。
5) 達(dá)到最大迭代次數(shù)后,根據(jù)獲得的全局最優(yōu)極值點(diǎn)的位置信息,輸出最優(yōu)超參數(shù),并基于所述最優(yōu)超參數(shù)構(gòu)建用于高速公路交通流預(yù)測的LSTM模型。
1.3" RF?PSO?LSTM集成深度學(xué)習(xí)算法
基于上述RF算法、PSO算法和LSTM神經(jīng)網(wǎng)絡(luò)模型算法的原理,本文在研究天氣特征影響因素對高速公路交通流預(yù)測的影響時,充分發(fā)揮各種算法的優(yōu)勢,設(shè)計RF?PSO?LSTM集成深度學(xué)習(xí)算法,具體算法流程如圖1所示。
算法流程
1) 從不同來源獲取高速公路的歷史交通流量數(shù)據(jù)以及與之對應(yīng)的天氣特征數(shù)據(jù),如溫度、濕度、風(fēng)速等。
2) 對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、缺失值處理、特征選擇等。
3) 使用RF算法對數(shù)據(jù)進(jìn)行建模和訓(xùn)練,以捕捉交通流量數(shù)據(jù)中的復(fù)雜關(guān)系和模式。
4) 利用PSO優(yōu)化算法對LSTM模型的超參數(shù)進(jìn)行優(yōu)化,如隱藏層神經(jīng)元個數(shù)和初始學(xué)習(xí)率。
5) RF算法作為特征提取器,將提取的天氣特征輸入到LSTM神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練。
6) 使用交叉驗(yàn)證等方法對RF?PSO?LSTM集成深度學(xué)習(xí)進(jìn)行評估和優(yōu)化,通過比較模型的預(yù)測結(jié)果與實(shí)際觀測值之間的誤差,來評估模型的準(zhǔn)確性和效果。
7) 使用RF?PSO?LSTM集成深度學(xué)習(xí)對未來一段時間的高速公路交通流量進(jìn)行預(yù)測。
2" RF?PSO?LSTM集成深度學(xué)習(xí)模型
針對天氣因素影響下高速公路交通流預(yù)測研究,RF?PSO?LSTM集成深度學(xué)習(xí)模型主要包含以下步驟:數(shù)據(jù)處理與特征分析、RF算法特征選擇、RF?PSO?LSTM神經(jīng)網(wǎng)絡(luò)模型構(gòu)建等。
2.1" 數(shù)據(jù)預(yù)處理與特征分析
本文所用高速公路交通流數(shù)據(jù)來自IDataScience提供的兩個城市間東西向高速公路西行車流量,對應(yīng)的高速公路天氣數(shù)據(jù)來自rp5.ru。選取數(shù)據(jù)的時間周期為2017年10月1日到2017年12月31日,數(shù)據(jù)頻率為每6 h記錄一次,分別為0:00、6:00、12:00、18:00四個時間點(diǎn),共92天的368組數(shù)據(jù)。天氣數(shù)據(jù)包括溫度(t)、露點(diǎn)溫度(Td)、相對濕度(U)、積雪深度(SSS)、降水量(RRR)、能見度(VV)、云層高度范圍(h)、云量(N)、平均風(fēng)速(Ff)、風(fēng)向(DD)、總氣壓(p)和海平面氣壓(Po)共12個特征維度,可充分反映出天氣特征對于高速公路交通流的影響。在分析中發(fā)現(xiàn),不同時間點(diǎn)對交通流具有較大的影響,并呈現(xiàn)出特定的周期性。圖2顯示368組數(shù)據(jù)的交通流變化情況。
由于原始數(shù)據(jù)中統(tǒng)計時間數(shù)據(jù)頻率較大,趨勢圖中并不能完全代表每日的具體交通流量,但是可以完全反映出每日的交通流的變化趨勢,如0:00時交通流量最小,6:00時會迎來交通流高峰,12:00時交通流量居中,18:00時呈現(xiàn)明顯的下降趨勢,不同時間點(diǎn)的交通流量存在著明顯的差異。因此在對交通流缺省值通過線性插值方法進(jìn)行擬合時,同一日期的不同時刻對車流量影響較大,需要通過前后日期的同一時刻進(jìn)行擬合,避免同一日期內(nèi)不同時刻對交通流的影響,可以使數(shù)據(jù)的擬合效果更好,符合實(shí)際情形。數(shù)據(jù)預(yù)處理過程中,還包括對異常數(shù)據(jù)的處理,主要有錯誤數(shù)據(jù)剔除和高峰時段數(shù)據(jù)去噪處理等。
為了更清晰地研究各種天氣特征對于高速公路交通流的影響,對天氣的數(shù)據(jù)特征進(jìn)行可視化分析。圖3為連續(xù)時間段2017年10月1日到2017年12月31日368組12種天氣特征數(shù)據(jù)的取值結(jié)果。
從天氣特征取值變化圖中可以看出,12個維度的天氣特征數(shù)據(jù)之間存在不同的量綱,并且存在較大差異的分散程度,不具有可比性,因此需要對每個天氣特征序列的樣本進(jìn)行歸一化處理。選用min?max方法對樣本數(shù)據(jù)進(jìn)行線性變換,將樣本中的輸入數(shù)據(jù)與輸出數(shù)據(jù)均映射到0~1,消除量綱引起的誤差,提高模型的預(yù)測精度。
式中;[xi]為原始數(shù)據(jù)中的第[i]個數(shù)據(jù);[x'i]為歸一化后的新數(shù)據(jù);[xmin]為最小值;[xmax]為最大值。
2.2" RF算法特征選擇
為了增強(qiáng)模型的收斂速度,提高模型的泛化能力,并且防止出現(xiàn)過度擬合的情況,將天氣特征數(shù)據(jù)中12個維度的數(shù)據(jù)進(jìn)行分析,從中選出與高速公路交通流關(guān)聯(lián)度高的特征。RF算法通過引入隨機(jī)性可以減少過擬合的風(fēng)險。每棵決策樹都是基于部分訓(xùn)練數(shù)據(jù)和部分特征構(gòu)建的,這有助于避免模型對訓(xùn)練數(shù)據(jù)的過度擬合,從而提高模型在未知數(shù)據(jù)上的泛化能力。
本文通過RF回歸算法進(jìn)行建模。RF算法決策樹數(shù)量設(shè)置為200,最小葉子數(shù)為1,根據(jù)重要性計算12個天氣輸入特征的平均不純度減少值,計算過程中誤差曲線如圖4所示。RF算法訓(xùn)練過程中,誤差曲線值急劇下降到0.115,隨著決策數(shù)數(shù)目的增加,誤差曲線趨于穩(wěn)定,當(dāng)決策樹數(shù)目達(dá)到100時,誤差曲線波動減少,趨于直線,訓(xùn)練過程穩(wěn)定,達(dá)到了很好的訓(xùn)練效果。RF算法中,特征的重要性通常通過計算平均不純度減少值來衡量,平均不純度減少值表示每個特征對于減少節(jié)點(diǎn)不純度的貢獻(xiàn)程度,平均不純度減少值越大,特征的重要性越高,特征在拆分節(jié)點(diǎn)時對于減少節(jié)點(diǎn)的不純度具有更大的影響。各天氣特征平均不純度減少值計算結(jié)果如表1所示。當(dāng)輸入特征過多時,模型需要處理的參數(shù)數(shù)量會大大增加,導(dǎo)致維度增加,造成模型無法訓(xùn)練或者泛化能力下降。輸入特征過少可能無法充分表達(dá)數(shù)據(jù)集的復(fù)雜性和信息,導(dǎo)致無法捕捉數(shù)據(jù)中的重要模式和特征,因此模型無法準(zhǔn)確地建模數(shù)據(jù)集。
根據(jù)表1的天氣特征平均不純度減少值計算結(jié)果,經(jīng)實(shí)驗(yàn)后,選擇平均不純度減少值較大的6個天氣特征作為輸入特征進(jìn)行學(xué)習(xí),分別是相對濕度、云層高度范圍、云量、溫度、露點(diǎn)溫度、降水量;而平均風(fēng)速、積雪深度、風(fēng)向等天氣特征的平均不純度減少值為負(fù)值,表示該特征對于節(jié)點(diǎn)不純度的減少貢獻(xiàn)為負(fù),在拆分節(jié)點(diǎn)時反而增加了節(jié)點(diǎn)的不純度。
因此,將選擇的6個關(guān)聯(lián)度高的天氣特征作為神經(jīng)網(wǎng)絡(luò)的輸入特征數(shù)據(jù)。
2.3" RF?PSO?LSTM集成深度學(xué)習(xí)模型構(gòu)建
通過RF算法對數(shù)據(jù)集中與高速公路交通流相關(guān)性較大的天氣特征進(jìn)行篩選,通過重要性排序,選擇平均不純度減少值較大的6個天氣特征,篩選后重新整理數(shù)據(jù),t時刻的數(shù)據(jù)表示為[xt1,xt2,xt3,xt4,xt5,xt6,y],依次代表內(nèi)容為相對濕度(U)、云量(N)、降水量(RRR)、云層高度范圍(h)、總氣壓(p)、能見度(VV)與交通流。按照7∶3的比例將數(shù)據(jù)集劃分為訓(xùn)練集數(shù)據(jù)與測試集數(shù)據(jù),訓(xùn)練集數(shù)據(jù)用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,模型學(xué)習(xí)了輸入序列與輸出序列之間的關(guān)系,從而調(diào)整網(wǎng)絡(luò)參數(shù)使損失函數(shù)最小化;測試集數(shù)據(jù)用于評估訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型在未見過的數(shù)據(jù)上的性能表現(xiàn),可以檢驗(yàn)?zāi)P偷姆夯芰皖A(yù)測準(zhǔn)確性,以驗(yàn)證模型是否能夠在實(shí)際應(yīng)用中有效地預(yù)測未知數(shù)據(jù)。
對數(shù)據(jù)集進(jìn)行劃分和處理之后,需要再對LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)設(shè)置,合理的參數(shù)設(shè)置可以提高模型的訓(xùn)練速度、泛化能力和預(yù)測準(zhǔn)確性,從而更好地適應(yīng)不同的數(shù)據(jù)集和預(yù)測任務(wù)。
LSTM神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置如表2所示。
LSTM神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置中:輸入層層數(shù)為輸入天氣特征維度數(shù)(6個);梯度下降算法設(shè)置為Adam;最大訓(xùn)練次數(shù)為1 000次;學(xué)習(xí)率下降因子為0.1,經(jīng)過800次訓(xùn)練后學(xué)習(xí)率下降;隱藏層神經(jīng)元個數(shù)的取值范圍為[100,1 500];學(xué)習(xí)率的取值范圍為[0.10,0.50]。接著對PSO算法參數(shù)進(jìn)行設(shè)置,PSO算法參數(shù)設(shè)置如表3所示。
通過PSO算法對LSTM神經(jīng)網(wǎng)絡(luò)中的隱藏層神經(jīng)元個數(shù)與學(xué)習(xí)率兩個超參數(shù)進(jìn)行優(yōu)化,采用均方歸一化誤差性能函數(shù)作為適應(yīng)度函數(shù)。PSO算法的參數(shù)設(shè)置分別為:初始化種群個數(shù)為100;種群維度為2;最大迭代次數(shù)為50;學(xué)習(xí)因子1與學(xué)習(xí)因子2均為2;慣性權(quán)重最小值為0.6;慣性權(quán)重最大值為1.4。
經(jīng)過PSO算法進(jìn)行優(yōu)化后,輸出的最優(yōu)參數(shù)組合如表4所示。其中,隱藏層神經(jīng)元個數(shù)為990個,學(xué)習(xí)率為0.372 8。將參數(shù)輸入LSTM神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建RF?PSO?LSTM集成深度學(xué)習(xí)模型,對集成深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,并對訓(xùn)練結(jié)果進(jìn)行評價分析。
3" 高速公路交通流預(yù)測分析
將提取后相關(guān)性較高的天氣特征數(shù)據(jù)作為輸入數(shù)據(jù),輸入至RF?PSO?LSTM集成深度學(xué)習(xí)模型中,同時對模型進(jìn)行訓(xùn)練;高速公路交通流數(shù)據(jù)作為輸出數(shù)據(jù),對輸出結(jié)果進(jìn)行評價分析。圖5是RF?PSO?LSTM集成深度學(xué)習(xí)模型訓(xùn)練集數(shù)據(jù)輸出結(jié)果和測試集數(shù)據(jù)輸出結(jié)果與真實(shí)值的對比圖。
交通流預(yù)測結(jié)果對比
通過圖5可以明顯看出,本文提出的RF?PSO?LSTM集成深度學(xué)習(xí)模型可以很好地通過天氣特征對高速公路交通流進(jìn)行預(yù)測,訓(xùn)練出的模型達(dá)到了較高的擬合效果,無論是訓(xùn)練集數(shù)據(jù)還是測試集數(shù)據(jù),預(yù)測值與真實(shí)值之間的誤差較小。由于本文研究的不是短期的交通流預(yù)測,并且數(shù)據(jù)量龐大,預(yù)測值和真實(shí)值之間存在誤差是無法避免的,達(dá)不到預(yù)測完全準(zhǔn)確的效率。
接著通過3個評價指標(biāo)對輸出結(jié)果進(jìn)行評價,分別是R2、平均絕對誤差(Mean Absolute Error, MAE)和均方根誤差(Root Mean Squared Error, RMSE)。3個評價指標(biāo)計算公式如下:
式中:[n]表示訓(xùn)練集數(shù)據(jù)數(shù)量或測試集數(shù)據(jù)數(shù)量;[Yi]表示真實(shí)高速公路交通流;[Yi]表示預(yù)測高速公路交通流;[Yi]表示真實(shí)高速公路交通流平均值。
為驗(yàn)證模型的高效性和有效性,本文采用了RF、CNN、PSO?SVM與RF?PSO?LSTM四種深度學(xué)習(xí)模型對同一數(shù)據(jù)集進(jìn)行訓(xùn)練學(xué)習(xí),并對結(jié)果進(jìn)行對比分析評價。RF、CNN、PSO?SVM三種深度學(xué)習(xí)模型的測試集數(shù)據(jù)預(yù)測結(jié)果如圖6所示。
數(shù)據(jù)交通流預(yù)測結(jié)果
不同指標(biāo)間的評價數(shù)據(jù)如表5所示。
由表5可知,多次實(shí)驗(yàn)之后,針對動態(tài)天氣特征下的高速公路交通流預(yù)測,本文提出的RF?PSO?LSTM集成深度學(xué)習(xí)模型對高速公路交通流預(yù)測的擬合程度達(dá)到了較高水平,訓(xùn)練集與測試集的[R2]分別達(dá)到了0.95與0.94,均優(yōu)于單一模型RF和CNN以及集成模型PSO?SVM的擬合程度。
上述結(jié)果表明RF?PSO?LSTM模型能夠更好地擬合訓(xùn)練數(shù)據(jù),捕捉數(shù)據(jù)中的復(fù)雜關(guān)系。
此外,RF?PSO?LSTM集成深度學(xué)習(xí)模型在預(yù)測的平均絕對誤差(MAE)方面表現(xiàn)最佳,模型的預(yù)測精度明顯優(yōu)于其他模型。然而,略顯不足的是RF?PSO?LSTM集成深度學(xué)習(xí)模型在均方根誤差(RMSE)方面效果不佳,不及其他模型,盡管與其他模型值接近。原因是RF?PSO?LSTM模型可能在處理異常值或者數(shù)據(jù)噪聲方面存在不足,導(dǎo)致預(yù)測的均方根誤差略高。
綜上所述,RF?PSO?LSTM集成深度學(xué)習(xí)模型在動態(tài)天氣特征下高速公路交通流的預(yù)測中展現(xiàn)出了較高的擬合程度、預(yù)測精度和穩(wěn)定性。
本節(jié)中,具體分析了天氣特征融合RF?PSO?LSTM集成深度學(xué)習(xí)模型在高速公路交通流預(yù)測中的應(yīng)用,同時,也對動態(tài)天氣特征預(yù)測結(jié)果進(jìn)行了評價分析。評價結(jié)果表明,本文模型在動態(tài)天氣特征下的交通流預(yù)測中表現(xiàn)出了較高的擬合程度、預(yù)測精度和穩(wěn)定性,為智能交通系統(tǒng)的發(fā)展提供了有益的參考和支持。
4" 結(jié)" 語
本文研究了天氣特征在高速公路交通流預(yù)測中的關(guān)鍵作用,并提出了一種RF?PSO?LSTM集成深度學(xué)習(xí)模型,以提高預(yù)測的準(zhǔn)確性和穩(wěn)定性。本文主要有以下幾個關(guān)鍵發(fā)現(xiàn):首先,本文結(jié)果表明天氣條件對高速公路交通流的顯著影響。通過將天氣特征納入預(yù)測模型,觀察到預(yù)測準(zhǔn)確性和魯棒性得到了顯著提高,突顯了在交通流預(yù)測中考慮天氣特征的重要性。
其次,本研究提出的RF?PSO?LSTM模型在解決交通流預(yù)測復(fù)雜性方面表現(xiàn)出色。通過將RF算法用于優(yōu)化特征提取、PSO優(yōu)化算法用于參數(shù)優(yōu)化,以及LSTM神經(jīng)網(wǎng)絡(luò)用于時間序列建模,提出的RF?PSO?LSTM集成深度學(xué)習(xí)方法相較于現(xiàn)有方法在動態(tài)天氣特征下高速公路交通流的預(yù)測中具有更優(yōu)異的性能,突顯了利用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)改進(jìn)交通流模型預(yù)測能力的價值。
此外,本文通過提供更準(zhǔn)確、更可靠的交通流預(yù)測工具,可以幫助交通管理部門和交通管理機(jī)構(gòu)制定更好的決策,優(yōu)化資源分配,促進(jìn)交通系統(tǒng)的可持續(xù)發(fā)展。
未來的研究工作集中于完善RF?PSO?LSTM集成深度學(xué)習(xí)方法,并探索可能影響交通流的其他動態(tài)因素,使高速公路交通流預(yù)測研究更加系統(tǒng)。
注:本文通訊作者為計明軍。
參考文獻(xiàn)
[1] WANG Y B, YU X H, ZHANG S Y, et al. Freeway traffic control in presence of capacity drop [J]. IEEE transactions on intelligent transportation systems, 2021, 22(3): 1497?1516.
[2] 史其信,鄭為中.道路網(wǎng)短期交通流預(yù)測方法比較[J].交通運(yùn)輸工程學(xué)報,2004(4):68?71.
[3] 陳孟,干可,李凱,等.基于實(shí)時多模態(tài)時空數(shù)據(jù)的時空圖卷積網(wǎng)絡(luò)精準(zhǔn)魯棒交通流預(yù)測模型[J].公路交通科技,2021,38(8):134?139.
[4] 白偉華,張傳斌,張塽旖,等.基于異常值識別卡爾曼濾波器的短期交通流預(yù)測[J].計算機(jī)應(yīng)用研究,2021,38(3):817?821.
[5] LUO X L, LI D Y, ZHANG S R. Traffic flow prediction during the holidays based on DFT and SVR [J]. Journal of sensors, 2019(10): 1?10.
[6] 王翔,陳小鴻,楊祥妹.基于K最近鄰算法的高速公路短時行程時間預(yù)測[J].中國公路學(xué)報,2015,28(1):102?111.
[7] 馮鳳江,楊增刊.基于圖卷積和注意力機(jī)制的高速公路交通流預(yù)測[J].公路交通科技,2023,40(9):215?223.
[8] LIU Q C, LIU T, CAI Y F, et al. Explanatory prediction of traffic congestion propagation mode: a self?attention based approach [J]. Physica a: statistical mechanics and its applications, 2021, 573(1): 1?17.
[9] 陳喜群,周凌霄,曹震.基于圖卷積網(wǎng)絡(luò)的路網(wǎng)短時交通流預(yù)測研究[J].交通運(yùn)輸系統(tǒng)工程與信息,2020,20(4):49?55.
[10] 崔建勛,要甲,趙泊媛.基于深度學(xué)習(xí)的短期交通流預(yù)測研究方法綜述[J].交通運(yùn)輸工程學(xué)報,2024,24(2):50?64.
[11] MAZE T H, AGARWAL M, BURCHETT G. Whether weather matters to traffic demand, traffic safety, and traffic operations and flow [J]. Management and delivery of maintenance and operations services, 2006(1948): 170?176.
[12] DATLA S, SHARMA S. Impact of cold and snow on temporal and spatial variations of highway traffic volumes [J]. Journal of transport geography, 2008, 16(5): 358?372.
[13] 李桃迎,王婷,張羽琪.考慮多特征的高速公路交通流預(yù)測模型[J].交通運(yùn)輸系統(tǒng)工程與信息,2021,21(3):101?111.
[14] 李巖,陳姜會,曾明哲,等.考慮天氣影響的高速公路交織區(qū)交通運(yùn)行狀態(tài)識別[J].交通運(yùn)輸系統(tǒng)工程與信息,2023,23(6):111?119.
[15] 戢曉峰,張琪,覃文文,等.惡劣天氣對高原山區(qū)高速公路交通流特征的影響分析[J].交通信息與安全,2020,38(4):10?16.
[16] 姚俊峰,何瑞,史童童,等.基于機(jī)器學(xué)習(xí)的交通流預(yù)測方法綜述[J].交通運(yùn)輸工程學(xué)報,2023,23(3):44?67.
[17] 龐學(xué)麗,宋坤,姚紅云,等.基于VMD?ISSA?LSTM的短時交通流預(yù)測研究[J].現(xiàn)代電子技術(shù),2024,47(8):31?36.
[18] 楊文玲,廣曉平.基于PSO?LSTM的高速公路短時交通流預(yù)測[J].綜合運(yùn)輸,2024,46(1):118?124.
[19] 吳劍云,于安雙.基于ConvLSTM的高速公路交通流預(yù)測仿真研究[J].實(shí)驗(yàn)室研究與探索,2022,41(12):132?137.
[20] 黃艷國,周陳聰,左可飛.基于RAdam優(yōu)化的DLSTM?AE交通流預(yù)測模型[J].公路交通科技,2023,40(1):185?191.
作者簡介:袁" 輝(1977—),男,湖南邵陽人,總經(jīng)理,研究方向?yàn)楣こ碳夹g(shù)。
計明軍(1973—),男,蒙古族,內(nèi)蒙古赤峰人,博士研究生,教授,研究方向?yàn)榻煌ㄟ\(yùn)輸與規(guī)劃。
收稿日期:2024?06?16" " " " " "修回日期:2024?07?31
基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(71971035)