鄧 捷,陸百川,劉權(quán)富,張 凱,馬慶祿
(重慶交通大學(xué)交通運輸學(xué)院,重慶 400074)
交通生成預(yù)測是通過預(yù)測算法,對城區(qū)社會經(jīng)濟特性、土地利用形態(tài)和居民個人及家庭屬性進行綜合分析,準(zhǔn)確預(yù)測出對象地區(qū)未來的交通生成量,是正確進行交通宏觀決策,制定交通發(fā)展戰(zhàn)略,編制交通規(guī)劃,以及制定道路可行性研究的重要前提。但是,由于影響交通生成量的因素較多,且各種因素之間的關(guān)系復(fù)雜,需要建立一個能包含所有影響因素的高精度預(yù)測模型,以使未來交通生成量的預(yù)測達到理想效果,這對交通規(guī)劃具有重要的意義。
許多研究者進行了有關(guān)交通生成預(yù)測的研究,常見的有生成率模型、類別生成率模型、回歸分析模型和類別回歸分析模型等[1-4],這些模型從簡單到復(fù)雜,就其中具體利用何種方法建立模型,主要取決于對象區(qū)域的土地利用形態(tài)和社會經(jīng)濟特征,這些模型屬于利用區(qū)域某一整體屬性為依據(jù)的集計模型,因此該類模型缺少影響交通生成的行為基礎(chǔ)這一主要因素,導(dǎo)致預(yù)測結(jié)果與實際值相差較大,不能滿足實際應(yīng)用的需要。在其后的研究中為克服集計模型缺陷,研究者們建立了隨機效應(yīng)模型、混合仿真模型和BP神經(jīng)網(wǎng)絡(luò)模型等[5-7],這些是以離散數(shù)據(jù)為基礎(chǔ)的離散模型,不僅擁有集計模型分析的優(yōu)勢,還能有效分析交通管理政策對交通出行者的影響,成為當(dāng)前分析交通生成的主要模型。但是前面兩種離散模型對數(shù)學(xué)推導(dǎo)要求較高,導(dǎo)致建模過程復(fù)雜,不利于實際操作,而BP神經(jīng)網(wǎng)絡(luò)模型,在學(xué)習(xí)過程中存在多個最佳逼近點,預(yù)測過程慢,以及預(yù)測結(jié)果與實際情況相差大等缺陷,不適宜實際應(yīng)用[8]。隨著RBF神經(jīng)網(wǎng)絡(luò)技術(shù)的不斷成熟,充分利用RBF神經(jīng)網(wǎng)絡(luò)能無限逼近任何非線性映射關(guān)系,進行交通方面的研究已成為一種有效方法[9-10]。RBF神經(jīng)網(wǎng)絡(luò)具有成形的系統(tǒng)算法結(jié)構(gòu),不需要再利用數(shù)學(xué)公式推導(dǎo),同時它是利用輸入和輸出的數(shù)據(jù)學(xué)習(xí)有用的知識,適合對無規(guī)則和多約束問題的研究,也是一種前饋式網(wǎng)絡(luò)結(jié)構(gòu),適合多變量函數(shù)的逼近,具有唯一最佳逼近點,其獨有的容錯性和泛化能力能較好地進行預(yù)測。筆者以離散數(shù)據(jù)為基礎(chǔ),利用RBF神經(jīng)網(wǎng)絡(luò)進行研究,建立了基于RBF神經(jīng)網(wǎng)絡(luò)的交通生成預(yù)測模型。利用該模型進行交通生成預(yù)測,根據(jù)城區(qū)歷史交通生成量,對其交通生成量的形成規(guī)律進行判斷和學(xué)習(xí),從而對未來交通生成量作出準(zhǔn)確預(yù)測。
RBF神經(jīng)網(wǎng)絡(luò)是一種具有拓撲結(jié)構(gòu)的前饋式神經(jīng)網(wǎng)絡(luò),由3層結(jié)構(gòu)組成,包括輸入層、隱含層和輸出層。RBF神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)如圖1所示。
圖1 RBF神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)
輸入層的作用是把來自外部的數(shù)據(jù)映射到隱含層,輸入層與隱含層實現(xiàn)神經(jīng)網(wǎng)絡(luò)的非線性映射,不對數(shù)據(jù)進行任何處理。整個神經(jīng)網(wǎng)絡(luò)的中心處理層是隱含層,隱含層與輸出層實現(xiàn)神經(jīng)網(wǎng)絡(luò)的線性映射,由于隱含層里包含徑向?qū)ΨQ的徑向基函數(shù),隱含層提供給輸出層的數(shù)據(jù)在徑向基函數(shù)作用后才輸出。
最初隱含層的作用函數(shù)對輸入數(shù)據(jù)只在局部響應(yīng),當(dāng)輸入數(shù)據(jù)接近作用函數(shù)的中央范圍處時,隱含層就會產(chǎn)生較大的輸出。徑向基函數(shù)采用高斯函數(shù):
式中:x為輸入向量;rk為隱節(jié)點的中心;‖x-rk‖為向量x-rk的范數(shù);σk為第k個感知的變量,它決定該基函數(shù)圍繞中心的寬度。
由于高斯徑向基函數(shù)自身具有特殊的性質(zhì),使其能對輸入變量某一范圍具有選擇性的反應(yīng)能力,從而實現(xiàn)RBF神經(jīng)網(wǎng)絡(luò)的局部調(diào)諧能力。
選擇輸出層作用函數(shù)為求和函數(shù)時,輸出為:
式中:Wjk為網(wǎng)絡(luò)的輸出權(quán)值;N為感知單元的個數(shù)(隱含層節(jié)點數(shù));Tk為徑向基神經(jīng)元。
利用RBF神經(jīng)網(wǎng)絡(luò)進行預(yù)測時,需要對基函數(shù)的中心、方差和隱含層與輸出層間的權(quán)值進行學(xué)習(xí)。學(xué)習(xí)的方法很多,基于研究的需要,采用自組織選取中心法進行學(xué)習(xí)。
在分析交通量產(chǎn)生因素時,必須將宏觀的區(qū)域影響和微觀的個人及家庭影響同時考慮。如交通形成與土地利用之間的關(guān)系,交通小區(qū)內(nèi)住宅區(qū)是重要的交通發(fā)生源,大型工廠的存在、機關(guān)事業(yè)單位片區(qū)、各類型學(xué)校的擁有量和商業(yè)圈中心等都是交通量形成的主要原因。從宏觀和微觀分別進行分析,宏觀的區(qū)域影響主要指的是交通小區(qū)內(nèi)用地情況、小區(qū)在城市中的地理位置、工作人員擁有量、各種人口總數(shù)、學(xué)生數(shù)量、工作崗位等居民特征和居民收入等社會發(fā)展水平,這兩類影響因素變化量不會很大,但類型繁多。微觀的個人及家庭影響主要指的是年齡、性別、職業(yè)、職務(wù)、自由時間、家庭職責(zé)、駕照擁有量和家庭規(guī)模,家庭收入、家庭人口構(gòu)成和家庭交通工具擁有率等是交通量形成的基礎(chǔ),且這兩類影響因素變化量較大,類型也繁多。
影響交通生成的因素中,存在數(shù)值型和非數(shù)值型兩種類型的參數(shù),而最后結(jié)果需要的是總?cè)丝跀?shù)量,不是具體某個參考因素,因此模型輸入?yún)?shù)可以在同一參考因素具有多個特征值時進行相同的變換,且不會影響模型的預(yù)測結(jié)果。根據(jù)模型對輸入?yún)?shù)的需求,數(shù)值型參數(shù)可以直接用作模型的輸入?yún)?shù),如人口總數(shù)、學(xué)生數(shù)量、工作崗位、年齡等;非數(shù)值型參數(shù)需要進行量化處理,通過量化后再作為模型的輸入?yún)?shù)。為了便于數(shù)據(jù)處理,根據(jù)實際情況,將性別進行量化處理,用0代表男,1代表女。其他的非數(shù)值參數(shù)采取同樣的處理方式進行量化。
對選定預(yù)測區(qū)域內(nèi)交通生成量的影響因素數(shù)據(jù)進行分析和整理,將各種影響因素分類作為模型的輸入,并將輸入分成不同的大類,包括選定對象地區(qū)的人口、土地利用形式、各項經(jīng)濟指標(biāo)等,便于模型輸入進行參考。將預(yù)測區(qū)域交通生成量作為輸出,為簡化模型,對輸出進行歸類,輸出結(jié)果為各種目的出行次數(shù)的集合。通過上述分析,根據(jù)輸入?yún)?shù)和對應(yīng)的輸出,假設(shè)存在關(guān)系式為:
式中:xm,t為土地利用形態(tài)影響因子;ym,t為社會經(jīng)濟特性影響因子;zm,t為個人及家庭特性影響因子;T(k)為交通生成總量;m為大區(qū)數(shù)目。
式(3)中的S為RBF神經(jīng)網(wǎng)絡(luò)進行預(yù)測的切入點,通過RBF神經(jīng)網(wǎng)絡(luò)內(nèi)部求得S,就能預(yù)測求出未來交通生成量。因此,依靠原始模型樣本訓(xùn)練得到可靠關(guān)系式S是整個模型的重點所在。在樣本訓(xùn)練過程中,為保證預(yù)測精度,定義預(yù)測指標(biāo)函數(shù)為:
對于單目標(biāo)函數(shù)n=1,標(biāo)定的目標(biāo)是調(diào)整Wjk,使誤差 e最小,即:
則權(quán)因子的調(diào)節(jié)公式為:
交通生成預(yù)測的原始RBF神經(jīng)網(wǎng)絡(luò)模型如圖2所示。在進行原始RBF神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時,整個過程是通過神經(jīng)元實現(xiàn),因此,每個階段都有相對應(yīng)的神經(jīng)元去參與處理。輸入層的每種影響因素都存在一個神經(jīng)元與其相互對應(yīng),以編號1~52表示輸入層的神經(jīng)元,編號53~54表示輸出層的神經(jīng)元。隱含層也存在大量的神經(jīng)元,RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練時隱含層神經(jīng)元由模型系統(tǒng)根據(jù)訓(xùn)練目的自身確定,因此隱含層的神經(jīng)元不需要人為確定,而由模型自身確定其數(shù)量。前面將模型的輸出進行了合并,因此輸出層只存在兩個神經(jīng)元。
圖2 交通生成預(yù)測的原始RBF神經(jīng)網(wǎng)絡(luò)模型
在原始RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練成功的狀態(tài)下,將需要預(yù)測區(qū)域的影響因素作為輸入?yún)?shù),并輸入到訓(xùn)練好的原始RBF神經(jīng)網(wǎng)絡(luò)中,通過RBF神經(jīng)網(wǎng)絡(luò)的處理,實現(xiàn)對未來交通生成量的預(yù)測,得到區(qū)域未來交通生成量T(k+1)。整個模型預(yù)測過程如圖3所示。
(1)選擇與出行生成相關(guān)性較強的原始數(shù)據(jù),將其作為樣本訓(xùn)練數(shù)據(jù)和預(yù)測數(shù)據(jù);
(2)對數(shù)據(jù)進行歸一化處理,使其變換為RBF神經(jīng)網(wǎng)絡(luò)需要的輸入模式;
(3)構(gòu)建RBF神經(jīng)網(wǎng)絡(luò),并定義網(wǎng)絡(luò)的相關(guān)參數(shù);
(4)調(diào)整隱含層單元數(shù)和隱含層單元中心,用高斯函數(shù)計算隱含層權(quán)值,獲得隱含層輸出;
(5)通過隱含層與輸出層的函數(shù)關(guān)系得出輸出層的輸出;
(6)計算訓(xùn)練誤差;
(7)判斷訓(xùn)練誤差是否小于指定目標(biāo),是則轉(zhuǎn)到步驟(9),否則轉(zhuǎn)步驟(8);
(8)利用最小二乘法進行權(quán)值調(diào)整,修改輸出層權(quán)值,轉(zhuǎn)入步驟(6);
(9)全部樣本是否訓(xùn)練完成,是則進行下一步,否則返回步驟(4);
(10)利用神經(jīng)網(wǎng)絡(luò)對用于檢驗網(wǎng)絡(luò)性能的歸一化處理數(shù)據(jù)進行預(yù)測;
(11)對預(yù)測得到的數(shù)據(jù)進行反處理,獲得真實預(yù)測值,并計算誤差。
選擇重慶市江北區(qū)人口調(diào)查數(shù)據(jù)為模型仿真數(shù)據(jù),該調(diào)查數(shù)據(jù)包含了該區(qū)常住人口的一日出行情況,以及每個片區(qū)土地利用狀況和社會經(jīng)濟情況。為了仿真需要,根據(jù)實際情況,按交通小區(qū)把調(diào)查對象分為153個小區(qū),共包括13429戶家庭和46591個人的一日出行情況。其中調(diào)查內(nèi)容包括每個小區(qū)出行者家庭結(jié)構(gòu)、個體特性、出行目的、出行時間和出行方式,同時還調(diào)查出發(fā)地和目的地土地利用形態(tài)等特征。
圖3 基于RBF神經(jīng)網(wǎng)絡(luò)的交通生成預(yù)測過程
首先需要對原始調(diào)查數(shù)據(jù)進行預(yù)處理和分析,主要分兩個方面:①調(diào)查對象的屬性,主要有小區(qū)位置、人口總數(shù)、就業(yè)人數(shù)、學(xué)生人數(shù)、家庭結(jié)構(gòu)、家庭收入、家庭人口、交通工具和數(shù)量、性別、年齡、職業(yè)、家庭職責(zé)、收入等構(gòu)成的原始數(shù)據(jù)庫;②出行目的合并,根據(jù)調(diào)查得到的出行結(jié)果,結(jié)果合并為基本出行(上班、上學(xué))和非基本出行(購物、探親訪友、娛樂、旅游、就醫(yī)、文化娛樂等)。
相對誤差絕對值的平均值為:
相對誤差絕對值的最大值為:
均方根誤差為:
式中:Yp(t)為交通生成量的預(yù)測值;Yr(t)為交通生成量的實際值。
為使數(shù)據(jù)適合RBF神經(jīng)網(wǎng)絡(luò)特性,減小噪聲干擾,先對樣本數(shù)據(jù)進行歸一化處理,其公式為:
式中:Xmax、Xmin分別為各因子的最大值和最小值;X為因子值。
基于預(yù)測模型對數(shù)據(jù)的需要,將獲得的數(shù)據(jù)分為訓(xùn)練與測試兩個樣本集合。為提高預(yù)測精度,在數(shù)據(jù)劃分時增加訓(xùn)練樣本的數(shù)據(jù)容量,以便加強對模型訓(xùn)練檢驗,其中隨機選擇60%的數(shù)據(jù)為訓(xùn)練樣本,余下40%的數(shù)據(jù)為測試樣本。
現(xiàn)將隨機選取的92個小區(qū)作為訓(xùn)練樣本,剩下的61個小區(qū)作為測試樣本。經(jīng)過預(yù)測模型處理,將測試樣本數(shù)據(jù)與實際數(shù)據(jù)進行比較分析,仿真結(jié)果及誤差如圖4所示。
從圖4可以看出,基于RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測模型能成功地進行交通生成量的預(yù)測,除少部分?jǐn)?shù)據(jù)誤差較大外,其余誤差都很小。
為了與RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型進行對比,利用同樣以離散數(shù)據(jù)為基礎(chǔ)的BP神經(jīng)網(wǎng)絡(luò)進行交通生成預(yù)測。對相同的數(shù)據(jù)進行BP神經(jīng)網(wǎng)絡(luò)預(yù)測,其隱含層包含45個神經(jīng)元,預(yù)測精度為0.001。將BP神經(jīng)網(wǎng)絡(luò)預(yù)測與RBF神經(jīng)網(wǎng)絡(luò)預(yù)測進行對比,兩種神經(jīng)網(wǎng)絡(luò)的預(yù)測誤差指標(biāo)比較如表1所示。
圖4 RBF神經(jīng)網(wǎng)絡(luò)預(yù)測仿真結(jié)果及誤差
通過兩種預(yù)測模型預(yù)測誤差指標(biāo)對比可知,RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測精度比BP神經(jīng)網(wǎng)絡(luò)的要高,基本出行和非基本出行的實際值與預(yù)測值差異要小,能滿足交通生成預(yù)測的要求。
通過對仿真過程和仿真結(jié)果進行分析發(fā)現(xiàn),在利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測的過程中,由于BP神經(jīng)網(wǎng)絡(luò)不存在唯一最佳逼近點,導(dǎo)致需要進行多次預(yù)測才能得到最佳預(yù)測結(jié)果,預(yù)測過程繁瑣,最佳的預(yù)測結(jié)果精度較低,與實際值差距大,而筆者提出的RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,該交通生成預(yù)測方法比傳統(tǒng)的交通生成預(yù)測方法準(zhǔn)確性高,能有效地進行交通生成預(yù)測。
表1 兩種神經(jīng)網(wǎng)絡(luò)交通生成預(yù)測誤差指標(biāo)比較
通過模型仿真分析,采用RBF神經(jīng)網(wǎng)絡(luò)進行交通生成預(yù)測是可行的,算法實現(xiàn)簡單,充分結(jié)合了RBF神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、自組織、自適應(yīng)和大范圍數(shù)據(jù)融合的特性,進行交通生成預(yù)測,得到的結(jié)果比其他預(yù)測模型精度更高,可為交通規(guī)劃的制定提供更完善和更準(zhǔn)確的數(shù)據(jù)信息。
[1]劉小明,任福田.公路網(wǎng)規(guī)劃中交通預(yù)測的思想方法[J].中國公路學(xué)報,1994,7(3):54 -59.
[2]石飛,王煒,江薇,等.基于土地利用形態(tài)的交通生成預(yù)測理論方法研究[J].土木工程學(xué)報,2005,38(3):115-118.
[3]GEORGE R P.A demand theory for numbers of trips in a random utility model of recreation[J].Journal of Environmental Economics and Management,1992,2(9):357-367.
[4]易漢文.城市分析與交通預(yù)測[M].武漢:湖北科學(xué)技術(shù)出版社,1994:155-180.
[5]高為,陸百川,贠天鸝,等.基于時空特性和RBF神經(jīng)網(wǎng)絡(luò)短時交通流預(yù)測[J].交通信息與安全,2011,29(1):16 -24.
[6]陸化普,周錢.交通出行生成預(yù)測的神經(jīng)網(wǎng)絡(luò)模型[J].交通運輸工程與信息學(xué)報,2008,6(2):6 -11.
[7]劉洪麗.城市居民出行生成預(yù)測方法研究[D].南京:河海大學(xué)圖書館,2006.
[8]歐陽紅祥,李欣,張信娟.人工神經(jīng)網(wǎng)絡(luò)在建筑材料價格預(yù)測中的應(yīng)用[J].武漢理工大學(xué)學(xué)報:信息與管理工程版,2013,35(1):115 -118.
[9]張冬青,寧宣熙,劉雪妮.基于RBF神經(jīng)網(wǎng)絡(luò)的非線性時間序列在線預(yù)測[J].控制理論與應(yīng)用,2009,26(2):151-155.
[10]呂曉玲,謝邦昌.數(shù)據(jù)挖掘方法與應(yīng)用[M].北京:中國人民大學(xué)出版社,2009:144-149.