鄧 捷,陸百川,劉權(quán)富,張 凱,馬慶祿
(重慶交通大學(xué)交通運(yùn)輸學(xué)院,重慶 400074)
交通生成預(yù)測(cè)是通過(guò)預(yù)測(cè)算法,對(duì)城區(qū)社會(huì)經(jīng)濟(jì)特性、土地利用形態(tài)和居民個(gè)人及家庭屬性進(jìn)行綜合分析,準(zhǔn)確預(yù)測(cè)出對(duì)象地區(qū)未來(lái)的交通生成量,是正確進(jìn)行交通宏觀決策,制定交通發(fā)展戰(zhàn)略,編制交通規(guī)劃,以及制定道路可行性研究的重要前提。但是,由于影響交通生成量的因素較多,且各種因素之間的關(guān)系復(fù)雜,需要建立一個(gè)能包含所有影響因素的高精度預(yù)測(cè)模型,以使未來(lái)交通生成量的預(yù)測(cè)達(dá)到理想效果,這對(duì)交通規(guī)劃具有重要的意義。
許多研究者進(jìn)行了有關(guān)交通生成預(yù)測(cè)的研究,常見(jiàn)的有生成率模型、類(lèi)別生成率模型、回歸分析模型和類(lèi)別回歸分析模型等[1-4],這些模型從簡(jiǎn)單到復(fù)雜,就其中具體利用何種方法建立模型,主要取決于對(duì)象區(qū)域的土地利用形態(tài)和社會(huì)經(jīng)濟(jì)特征,這些模型屬于利用區(qū)域某一整體屬性為依據(jù)的集計(jì)模型,因此該類(lèi)模型缺少影響交通生成的行為基礎(chǔ)這一主要因素,導(dǎo)致預(yù)測(cè)結(jié)果與實(shí)際值相差較大,不能滿(mǎn)足實(shí)際應(yīng)用的需要。在其后的研究中為克服集計(jì)模型缺陷,研究者們建立了隨機(jī)效應(yīng)模型、混合仿真模型和BP神經(jīng)網(wǎng)絡(luò)模型等[5-7],這些是以離散數(shù)據(jù)為基礎(chǔ)的離散模型,不僅擁有集計(jì)模型分析的優(yōu)勢(shì),還能有效分析交通管理政策對(duì)交通出行者的影響,成為當(dāng)前分析交通生成的主要模型。但是前面兩種離散模型對(duì)數(shù)學(xué)推導(dǎo)要求較高,導(dǎo)致建模過(guò)程復(fù)雜,不利于實(shí)際操作,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)模型,在學(xué)習(xí)過(guò)程中存在多個(gè)最佳逼近點(diǎn),預(yù)測(cè)過(guò)程慢,以及預(yù)測(cè)結(jié)果與實(shí)際情況相差大等缺陷,不適宜實(shí)際應(yīng)用[8]。隨著RBF神經(jīng)網(wǎng)絡(luò)技術(shù)的不斷成熟,充分利用RBF神經(jīng)網(wǎng)絡(luò)能無(wú)限逼近任何非線(xiàn)性映射關(guān)系,進(jìn)行交通方面的研究已成為一種有效方法[9-10]。RBF神經(jīng)網(wǎng)絡(luò)具有成形的系統(tǒng)算法結(jié)構(gòu),不需要再利用數(shù)學(xué)公式推導(dǎo),同時(shí)它是利用輸入和輸出的數(shù)據(jù)學(xué)習(xí)有用的知識(shí),適合對(duì)無(wú)規(guī)則和多約束問(wèn)題的研究,也是一種前饋式網(wǎng)絡(luò)結(jié)構(gòu),適合多變量函數(shù)的逼近,具有唯一最佳逼近點(diǎn),其獨(dú)有的容錯(cuò)性和泛化能力能較好地進(jìn)行預(yù)測(cè)。筆者以離散數(shù)據(jù)為基礎(chǔ),利用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行研究,建立了基于RBF神經(jīng)網(wǎng)絡(luò)的交通生成預(yù)測(cè)模型。利用該模型進(jìn)行交通生成預(yù)測(cè),根據(jù)城區(qū)歷史交通生成量,對(duì)其交通生成量的形成規(guī)律進(jìn)行判斷和學(xué)習(xí),從而對(duì)未來(lái)交通生成量作出準(zhǔn)確預(yù)測(cè)。
RBF神經(jīng)網(wǎng)絡(luò)是一種具有拓?fù)浣Y(jié)構(gòu)的前饋式神經(jīng)網(wǎng)絡(luò),由3層結(jié)構(gòu)組成,包括輸入層、隱含層和輸出層。RBF神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 RBF神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
輸入層的作用是把來(lái)自外部的數(shù)據(jù)映射到隱含層,輸入層與隱含層實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的非線(xiàn)性映射,不對(duì)數(shù)據(jù)進(jìn)行任何處理。整個(gè)神經(jīng)網(wǎng)絡(luò)的中心處理層是隱含層,隱含層與輸出層實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的線(xiàn)性映射,由于隱含層里包含徑向?qū)ΨQ(chēng)的徑向基函數(shù),隱含層提供給輸出層的數(shù)據(jù)在徑向基函數(shù)作用后才輸出。
最初隱含層的作用函數(shù)對(duì)輸入數(shù)據(jù)只在局部響應(yīng),當(dāng)輸入數(shù)據(jù)接近作用函數(shù)的中央范圍處時(shí),隱含層就會(huì)產(chǎn)生較大的輸出。徑向基函數(shù)采用高斯函數(shù):
式中:x為輸入向量;rk為隱節(jié)點(diǎn)的中心;‖x-rk‖為向量x-rk的范數(shù);σk為第k個(gè)感知的變量,它決定該基函數(shù)圍繞中心的寬度。
由于高斯徑向基函數(shù)自身具有特殊的性質(zhì),使其能對(duì)輸入變量某一范圍具有選擇性的反應(yīng)能力,從而實(shí)現(xiàn)RBF神經(jīng)網(wǎng)絡(luò)的局部調(diào)諧能力。
選擇輸出層作用函數(shù)為求和函數(shù)時(shí),輸出為:
式中:Wjk為網(wǎng)絡(luò)的輸出權(quán)值;N為感知單元的個(gè)數(shù)(隱含層節(jié)點(diǎn)數(shù));Tk為徑向基神經(jīng)元。
利用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)時(shí),需要對(duì)基函數(shù)的中心、方差和隱含層與輸出層間的權(quán)值進(jìn)行學(xué)習(xí)。學(xué)習(xí)的方法很多,基于研究的需要,采用自組織選取中心法進(jìn)行學(xué)習(xí)。
在分析交通量產(chǎn)生因素時(shí),必須將宏觀的區(qū)域影響和微觀的個(gè)人及家庭影響同時(shí)考慮。如交通形成與土地利用之間的關(guān)系,交通小區(qū)內(nèi)住宅區(qū)是重要的交通發(fā)生源,大型工廠的存在、機(jī)關(guān)事業(yè)單位片區(qū)、各類(lèi)型學(xué)校的擁有量和商業(yè)圈中心等都是交通量形成的主要原因。從宏觀和微觀分別進(jìn)行分析,宏觀的區(qū)域影響主要指的是交通小區(qū)內(nèi)用地情況、小區(qū)在城市中的地理位置、工作人員擁有量、各種人口總數(shù)、學(xué)生數(shù)量、工作崗位等居民特征和居民收入等社會(huì)發(fā)展水平,這兩類(lèi)影響因素變化量不會(huì)很大,但類(lèi)型繁多。微觀的個(gè)人及家庭影響主要指的是年齡、性別、職業(yè)、職務(wù)、自由時(shí)間、家庭職責(zé)、駕照擁有量和家庭規(guī)模,家庭收入、家庭人口構(gòu)成和家庭交通工具擁有率等是交通量形成的基礎(chǔ),且這兩類(lèi)影響因素變化量較大,類(lèi)型也繁多。
影響交通生成的因素中,存在數(shù)值型和非數(shù)值型兩種類(lèi)型的參數(shù),而最后結(jié)果需要的是總?cè)丝跀?shù)量,不是具體某個(gè)參考因素,因此模型輸入?yún)?shù)可以在同一參考因素具有多個(gè)特征值時(shí)進(jìn)行相同的變換,且不會(huì)影響模型的預(yù)測(cè)結(jié)果。根據(jù)模型對(duì)輸入?yún)?shù)的需求,數(shù)值型參數(shù)可以直接用作模型的輸入?yún)?shù),如人口總數(shù)、學(xué)生數(shù)量、工作崗位、年齡等;非數(shù)值型參數(shù)需要進(jìn)行量化處理,通過(guò)量化后再作為模型的輸入?yún)?shù)。為了便于數(shù)據(jù)處理,根據(jù)實(shí)際情況,將性別進(jìn)行量化處理,用0代表男,1代表女。其他的非數(shù)值參數(shù)采取同樣的處理方式進(jìn)行量化。
對(duì)選定預(yù)測(cè)區(qū)域內(nèi)交通生成量的影響因素?cái)?shù)據(jù)進(jìn)行分析和整理,將各種影響因素分類(lèi)作為模型的輸入,并將輸入分成不同的大類(lèi),包括選定對(duì)象地區(qū)的人口、土地利用形式、各項(xiàng)經(jīng)濟(jì)指標(biāo)等,便于模型輸入進(jìn)行參考。將預(yù)測(cè)區(qū)域交通生成量作為輸出,為簡(jiǎn)化模型,對(duì)輸出進(jìn)行歸類(lèi),輸出結(jié)果為各種目的出行次數(shù)的集合。通過(guò)上述分析,根據(jù)輸入?yún)?shù)和對(duì)應(yīng)的輸出,假設(shè)存在關(guān)系式為:
式中:xm,t為土地利用形態(tài)影響因子;ym,t為社會(huì)經(jīng)濟(jì)特性影響因子;zm,t為個(gè)人及家庭特性影響因子;T(k)為交通生成總量;m為大區(qū)數(shù)目。
式(3)中的S為RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)的切入點(diǎn),通過(guò)RBF神經(jīng)網(wǎng)絡(luò)內(nèi)部求得S,就能預(yù)測(cè)求出未來(lái)交通生成量。因此,依靠原始模型樣本訓(xùn)練得到可靠關(guān)系式S是整個(gè)模型的重點(diǎn)所在。在樣本訓(xùn)練過(guò)程中,為保證預(yù)測(cè)精度,定義預(yù)測(cè)指標(biāo)函數(shù)為:
對(duì)于單目標(biāo)函數(shù)n=1,標(biāo)定的目標(biāo)是調(diào)整Wjk,使誤差 e最小,即:
則權(quán)因子的調(diào)節(jié)公式為:
交通生成預(yù)測(cè)的原始RBF神經(jīng)網(wǎng)絡(luò)模型如圖2所示。在進(jìn)行原始RBF神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時(shí),整個(gè)過(guò)程是通過(guò)神經(jīng)元實(shí)現(xiàn),因此,每個(gè)階段都有相對(duì)應(yīng)的神經(jīng)元去參與處理。輸入層的每種影響因素都存在一個(gè)神經(jīng)元與其相互對(duì)應(yīng),以編號(hào)1~52表示輸入層的神經(jīng)元,編號(hào)53~54表示輸出層的神經(jīng)元。隱含層也存在大量的神經(jīng)元,RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)隱含層神經(jīng)元由模型系統(tǒng)根據(jù)訓(xùn)練目的自身確定,因此隱含層的神經(jīng)元不需要人為確定,而由模型自身確定其數(shù)量。前面將模型的輸出進(jìn)行了合并,因此輸出層只存在兩個(gè)神經(jīng)元。
圖2 交通生成預(yù)測(cè)的原始RBF神經(jīng)網(wǎng)絡(luò)模型
在原始RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練成功的狀態(tài)下,將需要預(yù)測(cè)區(qū)域的影響因素作為輸入?yún)?shù),并輸入到訓(xùn)練好的原始RBF神經(jīng)網(wǎng)絡(luò)中,通過(guò)RBF神經(jīng)網(wǎng)絡(luò)的處理,實(shí)現(xiàn)對(duì)未來(lái)交通生成量的預(yù)測(cè),得到區(qū)域未來(lái)交通生成量T(k+1)。整個(gè)模型預(yù)測(cè)過(guò)程如圖3所示。
(1)選擇與出行生成相關(guān)性較強(qiáng)的原始數(shù)據(jù),將其作為樣本訓(xùn)練數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù);
(2)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,使其變換為RBF神經(jīng)網(wǎng)絡(luò)需要的輸入模式;
(3)構(gòu)建RBF神經(jīng)網(wǎng)絡(luò),并定義網(wǎng)絡(luò)的相關(guān)參數(shù);
(4)調(diào)整隱含層單元數(shù)和隱含層單元中心,用高斯函數(shù)計(jì)算隱含層權(quán)值,獲得隱含層輸出;
(5)通過(guò)隱含層與輸出層的函數(shù)關(guān)系得出輸出層的輸出;
(6)計(jì)算訓(xùn)練誤差;
(7)判斷訓(xùn)練誤差是否小于指定目標(biāo),是則轉(zhuǎn)到步驟(9),否則轉(zhuǎn)步驟(8);
(8)利用最小二乘法進(jìn)行權(quán)值調(diào)整,修改輸出層權(quán)值,轉(zhuǎn)入步驟(6);
(9)全部樣本是否訓(xùn)練完成,是則進(jìn)行下一步,否則返回步驟(4);
(10)利用神經(jīng)網(wǎng)絡(luò)對(duì)用于檢驗(yàn)網(wǎng)絡(luò)性能的歸一化處理數(shù)據(jù)進(jìn)行預(yù)測(cè);
(11)對(duì)預(yù)測(cè)得到的數(shù)據(jù)進(jìn)行反處理,獲得真實(shí)預(yù)測(cè)值,并計(jì)算誤差。
選擇重慶市江北區(qū)人口調(diào)查數(shù)據(jù)為模型仿真數(shù)據(jù),該調(diào)查數(shù)據(jù)包含了該區(qū)常住人口的一日出行情況,以及每個(gè)片區(qū)土地利用狀況和社會(huì)經(jīng)濟(jì)情況。為了仿真需要,根據(jù)實(shí)際情況,按交通小區(qū)把調(diào)查對(duì)象分為153個(gè)小區(qū),共包括13429戶(hù)家庭和46591個(gè)人的一日出行情況。其中調(diào)查內(nèi)容包括每個(gè)小區(qū)出行者家庭結(jié)構(gòu)、個(gè)體特性、出行目的、出行時(shí)間和出行方式,同時(shí)還調(diào)查出發(fā)地和目的地土地利用形態(tài)等特征。
圖3 基于RBF神經(jīng)網(wǎng)絡(luò)的交通生成預(yù)測(cè)過(guò)程
首先需要對(duì)原始調(diào)查數(shù)據(jù)進(jìn)行預(yù)處理和分析,主要分兩個(gè)方面:①調(diào)查對(duì)象的屬性,主要有小區(qū)位置、人口總數(shù)、就業(yè)人數(shù)、學(xué)生人數(shù)、家庭結(jié)構(gòu)、家庭收入、家庭人口、交通工具和數(shù)量、性別、年齡、職業(yè)、家庭職責(zé)、收入等構(gòu)成的原始數(shù)據(jù)庫(kù);②出行目的合并,根據(jù)調(diào)查得到的出行結(jié)果,結(jié)果合并為基本出行(上班、上學(xué))和非基本出行(購(gòu)物、探親訪(fǎng)友、娛樂(lè)、旅游、就醫(yī)、文化娛樂(lè)等)。
相對(duì)誤差絕對(duì)值的平均值為:
相對(duì)誤差絕對(duì)值的最大值為:
均方根誤差為:
式中:Yp(t)為交通生成量的預(yù)測(cè)值;Yr(t)為交通生成量的實(shí)際值。
為使數(shù)據(jù)適合RBF神經(jīng)網(wǎng)絡(luò)特性,減小噪聲干擾,先對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理,其公式為:
式中:Xmax、Xmin分別為各因子的最大值和最小值;X為因子值。
基于預(yù)測(cè)模型對(duì)數(shù)據(jù)的需要,將獲得的數(shù)據(jù)分為訓(xùn)練與測(cè)試兩個(gè)樣本集合。為提高預(yù)測(cè)精度,在數(shù)據(jù)劃分時(shí)增加訓(xùn)練樣本的數(shù)據(jù)容量,以便加強(qiáng)對(duì)模型訓(xùn)練檢驗(yàn),其中隨機(jī)選擇60%的數(shù)據(jù)為訓(xùn)練樣本,余下40%的數(shù)據(jù)為測(cè)試樣本。
現(xiàn)將隨機(jī)選取的92個(gè)小區(qū)作為訓(xùn)練樣本,剩下的61個(gè)小區(qū)作為測(cè)試樣本。經(jīng)過(guò)預(yù)測(cè)模型處理,將測(cè)試樣本數(shù)據(jù)與實(shí)際數(shù)據(jù)進(jìn)行比較分析,仿真結(jié)果及誤差如圖4所示。
從圖4可以看出,基于RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型能成功地進(jìn)行交通生成量的預(yù)測(cè),除少部分?jǐn)?shù)據(jù)誤差較大外,其余誤差都很小。
為了與RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行對(duì)比,利用同樣以離散數(shù)據(jù)為基礎(chǔ)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行交通生成預(yù)測(cè)。對(duì)相同的數(shù)據(jù)進(jìn)行BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè),其隱含層包含45個(gè)神經(jīng)元,預(yù)測(cè)精度為0.001。將BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)與RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)進(jìn)行對(duì)比,兩種神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)誤差指標(biāo)比較如表1所示。
圖4 RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)仿真結(jié)果及誤差
通過(guò)兩種預(yù)測(cè)模型預(yù)測(cè)誤差指標(biāo)對(duì)比可知,RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度比BP神經(jīng)網(wǎng)絡(luò)的要高,基本出行和非基本出行的實(shí)際值與預(yù)測(cè)值差異要小,能滿(mǎn)足交通生成預(yù)測(cè)的要求。
通過(guò)對(duì)仿真過(guò)程和仿真結(jié)果進(jìn)行分析發(fā)現(xiàn),在利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的過(guò)程中,由于BP神經(jīng)網(wǎng)絡(luò)不存在唯一最佳逼近點(diǎn),導(dǎo)致需要進(jìn)行多次預(yù)測(cè)才能得到最佳預(yù)測(cè)結(jié)果,預(yù)測(cè)過(guò)程繁瑣,最佳的預(yù)測(cè)結(jié)果精度較低,與實(shí)際值差距大,而筆者提出的RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,該交通生成預(yù)測(cè)方法比傳統(tǒng)的交通生成預(yù)測(cè)方法準(zhǔn)確性高,能有效地進(jìn)行交通生成預(yù)測(cè)。
表1 兩種神經(jīng)網(wǎng)絡(luò)交通生成預(yù)測(cè)誤差指標(biāo)比較
通過(guò)模型仿真分析,采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行交通生成預(yù)測(cè)是可行的,算法實(shí)現(xiàn)簡(jiǎn)單,充分結(jié)合了RBF神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、自組織、自適應(yīng)和大范圍數(shù)據(jù)融合的特性,進(jìn)行交通生成預(yù)測(cè),得到的結(jié)果比其他預(yù)測(cè)模型精度更高,可為交通規(guī)劃的制定提供更完善和更準(zhǔn)確的數(shù)據(jù)信息。
[1]劉小明,任福田.公路網(wǎng)規(guī)劃中交通預(yù)測(cè)的思想方法[J].中國(guó)公路學(xué)報(bào),1994,7(3):54 -59.
[2]石飛,王煒,江薇,等.基于土地利用形態(tài)的交通生成預(yù)測(cè)理論方法研究[J].土木工程學(xué)報(bào),2005,38(3):115-118.
[3]GEORGE R P.A demand theory for numbers of trips in a random utility model of recreation[J].Journal of Environmental Economics and Management,1992,2(9):357-367.
[4]易漢文.城市分析與交通預(yù)測(cè)[M].武漢:湖北科學(xué)技術(shù)出版社,1994:155-180.
[5]高為,陸百川,贠天鸝,等.基于時(shí)空特性和RBF神經(jīng)網(wǎng)絡(luò)短時(shí)交通流預(yù)測(cè)[J].交通信息與安全,2011,29(1):16 -24.
[6]陸化普,周錢(qián).交通出行生成預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)模型[J].交通運(yùn)輸工程與信息學(xué)報(bào),2008,6(2):6 -11.
[7]劉洪麗.城市居民出行生成預(yù)測(cè)方法研究[D].南京:河海大學(xué)圖書(shū)館,2006.
[8]歐陽(yáng)紅祥,李欣,張信娟.人工神經(jīng)網(wǎng)絡(luò)在建筑材料價(jià)格預(yù)測(cè)中的應(yīng)用[J].武漢理工大學(xué)學(xué)報(bào):信息與管理工程版,2013,35(1):115 -118.
[9]張冬青,寧宣熙,劉雪妮.基于RBF神經(jīng)網(wǎng)絡(luò)的非線(xiàn)性時(shí)間序列在線(xiàn)預(yù)測(cè)[J].控制理論與應(yīng)用,2009,26(2):151-155.
[10]呂曉玲,謝邦昌.數(shù)據(jù)挖掘方法與應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2009:144-149.