□文/楊偉靜
基于BP神經(jīng)網(wǎng)絡(luò)的鐵路客流量預(yù)測(cè)研究
□文/楊偉靜
鐵路客流量的影響因素既來自于顧客的需求,也來自于鐵路系統(tǒng)的供給。根據(jù)這些影響因素選取樣本,利用BP神經(jīng)網(wǎng)絡(luò)的非線性映射特性進(jìn)行網(wǎng)絡(luò)訓(xùn)練及預(yù)測(cè),結(jié)果客觀可靠,從而為鐵路系統(tǒng)的管理工作提供了有力的支持。
鐵路客流量;BP神經(jīng)網(wǎng)絡(luò);預(yù)測(cè)
鐵路運(yùn)輸在社會(huì)生活中占有極為重要的地位,它是國(guó)民經(jīng)濟(jì)活動(dòng)中必不可少的重要組成部分。隨著社會(huì)的發(fā)展,鐵路客流量呈現(xiàn)出不斷增長(zhǎng)的趨勢(shì),鐵路運(yùn)輸管理部門應(yīng)做好鐵路客流量的預(yù)測(cè)工作,提前做好準(zhǔn)備,從而保證旅客順利出行。
一些學(xué)者對(duì)鐵路客流量預(yù)測(cè)進(jìn)行了相關(guān)研究,如常國(guó)珍、張前登(2008)采用時(shí)間序列分析方法對(duì)我國(guó)鐵路客流量進(jìn)行預(yù)測(cè);沈家軍、王煒、陳峻(2007)為了科學(xué)準(zhǔn)確地預(yù)測(cè)近期公交客流量,提出了應(yīng)用灰色馬爾可夫模型進(jìn)行預(yù)測(cè)的方法;田艷君、毛月華、李克(2007)通過對(duì)某市公路客運(yùn)量數(shù)據(jù)特征的分析,建立了基于支持向量機(jī)的客流量預(yù)測(cè)方法。這些方法主要是從客流量隨時(shí)間的變化規(guī)律進(jìn)行研究的,屬于時(shí)間模型預(yù)測(cè)法,這類方法要求環(huán)境相對(duì)穩(wěn)定,因此在應(yīng)用中存在一定的局限性。
陳翠利、黃志彤(2008)按照客運(yùn)專線客流的形成原因?qū)⑵浞譃橼厔?shì)客流、誘發(fā)客流和轉(zhuǎn)移客流,根據(jù)各部分客流的自身變化特點(diǎn),分別采用不同的模型或方法進(jìn)行預(yù)測(cè),最后給出了總體客流量預(yù)測(cè)的計(jì)算方法;這種方法雖然界定了三部分客流量的范圍,但是從實(shí)際來講,三者之間的界限不可能完全劃分清晰。轉(zhuǎn)移客流和誘發(fā)客流在實(shí)際中會(huì)有極少部分和趨勢(shì)客流相重合,同時(shí)還會(huì)有其他因素形成的微小客流而不被歸入這三部分,因此這種方法也存在一定的問題。
鐵路客流量受多種因素的影響,不僅僅是時(shí)間的函數(shù)。因此,本文利用BP神經(jīng)網(wǎng)絡(luò)具有高度非線性關(guān)系的映射能力,可以實(shí)現(xiàn)M維歐氏空間到N維歐氏空間的任意映射這一特點(diǎn),把影響鐵路客流量的各種因素作為輸入,建立起與客流量之間的映射,從而對(duì)客流量進(jìn)行預(yù)測(cè)。
從經(jīng)濟(jì)學(xué)角度來講,鐵路客流量就如同交易的商品數(shù)量,這個(gè)交易數(shù)量既受顧客需求的影響,也受來自鐵路供給方面的影響,現(xiàn)把這些影響因素總結(jié)如下:
1、經(jīng)濟(jì)發(fā)展水平。影響鐵路客流量首當(dāng)其沖的一個(gè)因素就是經(jīng)濟(jì)發(fā)展水平,而經(jīng)濟(jì)發(fā)展水平往往用一個(gè)國(guó)家的GDP來反映,這是一個(gè)重要的宏觀經(jīng)濟(jì)指標(biāo)。經(jīng)濟(jì)發(fā)展水平高,意味著旅客的出行增加,同時(shí)也意味著鐵路旅客運(yùn)輸能力的提升,這是一個(gè)綜合性的影響因素,也是一個(gè)非?;A(chǔ)的影響因素。
2、鐵路基礎(chǔ)設(shè)施狀況。我國(guó)鐵路旅客運(yùn)輸屬于壟斷市場(chǎng),鐵路投資的主體主要是政府。一個(gè)國(guó)家的鐵路營(yíng)業(yè)里程、鐵路客車擁有量等決定著鐵路旅客運(yùn)輸?shù)墓┙o,決定運(yùn)輸服務(wù)的數(shù)量、質(zhì)量。
3、居民消費(fèi)水平。隨著人們生活水平的提高,在滿足了人們起碼的生存和安全需求后,探親、休養(yǎng)、旅游、訪友等的需求也必然增長(zhǎng),與此相聯(lián)系的消費(fèi)性需求也將相應(yīng)地在數(shù)量上和質(zhì)量上發(fā)生變化。居民消費(fèi)水平可通過居民消費(fèi)支出來反映。
4、人口數(shù)量。旅客運(yùn)輸?shù)膶?duì)象是人,人口數(shù)量的變化必然引起旅行需求的變化。城市化進(jìn)程的加快,人口集中加速,人口流動(dòng)相對(duì)頻繁,客運(yùn)需求量也將變大。
5、旅行費(fèi)用,即運(yùn)輸服務(wù)價(jià)格。在一定的旅行條件下,旅客具有選擇運(yùn)價(jià)較低的運(yùn)輸工具的傾向,尤其是消費(fèi)性旅行需求更是如此。在我國(guó)富裕程度還遠(yuǎn)沒有達(dá)到發(fā)達(dá)國(guó)家水平的時(shí)候,票價(jià)仍將是旅客選擇運(yùn)輸方式時(shí)所考慮的主要因素之一。
6、其他替代運(yùn)輸方式的發(fā)展。對(duì)于某一運(yùn)輸方式而言,其他運(yùn)輸方式的運(yùn)價(jià)水平、服務(wù)質(zhì)量及其發(fā)展情況會(huì)直接影響其需求。比如,航空與公路交通的性價(jià)比顯著提高,會(huì)直接影響旅客對(duì)鐵路的需求。
7、政策因素。國(guó)家為了保證國(guó)民經(jīng)濟(jì)快速、持續(xù)、穩(wěn)定的增長(zhǎng),對(duì)國(guó)家的資源配置、能源交通等對(duì)國(guó)民經(jīng)濟(jì)發(fā)展有重大影響的方面施行宏觀管理和調(diào)控。因此,國(guó)家針對(duì)交通運(yùn)輸制定的有關(guān)政策必然會(huì)對(duì)各種交通運(yùn)輸方式產(chǎn)生很大的影響。
由于經(jīng)濟(jì)事物的復(fù)雜性,鐵路客流量的影響因素除了上述幾個(gè)主要方面外,還存在其他一些影響因素。在不影響問題分析的前提下,抓住主要方面,忽略次要的影響因素。
3.技術(shù)平臺(tái)。通過精干高效、優(yōu)勢(shì)互補(bǔ)、互惠雙贏的聯(lián)合運(yùn)營(yíng)管理體系,統(tǒng)籌兼顧本院學(xué)員、教職員工及部分石油企業(yè)員工隨時(shí)隨地培訓(xùn)學(xué)習(xí)的需求,快速建立起“管院在線”網(wǎng)絡(luò)技術(shù)學(xué)習(xí)平臺(tái)。其主要特點(diǎn):一是平臺(tái)具備在線學(xué)習(xí)、在線考試、互動(dòng)交流、考核評(píng)估、培訓(xùn)管理等功能,支持多終端的用戶訪問,同時(shí)PC 端、移動(dòng)端、微信端數(shù)據(jù)可以同步,支持?jǐn)帱c(diǎn)續(xù)播;二是創(chuàng)新使用分布式微服務(wù)架構(gòu),技術(shù)先進(jìn),對(duì)數(shù)據(jù)、應(yīng)用、訪問層都作保障系統(tǒng)性和穩(wěn)定性的優(yōu)化處理。
反向傳播算法是一種計(jì)算單個(gè)權(quán)值變化引起網(wǎng)絡(luò)性能變化值的較為簡(jiǎn)單的方法。由于BP算法過程包含從輸出節(jié)點(diǎn)開始,反向地向第一隱含層(即最接近輸入層的隱含層)傳播由總誤差引起的權(quán)值修正,所以稱為“反向傳播”。
BP網(wǎng)絡(luò)不僅含有輸入節(jié)點(diǎn)和輸出節(jié)點(diǎn),而且含有一層或多層隱(層)節(jié)點(diǎn)。輸入信息先向前傳遞到隱節(jié)點(diǎn),經(jīng)過作用后,再把隱節(jié)點(diǎn)的輸出信息傳遞到輸出節(jié)點(diǎn),最后給出輸出結(jié)果。
BP算法的學(xué)習(xí)過程由正向傳播和反向傳播組成。在正向傳播過程中,輸入信息從輸入層經(jīng)隱單元層逐層處理后,傳至輸出層。每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)。如果在輸出層得不到期望輸出,那么就轉(zhuǎn)為反向傳播,把誤差信號(hào)沿原連接路徑返回,并通過修改各層神經(jīng)元的權(quán)值,使誤差信號(hào)最小。
BP神經(jīng)網(wǎng)絡(luò)原理已經(jīng)應(yīng)用于國(guó)民經(jīng)濟(jì)的多個(gè)領(lǐng)域,顯示出了自身的優(yōu)勢(shì)。本文結(jié)合鐵路客流量自身的特點(diǎn),運(yùn)用BP神經(jīng)網(wǎng)絡(luò)原理進(jìn)行鐵路客流量預(yù)測(cè)的探討。
運(yùn)用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),首先要提供一組訓(xùn)練樣本,每個(gè)訓(xùn)練樣本由輸入和理想輸出對(duì)組成。通過對(duì)一組訓(xùn)練樣本的訓(xùn)練,網(wǎng)絡(luò)就可以形成自身的記憶規(guī)律。在此基礎(chǔ)上,輸入驗(yàn)證樣本利用模型進(jìn)行仿真預(yù)測(cè),從而判斷預(yù)測(cè)結(jié)果的精確度是否符合實(shí)際需要,若不符合,需要修改相應(yīng)的參數(shù)后重新訓(xùn)練網(wǎng)絡(luò),直至符合實(shí)際需要為止。
1、根據(jù)前文所介紹的影響鐵路客流量的因素,可以把各個(gè)影響因素作為輸入量。在七類影響因素中,假定政策是相對(duì)穩(wěn)定的,并且其他替代運(yùn)輸方式的影響也是相對(duì)穩(wěn)定的,因此這兩類影響因素可不必考慮;另外,旅行費(fèi)用與經(jīng)濟(jì)的發(fā)展水平存在高度相關(guān)關(guān)系,旅行費(fèi)用也可忽略。這樣,作為輸入層的指標(biāo)主要有:GDP、鐵路營(yíng)業(yè)里程、鐵路客車擁有量、居民消費(fèi)支出、人口數(shù)量這五個(gè)指標(biāo),從而決定了輸入層有五個(gè)節(jié)點(diǎn)。
3、隱含層節(jié)點(diǎn)數(shù)的選取關(guān)系到整個(gè)BP網(wǎng)絡(luò)的精確度和學(xué)習(xí)效率,最佳節(jié)點(diǎn)數(shù)可參考公式n1=log2n(其中n1為隱含層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù)),這樣可把隱含層節(jié)點(diǎn)數(shù)設(shè)定為3。
4、網(wǎng)絡(luò)中間層的神經(jīng)元傳遞函數(shù)S型正切函數(shù)tansig,輸出層神經(jīng)元傳遞函數(shù)采用S型對(duì)數(shù)函數(shù)logsig,trainlm為網(wǎng)絡(luò)的訓(xùn)練函數(shù)。
5、初始狀態(tài)的各節(jié)點(diǎn)之間的連接權(quán)值和閾值為(-1,1)之間隨機(jī)小數(shù),系統(tǒng)可自行產(chǎn)生。樣本的學(xué)習(xí)參數(shù)取0.2,訓(xùn)練次數(shù)為1,000次,誤差精度為0.001。
6、根據(jù)統(tǒng)計(jì)年鑒的數(shù)據(jù),選取1996~2007年的數(shù)據(jù)作為樣本,共12個(gè)樣本,前11個(gè)為訓(xùn)練樣本,最后1個(gè)作為驗(yàn)證樣本(數(shù)據(jù)表略)。
在網(wǎng)絡(luò)訓(xùn)練前,應(yīng)該對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理。歸一化的方法很多,考慮到鐵路客運(yùn)量及其影響因素均為正向向量,因此可采用一列數(shù)據(jù)分別除以這一列數(shù)據(jù)中最大值的方法,結(jié)果體現(xiàn)在下面的輸入輸出向量中。
7、網(wǎng)絡(luò)訓(xùn)練的MATLAB代碼如下:
8、神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果。對(duì)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練8次后,達(dá)到了誤差精度小于0.001。把歸一化后的驗(yàn)證樣本進(jìn)行仿真,輸出的結(jié)果為0.9553,與理想值1相差0.0447,誤差小于5%,說明預(yù)測(cè)模型是可靠的。
在本文的實(shí)例應(yīng)用中,由于數(shù)據(jù)獲取的渠道有限,在符合實(shí)際情況的前提下選取的指標(biāo)數(shù)量相對(duì)較少,在以后的研究中將在這方面繼續(xù)探索。另外,一些能夠帶來重要影響的偶發(fā)因素也可以通過隨機(jī)變量的方式體現(xiàn)在預(yù)測(cè)模型中,從而使預(yù)測(cè)結(jié)果更為科學(xué)、可靠。
本文所選取的樣本數(shù)據(jù)是按年份進(jìn)行的,從而進(jìn)行的是鐵路年客流量的預(yù)測(cè)。根據(jù)實(shí)際需要,可以選取月份的樣本數(shù)據(jù),進(jìn)行月客流量的預(yù)測(cè)。比如,為了預(yù)測(cè)春運(yùn)期間鐵路客流量,可以找出其影響因素,選取歷年春運(yùn)期間的樣本數(shù)據(jù)進(jìn)行預(yù)測(cè)。
BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法是一種非線性映射方法,它只要將處理過的數(shù)據(jù)輸入到網(wǎng)絡(luò)中,通過MATLAB的神經(jīng)網(wǎng)絡(luò)工具箱處理即可得到預(yù)測(cè)結(jié)果,避免了人為因素的影響,提高了預(yù)測(cè)的可靠性,使預(yù)測(cè)結(jié)果更有效、更客觀。但是,它也存在著一些缺點(diǎn),比如所選取的學(xué)習(xí)樣本的數(shù)量和質(zhì)量很大程度上影響著神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)性能,網(wǎng)絡(luò)層數(shù)以及隱含層神經(jīng)元數(shù)的選取也影響整個(gè)網(wǎng)絡(luò)的學(xué)習(xí)能力和學(xué)習(xí)效率等等。盡管如此,我們不能否認(rèn)BP神經(jīng)網(wǎng)絡(luò)對(duì)非線性系統(tǒng)的預(yù)測(cè)所取得的成果,人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于鐵路客流量的預(yù)測(cè)具有很好的發(fā)展前景。
[1]常國(guó)珍,張前登.基于時(shí)間序列的我國(guó)鐵路客流量預(yù)測(cè)[J].統(tǒng)計(jì)與咨詢,2008.4.
[2]劉強(qiáng),賈利民.基于復(fù)雜系統(tǒng)的鐵路客流影響因素分析研究 [J].鐵道運(yùn)輸與經(jīng)濟(jì),2008.11.
F53
A
河北金融學(xué)院)