崔翔鵬,黃洪瓊
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
基于GA優(yōu)化ELM的船舶交通流預(yù)測(cè)模型*
崔翔鵬,黃洪瓊
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
為了提高船舶交通流預(yù)測(cè)的效率和準(zhǔn)確率,分析了船舶流量預(yù)測(cè)中的影響因素多、非線性、隨機(jī)性等問(wèn)題,建立了ELM(極限學(xué)習(xí)機(jī))預(yù)測(cè)模型。同時(shí)為了避免極限學(xué)習(xí)機(jī)算法受輸入權(quán)值矩陣和隱含層偏差隨機(jī)性的影響,算法又采用GA(遺傳算法)對(duì)極限學(xué)習(xí)機(jī)的輸入權(quán)值矩陣和隱含層偏差進(jìn)行優(yōu)化,建立GA-ELM船舶交通流預(yù)測(cè)模型。利用上海洋山港船舶流量對(duì)該模型進(jìn)行了實(shí)例分析,通過(guò)MATLAB仿真進(jìn)行預(yù)測(cè),將GA-ELM模型與單純的BP模型、ELM模型進(jìn)行對(duì)比和分析,結(jié)果表明:GA-ELM模型具有更高的預(yù)測(cè)精度和效率,從而能夠相對(duì)準(zhǔn)確、高效地對(duì)船舶交通流量進(jìn)行預(yù)測(cè)。
船舶交通流量;遺傳算法;極限學(xué)習(xí)機(jī);預(yù)測(cè)
近年來(lái),隨著社會(huì)經(jīng)濟(jì)和對(duì)外貿(mào)易的迅速發(fā)展,各種水域的船舶流量不斷增加,導(dǎo)致了航行水域的船舶交通事故頻發(fā),不僅帶來(lái)了巨大的經(jīng)濟(jì)損失更是造成了人員傷亡。因此,提升航行水域船舶流量預(yù)測(cè)的準(zhǔn)確性和高效性尤為重要。同時(shí),預(yù)測(cè)的準(zhǔn)確性和高效性又為航道的規(guī)劃設(shè)計(jì)和船舶通航管理提供了有力的依據(jù)。目前國(guó)內(nèi)外研究船舶流量預(yù)測(cè)的方法有支持向量機(jī)預(yù)測(cè)[1]、回歸分析[2]、灰色分析[3]等方法,然而這些預(yù)測(cè)方法都很難滿(mǎn)足預(yù)測(cè)的高效性和準(zhǔn)確性。
針對(duì)現(xiàn)有預(yù)測(cè)方法存在的泛化能力不強(qiáng)、訓(xùn)練速度慢、預(yù)測(cè)準(zhǔn)確率不高等不足之處,本文采用了一種新的船舶交通流量預(yù)測(cè)模型,即GA-ELM預(yù)測(cè)模型,首次將遺傳算法(GA)對(duì)極限學(xué)習(xí)機(jī)(ELM)進(jìn)行優(yōu)化的方法用于船舶交通流量預(yù)測(cè)。遺傳算法具有良好的隨機(jī)搜索能力,它是根據(jù)生物界的進(jìn)化規(guī)律演化而來(lái);而極限學(xué)習(xí)機(jī)(ELM)算法具有獲得唯一最優(yōu)解以及學(xué)習(xí)速度快、泛化性能好等優(yōu)點(diǎn)。將兩者結(jié)合,利用GA優(yōu)化ELM的輸入層與隱含層間的連接權(quán)值及隱含層神經(jīng)元的閾值,實(shí)現(xiàn)了預(yù)測(cè)船舶交通流量的目的。
南洋理工大學(xué)副教授黃廣斌于2004年提出極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)算法,ELM是一種改進(jìn)的前饋神經(jīng)網(wǎng)絡(luò)(SLFN)學(xué)習(xí)算法,相比于傳統(tǒng)的SLFN,ELM具有訓(xùn)練速度快、獲得全局唯一的最優(yōu)解且具有良好的泛化能力[4]。另外,在樣本數(shù)據(jù)不足的情況下,ELM的預(yù)測(cè)結(jié)果也較好,其結(jié)構(gòu)如圖1所示,由輸入層、隱含層和輸出層三部分組成。
圖1 ELM結(jié)構(gòu)圖
通常設(shè)wij(i=1,…,l,j=1,…,n)為輸入層和隱含層之間的連接權(quán)值;bk(k=1,…,l)為隱含層神經(jīng)元的閾值;βjk(j=1,…,l,k=1,…,m)為隱含層和輸出層之間的連接權(quán)值;wij表示輸入層第i個(gè)神經(jīng)元和隱含層第j個(gè)神經(jīng)元的連接權(quán)值;βjk表示隱含層第j個(gè)神經(jīng)元與輸出層第k個(gè)神經(jīng)元的連接權(quán)值。設(shè)訓(xùn)練集輸入矩陣X和輸出矩陣Y分別為
X=[x1,x2,…,xn]T,Y=[y1,y2,…,ym]T
(1)
設(shè)隱含層神經(jīng)元的激勵(lì)函數(shù)為Sigmoid,其表達(dá)式為:
(2)
則由圖1可得網(wǎng)絡(luò)輸出T為:
T=[t1t2…tm]T
(3)
(4)
式中,j=1,2,…,n;wi=[wi1wi2…wim]。則式(4)可以表示為Hβ=T′,式中,T′為T(mén)的轉(zhuǎn)置矩陣。神經(jīng)網(wǎng)絡(luò)隱含層的矩陣H為:
H(w1,w2,…wl,b1,b2,…,bl,x1,x2,…,xn)=
(5)
當(dāng)隱含層的神經(jīng)元數(shù)目等于訓(xùn)練集樣本數(shù)目時(shí),設(shè)定?w和?b,單隱層前饋神經(jīng)網(wǎng)絡(luò)(Single-hiddenLayerFeedforwardNeuralNetwork,SLFNN)能夠沒(méi)有誤差接近訓(xùn)練樣本[5],即:
(6)
式中,j=1,2,…,m。然而當(dāng)訓(xùn)練集X的樣本數(shù)較多時(shí),通常取隱含層神經(jīng)元的個(gè)數(shù)K
(7)
當(dāng)選定激勵(lì)函數(shù)g(x)可以無(wú)限可微時(shí),取?w和?b,β值可以通過(guò)式(8)求得最小二乘解,即:
(8)
解得:
(9)
其中,H+為隱含層輸出矩陣H的Moore-Penrose逆。
遺傳優(yōu)化算法是根據(jù)生物界的進(jìn)化規(guī)律演化而來(lái)的隨機(jī)化搜索方法,在內(nèi)在的隱并行性、實(shí)用性和全局尋優(yōu)能力等方面具有較大優(yōu)勢(shì)。
由于ELM模型隱含層輸入權(quán)值和偏差是隨機(jī)給定的,可能存在某些隨機(jī)設(shè)定值為0時(shí),導(dǎo)致部分隱含層節(jié)點(diǎn)失效。因此本文采用遺傳算法對(duì)輸入權(quán)值和偏差進(jìn)行優(yōu)化,其通過(guò)遺傳算法的選擇、交叉、變異操作得到最優(yōu)的初始權(quán)值和閾值,進(jìn)而得到最優(yōu)的ELM模型。圖2為GA-ELM模型的流程圖,訓(xùn)練步驟如下:
圖2 GA-ELM模型流程圖
(1)設(shè)定適應(yīng)度函數(shù)、種群個(gè)數(shù)k及進(jìn)化次數(shù)p,本文選取測(cè)試集樣本數(shù)據(jù)均方差作為適應(yīng)度函數(shù)。適應(yīng)度函數(shù)值越小,模型越精確。
(2)規(guī)定種群。種群個(gè)數(shù)k一般設(shè)定為20~40個(gè)。個(gè)體的長(zhǎng)度是由隱含層輸入權(quán)值矩陣和偏差向量構(gòu)成,即D=L(n+1),其中L為隱含層節(jié)點(diǎn)數(shù)量,n為輸入層神經(jīng)元數(shù)量,即輸入向量的維度。
(3)局部求解最優(yōu)適應(yīng)度函數(shù)αbest。αbest初始值為10,θ及γ的初始值為0,把訓(xùn)練數(shù)據(jù)歸一化后帶入模型,依次求出每個(gè)個(gè)體的適應(yīng)度函數(shù),直到γ=k時(shí)循環(huán)終止,解得αbest的值[6]。
(4)全局求解最優(yōu)適應(yīng)度函數(shù)αbest。每次解得最優(yōu)適應(yīng)度函數(shù)后,采用交叉、變異將種群進(jìn)行優(yōu)化,檢驗(yàn)進(jìn)化代數(shù)θ,當(dāng)θ小于等于p時(shí),將γ值初始為0,退回到步驟(3),直到θ大于p停止運(yùn)算,即得出的αbest為最優(yōu)適應(yīng)度函數(shù),根據(jù)所對(duì)應(yīng)的參數(shù)便可得到優(yōu)化的ELM模型。
3.1 實(shí)驗(yàn)數(shù)據(jù)及設(shè)置
以上海洋山深水港經(jīng)過(guò)的船舶為研究對(duì)象,根據(jù)上海洋山港統(tǒng)計(jì)的數(shù)據(jù),選取2016年4月10日至2016年7月16日的船舶流量數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù)。前60天數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù),后37天數(shù)據(jù)作為測(cè)試數(shù)據(jù)。選取自然因素、船舶平均噸位、物流成本、業(yè)務(wù)指數(shù)、上海經(jīng)濟(jì)指數(shù)5個(gè)因素來(lái)建立預(yù)測(cè)模型。為降低預(yù)測(cè)誤差,對(duì)樣本數(shù)據(jù)按式(10)歸一化處理[7]。
(10)
仿真實(shí)驗(yàn)時(shí),利用MATLAB中的Sheffield工具箱實(shí)現(xiàn)GA,構(gòu)建最佳的GA-ELM船舶流量預(yù)測(cè)模型。設(shè)定GA的參數(shù)如下:種群大小為20,最大遺傳代數(shù)為100,交叉概率0.75,變異概率0.02,代溝0.95。
3.2 實(shí)驗(yàn)仿真效果及分析
(11)
(12)
(13)
將這3種模型進(jìn)行性能比較,其結(jié)果如表1所示。此外,對(duì)BP神經(jīng)網(wǎng)絡(luò)、ELM模型和GA-ELM模型分別進(jìn)行了仿真實(shí)驗(yàn)和對(duì)比,仿真結(jié)果如圖3~圖5所示。
表1 3種預(yù)測(cè)模型性能指標(biāo)比較
圖3 BP網(wǎng)絡(luò)模型預(yù)測(cè)值與實(shí)際值對(duì)比
圖4 ELM模型預(yù)測(cè)值與實(shí)際值對(duì)比
圖5 GA-ELM模型預(yù)測(cè)值與實(shí)際值對(duì)比
從表1及圖3~圖5可見(jiàn),BP神經(jīng)網(wǎng)絡(luò)和ELM模型都得到了相應(yīng)的預(yù)測(cè)效果,但在預(yù)測(cè)的準(zhǔn)確性上不及GA_ELM模型。由于BP神經(jīng)網(wǎng)絡(luò)對(duì)樣本數(shù)存在較高的要求,會(huì)存在過(guò)擬合現(xiàn)象以及ELM中隨機(jī)賦值問(wèn)題,導(dǎo)致這兩種算法預(yù)測(cè)的準(zhǔn)確性受到了影響。GA具有更好的全局尋優(yōu)能力,采用GA優(yōu)化ELM模型的隨機(jī)賦值問(wèn)題,使其得到最優(yōu)解,得到的預(yù)測(cè)誤差變小。
由表1可見(jiàn),GA-ELM預(yù)測(cè)模型的平均絕對(duì)誤差、平均絕對(duì)百分誤差、均方根誤差和仿真時(shí)間都明顯小于BP模型和ELM模型。因此,GA-ELM模型比BP模型以及ELM模型在預(yù)測(cè)的準(zhǔn)確性和高效性等方面具有更好的優(yōu)勢(shì)。
本文首次將遺傳算法優(yōu)化的極限學(xué)習(xí)機(jī)模型應(yīng)用于船舶流量預(yù)測(cè)中,根據(jù)GA算法原理,對(duì)ELM預(yù)測(cè)模型的參數(shù)的選擇進(jìn)行優(yōu)化,避免隨機(jī)性對(duì)模型預(yù)測(cè)的準(zhǔn)確性的影響,提高了預(yù)測(cè)精度。
利用GA-ELM對(duì)船舶交通流量進(jìn)行預(yù)測(cè),將預(yù)測(cè)效果與BP模型和ELM模型進(jìn)行對(duì)比分析。結(jié)果表明,GA-ELM具有更好的泛化能力和良好的穩(wěn)定性,預(yù)測(cè)結(jié)果與實(shí)際船舶交通流量相吻合,可以準(zhǔn)確、高效地預(yù)測(cè)船舶交通流量,為船舶交通流量的預(yù)測(cè)提供了一種新方法。
[1] 馮宏祥,肖英杰,孔凡邨.基于支持向量機(jī)的船舶交通流量預(yù)測(cè)模型[J].中國(guó)航海,2011,34(4):62-66.
[2] 王東, 熊錫龍. 基于影響因素分析的船舶交通流量預(yù)測(cè)多元線性回歸模型[J]. 船海工程, 2010, 39(3):178-180.
[3] 李俊, 徐志京, 唐貝貝. 基于GA優(yōu)化的灰色神經(jīng)網(wǎng)絡(luò)船舶交通流量預(yù)測(cè)方法研究[J]. 船海工程, 2013, 42(5):135-137.
[4] HUANG G B, ZHU Q Y,SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006, 70(1-3):489-501.
[5] HUANG G B, ZHU Q Y,SIEW C K. Extreme learning machine: a new learning scheme of feedforward neural networks[J]. Proceedings of International Joint Conference on Neural Networks, 2004, 2(2):985-990.
[6] 王新民, 李天正, 張欽禮. 基于 GA -ELM 漿體管道輸送臨界流速預(yù)測(cè)模型研究[J]. 中國(guó)安全生產(chǎn)科學(xué)技術(shù), 2015(8):101-105.
[7] 鈕浩東, 黃洪瓊. 基于FOA優(yōu)化GRNN的船舶交通流預(yù)測(cè)模型[J]. 微型機(jī)與應(yīng)用, 2016, 35(12):81-83.
[8] 郎茂祥. 預(yù)測(cè)理論與方法[M]. 北京:清華大學(xué)出版社, 2011.
Ship traffic flow prediction model based on GA-ELM algorithm
Cui Xiangpeng,Huang Hongqiong
(College of Information Engineering,Shanghai Maritime University,Shanghai 201306,China)
In order to improve the efficiency and accuracy of vessel traffic flow prediction, by analyzing the influence factors of ship flux, nonlinear and randomness problems and so on, establishing ELM(Extreme Learning Machine) prediction model. At the same time, in order to avoid ELM influenced by input weight matrix and the randomness of hidden layer deviation, using the genetic algorithm to optimize the input weight matrix and hidden layer deviation of the ELM, establishing GA-ELM vessel traffic flow prediction model. Using Shanghai Yangshan Port as case analysis for GA-ELM vessel traffic flow prediction model, by MATLAB simulation to make a comparison and analysis of GA-ELM model and simple BP model, ELM model. The results show that GA-ELM model has higher prediction accuracy and better generalization ability so that it can be used to predict the vessel traffic flow relatively accurately and efficiently.
ship traffic flow;genetic algorithms;extreme learning machine;prediction
國(guó)家自然科學(xué)基金(61673260)
TP391.9
A
10.19358/j.issn.1674- 7720.2017.09.005
崔翔鵬,黃洪瓊.基于GA優(yōu)化ELM的船舶交通流預(yù)測(cè)模型[J].微型機(jī)與應(yīng)用,2017,36(9):15-17,21.
2016-10-14)
崔翔鵬(1992-),男,碩士研究生,主要研究方向:智能信息處理及應(yīng)用。
黃洪瓊(1973-),女,副教授,主要研究方向:智能信息處理、智能交通系統(tǒng)及航運(yùn)智能運(yùn)輸系統(tǒng)。