王 峰,黃友能,何占元,徐田華, 唐 濤
(1.北京交通大學 電子信息學院,北京 100044;2. 朔黃鐵路發(fā)展有限責任公司,河北 滄州 062350;3. 北京交通大學 軌道交通控制與安全國家重點實驗室,北京 100044)
為滿足城市軌道交通運營效率不斷提升的需求,越來越多的城市軌道交通采用列車自動運行的方式。列車自動運行不僅能夠提高運輸效率、降低司機勞動強度,還可以減少由于人工誤操作對運營帶來的影響。列車自動進站停車是列車自動運行中的一個重要功能,而停車精度是列車在不影響運營安全的氣象條件下運行時,衡量列車自動進站過程中,是否滿足執(zhí)行列車車門和屏蔽門正常聯(lián)動功能的最重要的觸發(fā)條件。
目前,學者對城軌列車自動停車精度(Train Parking Error, TPE)的研究可總結為以下兩個方面:一是列車自動進站停車算法,主要采用的控制算法有經(jīng)典控制算法、參數(shù)自適應控制算法、智能控制算法、集成智能控制算法[1-3],這些算法研究通常是從保證站間運行時間、列車節(jié)能等角度開展,但當一條線路投入運營后,就不再調(diào)整算法。二是列車制動閘瓦特性,城軌列車進站停車過程中所需的制動力,主要由電制動提供,僅在速度低于3 km/h時才施加空氣制動使列車停穩(wěn)。文獻[4-6]分析總結了國內(nèi)外閘瓦磨損規(guī)律和使用壽命,列車閘瓦的理論使用年限較長,可達7~9年。
可以看出,在城軌線路投入運營后,列車自動進站停車算法通常不再調(diào)整。同時,從列車閘瓦理論使用年限來看,較長時期內(nèi)不會更換閘瓦,但隨著列車運行里程的增加,閘瓦的磨耗會導致列車制動性能變化,影響到列車進站停車算法中所依賴的參數(shù),從而導致進站停不準的情況發(fā)生。目前,針對此類問題,維護人員每日對車載設備記錄的自動進站停車數(shù)據(jù)進行分析,根據(jù)停車精度的偏移程度決定是否進行維修調(diào)整,顯然這種方式效率較低、勞動強度大。如果能夠預測列車自動進站停車精度的偏移情況,可指導維護人員依據(jù)其變化趨勢及時調(diào)整進站停車算法中的參數(shù)配置,從而可以大大減少列車上線運營后由于停不準引起的車門屏蔽門無法聯(lián)動的問題,對運營水平和維護效率的提高具有重要意義。
因此,本文提出一種停車精度預測方法,首先通過Weibull分布擬合各期停車精度的分布,進而采用支持向量回歸(Support Vector Regression, SVR)模型對停車精度分布進行預測,最后以北京地鐵某條線一列車的停車精度數(shù)據(jù)對提出的模型進行仿真驗證。
圖1為停車精度預測的主要流程,主要包括以下幾個步驟:
Step1停車精度數(shù)據(jù)預處理。首先,給定歷史進站停車精度數(shù)據(jù)庫后,依據(jù)現(xiàn)場維修需求,以單位時間均勻分割歷史數(shù)據(jù)為T期,每一期將作為一個分布樣本。
Step2擬合各期數(shù)據(jù)的分布。Weibull能夠表達多種分布,例如指數(shù)分布和正態(tài)分布等,具有很強的適應性[7],在工程領域有著廣泛的應用。因此,采用Weibull分布對每一期數(shù)據(jù)進行擬合,每一期將得到兩個分布參數(shù)的估計值,即尺度參數(shù)和形狀參數(shù)。對各期數(shù)據(jù)進行擬合后,得到兩個分布參數(shù)的時間序列,即有待構建預測模型的兩個時間序列。
Step3預測模型的構建與預測。在兩個時間序列基礎上,采用支持向量回歸算法分別構建兩個時間序列預測模型,通過構造的模型對下一期的分布情況進行預測。
Step4分布的分析與應用。通過分析下一期分布的參數(shù)和數(shù)字特征,如期望和方差等,可對下一期停車精度的情況作出評估,從而確定維修的必要性。
圖1 停車精度預測算法框架
Weibull 分布函數(shù)具有較好的適用性,在工程領域有著廣泛應用[8]。因此,本文采用Weibull分布對停車精度數(shù)據(jù)進行分布擬合。數(shù)據(jù)分期后,對各期停車精度分布數(shù)據(jù)進行Weibull分布擬合,得到分布參數(shù)。
假設隨機變量X服從Weibull分布(隨機變量的觀察值是每期數(shù)據(jù)),則X的概率密度函數(shù)為
( 1 )
分布函數(shù)為
( 2 )
式中:α>0 為尺度參數(shù);β>0為形狀指數(shù)。其中,Weibull分布中兩個參數(shù)都與停車精度分布特征因子有關。α>0代表停車精度的分布的離散程度;β>0決定停車精度的偏度,是分析停車精度分布動態(tài)的依據(jù)之一。
Weibull分布參數(shù)估計方法主要包括:最大似然估計法、矩估計法、線性回歸估計[9-10]。由于最大似然估計是一種簡單有效的參數(shù)估計方法,本文采用最大似然法對Weibull分布的參數(shù)估計。
根據(jù)最大似然估計法,Weibull分布的最大似然函數(shù)可以表示為
L(x1,x2,…,xn;α,β)=
( 3 )
對上式兩邊取對數(shù)可得
lnL(x1,x2,…,xn;α,β)=
( 4 )
為求解上式的極大值,令?lnL/?α=0 和?lnL/?β=0,求解得到。即對以下二元一次方程組求解:
( 5 )
上述方程組可由數(shù)值解法求得參數(shù)α和β。
支持向量回歸在很多領域已有廣泛的應用,取得了良好的效果。為了對下一期停車精度分布進行預測,以參數(shù)時間序列為基礎,采用支持向量回歸構建其預測模型。
文獻[11]提出一種基于結構風險最小化的統(tǒng)計學習算法,稱為支持向量機(Support Vector Machine, SVM)。目前SVM已在很多領域得到了廣泛應用,除模式識別領域之外,有學者通過改變SVM的損失函數(shù),將其構造為一種可用于回歸分析的算法,稱為支持向量回歸[12-13]。
支持向量回歸的核心思想可表述為:給定數(shù)據(jù)樣本集(x1,y1),…,(xm,ym)。為實現(xiàn)線性可分,通過構造一個非線性映射φ(·)將樣本特征空間x映射到高維特征空間F。新特征空間F線性回歸表示如下
f(x)=w·φ(x)+bφ:Rn→Fw∈F
( 6 )
式中:b為偏置;w為回歸系數(shù)向量。與傳統(tǒng)的統(tǒng)計學習不同,SVR通過結構風險最小化,來尋找一個合適的函數(shù)f。它能夠有效克服過擬合問題,有良好的泛化能力。由于引入了ε-敏感損失函數(shù),結構風險最小化可以表述如下
( 7 )
式中:C為懲罰因子;m為樣本數(shù)目;Θε(f(xi),yi)為ε-敏感損失函數(shù),數(shù)學描述如下
( 8 )
線性不可分時,上述優(yōu)化問題將得不到最優(yōu)解。因此,引入松弛因子ξ和ξ*,來保證解的存在性。SVR的原問題可看作一個二次規(guī)劃問題,形式如下
s.t. (w·φ(xi)+b)-yi≤ε+ξi
( 9 )
依據(jù)拉格朗日乘子法和對偶理論,可求得上述優(yōu)化問題的對偶問題,表述如下
(10)
式中:K(xi,xj)為核函數(shù),對偶問題的結果依賴于核函數(shù)K(xi,xj)(i=1,2,…,l)和常數(shù)C。
核函數(shù)的不同決定了不同形式的SVR回歸模型。其中,常用的核函數(shù)有Sigmoid核函數(shù)、徑向基核函數(shù)(RBF)、線性核函數(shù)等。本文采用RBF構建SVR模型為
K(x,xi)=exp(-γ‖x-xi‖2)
(11)
(12)
算法1給出了預測模型構造及預測的詳細步驟,以下進行闡述:
首先,以時間間隔τ(根據(jù)現(xiàn)場維修需求調(diào)研得到)對停車精度數(shù)據(jù)集D進行劃分,得到T期原始數(shù)據(jù)分組。然后,分別對T期數(shù)據(jù)的每一期進行處理:構造精度數(shù)據(jù)Dt的原始分布Xt;歸一化原始分布Xt后,得到分布Yt;對Yt進行Weibull分布擬合,估計出t期分布的參數(shù)αt,βt,即尺度和形狀參數(shù)。重復以上步驟,得到了各期Weibull分布的參數(shù)時間序列αt,βt,t=1,2,…,T。
在此基礎上,分割參數(shù)時間序列為訓練序列αtrain,βtrain和測試序列αtest,βtest,并對SVR模型進行訓練得到預測模型Mα,Mβ。在預測階段,基于前幾期的參數(shù)序列,對下一期的分布參數(shù)進行預測,得到下一期的分布參數(shù)αp,βp;最后,可構造出下一時期的停車精度分布,在反歸一化后計算得到下一時期精度分布的分布特征,期望和方差;以此對列車的停車狀況進行分析。
圖2 停車精度預測算法步驟
算法1: 基于Weibull分布和SVR的停車精度預測
輸入變量:停車精度數(shù)據(jù)D,數(shù)據(jù)劃分時間間隔τ。
中間變量:各期精度數(shù)據(jù)Dt;原始分布Xt;歸一化后的分布Yt;參數(shù)時間序列αt,βt,t=1,2,…,T;訓練序列αtrain,βtrain和測試序列αtest,βtest。
輸出結果:參數(shù)時間序列的預測模型Mα,Mβ。
(1)Dt←各期精度數(shù)據(jù):按照時間間隔τ對停車精度數(shù)據(jù)D進行劃分。
(2)fort=1,2,…,Tdo
(3)Xt← 原始分布:通過經(jīng)驗分布函數(shù)構造方法對各期精度數(shù)據(jù)Dt進行分布構造。
(4)Yt← 歸一化分布:對原始分布Xt進行歸一化操作,將分布值映射到[0,1]之間。
(5)αt,βt← Weibull分布參數(shù):通過對Yt進行Weibull分布擬合,估計出各期分布的分布參數(shù)。
(6)end for
(7)αt,βt← 參數(shù)時間序列:由兩個參數(shù)按各期時間順序排列構成。
(8)αtrain,βtrain和αtest,βtest←訓練序列和測試序列:由兩個參數(shù)時間序列分割成得到。
(9)Mα,Mβ← 預測模型:由訓練序列αtrain,βtrain作為SVR模型輸入,通過訓練得到。
(10)αp,βp← 預測結果:通過將待測時間序列分別輸入對應預測模型預測得到。
(11)Ynext← 通過預測得到的分布參數(shù)構造出下一時期的分布。
(12)最后,對預測得到的分布進行反歸一化并分析,如分布的期望和方差分析,進而給出列車停車狀況的評估。
3.3.1 統(tǒng)計指標
常用的預測模型的評價指標有:平均相對誤差ARE和均方根誤差RMSE等[14]。因此,本文采用這兩種指標對預測模型效果進行評價
(13)
(14)
3.3.2 分布相似性度量指標
為度量預測分布和真實分布的相似性,引入分布距離指標,然后基于分布距離構造相似性指標。這里采用常用的Hellinger距離(以下簡稱H-距離)。H-距離是一種度量分布差異性的距離指標[15-16]。它的定義可表述為,給定兩個離散概率分布P=[p1p2…pn]和Q=[q1q2…qn],這兩個分布的H-距離為
(15)
為了將分布差異性轉化為分布相似性,定義基于H-距離的分布相似性為
DS(P,Q)=1-H(P,Q)
(16)
若H(P,Q)越大,則分布P和Q的差異性越大。假設分布P和Q分別代表預測分布和真實分布,則DS(P,Q)值越大,表示預測分布越接近真實分布。
本文采用北京地鐵某條線一列車三年來的自動進站停車精度數(shù)據(jù),以間隔大于一年的兩期分布數(shù)據(jù)為例說明停車精度變化情況。由圖3可以看出,t+10期后的停車精度分布有向左偏移的趨勢;無論是停車精度分布的峰值(位置參數(shù)相關)還是分布跨度(尺度因子相關),都有一定量的變化。
圖3 停車精度經(jīng)驗分布的變化趨勢
針對北京地鐵某條線一列車自動停車精度統(tǒng)計值進行Weibull分布參數(shù)估計,得到的結果見表1(依據(jù)經(jīng)驗,時間間隔τ取30 d)。
表1 停車精度Weibull分布參數(shù)
通過Weibull分布對8期停車精度數(shù)據(jù)進行擬合得到圖4(橫坐標和縱坐標分別為精度值和其概率密度值(pdf))??梢钥闯?,從第t期到第t+7期的停車精度分布整體逐漸左移,且離散性變大。
圖5 尺度參數(shù)的實際值和預測值比較
圖5和圖6分別是尺度參數(shù)時間序列α和形狀參數(shù)時間序列β的預測結果??梢钥闯觯岢龅念A測模型能夠捕捉尺度參數(shù)和形狀參數(shù)的變化趨勢,準確地預測未來時期參數(shù)值。圖7通過對比預測參數(shù)下的精度分布和真實分布,定性地展示了預測的效果。可以看出,停車精度分布的預測效果(歸一化后)能夠和原始各期分布基本吻合。
圖6 形狀參數(shù)的實際值和預測值比較
圖7 停車精度預測分布和真實分布對比
表2從統(tǒng)計角度,通過RMSE和ARE指標評估了預測模型的表現(xiàn)效果,RMSE<0.09,兩個參數(shù)時間序列的預測效果較好,從而驗證了預測模型的有效性。
表2 預測結果的統(tǒng)計指標評價
圖8從分布相似性的角度(反歸一化后的預測結果與真實分布)給出了定量度量,預測分布和真實分布相似性的均值為0.953 3,驗證了提出算法的有效性。
圖8 預測分布和真實分布的相似性度量
本文通過對各期列車自動進站停車精度數(shù)據(jù)進行Weibull分布擬合,來描述各期列車自動停車的狀態(tài)。進而,取各期Weibull分布的特征參數(shù),即尺度參數(shù)和形狀參數(shù),來構造兩個特征時間序列。在此基礎上進行SVR模型訓練,得到兩個預測模型。采用預測模型對新一期的停車精度的兩個特征參數(shù)進行估計,從而得到新一期的列車自動停車精度的分布情況。通過北京地鐵某條線一列車自動進站停車精度數(shù)據(jù)的驗證分析,說明了本文提出的停車精度預測方法的有效性和準確性。