鄧連波,梅宏達(dá),周文梁,靜恩偉
(中南大學(xué) 交通運(yùn)輸工程學(xué)院,湖南 長沙 410075)
在發(fā)展綠色交通、建設(shè)節(jié)約型城市的背景下,我國城市軌道交通得到了快速發(fā)展。截至2019 年年底,中國大陸地區(qū)共40 個城市開通城軌交通運(yùn)營線路208 條[1]。我國城市軌道交通在跨越式發(fā)展的同時也面臨著運(yùn)營成本高、治理水平有待提升等諸多問題。因此保持和降低城市軌道交通的能耗水平,有助于發(fā)揮城市軌道交通的優(yōu)勢,保持城市軌道交通競爭力。列車運(yùn)行能耗一般占列車能耗的50%以上,在運(yùn)營支出中占較大比重[2]。一般考慮區(qū)間運(yùn)行時分范圍要求,以優(yōu)化列車運(yùn)行能耗值為目標(biāo),通過列車運(yùn)行曲線優(yōu)化來獲得合理的區(qū)間運(yùn)行時分和列車運(yùn)行能耗[3?8]。然而,由于區(qū)間平縱斷面和列車運(yùn)行控制過程的復(fù)雜性,給定運(yùn)行時分下的最優(yōu)能耗牽引運(yùn)行曲線往往很難獲得。為建立區(qū)間運(yùn)行時分和最優(yōu)能耗值的關(guān)系規(guī)律,數(shù)據(jù)擬合方法是較為合適的方法。擬合曲線可以直觀地顯示出離散數(shù)據(jù)的變化趨勢,在工程實際中具有廣泛的應(yīng)用[9?14]。其中用于擬合的數(shù)據(jù)點(diǎn)集的選取直接影響到最終擬合曲線的精度和效果,因此選擇合適的擬合數(shù)據(jù)點(diǎn)集十分關(guān)鍵,針對特定問題,REZA 等[9]設(shè)計粒度框回歸方法消除偏離擬合曲線的異常值,HASSAIN 等[10]利用奇異譜分析消除數(shù)據(jù)集噪聲。姜大治等[13]利用多項式擬合外推模型對大量實測數(shù)據(jù)進(jìn)行雙向檢驗剔除異常數(shù)據(jù)。本文所獲取的列車區(qū)間運(yùn)行數(shù)據(jù),是指在當(dāng)前所研究區(qū)間和線路方向上,每一次列車在區(qū)間運(yùn)行的實際數(shù)據(jù),包括區(qū)間實際列車運(yùn)行曲線數(shù)據(jù)、所對應(yīng)的運(yùn)行時分及其對應(yīng)的運(yùn)行能耗。本文將區(qū)間運(yùn)行時分和對應(yīng)能耗值二維數(shù)據(jù)作為樣本點(diǎn)的樣本信息,建立城軌列車區(qū)間運(yùn)行樣本數(shù)據(jù)集,以區(qū)間運(yùn)行時分及其最優(yōu)能耗值曲線擬合為研究對象,力圖挖掘兩者間的變化規(guī)律,確立基于實際列車運(yùn)行數(shù)據(jù)的區(qū)間運(yùn)行時分-最優(yōu)列車運(yùn)行能耗關(guān)系曲線,為城市軌道交通列車運(yùn)行策略選擇和能耗評價提供依據(jù)。
城軌列車運(yùn)行工況策略和控制參數(shù)的微小改變都會引起曲線及其運(yùn)行時分、運(yùn)行能耗的變化,司機(jī)駕駛水平也存在差異,造成了列車區(qū)間實際運(yùn)行數(shù)據(jù)的多樣性,相同的運(yùn)行時分也可能對應(yīng)著多條不同的列車運(yùn)行曲線。
依據(jù)區(qū)間運(yùn)行數(shù)據(jù)樣本集可探究區(qū)間運(yùn)行時分和最優(yōu)能耗值的關(guān)系規(guī)律。但若保留樣本集中能耗較高、明顯較差的數(shù)據(jù)點(diǎn)會使得兩者間關(guān)系呈無序狀態(tài),因此需要結(jié)合數(shù)據(jù)特點(diǎn)構(gòu)建時分?能耗數(shù)據(jù)點(diǎn)的劣解判別規(guī)則,從原始數(shù)據(jù)集中剔除能耗值不合理數(shù)據(jù),篩選出較優(yōu)的時分-能耗數(shù)據(jù)點(diǎn)集,以保證能耗曲線的擬合效果。首先通過兩兩數(shù)據(jù)點(diǎn)相互比較,構(gòu)建劣點(diǎn)判別規(guī)則,剔除明顯較差的劣點(diǎn);再根據(jù)多數(shù)據(jù)點(diǎn)間的能耗分布趨勢,進(jìn)一步剔除相對較差的數(shù)據(jù)點(diǎn),將最終篩選后的數(shù)據(jù)點(diǎn)作為最優(yōu)擬合數(shù)據(jù)點(diǎn)集。
盡管區(qū)間運(yùn)行時分與列車運(yùn)行曲線可能具有一對多的關(guān)系,但該區(qū)間每一運(yùn)行時分應(yīng)具有唯一的最優(yōu)能耗。研究表明,最優(yōu)能耗和運(yùn)行時分成負(fù)相關(guān)關(guān)系。因此,可根據(jù)列車運(yùn)行數(shù)據(jù)樣本的相互關(guān)系對劣解進(jìn)行判定。以圖1 所示的7 個樣本數(shù)據(jù)點(diǎn)集為例,根據(jù)最優(yōu)能耗與區(qū)間運(yùn)行時分的反比關(guān)系,因為TB>TA,故TB下最優(yōu)能耗EB必定小于EA,因此需要剔除B點(diǎn),同理相比C點(diǎn)需剔除D點(diǎn)。
基于最優(yōu)解規(guī)律,構(gòu)建從原始數(shù)據(jù)點(diǎn)集P篩選剔除相對劣點(diǎn)的判別規(guī)則如下:
?p1(E1,T1),p2(E2,T2)∈P,若E1=E2,T1>T2,則稱p1劣于p2。
?p1(E1,T1),p2(E2,T2)∈P,若T1=T2,E1>E2,,則稱p1劣于p2。
?p1(E1,T1),p2(E2,T2)∈P, 若T1≥T2,E1>E2則稱p1劣于p2。
算法1 基于數(shù)據(jù)比較的劣點(diǎn)判別和剔除算法
Step 1 將原始數(shù)據(jù)點(diǎn)集P中所有時分-能耗點(diǎn)按照運(yùn)行時分T的大小升序排列,設(shè)有序集P的元素數(shù)量為|P|,記初始元素數(shù)量為Num。
Step 3 若i 在該算法中,采用基于數(shù)據(jù)比較的劣點(diǎn)判別規(guī)則初步剔除質(zhì)量明顯較差的B,D兩點(diǎn),如圖2所示,獲得擬合數(shù)據(jù)點(diǎn)備選集Ps={A,E,F,C,G},從備選集中進(jìn)一步篩選可得最優(yōu)擬合數(shù)據(jù)點(diǎn)集P*。 篩選后的擬合數(shù)據(jù)點(diǎn)備選集Ps中,某些點(diǎn)不符能耗變化趨勢,會引起擬合誤差,使得曲線擬合效果較差,不適合包含于擬合點(diǎn)集中。由圖2中可看出,A,C和G均必須包含在擬合點(diǎn)集內(nèi),而E,F(xiàn)若處于擬合點(diǎn)集內(nèi),勢必會影響曲線走勢。為此需要確定最優(yōu)的擬合數(shù)據(jù)點(diǎn)集P*?Ps,使得擬合曲線具有較好的優(yōu)化效果。 圖2 剔除能耗較高“劣點(diǎn)”Fig.2 Eliminate outliers with high energy consumption 為了盡可能保留能耗更低的數(shù)據(jù)點(diǎn),對Ps內(nèi)任意2點(diǎn)連線,剔除位于連線線段上方的點(diǎn),只保留下方的邊界點(diǎn),如圖3所示。基于上述思想構(gòu)造算法如下: 圖3 剔除影響曲線走勢的數(shù)據(jù)點(diǎn)Fig.3 Eliminate points which affect the curve trend Step 4 重復(fù)上述操作,直至構(gòu)造的向量中再次含有點(diǎn)S2,至此提取出所有的邊界點(diǎn)。 Step 5 將邊界點(diǎn)子集BR中所有點(diǎn)按照運(yùn)行時分T的大小升序排列,作直線連接首末2點(diǎn),剔除位于直線上方的點(diǎn),僅保留下方邊界點(diǎn)至最終的最優(yōu)擬合數(shù)據(jù)點(diǎn)集P*中。 針對圖1所示的原始數(shù)據(jù)點(diǎn)集,通過上述劣點(diǎn)判別的算法1 和算法2,可獲得最優(yōu)擬合數(shù)據(jù)點(diǎn)集P*={A,C,G}。 對某一選定的列車運(yùn)行數(shù)據(jù)集,由每一數(shù)據(jù)點(diǎn)的運(yùn)行能耗和運(yùn)行時分值構(gòu)成二維數(shù)據(jù)散點(diǎn),這些二維數(shù)據(jù)散點(diǎn)可擬合成運(yùn)行時分-能耗曲線。B 樣條具有表示與設(shè)計自由型曲線曲面的強(qiáng)大功能,是最廣泛流行的形狀數(shù)學(xué)描述的主流方法之一。因此對于基于列車運(yùn)行數(shù)據(jù)形成的時分-能耗平面上,待擬合數(shù)據(jù)構(gòu)成的有序二維點(diǎn)集,可以通過B樣條方法擬合出區(qū)間運(yùn)行時分-能耗曲線[14]。 將前述最優(yōu)擬合數(shù)據(jù)點(diǎn)集P*作為待擬合的有序數(shù)據(jù)點(diǎn)集Q={qi(Ei,Ti),i= 1,…,m},對應(yīng)參數(shù)向量T={ti,i= 1,…,m},在節(jié)點(diǎn)向量U={u0=…=uk≤uk+1≤…≤un≤un+1= …=un+k+1}上定義k次(k+ 1階)B樣條曲線為: 其中N為B 樣條基函數(shù)矩陣,Q為平面有序數(shù)據(jù)點(diǎn)陣,如果確定了參數(shù)向量T和節(jié)點(diǎn)向量U,即求得基函數(shù)矩陣N,則可求得控制頂點(diǎn)陣D的近似解為: 由上述原理可知,B樣條擬合的關(guān)鍵是求出待擬合數(shù)據(jù)點(diǎn)集的參數(shù)向量T和節(jié)點(diǎn)向量U,通常的方法是固定節(jié)點(diǎn)向量不變,再通過均勻取值、累加弦長等方法選取參數(shù)向量或是先通過累加弦長法確定參數(shù)向量,再計算節(jié)點(diǎn)向量,如此得到的擬合曲線精度不高,難以達(dá)到最佳擬合[15?16]。因而本文擬采用遺傳算法,考慮到參數(shù)向量和節(jié)點(diǎn)向量之間的內(nèi)在聯(lián)系,即當(dāng)參數(shù)向量和控制頂點(diǎn)數(shù)確定時,通過平均有序參數(shù)法可以直接計算出合適的節(jié)點(diǎn)向量,如此確保每個相鄰的節(jié)點(diǎn)區(qū)間至少對應(yīng)一個數(shù)據(jù)點(diǎn),擬合曲線具有較高的保真性[17?19]。將B 樣條曲線的擬合問題轉(zhuǎn)化為利用遺傳算法尋求最優(yōu)參數(shù)向量和控制頂點(diǎn)數(shù)問題,降低了算法的復(fù)雜度。 1) 算法相關(guān)參數(shù)和符號定義 表1 算法符號定義Table1 Notation in algorithm 2) 初始種群的選擇和染色體編碼 本文根據(jù)B樣條擬合方法的特性,隨機(jī)生成大小為N的初始種群H。本文采取實數(shù)編碼,種群中每一個個體的染色體為m+ 1 維遞增實數(shù)向量,如式所示: 其中染色體的前m個基因代表與待擬合數(shù)據(jù)相對應(yīng)的參數(shù)向量,在區(qū)間[0,1]內(nèi)隨機(jī)選取,保證G1=0,G2= 1,G1,G2,…Gm遞增;染色體的第m+ 1 個基因代表控制頂點(diǎn)數(shù),這里采用3 次B 樣條擬合,故控制頂點(diǎn)的數(shù)目至少為4 個,Gm+1在區(qū)間[4,m]隨機(jī)選取即可。 3) 適應(yīng)度函數(shù) 為了用盡可能少的控制頂點(diǎn)繪制出最小二乘擬合誤差較小的擬合曲線,本文的適應(yīng)度函數(shù)如式(7)所示: 其中,SSE為擬合的最小二乘誤差,λ是控制頂點(diǎn)數(shù)的權(quán)重系數(shù),其大小影響最終解的控制頂點(diǎn)數(shù)量,一般控制頂點(diǎn)越多,擬合精度越高,但容易陷入“過擬合”。 4) 交叉操作 種群個體染色體的前m個基因代表參數(shù)向量,故交叉后得到的新染色體同樣應(yīng)當(dāng)保持參數(shù)向量遞增的特性,基于此采取線性交叉方法。 種群中隨機(jī)選取不相同的2個個體h1,h2,在區(qū)間[0,1]之間生成的隨機(jī)數(shù)r,若r<ρc,則執(zhí)行線性交叉,交叉后產(chǎn)生的新個體計算公式如下: 其中s為區(qū)間[0,1]之間生成的隨機(jī)數(shù),如此交叉后的新個體的前m個基因仍舊保持遞增,再對染色體的第m+ 1個基因四舍五入取整數(shù)即可。 同時基于優(yōu)勢遺傳的思想,使得適應(yīng)度較高的優(yōu)良個體的交叉概率較適應(yīng)度較低的個體更大,以保證優(yōu)勢基因能夠遺傳給子代,從而提升算法的尋優(yōu)能力,本文根據(jù)種群的適應(yīng)度值設(shè)計動態(tài)交叉概率ρc如式(9)所示: f1為待交叉2 個個體中較大的適應(yīng)度值,f2為待交叉2個個體中較小的適應(yīng)度值。 5) 變異操作 根據(jù)編碼方式和染色體基因特點(diǎn),采取單點(diǎn)變異方法,種群中每一個個體染色體上的每一位基因都可能發(fā)生變異。 記個體為h1={G1,G2,…Gm,Gm+1},對其每一個基因Gi,i= 1,2…m,m+ 1,在區(qū)間[0,1]之間生成的隨機(jī)數(shù)r,若r<ρu,則執(zhí)行單點(diǎn)變異,變異后新個體的基因值G'i由下式計算: 其中s為區(qū)間[0,1]之間生成的隨機(jī)數(shù)。 同樣基于優(yōu)勢遺傳的思想,使得適應(yīng)度高的優(yōu)良個體以較低概率變異以便保留優(yōu)勢基因,適應(yīng)度低的個體以較高概率變異以尋求新的優(yōu)化方向,如此可以避免算法陷入局部最優(yōu)。本文根據(jù)種群適應(yīng)度值設(shè)計動態(tài)變異概率如式(10)所示: 其中,f為待變異個體的適應(yīng)度值。 6) 選擇操作 本文選取適值比例法即輪盤賭模型,計算父代個體染色體集合H以及通過交叉和變異產(chǎn)生的子代染色體集合R中染色體的適應(yīng)度值,進(jìn)而依據(jù)每個染色體的適值比例來確定相應(yīng)個體的選擇概率,從中選擇新一代種群。 基于上述思想,設(shè)計擬合算法如下: 算法3 基于遺傳算法的B樣條擬合算法 Step 1 輸入B 樣條曲線次數(shù)k,待擬合數(shù)據(jù)點(diǎn)集Q={qi(Ei,Ti),i= 1,…,m},種群大小N,最大進(jìn)化代數(shù)tmax以及給定擬合精度ε。隨機(jī)生成初始種群后,記迭代次數(shù)t= 1。 Step 2 計算初始種群每個個體的適應(yīng)度值,種群的平均適應(yīng)度值fmean,種群中個體的最大適應(yīng)度值fmax和種群中個體的最小適應(yīng)度值fmin。 Step 3 從種群中隨機(jī)選取交叉?zhèn)€體對,計算其交叉概率ρc,通過線性交叉方法產(chǎn)生新個體,記錄交叉后子代染色體集合Rc。 Step 4 依次選取種群中個體,計算其變異概率ρu,對該個體每個基因執(zhí)行單點(diǎn)變異操作,如果發(fā)生變異,記錄變異后子代染色體集合Ru。 Step 5 計算子代染色體集合R的適應(yīng)度值,通過輪盤賭模型,在原父代種群H和子代種群R中選擇大小為N的新一代種群。 Step 6 判斷是否滿足t>tmax或種群中個體的最小誤差SSE≤ε的終止條件,如果不滿足,令t=t+1,重復(fù)Step 2~Step 5。 采用某城市地鐵列車在同一區(qū)間的列車運(yùn)行數(shù)據(jù),構(gòu)成如圖4所示的區(qū)間運(yùn)行時分和相應(yīng)的能耗值原始數(shù)據(jù)散點(diǎn)圖。 基于算法1 和算法2 獲得最優(yōu)擬合數(shù)據(jù)點(diǎn)集P*,如圖5所示。擬合算例參數(shù)設(shè)置如表2所示。 針對最優(yōu)擬合數(shù)據(jù)集P*,采用算法3進(jìn)行曲線優(yōu)化擬合,迭代過程如圖6 所示。圖中可以看出,種群平均適應(yīng)度快速趨于穩(wěn)定狀態(tài),擬合誤差隨著遺傳代數(shù)的增加下降也很快,至第157代擬合誤差SSE=0.009 43,即可達(dá)到擬合精度要求。說明算法3的尋優(yōu)能力較強(qiáng),擬合精度高,收斂速度快。 為分析本文數(shù)據(jù)篩選和優(yōu)化擬合方法的效果,將經(jīng)過算法2 優(yōu)化后的擬合曲線與算法1 簡單剔除能耗劣點(diǎn)得到的擬合曲線結(jié)果進(jìn)行比較,如圖7所示。雖然圖中二者的整體趨勢相近,但經(jīng)局部放大后不難看出,最優(yōu)擬合曲線更為光滑,整體位于對比擬合曲線下方,說明優(yōu)化后的擬合曲線能耗更優(yōu)。 圖7 擬合曲線對比圖Fig.7 Comparison of fitting curves 同時,將本文提出的擬合方法與相同擬合數(shù)據(jù)集下的2 層BP 神經(jīng)網(wǎng)絡(luò)擬合方法、經(jīng)典3 次多項式擬合方法進(jìn)行對比,如圖8 所示。3 種擬合方法得到的擬合曲線走勢基本相同,但局部放大可明顯看出本文所采用的擬合方法整體能耗更優(yōu)。 圖8 不同擬合方法對比Fig.8 Comparison of different fitting methods 1) 結(jié)合數(shù)據(jù)特點(diǎn)構(gòu)建基于數(shù)據(jù)比較和基于能耗變化趨勢的劣點(diǎn)判別規(guī)則,從原始數(shù)據(jù)集中剔除能耗不合理和能耗值較高數(shù)據(jù),篩選出較優(yōu)的時分-能耗數(shù)據(jù)點(diǎn)集,縮減了列車運(yùn)行數(shù)據(jù)集規(guī)模,保證了曲線擬合質(zhì)量。 2) 提出基于遺傳算法的B 樣條擬合方法,在經(jīng)典B樣條擬合方法中結(jié)合遺傳算法尋求最優(yōu)的參數(shù)向量和節(jié)點(diǎn)向量,擬合精度高,收斂速度快,擬合曲線具有較高的保真性。 基于城軌區(qū)間實際運(yùn)行數(shù)據(jù)的運(yùn)行時分?最優(yōu)能耗值函數(shù)的擬合方法具有一定的實踐意義,突破了區(qū)間運(yùn)行時分和運(yùn)行能耗優(yōu)化的理論局限。最優(yōu)能耗擬合曲線可用于區(qū)間運(yùn)行時分選擇、運(yùn)行圖能耗評估、司機(jī)工作考核等方面。1.2 基于能耗變化趨勢的劣點(diǎn)判別規(guī)則
2 基于遺傳算法的B樣條擬合方法
2.1 給定數(shù)據(jù)集下的B樣條擬合方法
2.2 B樣條擬合的遺傳算法設(shè)計
3 實例分析
4 結(jié)論