習(xí)佳星 沈 鋼 許承焯
(同濟大學(xué)鐵道與城市軌道交通研究院,201804,上?!蔚谝蛔髡?,碩士研究生)
輪緣是影響列車輪對導(dǎo)向和防止脫軌的關(guān)鍵部位。輪緣是否存在異常磨耗對線路運營安全至關(guān)重要。當(dāng)前對輪緣異常磨耗的研究較少:文獻[1]對深圳軌道交通9號線輪緣嚴(yán)重磨耗問題進行研究,通過比較左右側(cè)車輪輪緣磨耗量,發(fā)現(xiàn)輪對明顯磨耗不均勻;文獻[2]對上海軌道交通4號線列車運營期內(nèi)的輪緣萬km磨耗量進行計算,發(fā)現(xiàn)其顯著高于與其部分共線的3號線列車車輪輪緣磨耗量;文獻[3]對廣州軌道交通3號線頻繁鏇輪的現(xiàn)象進行分析,發(fā)現(xiàn)一段范圍內(nèi)輪緣厚度磨耗速率遠超出正常值。而輪緣異常磨耗研究尚缺少對輪緣磨耗監(jiān)控數(shù)據(jù)挖掘分析的有效方法。
輪緣磨耗異常值檢測常采用統(tǒng)計學(xué)方法、基于距離的方法和基于樹的方法等。箱線圖法是一種統(tǒng)計學(xué)方法,對數(shù)據(jù)分布類型沒有限制,抗干擾性好,其計算結(jié)果相對客觀[4]。孤立森林法是一種基于樹的方法,沒有利用距離或密度測量,具有簡單、高效的優(yōu)點[5]。本文基于某地鐵自動化采集設(shè)備采集的整列列車48個車輪的實測廓形數(shù)據(jù),分別采用箱線圖算法和孤立森林算法進行輪緣磨耗異常檢測。
基于某地鐵列車的實測廓形數(shù)據(jù),對輪緣厚度Sw按左右、軸位及動拖車分別進行計算分析,得到鏇修后列車運行里程L為1.2萬km至14.5萬km時,Sw在各維度下的磨耗情況,如圖1—圖3所示。
由圖1—圖3可知,該列車輪緣存在偏磨,但不同軸位、不同車輛的磨耗差異不明顯。可見,僅依靠輪緣厚度難以判斷輪緣是否存在異常磨耗。
圖1 左、右側(cè)的車輪Sw平均值變化
圖2 不同軸位的車輪Sw平均值變化
圖3 動車及拖車的車輪Sw平均值變化
輪緣根部是輪對自導(dǎo)向能力的關(guān)鍵部位,其磨損是導(dǎo)致輪緣磨耗的起因。如果輪緣根部發(fā)生磨耗,其輪徑差減小會導(dǎo)致輪對自導(dǎo)向能力減弱,當(dāng)車輛通過曲線時為防止脫軌,輪緣會與鋼軌內(nèi)軌面接觸并產(chǎn)生輪緣側(cè)磨。由此,本研究基于輪緣根部和側(cè)面磨耗規(guī)律選擇指標(biāo)。
輪緣根部發(fā)生磨耗后,在相同的橫移量下輪對所能產(chǎn)生的輪徑差減小,自導(dǎo)向能力減弱,車輪輪緣區(qū)段會與鋼軌產(chǎn)生磨耗。因此,本文擬定以輪緣根部的輪徑差變動量來衡量輪緣根部的磨耗。
現(xiàn)階段,相關(guān)單位將Sw作為輪緣側(cè)磨衡量指標(biāo)。Sw測量以名義滾動圓接觸點作為基準(zhǔn)。當(dāng)踏面名義滾動圓處存在磨耗時,可能出現(xiàn)圖4所示情況,即磨耗廓形Sw2與新廓形Sw1相等。此外,當(dāng)名義滾動圓處磨耗速率大于輪緣側(cè)磨速率時,可能表現(xiàn)出輪緣“假增厚”。因此,本文選用磨耗面積Aw來衡量輪緣側(cè)磨(圖4陰影)。將磨耗廓形與參考廓形作對比,Aw能直接表示輪緣的側(cè)磨量。
注:Sh1表示新廓形的輪緣高度,Sh2表示磨耗廓形的輪緣高度。
由上述輪緣磨耗規(guī)律,本研究以輪緣根部輪徑差之半(橫移量為12 mm)變化速率Rf和輪緣磨耗面積(法向磨耗面積,且距輪背橫向距離為20~30 mm區(qū)段)變化速率Ra為指標(biāo),對輪緣磨耗進行檢測辨識。
文獻[6]于1977年提出經(jīng)典的箱線圖理論。箱線圖主要由最小值、下四分位數(shù)Q1、中位數(shù)Q2、上四分位數(shù)Q3和最大值5個數(shù)值點組成,Q1與Q3的差值為四分位距IQR。本研究將樣本數(shù)據(jù)中大于Q3+1.5IQR或小于Q1-1.5IQR的值定義為異常值。
針對本研究中的監(jiān)控數(shù)據(jù)分別計算在連續(xù)里程區(qū)段內(nèi)各車輪輪緣磨耗速率的變化情況,識別出存在異常磨耗的車輪及其里程區(qū)段。以Ra為例,假設(shè)整列車各車輪輪緣側(cè)磨面積為Aw1,Aw2,Aw3,…,Awn,n為列車車輪樣本總數(shù)。用Awi,1,Awi,2,Awi,3,…,Awi,t,表示第i個車輪輪緣磨耗面積Awi下的t個有序趨勢值,設(shè)l為時間序列觀察窗口長度(l 1)計算得到各車輪在觀察窗口長度l內(nèi)的輪緣磨耗面積變化值ΔAwi,t和t時刻磨耗速率RAwi,t: ΔAwi,t=Awi,t-Awi,t-1,i=1,2,3,…,n (1) RAwi,t=ΔAwi,t/ΔL,i=1,2,3,…,n (2) 2)計算得到t時刻樣本數(shù)據(jù)內(nèi)各分位數(shù)所處位置Lp,t及數(shù)值Qp,t: 3)計算得到t時刻樣本數(shù)據(jù)內(nèi)的Ra最大值Qu,t: 4)判斷Awi,t≤Qu,t是否成立,若不成立則標(biāo)記為異常值。 5)更改時刻值t=t+l,并重復(fù)1)—4),完成對各個時刻測量值的異常狀態(tài)辨識。 圖5為箱線圖檢測識別算法的流程圖。 圖5 箱線圖檢測識別算法 根據(jù)箱線圖算法,將Ra換成Rf,同樣可以計算并觀察連續(xù)里程區(qū)段內(nèi)Rf的波動大小及異常狀況。 本文分別計算L為0~10.7萬km的車輪Ra和Rf的監(jiān)控數(shù)據(jù)分析結(jié)果。 選取典型的存在異常磨耗和正常磨耗車輪的監(jiān)控結(jié)果,如圖6及圖7所示。從圖6 a)中可知,當(dāng)L為1.7萬~5.7萬km及6.2萬~8.2萬km時,該車輪Ra超出最大值,識別出該車輪存在異常磨耗。同理,由圖7 a)可識別,當(dāng)L為8.7萬~10.2萬km時,該車輪存在異常磨耗。對比圖6 b)及圖7 b)中的正常磨耗車輪可見,各車輪輪緣磨耗速率基本在其磨耗速率均值曲線附近小幅度波動。 a)1軸左輪 由圖6及圖7可知,基于箱線圖的輪緣磨耗檢測識別方法能辨識出車輪存在異常磨耗的狀況,客觀地得到了各指標(biāo)的檢測識別結(jié)果。 a)23軸左輪 L為1.7萬~10.7萬km時,箱線圖算法有效辨識出的輪緣異常磨耗情況統(tǒng)計結(jié)果見表1。 L=10.5萬km時,整列車的輪緣法向磨耗面積均值、輪緣根部的輪徑差之半均值分別為8.18 mm2、0.95 mm;表1中1號、2號、28號、34號、41號、42號、46號和47號車輪的輪緣法向磨耗面積分別為19.71 mm2、14.43 mm2、8.94 mm2、13.77 mm2、9.57 mm2、9.58 mm2、8.64 mm2和8.30 mm2,3號、23號、34號、38號、41號、42號、43號、47號和48號車輪的輪緣根部輪徑差之半值分別為2.41 mm、2.64 mm、2.58 mm、1.72 mm、2.46 mm、1.34 mm、1.68 mm、1.37 mm和1.31 mm,都明顯高于平均水平,表現(xiàn)出磨耗異常。這與實際磨耗情況基本一致。 表1 箱線圖算法的磨耗異常檢測計算結(jié)果 周志華教授等于2008年在第八屆IEEE數(shù)據(jù)挖掘國際會議上提出孤立森林理論[7],提出異常數(shù)據(jù)可基于路徑長度被檢測出來。二叉搜索樹的平均路徑長度c(n)為: c(n)=2h(n-1)-2(n-1)/n (3) 其中n為樣本個數(shù);h(i)為調(diào)和數(shù),該值可被估計為h(i)=ln(i)+0.577 215 664 9(Euler常數(shù))。c(n)用來標(biāo)準(zhǔn)化樣本x的路徑長度h(x)。 異常分值s(x,n)用來判斷數(shù)據(jù)異常的程度,定義如下: s(x,n)=2-E(h(x))/c(n) (4) 其中E(h(x))為樣本x在一群孤立樹中的路徑長度的期望。 孤立森林算法在構(gòu)建孤立樹的過程中,存在分割數(shù)據(jù)隨機性較強的問題。對此,本文改進了孤立森林算法:先分析采樣數(shù)據(jù),判斷此樣本集是否適合構(gòu)造孤立樹,以避免隨機選擇的根節(jié)點中包含較多沒有離群點的樣本集;隨后,在構(gòu)造孤立樹時,用特定的切割點將孤立樹分成左右子樹。 對于數(shù)據(jù)集m,隨機選擇j個樣本點作為孤立樹根節(jié)點樣本,再隨機選擇其中一維作為切割屬性。由數(shù)據(jù)的分布特性可知,樣本點中超過上界值的概率很低。因此,若有數(shù)據(jù)點落在此區(qū)域外,則所選根節(jié)點樣本中包含異常點的可能性很大。如果樣本集中的最大值max(j)大于這個上界值,則將j樣本放入樹的根節(jié)點,否則構(gòu)建為1棵空樹。 在第一次選擇切割點時,取根節(jié)點樣本數(shù)據(jù)中相應(yīng)切割屬性下的上界值作為切割點。在下一個子空間選擇切割點時,則以該子樣本數(shù)據(jù)最大值zmax與最小值zmin之間的黃金分割點作為切割點。遞歸上述過程直到當(dāng)前子樹只包含1個數(shù)據(jù)點或達到最大限制的樹高。此樹定義為孤立樹。 孤立森林算法的改進去除了可能含有干擾屬性的孤立樹,加快了迭代,提高了運行效率及穩(wěn)定性。 結(jié)合Ra和Rf綜合計算各車輪輪緣磨耗速率的異常得分s(j,m)。具體流程如下: 步驟1:初始化孤立森林。設(shè)置孤立樹分叉的最大限制高度。 步驟2:初始化生成孤立樹算法參數(shù)。輸入數(shù)據(jù)集m,該數(shù)據(jù)集存入的是鏇修后10.7萬km里程范圍內(nèi)48個車輪的輪緣磨耗速率值,具有Ra和Rf2個指標(biāo)維度。生成孤立樹的總數(shù)即是數(shù)據(jù)集的采樣次數(shù)為T,采樣大小為j。樣本中的2個指標(biāo)維度即代表孤立樹分叉過程中的2種切割屬性。 步驟3:判斷當(dāng)前磨耗速率樣本數(shù)據(jù)中的最大值max(j)>上界值(由樣本數(shù)據(jù)的分布特性確定)是否成立。若不成立,則舍棄該樣本集,重新選取1個樣本集。 步驟4:隨機選擇1個指標(biāo)維度作為切割屬性,選擇相應(yīng)上界值作為初次切割點p,在選取的指標(biāo)維度下對磨耗速率樣本集中的數(shù)據(jù)進行比較,磨耗速率≥p的放在右子樹,磨耗速率 步驟5:判斷樣本集的分割是否達到最大限制高度或者當(dāng)前子樣本中是否只有1個磨耗速率數(shù)據(jù)點。若是,則完成對樣本集的1次計算,并且開始構(gòu)建下一個樣本集。 步驟6:遞歸構(gòu)造孤立子樹,即不斷分叉。左子樹(即磨耗速率數(shù)據(jù)的子樣本集)選擇數(shù)據(jù)最大值與最小值之間的0.618比例處(即zmin+0.618×(zmax-zmin))為切割點;右子樹相應(yīng)選擇0.382比例處(zmin+0.382×(zmax-zmin))作為切割點。選擇黃金分割點可減小切割隨機性,能讓孤立樹在生成子空間時每次都切割為與樣本父節(jié)點均等比例大小的左右子樹[5];并且2個分割點比例之和為1,可使得構(gòu)造子樹時迭代速度加快,且具有一定穩(wěn)定性[7]。 步驟7:重復(fù)步驟6,完成每棵孤立樹的構(gòu)建。 步驟8:重復(fù)步驟3—步驟7,遍歷所有孤立樹。設(shè)定檢測閾值Sm,計算得到s(j,m),將磨耗速率得分超過閾值的數(shù)據(jù)點確定為異常點。 圖8為改進后的孤立森林算法流程圖。采用改進后的孤立森林算法對L<10.7萬km的列車車輪輪緣磨耗情況進行計算。 圖8 改進后的孤立森林檢測識別算法 表2為L<10.7萬km,選用不同Sm時,改進后的孤立森林算法對存在異常磨耗的車輪及其里程區(qū)段的辨識結(jié)果。和表1對照的誤報情況見表3。其中誤報車輪數(shù)是將正常磨耗車輪監(jiān)測為異常磨耗車輪的個數(shù),總誤報次數(shù)為誤報車輪數(shù)與非連續(xù)區(qū)段對應(yīng)誤報次數(shù)乘積的總和。 由表3可知,改進后的孤立森林算法所得異常檢測結(jié)論與箱線圖算法所得結(jié)論較一致,兩種算法檢測出來的存在異常磨耗的車輪及其里程區(qū)段結(jié)果基本一致,驗證了兩種算法應(yīng)用于地鐵車輪輪緣磨耗異常檢測的可行性。 由表2及表3還可看出:當(dāng)Sm為0.820~0.831時,能辨識出存在異常磨耗的車輪及其里程區(qū)段,存在1~3個車輪誤報的情況;當(dāng)Sm減小至0.800時,總誤報次數(shù)相對增加;當(dāng)Sm為0.832~0.930時,出現(xiàn)不能辨識出車輪存在異常磨耗的狀況??梢?,過高的閾值降低了算法辨識的準(zhǔn)確性。 表2 不同Sm下的異常辨識結(jié)果 表3 不同Sm下的異常辨識誤報情況統(tǒng)計結(jié)果 當(dāng)Sm=0.831時,L分別為1.97萬km、4.01萬km和9.35萬km時的輪緣磨耗檢測識別結(jié)果如圖9所示。由圖9 a)可知,Sm=0.831,L=1.97萬km時,1號、42號輪被辨識為異常點,且明顯與同列車其余位置的車輪區(qū)分開來;圖9 b)中的孤立分?jǐn)?shù)結(jié)果顯示,1號、42號輪的s(j,m)值高于Sm。分析圖9 c)—圖9 f),同樣可得類似結(jié)論。這說明改進后的孤立森林算法能夠較好地辨識出存在異常磨耗的車輪及其里程區(qū)段,得到相應(yīng)的綜合檢測識別結(jié)果。 a)磨耗速率異常辨識(L=1.97萬km) 本文基于某地鐵列車48個車輪的實測廓形數(shù)據(jù),結(jié)合輪緣磨耗面積變化速率和輪緣根部輪徑差變化速率,對大量實測數(shù)據(jù)進行了有效分析和處理,提出了兩種能檢測和辨識出存在異常磨耗的車輪及對應(yīng)里程區(qū)段的數(shù)據(jù)挖掘的方法。 箱線圖法具有好的抗干擾能力,對數(shù)據(jù)類型沒有限制。本文通過箱線圖算法完成了對指標(biāo)的單獨檢測,得到客觀的統(tǒng)計結(jié)果,能很好地辨識出異常磨耗的車輪及其對應(yīng)里程。 本文對孤立森林算法中生成孤立樹及分割成左右子樹的過程進行了優(yōu)化改進,提高了計算效率。通過改進后的孤立森林算法完成了對指標(biāo)的綜合檢測。經(jīng)比較,改進后的孤立森林算法與箱線圖法可以得到較一致的磨耗異常檢測結(jié)論,驗證了兩種方法的可行性。此外,在改進后的孤立森林算法中,閾值設(shè)為0.820~0.831時的檢測可靠性最好。3 基于孤立森林算法的磨耗檢測
3.1 孤立森林相關(guān)概念
3.2 孤立森林算法的改進
3.3 改進算法流程及結(jié)果分析
4 結(jié)語