陳振虹, 劉彬
(1.中國鐵路廣州局集團有限公司廣州動車段,廣東廣州 510088;2.中國國家鐵路集團有限公司機輛部,北京 100844)
安全管控是高速鐵路各項工作的重中之重。我國高速鐵路運營里程已突破3.5萬km,動車組保有量超過3 000標準組。高速鐵路建設(shè)初期,為保障行業(yè)發(fā)展基礎(chǔ)和最大化滿足人民群眾安全出行需求,在不斷前置現(xiàn)場安全管理的同時努力提升設(shè)備運用率[1]。隨著供需矛盾的逐步緩解,形勢在發(fā)生質(zhì)的變化,啟動安全性、可用性及經(jīng)濟性指標綜合優(yōu)化工作,推動動車組修程修制改革[2-3]。實際工作中,傳統(tǒng)安全管理工作方式面臨著一些體系性的瓶頸。大數(shù)據(jù)時代的到來為進一步提升安全管理能力提供了思維的變革和有力武器。大數(shù)據(jù)應(yīng)用可細分為多個維度,關(guān)鍵是應(yīng)用大數(shù)據(jù)思維去解決具體問題,不局限于使用純粹的大數(shù)據(jù)軟件及硬件。中國國家鐵路集團有限公司(簡稱國鐵集團)適時組織全路力量,啟動了基于大數(shù)據(jù)的安全規(guī)律分析課題和平臺建設(shè)工作,在我國“一帶一路”倡議下,對提升高速鐵路行業(yè)軟實力影響深遠。首先研究涉及項目的總體性問題;在此基礎(chǔ)上按照數(shù)據(jù)獲取與清洗及分析、挖掘的順序,對各階段出現(xiàn)的難點進行綜合分析,提出可行的優(yōu)化方案。
(1)明確頂層規(guī)劃及工作界面。大數(shù)據(jù)分析工作受到各層面的高度關(guān)注。項目與當前熱度較高的技術(shù)概念幾乎都有關(guān)聯(lián)和交叉,如大數(shù)據(jù)和故障預(yù)測與健康管理(Prognostics and Health Management,PHM)的關(guān)系,大數(shù)據(jù)的工作可以支持PHM,但大數(shù)據(jù)的工作目標不一定是實現(xiàn)PHM。推進PHM建設(shè)也可以使用大數(shù)據(jù)外的其他技術(shù)。
規(guī)劃階段可綜合考慮對后續(xù)其他擴展性應(yīng)用的支持,但項目實際實施需要總體考慮工作界面及可行性,避免出現(xiàn)項目范圍過大難以落地的情況。應(yīng)明確區(qū)分大數(shù)據(jù)與PHM的范疇,合理設(shè)置與PHM的銜接界面,有序規(guī)劃。
(2)強化平臺為主的概念。從長期運用的角度統(tǒng)籌考慮,需強調(diào)“平臺”的概念。在此基礎(chǔ)上把10年數(shù)據(jù)分析作為大數(shù)據(jù)平臺的試點及應(yīng)用場景之一。按照平臺的定位進行推進,可避免系統(tǒng)僅按照當前發(fā)展階段的口徑要求定制設(shè)計,導(dǎo)致功能過于單一。
以安全數(shù)據(jù)為基礎(chǔ),除了傳統(tǒng)安全責(zé)任分析外,其他領(lǐng)域也應(yīng)兼顧展開。例如:可能某些事故雖從責(zé)任角度定責(zé)為其他甚至是非責(zé)任,但如果該問題發(fā)生頻次較高,則應(yīng)研究是否存在其他方面的問題,如是否可從新角度進行動車組優(yōu)化改進,目標是大幅降低此類問題的發(fā)生概率。此種數(shù)據(jù)分析使用的方案借助平臺實現(xiàn)了安全驅(qū)動下的設(shè)計優(yōu)化閉環(huán),此外也可在高速鐵路同路外單位的接口優(yōu)化、安全管理培訓(xùn)輸入等多個維度進行擴展。
平臺建設(shè)應(yīng)適當優(yōu)化管理深度,避免管得過深,拘泥于細節(jié)。不同管理層級對安全管理的范圍和標準并不一致,對系統(tǒng)需求目標也不盡相同。
在鐵路安全平臺建設(shè)上,應(yīng)進一步提升平臺系統(tǒng)本身的靈活性,既發(fā)揮全路管理優(yōu)勢,具有全路整體性的功能,同時也可以為各鐵路局集團公司提供二次開發(fā)的基礎(chǔ)平臺,并為全路管理政策的調(diào)整預(yù)留空間。此外,在數(shù)據(jù)方面應(yīng)同時研究數(shù)據(jù)脫敏處理方案。
為實現(xiàn)預(yù)留功能擴展的要求,建議系統(tǒng)架構(gòu)上明確區(qū)分基礎(chǔ)數(shù)據(jù)和擴展數(shù)據(jù),避免信息化推進過程中業(yè)務(wù)數(shù)據(jù)的處理概念不夠清晰。從既有數(shù)據(jù)中分離出基礎(chǔ)數(shù)據(jù),基礎(chǔ)數(shù)據(jù)應(yīng)盡量選擇具有相對客觀屬性的字段,如故障現(xiàn)象、發(fā)生時分、擔(dān)當人員、晚點時間等,此類數(shù)據(jù)應(yīng)為不隨管理政策變化而變化的數(shù)據(jù)。其他派生性數(shù)據(jù)納入擴展數(shù)據(jù),如動車組具體運用問題是否納入安監(jiān)報-1。不同發(fā)展階段結(jié)合實際需要管理口徑會有動態(tài)調(diào)整,從更長時間周期的角度,會有數(shù)據(jù)口徑不一致的問題。通過派生數(shù)據(jù)的分離處理,可進行多版本保留,滿足不同維度的統(tǒng)計和轉(zhuǎn)換需求。
對于非結(jié)構(gòu)化的字段進行計算處理,由于基礎(chǔ)工具需要根據(jù)鐵路業(yè)務(wù)進行開發(fā)并通過模型訓(xùn)練逐步成熟,可考慮采用分步實施的方案,同步進行手工和自動的字段化處理。
此種處理方法的好處在于可同步開展工作,以字段化作為獨立分析途徑,也可對非結(jié)構(gòu)化的大數(shù)據(jù)運算結(jié)果進行評估。
以上頂層規(guī)劃進一步明晰后,便于主體框架明晰,各項工作有的放矢且邊界清晰,避免項目反復(fù)。
數(shù)據(jù)來源是大數(shù)據(jù)分析的關(guān)鍵基礎(chǔ)。動車組數(shù)據(jù)來源非常廣泛,除了車載列車網(wǎng)絡(luò)中的各類診斷數(shù)據(jù)外,還有大量如動車組管理信息系統(tǒng)(EMIS)、動車組運行故障圖像檢測系統(tǒng)、車輛滾動軸承故障軌邊聲學(xué)診斷系統(tǒng)、車輛運行品質(zhì)軌邊動態(tài)監(jiān)測系統(tǒng)、動車段所輪緣踏面檢測裝置以及車輪車床等各類監(jiān)測、維修數(shù)據(jù),同時客票等信息也可作為寶貴的數(shù)據(jù)。但實際推進中,很多數(shù)據(jù)由于數(shù)據(jù)規(guī)范及設(shè)備互聯(lián)互通軟硬件技術(shù)限制,實際上難以一次到位。實際項目實施必須采取謹慎評估、抓大放小、分類實施的方案。從國外項目看,德國西門子股份公司在推進軌道交通智能數(shù)字化分析Railigent?平臺時,也沒有一次性把所有系統(tǒng)數(shù)據(jù)全數(shù)獲取,而是主要集中于拓展車載診斷信息落地的分析應(yīng)用。
結(jié)合EMIS中既有數(shù)據(jù)情況,經(jīng)過數(shù)據(jù)范圍的可行性評估,對事故及安監(jiān)報-1故障等核心基礎(chǔ)數(shù)據(jù)進行階段攻關(guān),力爭做到數(shù)據(jù)完備。在此基礎(chǔ)上,逐步納入前述其他各類數(shù)據(jù)信息,為后續(xù)工作全面開展做好規(guī)劃。
實際推進過程中,部分專業(yè)項目組反復(fù)面對原始數(shù)據(jù)的質(zhì)量問題。
長時間跨度的歷史數(shù)據(jù)往往都存在一些不完美之處。從動車組專業(yè)角度看,我國動車組裝備的配套運用維修技術(shù)沒有同步引進,基本是逐步摸索發(fā)展形成的。EMIS各模塊根據(jù)實際運用需求陸續(xù)開發(fā),因此或多或少會存在早期數(shù)據(jù)錄入不全的情況。同時,隨著動車組運用檢修管理的深入,信息系統(tǒng)部分協(xié)議和字段的升級優(yōu)化(如動車組編號)也會導(dǎo)致歷史數(shù)據(jù)與當前數(shù)據(jù)有很大不同,這些情況會導(dǎo)致一些數(shù)據(jù)的不完備或格式等方面的不一致。
大數(shù)據(jù)技術(shù)的特性之一是接納非理想化數(shù)據(jù),雖然較難使用在一些如銀行賬務(wù)結(jié)算的場景,但在總體決策建議領(lǐng)域具有很高價值。需要研究如何接受不確定性,利用非結(jié)構(gòu)化數(shù)據(jù)發(fā)掘出更多有價值的信息。
項目推進應(yīng)先評估項目目標,在此基礎(chǔ)上重點關(guān)注對應(yīng)的清洗策略。在目前數(shù)據(jù)實際情況基礎(chǔ)上盡量做到保真,重點研究數(shù)據(jù)的過濾算法。在系統(tǒng)后臺設(shè)計時同步引入數(shù)據(jù)置信度屬性,參與后續(xù)運算生成關(guān)鍵綜合指標。系統(tǒng)生成的總體決策用指標,建議也使用概率化的數(shù)學(xué)方式進行描述。此外,在置信度問題的處理上也可再次利用大數(shù)據(jù)理念,著力增加數(shù)據(jù)的規(guī)模和維度,規(guī)模的改變有時會引起事物狀態(tài)的變化;通過多維度校核等各種技術(shù)手段,隨著數(shù)據(jù)的積累和系統(tǒng)自學(xué)習(xí),不斷提升數(shù)據(jù)的置信度。
數(shù)據(jù)清洗工作中,部分文件型的相關(guān)信息(即使沒有完全使用過)也應(yīng)謹慎處理,如故障調(diào)查分析報告等,可能隨著分析的不斷擴展,會有需求從新的維度對報告進一步提煉,通過系統(tǒng)進一步增加自動化分解字段,推進實現(xiàn)視頻、音頻、圖片等的進一步整合。
將專業(yè)間交叉性的問題進一步細化研究,實現(xiàn)跨專業(yè)分析,也可發(fā)掘出有價值的信息。
以動車組為例,運用故障分析過程中帶有跨專業(yè)接口的問題往往需要進一步研究。典型如受電弓自動降弓裝置(Automatic Dropping Device,ADD)觸發(fā)故障。如果故障原因在車輛專業(yè)內(nèi)部,分析比較清晰;但如果是接觸網(wǎng)故障,信息閉環(huán)往往缺少進一步數(shù)據(jù),因為從責(zé)任角度劃分至非車輛責(zé)任時對車輛專業(yè)已完成閉環(huán)。但實際上弓網(wǎng)類故障是運輸組織中較為核心的故障之一,處置中經(jīng)常需涉及到跨鐵路局集團公司多專業(yè)多層次協(xié)同,涉及到故障信息提報、作業(yè)安全防護、弓網(wǎng)故障綜合診斷等,如處置不當容易導(dǎo)致事故擴大化。又如在動車組和供電專業(yè)間進行較為完整的跨專業(yè)分析,可能在優(yōu)化車輛同供電專業(yè)之間接口和應(yīng)急組織層面提升多個專業(yè)的綜合協(xié)同,對從整體上進一步提升安全管理總體質(zhì)量起到一定作用。類似情況還有電務(wù)車載設(shè)備故障、輪軌類問題(如轉(zhuǎn)向架橫向加速度超限報警)等。
從此角度出發(fā),建議應(yīng)建立跨專業(yè)的核心信息基礎(chǔ)數(shù)據(jù)平臺。以動車組車號、每日運行交路等作為核心基礎(chǔ)數(shù)據(jù)項之一,在平臺中進行設(shè)置;為跨專業(yè)的貫通建設(shè)數(shù)據(jù)之錨,為專業(yè)間自動化的大數(shù)據(jù)交叉分析奠定基礎(chǔ);各專業(yè)協(xié)同編制標準化的數(shù)據(jù)接口,達到各專業(yè)共建、共享、共用的目標。
經(jīng)過數(shù)據(jù)來源范圍核定及系統(tǒng)數(shù)據(jù)補充、清理核定工作,對數(shù)據(jù)來源的認識也有進一步提升。
系統(tǒng)長久的發(fā)展應(yīng)定位于從既有生產(chǎn)系統(tǒng)、診斷系統(tǒng)獲取,才能解決長期數(shù)據(jù)供給問題。此外,通過設(shè)備獲取的數(shù)據(jù)可減少人為干預(yù),為數(shù)據(jù)分析增加高置信度的數(shù)據(jù)維度。
大數(shù)據(jù)分析的推進也促使行業(yè)提升了移動裝備等各類設(shè)備設(shè)施的設(shè)計理念。將動車組的動態(tài)性能狀態(tài)數(shù)據(jù)(如振動、通過間接產(chǎn)生的噪聲等)使用特定技術(shù)手段進行測量,可為大數(shù)據(jù)整合分析提供更豐富的數(shù)據(jù)。
從動車組角度,將車載監(jiān)測通過遠程數(shù)據(jù)落地實現(xiàn)基礎(chǔ)技術(shù)狀態(tài)的輸入;通過地面檢測監(jiān)測實現(xiàn)軌旁紅外熱像、綜合噪聲頻譜、輪軌力綜合狀態(tài)檢測,形成綜合監(jiān)控體系,可解決單維度分析準確度不高問題,將對鐵路行業(yè)產(chǎn)生深遠影響。
在各類字段的設(shè)置及分析中應(yīng)注意結(jié)合信息化手段升級數(shù)據(jù)統(tǒng)計計算的全面性和精準性,避免復(fù)用傳統(tǒng)報告數(shù)據(jù)處理使用的較為簡統(tǒng)的分析方案。
以動車組分解結(jié)構(gòu)為例,傳統(tǒng)分析中只設(shè)有1個字段。如動車組自動降弓故障,各鐵路局集團公司填寫速報時,填寫屬于“主供電系統(tǒng)”。入庫檢查分析為網(wǎng)絡(luò)輸入輸出控制模塊故障后,再更改為“網(wǎng)絡(luò)及輔助監(jiān)控系統(tǒng)”。
傳統(tǒng)故障分析處理中考慮優(yōu)化流程,抓大放小地進行人工分析是可取的。但當信息系統(tǒng)具有精細化處理能力后,此種處理方式應(yīng)及時升級,否則會導(dǎo)致后續(xù)分析能力的不足[4]。
故障現(xiàn)象與故障原因應(yīng)作為獨立概念分離為2個字段。故障現(xiàn)象屬于哪個功能系統(tǒng)及故障原因在哪個部件屬于2個獨立范疇。只有實現(xiàn)分離,系統(tǒng)才具備按現(xiàn)象統(tǒng)計或按故障部位統(tǒng)計的能力,并可在此基礎(chǔ)上研究故障現(xiàn)象與故障部件的綜合交錯關(guān)系,為后續(xù)構(gòu)建高速動車組診斷體系奠定基礎(chǔ)。
跨專業(yè)中也會出現(xiàn)類似問題,如問題現(xiàn)象在電務(wù)專業(yè),可能問題原因在車輛專業(yè)。如果此類交叉過多,說明專業(yè)接口邊界應(yīng)進一步調(diào)整優(yōu)化。
在責(zé)任分析方面,如同一事故由甲單位承擔(dān)主要責(zé)任、乙單位承擔(dān)次要責(zé)任,系統(tǒng)統(tǒng)計功能設(shè)計過程中如只按照第一責(zé)任單位計算,則乙單位沒有放入其承擔(dān)次要責(zé)任的部分,會失去全面性。
大數(shù)據(jù)平臺建議多設(shè)置字段,同時應(yīng)引入加權(quán)進行更為完整的評價,實現(xiàn)較為完備的分析。
安全管理關(guān)鍵指標定制過程中,存在國內(nèi)外對事故等分級口徑不一致及如何選取我國指標定義口徑的問題[5-6]。
國內(nèi)外基本指標口徑不一致在日常工作中確實帶來不便之處,導(dǎo)致橫向指標不具備可比性等問題。以事故管理口徑為例,德國鐵路安全事故更多指列車碰撞、脫軌、平交道口沖撞、火災(zāi)等嚴重事故,重點關(guān)注人員死亡及重傷,把信號冒進等列為事故苗頭,而對列車晚點和旅客舒適度方面的問題不列入事故[7];而我國《鐵路交通事故調(diào)查處理規(guī)則》把較為嚴重的晚點問題也納入安全事故辦理。
在此背景下直接對故障頻度數(shù)據(jù)進行對比是不科學(xué)的。建議將技術(shù)指標和管理指標分離,同時在系統(tǒng)中設(shè)定有多個不同管理口徑的指標,基礎(chǔ)數(shù)據(jù)一致,可互相切換視角。這樣我國鐵路事故可根據(jù)國外標準進行統(tǒng)計,實現(xiàn)同口徑對比,同時也可滿足部分國際化需求。
通過此方式還可解決在實際管理中不同時期管理要求動態(tài)調(diào)整的需求,針對同一故障可有不同的版本方案。把當前技術(shù)政策作為多路輸出中最核心的輸出放在默認位置,預(yù)留后續(xù)政策動態(tài)優(yōu)化的空間,并可對不同時期數(shù)據(jù)進行轉(zhuǎn)換和重新整合。
數(shù)據(jù)梳理工作中對自動化數(shù)據(jù)處理的需求較大,從總體上看,主要集中在文本材料的自動字段化分解及多字段的自動關(guān)聯(lián)分析等方面。
首先是文本材料的字段化分解。此功能可為后期自動處理海量數(shù)據(jù)奠定基礎(chǔ)。如要達到較高的準確率,在試點階段具體專業(yè)人員需參與模型的訓(xùn)練和培養(yǎng)。不斷對典型樣例進行深入、精準分析,對自動字段化的結(jié)果與人工核定結(jié)果進行比對,完善系統(tǒng)判別條件,矯正自動分析和實際情況的差距。系統(tǒng)設(shè)計中預(yù)留投入運用后的自學(xué)習(xí)功能,不斷利用系統(tǒng)自身產(chǎn)生的數(shù)據(jù)與實際數(shù)據(jù)進行比對測試,通過反饋機制不斷提升。
其次是多維字段的自動關(guān)聯(lián)分析。大數(shù)據(jù)優(yōu)勢在于關(guān)聯(lián)性分析自動化,找出某些傾向性關(guān)聯(lián)。利用大數(shù)據(jù)思維對部分維度進行交叉分析,早期可通過人工試算先得出一些重要結(jié)論。應(yīng)大力推進自動關(guān)聯(lián)分析,力爭實現(xiàn)更多維度的數(shù)據(jù)運算,經(jīng)過交叉印證后可能得到更多有價值信息。在跨專業(yè)核心公共數(shù)據(jù)平臺中引入全國氣象數(shù)據(jù),對全路線路數(shù)據(jù)同GPS坐標進行體系性擬合,這些基礎(chǔ)工作都可能在各專業(yè)分析中發(fā)揮出強大力量。
最后是重要關(guān)聯(lián)關(guān)系的挖掘。后續(xù)系統(tǒng)較為完備后,推動實現(xiàn)不同氣候、地域、季節(jié)、時段的分析,甚至相關(guān)人員年齡、教育程度分析。可根據(jù)需要選取同一類事件進行專項綜合分析,如可通過研究新車型投入運用后的時間周期規(guī)律,充分發(fā)揮我國規(guī)模優(yōu)勢[8],對進一步減少問題發(fā)生具有重要意義。
基于大數(shù)據(jù)的高速鐵路安全規(guī)律分析,針對整體分析架構(gòu)、數(shù)據(jù)獲取及處理、數(shù)據(jù)分析及自動挖掘在實際推進中出現(xiàn)的問題,應(yīng)結(jié)合我國高速鐵路運用檢修實際進行研究優(yōu)化,使其既可繼承歷史又能面向未來。大數(shù)據(jù)分析中數(shù)據(jù)復(fù)雜多變,應(yīng)抓住主要矛盾,明確具體目標需求,通過系統(tǒng)找出幾個相互耦合的關(guān)鍵因素,從綜合角度分析總結(jié)健康綜合指標,為后續(xù)提煉核心干預(yù)措施奠定基礎(chǔ)。