王同軍
(1. 中國鐵路總公司,北京 100844;2. 中國鐵道科學(xué)研究院,北京 100081)
中國鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計研究與實踐
王同軍1,2
(1. 中國鐵路總公司,北京 100844;2. 中國鐵道科學(xué)研究院,北京 100081)
大數(shù)據(jù)時代數(shù)據(jù)成為企業(yè)核心資產(chǎn)和提升競爭力的源泉,處在改革轉(zhuǎn)型期的我國鐵路為實現(xiàn)提高經(jīng)營效益、保障運輸安全、優(yōu)化運能效率、提升服務(wù)能力等目標(biāo),對于大數(shù)據(jù)技術(shù)有著極為迫切的應(yīng)用需求。闡述我國鐵路在大數(shù)據(jù)時代面臨的數(shù)據(jù)共享困難、數(shù)據(jù)治理手段缺乏、數(shù)據(jù)分析能力不足、數(shù)據(jù)創(chuàng)新應(yīng)用需求迫切等系列挑戰(zhàn),從鐵路大數(shù)據(jù)發(fā)展整體出發(fā)提出鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計的重要性。鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計劃分為大數(shù)據(jù)基礎(chǔ)設(shè)施體系、大數(shù)據(jù)匯集體系、大數(shù)據(jù)資產(chǎn)體系、大數(shù)據(jù)治理體系、大數(shù)據(jù)分析體系及大數(shù)據(jù)應(yīng)用體系等6個部分。詳細(xì)分析鐵路行業(yè)在客貨運輸、基礎(chǔ)設(shè)施檢測、動車組管理、工程建設(shè)等方面已經(jīng)開展的大數(shù)據(jù)典型應(yīng)用,并給出鐵路大數(shù)據(jù)應(yīng)用的分階段實施建議。
大數(shù)據(jù);鐵路運輸;客運;貨運;動車組;基礎(chǔ)設(shè)施;頂層設(shè)計;工程建設(shè)
大數(shù)據(jù)浪潮席卷全球各行各業(yè),正在成為引領(lǐng)新一輪科技創(chuàng)新的核心技術(shù)引擎。由于蘊含著巨大的商業(yè)及社會經(jīng)濟價值,大數(shù)據(jù)被譽為未來的新石油和國家基礎(chǔ)性戰(zhàn)略資源,推動著人類社會的變革和升級換代。人類社會繼蒸汽時代、電氣時代后,正在加速跨進(jìn)數(shù)據(jù)為王的大數(shù)據(jù)時代。當(dāng)前,數(shù)據(jù)已經(jīng)成為企業(yè)最重要的資產(chǎn)之一,數(shù)據(jù)資源占有量、數(shù)據(jù)活性、數(shù)據(jù)分析能力已成為衡量一個企業(yè)核心競爭力的重要標(biāo)志。
2011年,全球知名咨詢公司麥肯錫發(fā)布題為《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)力的前沿》[1]的研究報告,標(biāo)志著大數(shù)據(jù)技術(shù)的誕生。大數(shù)據(jù)蘊含的戰(zhàn)略價值引起眾多發(fā)達(dá)國家政府的重視,相繼出臺大數(shù)據(jù)戰(zhàn)略規(guī)劃促進(jìn)大數(shù)據(jù)應(yīng)用與發(fā)展。2012年3月美國政府發(fā)布了《大數(shù)據(jù)研究與發(fā)展計劃》[2],投資2億美元進(jìn)行大數(shù)據(jù)研發(fā)以提升從海量復(fù)雜數(shù)據(jù)中獲取知識和洞見的能力,標(biāo)志著美國率先將大數(shù)據(jù)上升為國家戰(zhàn)略。2013年7月法國政府發(fā)布《法國政府大數(shù)據(jù)五項支持計劃》[3],旨在交通、醫(yī)療衛(wèi)生等縱向行業(yè)設(shè)立大數(shù)據(jù)旗艦項目,為大數(shù)據(jù)應(yīng)用建立良好的生態(tài)環(huán)境。2013年10月英國政府發(fā)布《把握數(shù)據(jù)帶來的機遇:英國數(shù)據(jù)能力戰(zhàn)略》[4],從提升數(shù)據(jù)分析技術(shù)、加強國家基礎(chǔ)設(shè)施建設(shè)、確保數(shù)據(jù)安全和共享等方面作出部署。2012年5月聯(lián)合國公布了《大數(shù)據(jù)開發(fā):機遇與挑戰(zhàn)》[5],闡述了各國運用大數(shù)據(jù)促進(jìn)社會發(fā)展方面所面臨的歷史機遇和挑戰(zhàn),并為正確運用大數(shù)據(jù)提出了戰(zhàn)略性建議。
我國政府對大數(shù)據(jù)研究和應(yīng)用也給予了前所未有的高度重視。2014年3月,大數(shù)據(jù)首次寫入《政府工作報告》,標(biāo)志著大數(shù)據(jù)上升到國家戰(zhàn)略高度。2015年9月,國務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)[2015]50號),全面制定了我國大數(shù)據(jù)發(fā)展的總體藍(lán)圖和頂層設(shè)計。2016年3月,《中共中央關(guān)于制定國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃的建議》中提出“實施國家大數(shù)據(jù)戰(zhàn)略,加快推動數(shù)據(jù)資源共享開放和開發(fā)應(yīng)用,助力產(chǎn)業(yè)轉(zhuǎn)型升級和社會治理創(chuàng)新”。2016年1月,國家發(fā)改委印發(fā)《關(guān)于組織實施促進(jìn)大數(shù)據(jù)發(fā)展重大工程的通知》(發(fā)改辦高技[2016]42號),重點支持大數(shù)據(jù)示范應(yīng)用、大數(shù)據(jù)共享開放、基礎(chǔ)設(shè)施統(tǒng)籌發(fā)展和數(shù)據(jù)要素流通。2016年8月,國家發(fā)改委印發(fā)《關(guān)于請組織申報大數(shù)據(jù)領(lǐng)域創(chuàng)新能力建設(shè)專項的通知》(發(fā)改辦高技[2016]1918號),旨在建立和完善大數(shù)據(jù)領(lǐng)域的技術(shù)創(chuàng)新平臺,構(gòu)建支撐國家大數(shù)據(jù)戰(zhàn)略實施的創(chuàng)新網(wǎng)絡(luò),加快大數(shù)據(jù)融合技術(shù)率先在相關(guān)領(lǐng)域的深度應(yīng)用。2016年12月,國務(wù)院印發(fā)《“十三五”國家信息化規(guī)劃》(國發(fā)[2016]73號),強調(diào)建立統(tǒng)一開放的大數(shù)據(jù)體系,包括加強數(shù)據(jù)資源規(guī)劃建設(shè),全面推進(jìn)重點領(lǐng)域大數(shù)據(jù)高效采集、有效整合、安全利用,深化政府?dāng)?shù)據(jù)和社會數(shù)據(jù)關(guān)聯(lián)分析、融合利用,建立國家關(guān)鍵數(shù)據(jù)資源目錄體系,建立國家互聯(lián)網(wǎng)大數(shù)據(jù)平臺,構(gòu)建統(tǒng)一高效、互聯(lián)互通、安全可靠的國家數(shù)據(jù)資源體系。
我國鐵路已經(jīng)建立了全球領(lǐng)先、規(guī)模龐大的鐵路網(wǎng)及支撐路網(wǎng)建設(shè)和運營的大量信息系統(tǒng)。截至2015年底,在全長12.1萬km鐵路沿線、6 000余個車站/作業(yè)段,2.1萬臺機車、1.7萬輛動車組上都安裝了大量感知設(shè)備;鐵路作為大眾化交通工具,2015年旅客發(fā)送量達(dá)25.35億人,貨物發(fā)送量達(dá)33.58億t[6]?;谖锫?lián)網(wǎng)感知設(shè)備、信息系統(tǒng)接入、移動設(shè)備接入、數(shù)據(jù)交換共享等方式,我國鐵路已經(jīng)積累了體量接近10 PB規(guī)模的有關(guān)工程建設(shè)、聯(lián)調(diào)聯(lián)試、運營管理、安全管理、客運服務(wù)、物流服務(wù)等領(lǐng)域的海量數(shù)據(jù),數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、流式數(shù)據(jù)等多種類型,數(shù)據(jù)中蘊含著巨大的分析和應(yīng)用價值。這些都為我國鐵路開展大數(shù)據(jù)分析提供了重要基礎(chǔ)和保障。鑒于鐵路大數(shù)據(jù)應(yīng)用是一個復(fù)雜的系統(tǒng)工程,涉及到鐵路內(nèi)外部多個專業(yè)和部門的統(tǒng)籌協(xié)調(diào)發(fā)展,因此,加強頂層設(shè)計、科學(xué)有序開展鐵路大數(shù)據(jù)應(yīng)用已成為當(dāng)前鐵路行業(yè)亟待解決的重大問題[7]。
大數(shù)據(jù)時代給傳統(tǒng)鐵路行業(yè)帶來了巨大機遇和挑戰(zhàn)[8]。大數(shù)據(jù)是以容量大、類型多、存取速度快、應(yīng)用價值高為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)。鐵路大數(shù)據(jù)除了具備傳統(tǒng)大數(shù)據(jù)的“4V”特征[9]外,還具有獨特的自身行業(yè)特點。
一是業(yè)務(wù)覆蓋全。鐵路信息化起步早,發(fā)展快,數(shù)據(jù)基礎(chǔ)好。鐵路大數(shù)據(jù)貫穿“勘測設(shè)計—工程建設(shè)—聯(lián)調(diào)聯(lián)試—運營維護(hù)”等全生命周期,覆蓋車、機、工、電、輛等全業(yè)務(wù)鏈條,可為各環(huán)節(jié)經(jīng)營管理決策提供良好支撐。
二是時空分布廣。鐵路大數(shù)據(jù)資源來源于遍布全國18個鐵路局(公司)、600余個站段的所有機車、車輛、基礎(chǔ)設(shè)施上的各種傳感器,時空分布廣,具有明顯的地域分布性。
三是更新速度快。覆蓋全路的5T、6A、6C、ATIS、視頻監(jiān)控等各種自動化信息采集設(shè)備源源不斷地產(chǎn)生著鮮活的數(shù)據(jù)資源,數(shù)據(jù)更新速度快、時效性強、數(shù)據(jù)活性大。
四是業(yè)務(wù)價值高。鐵路數(shù)據(jù)資源關(guān)乎國計民生,具有較高的業(yè)務(wù)價值。鐵路互聯(lián)網(wǎng)售票數(shù)據(jù)、行車安全數(shù)據(jù)、設(shè)備狀態(tài)等數(shù)據(jù)對于建設(shè)服務(wù)型企業(yè)、保障人民生命財產(chǎn)安全及降低養(yǎng)護(hù)維修成本具有重要意義。
當(dāng)前我國鐵路正處于轉(zhuǎn)型和發(fā)展的關(guān)鍵時期,面臨著數(shù)據(jù)共享困難、數(shù)據(jù)治理手段缺乏、數(shù)據(jù)分析能力不足、數(shù)據(jù)創(chuàng)新應(yīng)用需求迫切等一系列挑戰(zhàn),主要歸納為以下四方面:
一是大數(shù)據(jù)共享方面,存在數(shù)據(jù)壁壘嚴(yán)重、共享不充分等問題?,F(xiàn)有業(yè)務(wù)數(shù)據(jù)多分散于各應(yīng)用系統(tǒng)和應(yīng)用平臺中,在跨業(yè)務(wù)、跨層級、跨部門數(shù)據(jù)共享過程中,普遍存在數(shù)據(jù)編碼標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)共享口徑不一致、多系統(tǒng)交叉共享壓力過大等問題,急需通過構(gòu)建企業(yè)級大數(shù)據(jù)平臺和數(shù)據(jù)共享機制,確保企業(yè)內(nèi)部數(shù)據(jù)共享的標(biāo)準(zhǔn)、安全,以及統(tǒng)一與社會數(shù)據(jù)開展共享協(xié)作。
二是大數(shù)據(jù)治理方面,存在數(shù)據(jù)不完整、數(shù)據(jù)質(zhì)量不高等問題。各業(yè)務(wù)系統(tǒng)建設(shè)時期各有不同,采用不同的開發(fā)語言、技術(shù)架構(gòu)、數(shù)據(jù)庫導(dǎo)致業(yè)務(wù)數(shù)據(jù)格式不盡相同。同時,由于自動化采集手段和手工采集方式并存,導(dǎo)致數(shù)據(jù)質(zhì)量不佳,各系統(tǒng)間數(shù)據(jù)在共享融合過程中需要采用各種技術(shù)手段、建立各項數(shù)據(jù)標(biāo)準(zhǔn)開展數(shù)據(jù)治理。
三是大數(shù)據(jù)分析方面,由于整體數(shù)據(jù)意識不強、缺乏數(shù)據(jù)思維能力、數(shù)據(jù)視野不夠開闊,數(shù)據(jù)應(yīng)用大都停留于日常業(yè)務(wù)功能實現(xiàn)和常規(guī)統(tǒng)計分析方面,數(shù)據(jù)應(yīng)用深度不足,跨系統(tǒng)、跨專業(yè)的數(shù)據(jù)應(yīng)用匱乏,數(shù)據(jù)驅(qū)動業(yè)務(wù)能力不強,無法滿足服務(wù)改進(jìn)、精準(zhǔn)化管理和智能鐵路發(fā)展需求。
四是大數(shù)據(jù)創(chuàng)新應(yīng)用方面,我國鐵路正面臨著基于大數(shù)據(jù)技術(shù)提高運營收益、確保運輸安全、提高運輸效率、增強服務(wù)品質(zhì)等方面的挑戰(zhàn)。當(dāng)前我國鐵路已經(jīng)完成轉(zhuǎn)企,迫切需要適應(yīng)經(jīng)濟新常態(tài)全面提高鐵路運輸企業(yè)經(jīng)營效益。同時隨著鐵路運輸速度加快、開行列車密度增大及運輸質(zhì)量提高,鐵路運營秩序和運輸安全面臨極大挑戰(zhàn)。需整合強化各類實時監(jiān)控監(jiān)測系統(tǒng),實現(xiàn)對安全數(shù)據(jù)信息的及時采集、系統(tǒng)分析、科學(xué)評估、有效預(yù)警。其次鐵路運輸企業(yè)由粗放型向精細(xì)化、集約型轉(zhuǎn)變,迫切需要合理配置運力資源,全面提高運輸效率。需開展設(shè)備狀態(tài)分析大數(shù)據(jù)應(yīng)用,全面建立主要行車設(shè)備電子檔案,實現(xiàn)設(shè)備健康狀態(tài)評估、故障預(yù)警和維修決策支持。此外,鐵路作為綜合運輸體系的骨干,亟待加強與其他交通運輸方式的相互銜接。需開展客貨運服務(wù)大數(shù)據(jù)應(yīng)用,為旅客提供“家到家”智慧出行服務(wù),為貨主提供“門到門”全程物流服務(wù)。
綜上所述,利用當(dāng)前較為成熟的大數(shù)據(jù)治理、存儲、分析、展示等相關(guān)技術(shù),解決當(dāng)前鐵路面臨的數(shù)據(jù)共享、數(shù)據(jù)治理、數(shù)據(jù)分析等方面的挑戰(zhàn),通過鐵路內(nèi)部各專業(yè)及綜合運輸、氣象、國民經(jīng)濟等相關(guān)數(shù)據(jù)資源的跨界整合,將為鐵路實現(xiàn)基于數(shù)據(jù)的、以客戶為中心的客貨服務(wù)、運輸調(diào)度、經(jīng)營管理等提供技術(shù)可能。
我國鐵路是由車、機、工、電、輛等多個專業(yè)構(gòu)成,跨越全國各個省市和地區(qū)的龐大鐵路網(wǎng),具有技術(shù)構(gòu)成復(fù)雜、業(yè)務(wù)應(yīng)用廣泛、業(yè)務(wù)流程多樣、涉及部門繁多等特點,因此鐵路大數(shù)據(jù)應(yīng)用是一個涉及全業(yè)務(wù)、全數(shù)據(jù)、全流程、全應(yīng)用的復(fù)雜系統(tǒng)工程。發(fā)展鐵路大數(shù)據(jù)需從整體出發(fā),統(tǒng)籌考慮各方因素,加強頂層設(shè)計,避免各專業(yè)各自為政,確保整體工作思路清晰、有序開展。
完整的鐵路大數(shù)據(jù)應(yīng)用體系既包括承載大數(shù)據(jù)應(yīng)用的數(shù)據(jù)中心基礎(chǔ)設(shè)施,也包括大數(shù)據(jù)分析相關(guān)軟件,以及在大數(shù)據(jù)平臺中存儲和分析的大數(shù)據(jù)資產(chǎn)。按照“先進(jìn)性、適用性、可實施性、完整性、全局性”等頂層設(shè)計相關(guān)原則,鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計劃分為大數(shù)據(jù)基礎(chǔ)設(shè)施體系、大數(shù)據(jù)匯集體系、大數(shù)據(jù)資產(chǎn)體系、大數(shù)據(jù)治理體系、大數(shù)據(jù)分析體系和大數(shù)據(jù)應(yīng)用體系6部分。鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計參考框架見圖1。
(1)大數(shù)據(jù)基礎(chǔ)設(shè)施體系,主要指機房環(huán)境和硬件設(shè)備。機房環(huán)境是滿足數(shù)據(jù)中心機房電氣、空調(diào)、消防、弱電工程等設(shè)計標(biāo)準(zhǔn)的場所。硬件設(shè)備主要包括服務(wù)器設(shè)備、網(wǎng)絡(luò)設(shè)備、安全設(shè)備等三大類,滿足鐵路大數(shù)據(jù)中心數(shù)據(jù)存儲、傳輸?shù)刃枨蟆7?wù)器設(shè)備可基于云化或非云化環(huán)境,建立起大數(shù)據(jù)平臺管理節(jié)點、Hadoop數(shù)據(jù)節(jié)點、Hadoop測試節(jié)點、關(guān)系型數(shù)據(jù)存儲節(jié)點、數(shù)據(jù)倉庫部署節(jié)點等基礎(chǔ)環(huán)境。
(2)大數(shù)據(jù)匯集體系,主要解決數(shù)據(jù)匯集問題,即將數(shù)據(jù)資源從各業(yè)務(wù)系統(tǒng)抽取并集中起來。從數(shù)據(jù)匯集的范圍來看,既包括中國鐵路總公司(簡稱總公司)內(nèi)部的運輸生產(chǎn)、經(jīng)營管理數(shù)據(jù),也包括以總公司為核心的供應(yīng)鏈上的相關(guān)數(shù)據(jù),還包括公安、氣象、地質(zhì)及綜合運輸?shù)壬鐣畔ⅰ?/p>
圖1 鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計參考框架
(3)大數(shù)據(jù)資產(chǎn)體系,基于關(guān)系型數(shù)據(jù)存儲、非關(guān)系型數(shù)據(jù)存儲和分布式文件存儲等技術(shù),實現(xiàn)全路客運、貨運、建設(shè)管理、聯(lián)調(diào)聯(lián)試、基礎(chǔ)設(shè)施、機車車輛、工務(wù)、供電、電務(wù)、安全管理、人才培養(yǎng)、協(xié)同辦公等業(yè)務(wù)數(shù)據(jù)管理,實現(xiàn)主數(shù)據(jù)、元數(shù)據(jù)等基礎(chǔ)數(shù)據(jù)統(tǒng)一管理和維護(hù),實現(xiàn)氣象、經(jīng)濟、綜合交通、供應(yīng)鏈上下游、地理信息等社會數(shù)據(jù)的集中共享協(xié)作,構(gòu)建鐵路企業(yè)級清晰、完整、高質(zhì)量、高可靠的數(shù)據(jù)資產(chǎn)體系,提升鐵路行業(yè)數(shù)據(jù)能力和價值。
(4)大數(shù)據(jù)治理體系,是指采取有效的數(shù)據(jù)治理確保鐵路大數(shù)據(jù)的準(zhǔn)確、一致、及時,實現(xiàn)鐵路數(shù)據(jù)資源向數(shù)據(jù)資產(chǎn)轉(zhuǎn)變。數(shù)據(jù)治理就是對數(shù)據(jù)的獲取、處理、使用進(jìn)行監(jiān)管,保證數(shù)據(jù)質(zhì)量,并促進(jìn)數(shù)據(jù)更高效地被利用。數(shù)據(jù)治理的內(nèi)容包括:通過數(shù)據(jù)標(biāo)準(zhǔn)的落地,達(dá)到消除歧義、提高數(shù)據(jù)質(zhì)量的目的,確保重要信息的完整、一致和準(zhǔn)確,促進(jìn)數(shù)據(jù)的共享,真正發(fā)揮數(shù)據(jù)資產(chǎn)的價值;通過數(shù)據(jù)質(zhì)量管理,對數(shù)據(jù)在獲取、存儲、維護(hù)、應(yīng)用、消亡的每個階段內(nèi)可能引發(fā)的各類數(shù)據(jù)質(zhì)量問題,進(jìn)行識別、度量、監(jiān)控、預(yù)警等,從而進(jìn)一步提升數(shù)據(jù)質(zhì)量;從基礎(chǔ)設(shè)施、網(wǎng)絡(luò)、應(yīng)用、系統(tǒng)及數(shù)據(jù)等多個層次入手,保證數(shù)據(jù)和信息的完整性、保密性、可用性;構(gòu)建統(tǒng)一的主數(shù)據(jù)管理系統(tǒng),實現(xiàn)鐵路主數(shù)據(jù)統(tǒng)一管理、及時更新、專業(yè)維護(hù)、集中發(fā)布、全路共享,為各業(yè)務(wù)應(yīng)用系統(tǒng)和用戶提供標(biāo)準(zhǔn)、規(guī)范的主數(shù)據(jù)服務(wù)。
(5)大數(shù)據(jù)分析體系,提供流計算、內(nèi)存計算、批量計算等多種分布式計算能力,滿足不同時效性的計算需求。鐵路各種安全監(jiān)控系統(tǒng)產(chǎn)生的數(shù)據(jù)是一組順序、大量、快速、連續(xù)到達(dá)的數(shù)據(jù)序列,要求實時進(jìn)行處理,此類數(shù)據(jù)可采用流計算方法,實現(xiàn)在線統(tǒng)計分析、過濾、預(yù)警等應(yīng)用。對于鐵路客票發(fā)售與預(yù)訂等類型系統(tǒng),可使用內(nèi)存計算方法,滿足交互性分析需求,提供在線數(shù)據(jù)查詢和分析,便于人機交互。鐵路大多數(shù)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)分析屬于大批量數(shù)據(jù)的離線分析,可使用批量計算技術(shù),用于時效性要求較低的數(shù)據(jù)處理業(yè)務(wù),如歷史數(shù)據(jù)報表分析。在數(shù)據(jù)計算的基礎(chǔ)上,開展分析建模、模型運行、模型發(fā)布等能力的建設(shè),滿足實時、離線應(yīng)用的分析挖掘需求,支持算法并行化處理,為鐵路分析決策應(yīng)用構(gòu)建提供基礎(chǔ)平臺支撐。
(6)大數(shù)據(jù)應(yīng)用體系,指基于各業(yè)務(wù)領(lǐng)域數(shù)據(jù)分析、決策支持等業(yè)務(wù)需求,打破既有業(yè)務(wù)系統(tǒng)數(shù)據(jù)壁壘,實現(xiàn)面向應(yīng)用的多業(yè)務(wù)數(shù)據(jù)建模,支撐面向戰(zhàn)略決策、運營管理、現(xiàn)場管理等各層用戶的分析應(yīng)用。在經(jīng)營效益方面,開展客貨運市場分析、競爭行業(yè)分析、定價及收益管理、運營成本分析及設(shè)備養(yǎng)護(hù)維修分析;在運輸安全方面,進(jìn)行風(fēng)險源隱患分析、事故關(guān)聯(lián)分析、行車調(diào)度安全分析、互聯(lián)網(wǎng)輿情分析等;在運輸效率方面,開展物資生命周期管理、運力資源優(yōu)化配置、開行方案優(yōu)化等;在服務(wù)品質(zhì)方面,進(jìn)行客貨運用戶畫像、延伸服務(wù)、產(chǎn)品優(yōu)化等。
在鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計的指導(dǎo)下,中國鐵道科學(xué)研究院率先開展了鐵路大數(shù)據(jù)分析技術(shù)探索與典型應(yīng)用實踐,初步形成了鐵路大數(shù)據(jù)應(yīng)用平臺,構(gòu)建了涵蓋客貨運輸、基礎(chǔ)設(shè)施、動車組、工程建設(shè)、安全保障等近60個應(yīng)用場景。
3.1 客運大數(shù)據(jù)分析
在客運領(lǐng)域,中國鐵道科學(xué)研究院早在2001年就開始了客運相關(guān)數(shù)據(jù)的積累,尤其在2012年實行互聯(lián)網(wǎng)售票和鐵路實名制后,實現(xiàn)了客票發(fā)售、旅客實名制等數(shù)據(jù)的海量增長。同時,旅客服務(wù)與客運管理系統(tǒng)的運行也積累了大量數(shù)據(jù),依托這些數(shù)據(jù)開展了一系列分析,目前已實現(xiàn)對客流分析、車票銷售統(tǒng)計、客流預(yù)測、旅客群體分析和異常行為診斷等的深度挖掘分析(見圖2)。例如,在客流量預(yù)測中,以歷年同期售票情況為數(shù)據(jù)支撐,建立增長率模型、四階段法模型等適用于鐵路客流情況分析的預(yù)測模型,實現(xiàn)了對未來客流量的高精度預(yù)測,為鐵路運輸組織及運力調(diào)配提供了有力支撐;在打擊黃牛購票中,針對12306產(chǎn)生的用戶行為日志數(shù)據(jù)、余票日志數(shù)據(jù)等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,實現(xiàn)了12306用戶中異常購票行為的鑒別,保障了廣大群眾的公平購票。
3.2 貨運大數(shù)據(jù)分析
在貨運領(lǐng)域,綜合分析鐵路運輸數(shù)據(jù)、社會生產(chǎn)數(shù)據(jù)、社會物流數(shù)據(jù),圍繞貨運收益管理和現(xiàn)代化物流服務(wù)需求,進(jìn)行一系列預(yù)測算法模型的構(gòu)建及大數(shù)據(jù)分析方法的探索,完成海量數(shù)據(jù)的有效信息挖掘并應(yīng)用于貨運業(yè)務(wù)的智能決策。實現(xiàn)了貨運市場價格監(jiān)測、物流市場需求調(diào)查與監(jiān)測分析、貨運收益管理、第四方物流平臺等一系列大數(shù)據(jù)分析應(yīng)用場景(見圖3),并為貨運改革提供依據(jù)和支持。
圖2 客運大數(shù)據(jù)分析應(yīng)用
3.3 基礎(chǔ)設(shè)施大數(shù)據(jù)分析
鐵路基礎(chǔ)設(shè)施檢測數(shù)據(jù)中心作為全路唯一的基礎(chǔ)設(shè)施檢測數(shù)據(jù)集成管理和處理分析研究中心,自2010年運營以來,管理著全路運營線路日常周期檢測數(shù)據(jù)、新建高速鐵路聯(lián)調(diào)聯(lián)試動態(tài)檢測數(shù)據(jù),以及全路鋼軌探傷、綜合巡檢、周邊環(huán)境視頻等數(shù)據(jù)。利用這些數(shù)據(jù)開展了軌道檢測、鋼軌探傷等一系列大數(shù)據(jù)分析工作。通過綜合分析常年積累的軌道檢測和維修數(shù)據(jù),以及通過總質(zhì)量等運營數(shù)據(jù),基于故障預(yù)測與健康管理模型,建立了軌道質(zhì)量評價色階圖,利用色彩直觀反映軌道單元綜合質(zhì)量的時空變化與維修預(yù)警情況,為工務(wù)部門何時何地安排大機搗固作業(yè)提供決策支持(見圖4)。
圖3 貨運大數(shù)據(jù)分析應(yīng)用
3.4 動車組大數(shù)據(jù)分析
基于動車組管理系統(tǒng)中積累的豐富數(shù)據(jù),按照“一車一檔”模式,建立和完善了動車組及其重要零件的全生命周期電子檔案,覆蓋了基本信息、檢修履歷、實時位置、運行狀態(tài)及報警故障等信息,并開展了動車組保有量分析、動車組開行分析、動車組生產(chǎn)力布局、動車組檢修工作精準(zhǔn)預(yù)測等一系列大數(shù)據(jù)分析工作。在動車組故障關(guān)聯(lián)挖掘中,設(shè)計了動車組故障數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘Apriori算法,實現(xiàn)了動車組故障規(guī)則的挖掘,可有效預(yù)測動車組質(zhì)量狀態(tài)、定位故障并確定修程,提高檢修效率,為動車組運行安全、故障診斷和維修等工作提供決策支持(見圖5)。
圖4 基礎(chǔ)設(shè)施大數(shù)據(jù)分析應(yīng)用
圖5 動車組大數(shù)據(jù)分析應(yīng)用
3.5 工程建設(shè)大數(shù)據(jù)分析
從2013年開始,在總公司的領(lǐng)導(dǎo)下,依托鐵路BIM聯(lián)盟,中國鐵道科學(xué)研究院開始鐵路工程管理平臺建設(shè)。目前已經(jīng)在全路完成了以實驗室、拌合站等為典型業(yè)務(wù)的應(yīng)用推廣。在此過程中積累了實驗室、拌合站、隧道施工過程監(jiān)測等海量工程建設(shè)業(yè)務(wù)數(shù)據(jù)。通過項目生產(chǎn)數(shù)據(jù)可分析施工單位生產(chǎn)質(zhì)量、管理質(zhì)量,根據(jù)數(shù)據(jù)分析結(jié)果可進(jìn)行生產(chǎn)進(jìn)度與施工組織計劃對比、生產(chǎn)進(jìn)度異常報警、生產(chǎn)狀態(tài)異常報警,實現(xiàn)生產(chǎn)工序、生產(chǎn)工藝、質(zhì)量信息的可追溯。此外,通過數(shù)字仿真技術(shù)圍繞三維BIM模型進(jìn)行施工過程信息和數(shù)據(jù)的集成與分析,為優(yōu)化設(shè)計方案、指導(dǎo)工程施工等提供了決策支持(見圖6)。
圖6 工程建設(shè)大數(shù)據(jù)分析應(yīng)用
3.6 安全保障大數(shù)據(jù)分析
在安全領(lǐng)域,通過采集、整合鐵路相關(guān)人員的不安全行為、設(shè)備和環(huán)境的不安全狀態(tài)及安全管理缺陷信息,構(gòu)建覆蓋運、機、工、電、輛、供電、環(huán)境等多專業(yè)的鐵路安全大數(shù)據(jù)應(yīng)用,實現(xiàn)鐵路運營安全與應(yīng)急保障數(shù)據(jù)融合、集成,以及信息共享、綜合運用,實現(xiàn)問題閉環(huán)處理、綜合報警分析、問題規(guī)律分析、設(shè)備技術(shù)狀態(tài)評價及運營安全風(fēng)險預(yù)警,為各專業(yè)維修養(yǎng)護(hù)及行車調(diào)度指揮和安全監(jiān)督管理等提供輔助決策支持,為鐵路運營安全有序可控提供技術(shù)保障(見圖7)。
當(dāng)前部分企業(yè)盲目開展大數(shù)據(jù)中心建設(shè),過分追求基礎(chǔ)設(shè)施規(guī)模,帶來一次性投入巨大、建設(shè)和應(yīng)用脫節(jié)、場所和設(shè)備空置、資金浪費嚴(yán)重等問題。鑒于此,鐵路大數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)應(yīng)在頂層設(shè)計指導(dǎo)下按照統(tǒng)一規(guī)劃、分期分步、軟硬結(jié)合、應(yīng)用發(fā)展相協(xié)調(diào)的原則推進(jìn)。參考國內(nèi)外相關(guān)行業(yè)大數(shù)據(jù)應(yīng)用經(jīng)驗[10-11],根據(jù)當(dāng)前鐵路大數(shù)據(jù)應(yīng)用基礎(chǔ)和實際,考慮未來大數(shù)據(jù)應(yīng)用需求,建議采用先典型示范、再優(yōu)化推廣的兩階段實施策略。
圖7 安全保障大數(shù)據(jù)分析應(yīng)用
4.1 第一階段(2017—2018年)
(1)基礎(chǔ)設(shè)施方面:基于既有鐵路數(shù)據(jù)機房環(huán)境進(jìn)行改擴建,使其具備支撐典型示范應(yīng)用要求的機房環(huán)境能力。通過利舊、購置或租用主流X86服務(wù)器,建設(shè)支持相關(guān)業(yè)務(wù)領(lǐng)域典型示范場景數(shù)據(jù)存儲處理能力的軟硬件環(huán)境。
(2)數(shù)據(jù)匯集與管理方面:實現(xiàn)鐵路工程建設(shè)、聯(lián)調(diào)聯(lián)試、基礎(chǔ)設(shè)施、移動設(shè)備、客貨運、安全應(yīng)急、防災(zāi)監(jiān)測等業(yè)務(wù)領(lǐng)域數(shù)據(jù)的匯集,并適度采集氣象、區(qū)域經(jīng)濟、綜合交通等社會數(shù)據(jù),開展數(shù)據(jù)清洗、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)血緣和數(shù)據(jù)質(zhì)量管理等大數(shù)據(jù)資產(chǎn)治理體系建設(shè)。
(3)典型示范方面:基于平臺構(gòu)建鐵路大數(shù)據(jù)分析體系,選取當(dāng)前需求迫切、數(shù)據(jù)基礎(chǔ)好、經(jīng)濟效益好、帶動能力強的領(lǐng)域開展大數(shù)據(jù)分析應(yīng)用示范。先期可選取客貨運輸、安全監(jiān)控、基礎(chǔ)設(shè)施全生命周期分析等領(lǐng)域大數(shù)據(jù)應(yīng)用。
4.2 第二階段(2018—2020年)
(1)基礎(chǔ)設(shè)施方面:基于第一階段典型示范的開展情況,充分考慮鐵路大數(shù)據(jù)增長速度和增長規(guī)模的要求,面向全路適時開展規(guī)模適度的企業(yè)級大數(shù)據(jù)中心和災(zāi)備中心建設(shè),用以支撐全路各業(yè)務(wù)領(lǐng)域全量數(shù)據(jù)的存儲和計算。綜合數(shù)據(jù)中心建設(shè)的國家相關(guān)政策要求和項目的可實施性、可持續(xù)性等原則,鐵路大數(shù)據(jù)中心選址可考慮環(huán)首都經(jīng)濟圈范圍區(qū)位優(yōu)勢明顯、資源要素優(yōu)越、基礎(chǔ)設(shè)施及電力供應(yīng)完備、大數(shù)據(jù)產(chǎn)業(yè)聚集效應(yīng)突出的區(qū)域。例如獲得京津冀區(qū)域一體化、“一帶一路”、京津冀大數(shù)據(jù)綜合試驗區(qū)等政策支持的武清高村科技創(chuàng)新園已成功吸引了北京多家大數(shù)據(jù)企業(yè)進(jìn)駐。此外,鐵路大數(shù)據(jù)中心災(zāi)備中心的選址要充分考慮當(dāng)?shù)刈匀坏乩項l件、配套設(shè)施條件、周邊環(huán)境、成本因素、政策環(huán)境、高科技人才資源等條件,遵循全面災(zāi)難防護(hù)、業(yè)務(wù)連續(xù)性、資源共享、平戰(zhàn)結(jié)合等原則。例如很多行業(yè)/企業(yè)級災(zāi)備中心通常選址呼和浩特、貴陽、嘉興等地。
(2)數(shù)據(jù)匯集與管理方面:在第一階段數(shù)據(jù)匯集基礎(chǔ)上,實現(xiàn)運輸調(diào)度、協(xié)同管理等全路業(yè)務(wù)數(shù)據(jù)匯集,進(jìn)一步擴大社會數(shù)據(jù)范圍和數(shù)量,實現(xiàn)互聯(lián)網(wǎng)、社交、輿情、供應(yīng)鏈上下游等數(shù)據(jù)采集。加強數(shù)據(jù)治理能力,實現(xiàn)數(shù)據(jù)質(zhì)量、安全管控,建立完善的數(shù)據(jù)管理體系和制度。
(3)典型示范方面:基于客貨運輸、安全監(jiān)控、基礎(chǔ)設(shè)施全生命周期分析等領(lǐng)域大數(shù)據(jù)應(yīng)用的經(jīng)驗,推廣業(yè)務(wù)領(lǐng)域大數(shù)據(jù)應(yīng)用范圍,逐步建立全業(yè)務(wù)、全范圍的應(yīng)用,實現(xiàn)全路覆蓋,為總公司構(gòu)建智能鐵路、實施“京津冀一體化”“一帶一路”和“走出去”戰(zhàn)略提供技術(shù)支持。
[1] MANYIKA J,CHUI M,BROWN B,et al.Big data:the next frontier for innovation,competition,and productivity[R].McKinsey Global Institute,2011.
[2] Executive Office of the President.Big data research anddevelopment initiative[EB/OL].(2012-03-29)[2016-12-30].https://www.whitehouse.gov/sites/default/ files/microsites/ostp/ big_data_press_release_final_2.pdf.
[3] SMEs,Innovation and the Digital Economy.French government support for big data[EB/OL].(2013-07-04)[2016-12-30].http://www.invest-in-france. org/us/n ews/french-government-support-for-big-data. html.
[4] Great Britain. Department for Business,Innovation and Skills(BIS).Seizing the data opportunity:A strategy for UK data capability[EB/OL].(2013-10-30)[2016-12-30].https://www.gov.uk/government/ uploads/system/uploads/attachment_data /file/254136/ bis-13-1250-strategy-for-uk-data-capability-v4.pdf.
[5] UN Global Pulse.Big data for development: challenges & opportunities[EB/OL].(2012-05)[2016-12-30].http://www.unglobalpulse.org/sites/default/files/ BigDatafor Development- UNGlobalPulseJune2012.pdf.
[6] 國家鐵路局.2015年鐵道統(tǒng)計公報[EB/OL].(2016-03-03)[2016-12-30].http://www.nra.gov.cn/ xwzx/zlzx/hytj/201603/t20160303_21466.shtml.
[7] 顧新建,代風(fēng),楊青海,等.制造業(yè)大數(shù)據(jù)頂層設(shè)計的內(nèi)容和方法[J].成組技術(shù)與生產(chǎn)現(xiàn)代化,2015(4):12-17.
[8] 李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊,2012,27(6):5-15.
[9] 維克托·邁爾-舍恩伯格.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2012.
[10] 段軍紅,張乃丹,趙博,等.電力大數(shù)據(jù)基礎(chǔ)體系架構(gòu)與應(yīng)用研究[J].電力信息與通信技術(shù),2015,13(2):92-95.
[11] 李秋靜,葉云.電信大數(shù)據(jù)解決方案及實踐[J].中興通訊技術(shù),2013,19(4):39-41.
責(zé)任編輯 高紅義
On Top-Level Design for China Railway’s Big Data Application & Case Study
WANG Tongjun1,2
(1. CHINA RAILWAY,Beijing 100844,China;2. China Academy of Railway Sciences,Beijing 100081,China)
In the big data era, data have become core assets of enterprises and the source of enhancing competitiveness. In order to realize the goal of improving operational efficiency, ensuring transport safety, optimizing transport efficiency and improving services, China’s railway urgently calls for the application of big data technologies. This paper expounds on challenges faced by China’s railway sector including those in data sharing, lack of data management methods and def cient data analysis and data innovation, and highlights the importance of top-level design for the application of railway big data from the perspective of the overall development of railway big data. The top-level design for the application of railway big data is composed of six parts: big data infrastructure system, big data collection system, big data asset system, big data management system, big data analysis system and big data application system. This article analyzes in detail the typical cases of big data application in passenger and freight transport, infrastructure inspection, EMU management, engineering construction etc., and offers suggestions for different phases of application of railway big data.
big data;railway transport;passenger transport;freight transport;EMU;infrastructure;toplevel design;engineering construction
U29;TP311.13
A
1001-683X(2017)01-0008-09
10.19549/j.issn.1001-683x.2017.01.008
2016-12-30
王同軍(1964—),男,中國鐵路總公司副總工程師兼中國鐵道科學(xué)研究院院長。