曾祥富 王修歷
摘? 要:該文分析工務(wù)基礎(chǔ)數(shù)據(jù)管理、鐵路工務(wù)管理信息系統(tǒng)應(yīng)用以及臺賬主管人員數(shù)據(jù)素養(yǎng)水平現(xiàn)狀,針對基礎(chǔ)數(shù)據(jù)不準(zhǔn)確、難以捕捉異常、與本地數(shù)據(jù)關(guān)聯(lián)不足、臺賬主管人員數(shù)據(jù)素養(yǎng)水平存在差異等問題,在鐵路工務(wù)管理信息系統(tǒng)導(dǎo)出數(shù)據(jù)的基礎(chǔ)上,結(jié)合本地生產(chǎn)管理數(shù)據(jù),提出基于Tableau的基礎(chǔ)數(shù)據(jù)可視化分析實現(xiàn)路徑,并給出臺賬主管人員數(shù)據(jù)素養(yǎng)提升策略。
關(guān)鍵詞:鐵路工務(wù);基礎(chǔ)數(shù)據(jù);可視化分析;Tableau;大數(shù)據(jù)
中圖分類號:C37? ? ? 文獻標(biāo)志碼:A? ? ? ? ? 文章編號:2095-2945(2024)19-0143-04
Abstract: This paper analyzes the basic data management of public works, the application of railway public works management information system and the current situation of data literacy level of account managers. In view of the problems such as inaccurate basic data, difficult to catch anomalies, insufficient association with local data, differences in data literacy level of account managers, and so on, on the basis of data derived from railway public works management information system, according to local production management data. This paper puts forward the realization path of visual analysis of basic data based on Tableau, and puts forward the strategy to improve the data literacy of account managers.
Keywords: railway public works; basic data; visual analysis; Tableau; big data
鐵路工務(wù)基礎(chǔ)數(shù)據(jù)眾多,傳統(tǒng)基礎(chǔ)數(shù)據(jù)主要通過鐵路工務(wù)管理信息系統(tǒng)(以下簡稱PWMIS)進行管理,并導(dǎo)出Excel統(tǒng)計數(shù)據(jù)開展二次分析,但日常管理存在數(shù)據(jù)不準(zhǔn)確、分散不關(guān)聯(lián)、動態(tài)更新不及時和可視化展示不足等問題。同時,工務(wù)設(shè)備臺賬管理人員在數(shù)據(jù)意識、數(shù)據(jù)知識、數(shù)據(jù)技能等方面也存在差異。
大數(shù)據(jù)時代,需要管理者快速、高效理解與挖掘數(shù)據(jù)背后的信息[1],需要在PWMIS系統(tǒng)導(dǎo)出數(shù)據(jù)的基礎(chǔ)上,結(jié)合本地生產(chǎn)管理數(shù)據(jù),對工務(wù)基礎(chǔ)數(shù)據(jù)進行深度挖掘和關(guān)聯(lián)分析。以Tableau為代表的商業(yè)自助式BI工具在大數(shù)據(jù)可視化管理方面優(yōu)勢明顯[2],可以此為載體開展本地數(shù)據(jù)可視化管理。同時,相較于傳統(tǒng)數(shù)據(jù)而言,大數(shù)據(jù)不僅體量龐大、類型復(fù)雜,還具備時效性強、價值密度低的特征,大數(shù)據(jù)的誕生促進了人們工作思維及生活方式的轉(zhuǎn)變[3],對數(shù)據(jù)管理人員的數(shù)據(jù)能力提出了更高的要求,因此亟需提升工務(wù)基礎(chǔ)數(shù)據(jù)臺賬管理人員的數(shù)據(jù)素養(yǎng)。
1? 工務(wù)基礎(chǔ)數(shù)據(jù)管理現(xiàn)狀
1.1? 工務(wù)基礎(chǔ)數(shù)據(jù)組成及應(yīng)用情況
1.1.1? 基礎(chǔ)數(shù)據(jù)組成
PWMIS包含工務(wù)基礎(chǔ)數(shù)據(jù)管理、工務(wù)安全生產(chǎn)管理、工務(wù)地理信息應(yīng)用、工務(wù)檢測監(jiān)測數(shù)據(jù)管理和工務(wù)修理輔助決策管理五大子應(yīng)用模塊。其中工務(wù)基礎(chǔ)數(shù)據(jù)管理包括線路設(shè)備、橋隧設(shè)備、路基設(shè)備、運營情況、專題圖(綜合圖、配線圖及速度圖)、LKJ數(shù)據(jù)(車站、股道、道岔、線路允許速度、坡度、曲線、橋梁、隧道、道口、正線里程信息表和線路里程斷鏈表等)。系統(tǒng)組成如圖1所示。
1.1.2? PWMIS基礎(chǔ)數(shù)據(jù)應(yīng)用現(xiàn)狀
鐵路工務(wù)專業(yè)通過多年信息化建設(shè),建立了基于PWMIS的工務(wù)基礎(chǔ)臺帳信息化管理。特別是PWMIS2.0升級版應(yīng)用以來,一定程度上解決了長期以來工務(wù)基礎(chǔ)設(shè)施圖紙資料、技術(shù)檔案以及圖形圖像等數(shù)據(jù)分散管理,未與基礎(chǔ)臺賬信息建立關(guān)聯(lián)等問題,有利于專業(yè)管理人員及現(xiàn)場作業(yè)人員全面掌握設(shè)備設(shè)施狀態(tài),為工務(wù)精細化管理及現(xiàn)場問題處置提供了便利。但在實際應(yīng)用中還存在如下問題:
數(shù)據(jù)不準(zhǔn)確。每年線路新建、大修、更改數(shù)量較多,且運營一段時間后線路線型也在發(fā)生變化,加之鐵路局集團公司、站段、車間及工區(qū)各層級信息不對稱、設(shè)備管理單位與施工單位技術(shù)交接不到位等原因?qū)е聰?shù)據(jù)不準(zhǔn)確[4]。
數(shù)據(jù)異常難以捕捉。PWMIS導(dǎo)出的設(shè)備基礎(chǔ)信息仍以Excel表格統(tǒng)計為止,數(shù)據(jù)缺少可視化展示,出現(xiàn)數(shù)據(jù)異常很難被發(fā)現(xiàn)。
數(shù)據(jù)與本地數(shù)據(jù)關(guān)聯(lián)不足。目前工務(wù)生產(chǎn)管理仍存在大量信息需在本地進行管理,特別是臨時性、突發(fā)性工作任務(wù),單靠PWMIS數(shù)據(jù)分析查詢功能無法完成深度分析。
1.1.3? 基礎(chǔ)數(shù)據(jù)可視化分析必要性
針對數(shù)據(jù)不準(zhǔn)確問題可通過建立完善相關(guān)制度,加強專業(yè)管理加以解決。針對數(shù)據(jù)異常難以捕捉、與本地數(shù)據(jù)關(guān)聯(lián)不足等問題可通過商業(yè)BI工具可視化分析來實現(xiàn)。通過可視化分析將幫助決策者快速思考,獲取信息,做出判斷[5]。
通過系統(tǒng)化規(guī)則或算法識別異常數(shù)據(jù)。一是基于固定數(shù)值的異常判斷。如結(jié)合年度大維修任務(wù)完成情況統(tǒng)計發(fā)現(xiàn)年度設(shè)備變化異常處所,反推設(shè)備臺賬記錄。二是基于相對數(shù)值的異常判斷。如同比和環(huán)比情況,將現(xiàn)有設(shè)備與歷史設(shè)備數(shù)量進行對比分析。三是基于統(tǒng)計分布的異常判斷。比如可通過盒須圖、分布區(qū)間、標(biāo)準(zhǔn)偏差等方式分析異常偏離值。
管理本地數(shù)據(jù)實現(xiàn)數(shù)據(jù)深度挖掘。單項工作需在PWMIS基礎(chǔ)數(shù)據(jù)上關(guān)聯(lián)實際需求,從業(yè)務(wù)出發(fā)尋求合理的專業(yè)解釋,洞察事物變化規(guī)律。通過可視化分析有助于全面精準(zhǔn)定位問題,制定針對性措施。
鑒于專業(yè)管理人員日常管理需求和工務(wù)基礎(chǔ)數(shù)據(jù)量大、時效性高、數(shù)據(jù)關(guān)聯(lián)性強等特點,亟需在PWMIS導(dǎo)出數(shù)據(jù)基礎(chǔ)上,開展工務(wù)基礎(chǔ)大數(shù)據(jù)可視化分析研究,以便及時發(fā)現(xiàn)異常,洞察規(guī)律。
1.2? 臺賬主管人員數(shù)據(jù)素養(yǎng)水平現(xiàn)狀分析
1.2.1? 數(shù)據(jù)感知意識淡薄
數(shù)據(jù)意識通常是指對數(shù)據(jù)和數(shù)據(jù)問題的感受力,以及對數(shù)據(jù)價值的洞察力和判斷力,它決定了獲取、判斷和利用數(shù)據(jù)的自覺度[6]。部分工務(wù)基礎(chǔ)管理人員因長期從事某個單項工作,所處層次不同,不能及時從數(shù)據(jù)視角來捕捉生產(chǎn)管理行為帶來的變化,不會主動搜集、分析安全生產(chǎn)管理所帶來的基礎(chǔ)數(shù)據(jù)變化,從而在主觀上導(dǎo)致基礎(chǔ)數(shù)據(jù)得不到及時更新。
1.2.2? 數(shù)據(jù)知識儲備不足
一是統(tǒng)計學(xué)基礎(chǔ)知識欠缺。部分臺賬管理人員對描述性統(tǒng)計中離中趨勢、集中趨勢以及分布特征各項指標(biāo)混淆,理解不到位,不會運用基本的描述性統(tǒng)計指標(biāo)對數(shù)據(jù)進行分析。二是不注重可視化原理運用,錯誤選擇圖表類型。比如在表達趨勢型、占比型、對比型圖表類型上選擇錯誤。在研究某一區(qū)段線路設(shè)備數(shù)量隨時間變化趨勢時可以選擇柱狀圖和折線圖,但卻不能清晰地鑒定柱狀圖和條形圖的區(qū)別。通常如果觀測的時間是離散型變量,如1月、3月、5月、7月這樣的時間序列,且柱子不超過12個時,可以選擇柱狀圖。但是如果觀測的時間是連續(xù)性變量,如1月15日、2月21日、3月24日等,觀測的時間點甚至多于12個時,此時優(yōu)先選擇折線圖。
1.2.3? 數(shù)據(jù)分析能力欠缺
一是展示手段不足。目前基礎(chǔ)數(shù)據(jù)分析各類展示報告中,傳統(tǒng)的三圖一表仍是主要的可視化展現(xiàn)方式。所謂三圖一表,即條形圖、折線圖、餅圖和交叉表。而大數(shù)據(jù)分析通常強調(diào)大數(shù)據(jù)樣本的宏觀特征、分布規(guī)律和相互關(guān)系,對應(yīng)的直方圖、盒須圖和散點圖等高級圖形應(yīng)用較少。至于基于地圖統(tǒng)計分析、互聯(lián)網(wǎng)元素的文字云、樹狀圖、氣泡圖等應(yīng)用則更少。二是分析問題解析與層次研究。通常的數(shù)據(jù)分析為迎合決策者個人需求,比如上級要求哪方面內(nèi)容,則提供哪方面內(nèi)容。臺賬管理人員的個人思考受限于其掌握的工具,通常編制的報告羅列了大量的數(shù)據(jù),并花費大量時間用在文字修飾和排版上。
1.2.4? 輔助決策能力不足
一是缺少數(shù)據(jù)交互分析。臺賬管理人員所依賴的定制數(shù)據(jù)分析手段缺少數(shù)據(jù)交互,不利于快速決策。數(shù)據(jù)交互是自定義分析的前提。經(jīng)常臺賬管理人員只能被動地接受分析結(jié)果,而不同的決策層所關(guān)注的重點又有所不同,對比的層次也不盡相同,這時候就需要一些假設(shè)性檢驗,所以也需要更多的交互。如何讓管理者用感性直覺的思維快速做出理性正確的決策也是擺在臺賬管理人員面前的問題。二是未遵循基本表達分析邏輯?;镜姆治鲞壿嫲▍^(qū)分用戶、真實準(zhǔn)確、符合大眾認知與審美、適度原則和五秒原則等。區(qū)分用戶主要指基礎(chǔ)數(shù)據(jù)提供給集團公司經(jīng)理層、站段管理層和車間執(zhí)行層的內(nèi)容和角度應(yīng)該是不一樣;真實準(zhǔn)確則是對數(shù)據(jù)分析的時候必須真實客觀地反映,避免人為去粉飾掩蓋問題,避重就輕去分析原因;符合大眾認知與審美指的是要尊重行業(yè)表達邏輯和審美習(xí)慣;適度原則即適度即可,過猶不及;五秒原則是指數(shù)據(jù)分析的結(jié)果讓人能快速準(zhǔn)確獲得作者想表達的信息。
2? 基于Tableau的基礎(chǔ)數(shù)據(jù)可視化分析
2.1? 基礎(chǔ)數(shù)據(jù)可視化方案設(shè)計
2.1.1? 功能需求設(shè)計
基于自定義地圖的基礎(chǔ)數(shù)據(jù)可視化展示。主要對管轄范圍內(nèi)基礎(chǔ)設(shè)施設(shè)備進行統(tǒng)計分析,快速定位薄弱區(qū)段、問題設(shè)備,設(shè)備質(zhì)量整體把握,并關(guān)聯(lián)人員、機具、材料等生產(chǎn)生活設(shè)施。
自助式數(shù)據(jù)統(tǒng)計分析。利用BI工具的交互特性以及數(shù)據(jù)分析靈活性,依據(jù)不同維度不同統(tǒng)計指標(biāo),自助式開展各類統(tǒng)計分析工作。
異常數(shù)據(jù)識別。分別從基于固定數(shù)值、相對數(shù)值和分布特點3個方面對異常值進行提醒識別。
2.1.2? 基礎(chǔ)信息設(shè)計
各類工務(wù)基礎(chǔ)數(shù)據(jù)表。包括線路設(shè)備、橋隧設(shè)備、路基設(shè)備、運營情況、專題圖和LKJ等基礎(chǔ)數(shù)據(jù)以及本地管理的業(yè)務(wù)數(shù)據(jù)。
2.1.3? 可視化設(shè)計
首先準(zhǔn)備好數(shù)據(jù)展示的各類圖表,注意依據(jù)數(shù)據(jù)可視化設(shè)計原則選擇合適的圖表[6],常用的圖表類型選擇見表1。
各類構(gòu)成儀表板元素的圖表確定后,需要確定合適的屏幕分辨率和設(shè)計稿尺寸,根據(jù)工務(wù)基礎(chǔ)數(shù)據(jù)日常分析需求,抽取業(yè)務(wù)場景關(guān)鍵的指標(biāo),明確主次關(guān)系,提取業(yè)務(wù)中用戶最關(guān)心、最核心數(shù)據(jù)進行展示,對于次要的數(shù)據(jù)源和控件可以適當(dāng)弱化設(shè)計。
2.2? 數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備包括數(shù)據(jù)處理和數(shù)據(jù)建模2個階段。數(shù)據(jù)處理主要是讀取本地數(shù)據(jù)及PWMIS導(dǎo)出基礎(chǔ)數(shù)據(jù),在TableauPrep Builder和Tableau Desktop中完成數(shù)據(jù)處理。數(shù)據(jù)建模主要利用Tableau Desktop聯(lián)接和混合功能建立星型數(shù)據(jù)模型。
2.2.1? 數(shù)據(jù)處理
利用Tableau Prep Builder進行數(shù)據(jù)預(yù)處理,常用數(shù)據(jù)處理內(nèi)容包括字段重命名、字段篩選、清除異常值及重復(fù)項、數(shù)據(jù)轉(zhuǎn)置、聚合計算和數(shù)據(jù)合并等。
2.2.2? 數(shù)據(jù)建模
針對基礎(chǔ)數(shù)據(jù)管理的多張表,使用不同的關(guān)系、聯(lián)接和并集組合建立數(shù)據(jù)關(guān)系模型。主要通過2個層次來建立數(shù)據(jù)關(guān)系模型。一是在物理層,通過聯(lián)接、并集形式對各類基礎(chǔ)信息數(shù)據(jù)進行處理,如將不同站段的人員生產(chǎn)管理信息通過數(shù)據(jù)并集形式進行合并生成新的總表。二是在邏輯層,不同表之間通過關(guān)鍵字段建立關(guān)系。如在TableauPrep Builder中對車站信息表、股道信息表進行表間聯(lián)接操作,將線編號、車站名等字段作為關(guān)鍵字段放入聯(lián)接子句,通過右側(cè)聯(lián)接方式快速識別兩表不匹配處所,及時核對更改。
2.3? 可視化實現(xiàn)
2.3.1? 全局設(shè)備概覽
主要對局管內(nèi)線管轄線路里程、車站總數(shù)、股道條數(shù)、曲線條數(shù)、道岔組數(shù)、橋梁隧道座數(shù)和道口個數(shù)等基本情況進行統(tǒng)計。如圖2所示,某局管內(nèi)工務(wù)設(shè)備總體概覽。
2.3.2? 各類設(shè)備統(tǒng)計分析
根據(jù)業(yè)務(wù)需要對某單項設(shè)備自助式分析。如圖3所示,某局管內(nèi)所有道岔分布按線別、按車站、按圖號進行統(tǒng)計分析。安排大修計劃需要淘汰某種型號道岔時,可通過交互快速定位到其分布車站,也可與大維修歷史數(shù)據(jù)關(guān)聯(lián)其大維修信息。
3? 臺賬管理人員數(shù)據(jù)素養(yǎng)提升策略
3.1? 推進數(shù)據(jù)意識培養(yǎng)
一是在工務(wù)系統(tǒng)內(nèi)部積極營造數(shù)據(jù)分析氛圍。定期組織專題培訓(xùn),提升臺賬管理人員的數(shù)據(jù)意識,增強對數(shù)字信息的敏感度,開展類似Excel等基礎(chǔ)數(shù)據(jù)分析工具的培訓(xùn)工作。通過以比促學(xué)等方式增強臺賬管理人員對數(shù)據(jù)知識的求知欲,鍛煉利用檢索網(wǎng)絡(luò)數(shù)字資源分析和解決問題的能力,并不斷提升自身的數(shù)據(jù)資源應(yīng)用水平和利用能力。
二是重視數(shù)據(jù)分析思維模式的培養(yǎng)。數(shù)據(jù)分析思維是在數(shù)據(jù)分析過程中,一套完整的發(fā)現(xiàn)、思考、解決問題的方法論,通過建立一套科學(xué)合理的數(shù)據(jù)監(jiān)測與評價體系來總結(jié)規(guī)律、發(fā)現(xiàn)異常、提出建議。數(shù)據(jù)分析思維通常包括結(jié)構(gòu)化思維、公式化思維和業(yè)務(wù)化思維,臺賬管理人員可從不同維度加以提升,見表2。
3.2? 分層分類開展培訓(xùn)
一是加強數(shù)據(jù)知識學(xué)習(xí)。臺賬管理人員應(yīng)熟練獲取各類數(shù)據(jù),了解數(shù)據(jù)源、數(shù)據(jù)獲取途徑,掌握檢索與收集數(shù)據(jù)的基礎(chǔ)能力,能夠?qū)?shù)據(jù)的格式、類型、特點做出精準(zhǔn)解讀。能用基本描述統(tǒng)計量描述基礎(chǔ)數(shù)據(jù)的平均值、中位數(shù)、標(biāo)準(zhǔn)差和分布特征等,合理選擇圖表表達解釋數(shù)據(jù)。
二是提升數(shù)據(jù)分析技能。如通過開展軟件使用培訓(xùn),讓臺賬管理人員可以靈活選擇工具處理分析原始數(shù)據(jù),利用統(tǒng)計分析軟件對獲取的數(shù)據(jù)做出恰當(dāng)統(tǒng)計分析,結(jié)合經(jīng)驗與實際對統(tǒng)計分析結(jié)果做出精準(zhǔn)解釋。如結(jié)合生產(chǎn)實際構(gòu)建多元化數(shù)據(jù)應(yīng)用場景,提升數(shù)據(jù)理解能力及遷移能力。
4? 結(jié)束語
工務(wù)基礎(chǔ)數(shù)據(jù)管理工作重要且繁雜,大數(shù)據(jù)時代對數(shù)據(jù)管理者的數(shù)據(jù)意識、數(shù)據(jù)知識、數(shù)據(jù)技能提出了更高的要求。通過開展基于Tableau的鐵路工務(wù)基礎(chǔ)數(shù)據(jù)可視化管理實踐,助力臺賬管理人員提升數(shù)據(jù)素養(yǎng),提升了大數(shù)據(jù)應(yīng)用能力,提高了工務(wù)基礎(chǔ)數(shù)據(jù)管理水平。
參考文獻:
[1] 李擎,張秋艷,白磊.一種基于文本挖掘的鐵路基礎(chǔ)設(shè)施設(shè)備風(fēng)險隱患識別模型[J].鐵路計算機應(yīng)用,2018,27(2):1-4.
[2] 雷元.34招精通商業(yè)智能數(shù)據(jù)分析·Power BI和Tableau進階實戰(zhàn)[M].北京:電子工業(yè)出版社,2021:1-2.
[3] 吳明宇.大數(shù)據(jù)時代下高校教師數(shù)據(jù)素養(yǎng)能力的提升路徑[J].經(jīng)濟研究導(dǎo)刊,2023(13):127.
[4] 王麗潔.工務(wù)線路設(shè)備技術(shù)臺賬失準(zhǔn)的原因及對策[J].鐵道技術(shù)監(jiān)督,2013(5):30-32.
[5] 喜樂君.數(shù)據(jù)可視化分析·業(yè)務(wù)可視化分析[M].北京:電子工業(yè)出版社,2021:8-10.
[6] 郝媛玲,沈婷婷.高校文理科研究生數(shù)據(jù)素養(yǎng)比較[J].圖書館論壇,2016(8):126-132.