宋 云
(中國鐵路北京局集團有限公司 統(tǒng)計和節(jié)能環(huán)保所,北京 100860)
統(tǒng)計數(shù)據(jù)分析是發(fā)揮統(tǒng)計工作咨詢、監(jiān)督等功能的主要手段,是為決策者提供數(shù)據(jù)支持和決策依據(jù)的重要方法。2015年,中國鐵路總公司規(guī)劃了208個物流基地,其中一級33個、二級175個[1],近年來逐步建成開通。對鐵路統(tǒng)計分析工作而言,鐵路物流基地統(tǒng)計分析屬于新興業(yè)態(tài),傳統(tǒng)以生產(chǎn)管理為核心的鐵路貨場的數(shù)據(jù)采集分析方法,難以滿足效率效益導向型鐵路物流基地數(shù)據(jù)分析的需求。為準確把握鐵路物流基地的建設(shè)運營情況,在全面、準確地采集鐵路物流基地運營統(tǒng)計數(shù)據(jù)基礎(chǔ)上,需要選用科學、合理的方法系統(tǒng)地分析統(tǒng)計數(shù)據(jù),對于充分發(fā)揮統(tǒng)計工作對鐵路物流基地業(yè)務(wù)運營的支撐作用,具有重要的理論價值和實際意義。
鐵路物流基地統(tǒng)計數(shù)據(jù)采集方法是指根據(jù)研究目的和要求,主要針對調(diào)查對象、調(diào)查單位的原始資料開展搜集登記工作的采集方法。按照統(tǒng)計數(shù)據(jù)的來源,可以分為鐵路內(nèi)部統(tǒng)計數(shù)據(jù)采集法和入駐企業(yè)統(tǒng)計數(shù)據(jù)采集法。
(1)統(tǒng)計報表采集法。統(tǒng)計報表采集法是鐵路內(nèi)部統(tǒng)計數(shù)據(jù)采集的主要采集方法之一,目前多項鐵路物流統(tǒng)計數(shù)據(jù)都是采用統(tǒng)計報表的方法進行提報和采集的,多按照中國鐵路總公司、鐵路局集團公司和各專業(yè)運輸公司的相關(guān)規(guī)定,明確統(tǒng)計報表的內(nèi)容、表式和時間程序等信息,自上而下統(tǒng)一布置、自下而上逐級上報。目前鐵路內(nèi)部的統(tǒng)計通常采用定期統(tǒng)計報表制度,用于采集企業(yè)業(yè)務(wù)運營中的各類數(shù)據(jù),為企業(yè)管理部門和相關(guān)政府部門管理決策提供重要的數(shù)據(jù)資料。例如,與機車、貨車和運輸過程統(tǒng)計相關(guān)的統(tǒng)計信息,其統(tǒng)計報表可以采用《鐵路機車統(tǒng)計規(guī)則》(鐵總計統(tǒng)[2016] 261號)、《鐵路貨車統(tǒng)計規(guī)則》(鐵總計統(tǒng)[2017] 195號)和《鐵路貨物運輸統(tǒng)計規(guī)則》(鐵總計統(tǒng)[2017] 121號)中的已有統(tǒng)計報表。對于既有的鐵路運輸相關(guān)統(tǒng)計規(guī)則或統(tǒng)計管理辦法中尚未涉及,需要新增的統(tǒng)計報表,應(yīng)充分遵循統(tǒng)計報表設(shè)計規(guī)則,在完成設(shè)計和初步試用后,納入相關(guān)統(tǒng)計規(guī)則,形成固定的統(tǒng)計模式,在鐵路物流基地的運營統(tǒng)計中實施應(yīng)用。
(2)信息系統(tǒng)采集法。信息系統(tǒng)采集法是除了統(tǒng)計報表采集法外,在現(xiàn)代企業(yè)管理中的另一種重要的數(shù)據(jù)采集方法[2]。當前我國鐵路經(jīng)營管理中,涉及到眾多的管理信息系統(tǒng),主要包括:貨運電子商務(wù)系統(tǒng)、貨票系統(tǒng)、貨運站系統(tǒng)、集裝箱管理系統(tǒng)、零散快運貨物作業(yè)平臺、現(xiàn)車系統(tǒng)、十八點統(tǒng)計分析系統(tǒng)、接取送達物流系統(tǒng)等。通過既有的鐵路生產(chǎn)管理信息系統(tǒng),可以提取得到各項所需的鐵路物流基地運營統(tǒng)計數(shù)據(jù)信息。與此同時,為進一步完善鐵路物流基地運營統(tǒng)計信息采集和業(yè)務(wù)運營管理,還可以根據(jù)實際需要建立相對獨立的鐵路物流基地管理信息系統(tǒng)。利用該系統(tǒng),可以采集鐵路物流基地運營中產(chǎn)生的各類統(tǒng)計數(shù)據(jù),如鐵路物流業(yè)務(wù)規(guī)模統(tǒng)計數(shù)據(jù)、物流經(jīng)營效益統(tǒng)計數(shù)據(jù)、物流基礎(chǔ)設(shè)施設(shè)備統(tǒng)計數(shù)據(jù)、物流從業(yè)人員統(tǒng)計數(shù)據(jù)、物流服務(wù)質(zhì)量及社會貢獻統(tǒng)計數(shù)據(jù)等。對于來自既有鐵路生產(chǎn)管理信息系統(tǒng)的統(tǒng)計數(shù)據(jù)與來自鐵路物流基地自身管理信息系統(tǒng)的統(tǒng)計數(shù)據(jù),可以通過建立的數(shù)據(jù)傳輸通道和規(guī)定的數(shù)據(jù)處理規(guī)則,進行信息處理整合,形成完善的鐵路物流基地業(yè)務(wù)運營基礎(chǔ)數(shù)據(jù)庫,為后續(xù)的業(yè)務(wù)評價和決策支持提供原始數(shù)據(jù)資料。
(3)專門調(diào)查采集法。專門調(diào)查采集法是數(shù)據(jù)統(tǒng)計工作中,對于統(tǒng)計報表采集法和信息系統(tǒng)采集法的一種重要補充。針對運營管理中需要解決的突出問題,在需要相關(guān)統(tǒng)計數(shù)據(jù)支撐時,即可采用專門調(diào)查采集法,對目標調(diào)查對象進行專門調(diào)查,由專業(yè)的數(shù)據(jù)統(tǒng)計調(diào)查人員,實地赴調(diào)查對象所在地,進行相關(guān)數(shù)據(jù)的采集。例如,為全面了解和掌握當前我國鐵路物流基地的規(guī)劃、建設(shè)和運營狀況,中國鐵路總公司在2018年3月和2018年10月,分別組織專門的調(diào)查人員2次赴各鐵路局集團公司的典型鐵路物流基地進行專門調(diào)查。通過調(diào)查,采集到了全路各級別鐵路物流基地的建設(shè)運營數(shù)據(jù),為鐵路物流基地運營評價和發(fā)展戰(zhàn)略調(diào)整奠定了良好基礎(chǔ)。
鐵路物流基地與傳統(tǒng)鐵路貨場的顯著區(qū)別之一表現(xiàn)在其具有更好的市場開放性,除服務(wù)于鐵路運輸企業(yè)自身以外,其向社會物流企業(yè)、生產(chǎn)企業(yè)、商貿(mào)企業(yè)等社會企業(yè)開放,積極引導社會企業(yè)入駐基地,形成鐵路基礎(chǔ)設(shè)施與社會企業(yè)設(shè)施的融合發(fā)展。在對鐵路物流基地入駐企業(yè)信息的統(tǒng)計過程中,可能涉及到入駐企業(yè)商業(yè)信息保密等因素,導致信息統(tǒng)計不全或難以實現(xiàn)。因此,在入駐企業(yè)統(tǒng)計數(shù)據(jù)采集中,主要有以下方法。
(1)基于物流基地監(jiān)控方案的入駐企業(yè)數(shù)據(jù)采集法。鐵路物流基地監(jiān)控方案是確保鐵路物流基地安全運營的基礎(chǔ)和保障。通過對鐵路物流基地內(nèi)部及周邊進行視頻監(jiān)控,包括周邊道路監(jiān)控、物流基地出入口監(jiān)控、內(nèi)部道路監(jiān)控、停車場監(jiān)控、作業(yè)區(qū)監(jiān)控和辦公區(qū)監(jiān)控等,可以獲得入駐企業(yè)物流車輛、人員的生產(chǎn)情況,進而獲得入駐企業(yè)在鐵路物流基地經(jīng)營的相關(guān)統(tǒng)計數(shù)據(jù)。
(2)基于合作協(xié)議的入駐企業(yè)數(shù)據(jù)提報法。入駐企業(yè)與鐵路物流基地是長期合作、利益共贏的合作伙伴,為進一步改善物流基地服務(wù)狀況,提升服務(wù)水平,鐵路物流基地可以同入駐企業(yè)簽訂戰(zhàn)略合作協(xié)議,在協(xié)議允許范圍內(nèi),要求鐵路物流基地入駐企業(yè)提報一定的在該基地運營的生產(chǎn)信息,如在該基地到發(fā)的業(yè)務(wù)量、收入等。采用基于合作協(xié)議的入駐企業(yè)數(shù)據(jù)提報方法,可以獲得更為詳盡、準確的鐵路物流基地入駐企業(yè)統(tǒng)計數(shù)據(jù)。
(3)基于第三方調(diào)查的入駐企業(yè)數(shù)據(jù)采集法?;诘谌秸{(diào)查的入駐企業(yè)數(shù)據(jù)采集法,主要應(yīng)用于對鐵路物流基地入駐企業(yè)滿意度的調(diào)查,可以通過引入專業(yè)的第三方數(shù)據(jù)調(diào)查及咨詢機構(gòu),利用其專業(yè)的數(shù)據(jù)采集及評價技術(shù),對入駐企業(yè)的滿意度進行調(diào)查,分析調(diào)查結(jié)果,提出鐵路物流基地改進服務(wù)內(nèi)容及提升業(yè)務(wù)水平的建議和意見。
由于鐵路物流基地統(tǒng)計數(shù)據(jù)的采集渠道多樣,因而不同統(tǒng)計主體或統(tǒng)計人員在進行原始記錄生成整理的時候,難免產(chǎn)生多個記錄表征同一統(tǒng)計對象的情況,此類數(shù)據(jù)被稱為重復(fù)記錄。消除重復(fù)記錄可以針對2個數(shù)據(jù)集或者一個合并后的數(shù)據(jù)集,檢測出標識同一個鐵路物流基地的重復(fù)記錄,即匹配過程。檢測重復(fù)記錄的算法主要有:遞歸的字段匹配算法、基本的字段匹配算法、編輯距離、Smith-Waterman算法、Cosine相似度函數(shù)等。
異常數(shù)據(jù)是指由于人工記錄失誤、信息系統(tǒng)錯誤或者統(tǒng)計報表錯誤等原因,而產(chǎn)生的與實際數(shù)據(jù)不符的異常值,也就是有利于數(shù)據(jù)聚類以外的離群點數(shù)據(jù)。異常數(shù)據(jù)的處理通常是基于統(tǒng)計分析算法及數(shù)據(jù)挖掘技術(shù),采用聚類算法獲得數(shù)據(jù)聚類,再從中剔除偏離數(shù)據(jù)聚類的離點。同時,還存在一類異常數(shù)據(jù),就是在統(tǒng)計過程中不符合統(tǒng)計標準的數(shù)據(jù),如在就業(yè)崗位數(shù)量統(tǒng)計中統(tǒng)計數(shù)據(jù)出現(xiàn)的小數(shù)。
鐵路物流基地數(shù)據(jù)統(tǒng)計時,很難避免出現(xiàn)數(shù)據(jù)缺失,產(chǎn)生的原因可能有人因疏失或系統(tǒng)錯誤。處理缺失數(shù)據(jù)的方法主要有:刪除整條數(shù)據(jù)記錄、進行二次統(tǒng)計或采用擬合方法填補缺失數(shù)據(jù)和不予處理等。由于不能放棄對于某個鐵路物流基地運營情況的評價,因而刪除整條數(shù)據(jù)記錄的方式,在進行鐵路物流基地運營評價中不可行。不處理的方式則會導致鐵路物流基地運營評價模型在計算中因個別數(shù)據(jù)確實出現(xiàn)運算錯誤,影響評價結(jié)果。因此,在遇到缺失數(shù)據(jù)時,應(yīng)采用進行二次統(tǒng)計或數(shù)據(jù)擬合的方法,對缺失的統(tǒng)計數(shù)據(jù)項進行補充完善,形成完整的統(tǒng)計數(shù)據(jù)記錄。
鐵路物流基地基礎(chǔ)數(shù)據(jù)處理工作從總體上可以分為4個主要環(huán)節(jié):數(shù)據(jù)采集、數(shù)據(jù)審核、數(shù)據(jù)預(yù)處理和統(tǒng)計數(shù)據(jù)分析[3]。在鐵路物流基地基礎(chǔ)數(shù)據(jù)統(tǒng)計過程中,需要各個部門、各個單位,環(huán)環(huán)相扣?;谛畔⒓夹g(shù)的鐵路物流基地基礎(chǔ)數(shù)據(jù)處理流程如圖1所示。
圖1 鐵路物流基地基礎(chǔ)數(shù)據(jù)處理流程Fig.1 Basic data processing flow for railway logistics parks
(1)數(shù)據(jù)采集。數(shù)據(jù)采集是鐵路物流基地統(tǒng)計的開始,也是進行鐵路物流基地統(tǒng)計及評價分析工作的基礎(chǔ)。通過合理設(shè)計數(shù)據(jù)采集方法,得到完善的鐵路物流基地統(tǒng)計基礎(chǔ)數(shù)據(jù),是保證鐵路物流基地運營評價結(jié)果科學性的根本保證。
(2)數(shù)據(jù)審核。數(shù)據(jù)審核是進一步確保統(tǒng)計數(shù)據(jù)質(zhì)量的方法和手段,通過完整性審核、準確性審核和規(guī)范性審核,能夠彌補統(tǒng)計數(shù)據(jù)采集工作中出現(xiàn)的不足,作為提升統(tǒng)計數(shù)據(jù)質(zhì)量的第2道保障。
(3)數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是統(tǒng)計數(shù)據(jù)分析動作的前期準備,在完成數(shù)據(jù)采集及審核工作后,采用科學手段對數(shù)據(jù)中的噪聲數(shù)據(jù)進行清理和校正,進一步提升數(shù)據(jù)統(tǒng)計分析及評價結(jié)果的科學性。
(4)統(tǒng)計數(shù)據(jù)分析。統(tǒng)計數(shù)據(jù)分析通過運用一系列科學的數(shù)量分析方案和經(jīng)濟理論知識對已經(jīng)加工整理過的鐵路物流基地統(tǒng)計數(shù)據(jù)及其他信息加以分析和研究,以概括出各項統(tǒng)計數(shù)據(jù)之間或其他統(tǒng)計信息之間的本質(zhì)聯(lián)系,從而反映出各種經(jīng)營現(xiàn)象和管理工作之間的聯(lián)系,以達到最終指導經(jīng)營,為管理層決策提供數(shù)據(jù)支撐和理論依據(jù)的目的[4]。
鐵路物流基地統(tǒng)計數(shù)據(jù)分析是進行鐵路物流基地統(tǒng)計的重要目的之一,通過對統(tǒng)計獲得的基礎(chǔ)數(shù)據(jù)進行分析,可以發(fā)現(xiàn)統(tǒng)計數(shù)據(jù)中存在的數(shù)學規(guī)律,反映鐵路物流基地的運營情況。K-means聚類算法是一種解決大數(shù)據(jù)聚類問題的方法,其特征是能夠很好地解決超大規(guī)模數(shù)據(jù)集與高維數(shù)據(jù)集的聚類。結(jié)合鐵路物流基地統(tǒng)計字段較多、數(shù)據(jù)規(guī)模巨大的特征,基于K-means聚類算法對鐵路物流基地統(tǒng)計數(shù)據(jù)分析方法進行研究,并結(jié)合實際算例進行驗證。
K-means聚類算法是一種迭代求解的聚類分析算法,其應(yīng)用步驟如下。首先隨即選取K個評價對象作為模型的初始聚類中心,然后依次計算每個對象與各聚類中心之間的空間距離,依據(jù)每個對象與各個聚類中心之間的距離,將所有對象分配給距離其最近的聚類中心[5]。每個聚類中心及分配給其的聚類對象分別代表一個聚類。當全部聚類對象都被分配完畢后,表示一次計算結(jié)束,每個聚類的聚類中心會根據(jù)聚類中分配的現(xiàn)有對象被重新計算。重復(fù)迭代此過程,直至滿足某個終止條件為止,完成聚類計算。聚類終止條件既可以是無聚類中心或最小數(shù)目的聚類中心再發(fā)生變化,無對象或最小數(shù)目對象被重新分配給不同的聚類,也可以是聚類誤差的平方和局部最小等。研究選取聚類誤差的平方和局部最小作為終止聚類算法的計算條件[6]。實際操作中,可以應(yīng)用SPSS數(shù)據(jù)分析軟件,使用軟件嵌套的K-means聚類算法對統(tǒng)計數(shù)據(jù)進行自動化聚類分析,獲得聚類分析結(jié)果。K-means聚類算法在鐵路物流基地統(tǒng)計數(shù)據(jù)分析中的應(yīng)用流程如圖2所示。
基于對全路鐵路物流基地運營統(tǒng)計數(shù)據(jù)的統(tǒng)計調(diào)查結(jié)果,選取28個鐵路物流基地的統(tǒng)計數(shù)據(jù)作為案例分析對象,對統(tǒng)計數(shù)據(jù)分析方法的可行性和有效性進行驗證。
圖2 K-means 聚類算法在鐵路物流基地統(tǒng)計數(shù)據(jù)分析中的應(yīng)用流程Fig.2 Application flow of K-means clustering algorithm in statistical data analysis of railway logistics parks
由于當前鐵路物流基地數(shù)據(jù)采集的手段還較為傳統(tǒng),以人工填報統(tǒng)計報表方式為主,采集運營管理數(shù)據(jù)的效率低下[7-8]。因此,在鐵路物流基地調(diào)查的數(shù)據(jù)采集過程中,在統(tǒng)計數(shù)據(jù)采集質(zhì)量和效率方面,都存在一定的問題。通過統(tǒng)計表報采集到的鐵路物流基地運營管理數(shù)據(jù),在數(shù)據(jù)的規(guī)范性、完整性、科學性等方面,均存在不足。在此采用二次統(tǒng)計和數(shù)據(jù)擬合等方式填補空缺數(shù)據(jù),并對數(shù)據(jù)噪音進行清理,以有效提升鐵路物流基地運營評價的科學性及合理性。經(jīng)調(diào)查統(tǒng)計及數(shù)據(jù)預(yù)處理,整理得到28個鐵路物流基地的統(tǒng)計數(shù)據(jù)如表1所示。
對表1中數(shù)值進行歸一化處理,采用SPSS軟件對28個統(tǒng)計對象進行K-means聚類分析,聚類結(jié)果顯示,統(tǒng)計對象被分為4類,其中,第一類包含10個對象,第二類包含11個對象,第三類包含6個對象,第四類包含1個對象。進一步分析各聚類的數(shù)據(jù)特征,可以判斷其中第二類屬于運營狀況最好的聚類,第一類運營狀況較好,第三類運營狀況適中,第四類運營狀況欠佳。總體看來,運營狀況良好的鐵路物流基地占比39.3%,運營狀況較好的鐵路物流基地占比35.6%,鐵路物流基地的整體運營狀況較為理想。
結(jié)合鐵路物流基地的實際運營情況來看,大部分一級鐵路物流基地為新規(guī)劃建設(shè)的鐵路物流基地,其投入運營時間較短,尚處于市場開拓期,在經(jīng)營業(yè)績方面還存在很好的發(fā)展空間,可以通過進一步開拓市場和優(yōu)化調(diào)整經(jīng)營策略,實現(xiàn)更大程度的業(yè)績提升。部分二級、三級鐵路物流基地,是由既有鐵路貨場轉(zhuǎn)型升級改造而來,具有很好的市場基礎(chǔ),此類鐵路物流基地應(yīng)繼續(xù)積極發(fā)揮既有優(yōu)勢,規(guī)避發(fā)展中可能存在的劣勢,優(yōu)化運營管理策略,促進業(yè)績提升。
鐵路物流基地統(tǒng)計數(shù)據(jù)分析的最終目標,是為鐵路物流基地規(guī)劃建設(shè)和運營管理優(yōu)化調(diào)整提供決策依據(jù),以實現(xiàn)全面提升鐵路物流基地運營水平和經(jīng)營效益的目的。通過優(yōu)化鐵路物流基地統(tǒng)計數(shù)據(jù)、統(tǒng)計分析方法,可以獲得更為科學合理的數(shù)據(jù)分析結(jié)果,用以指導鐵路物流基地的經(jīng)營實際,以取得更好的運營效果。在總結(jié)梳理鐵路物流基地運營策略優(yōu)化過程中存在共性問題和通用經(jīng)驗的基礎(chǔ)上,獲得可推廣、可應(yīng)用的鐵路物流基地運營策略優(yōu)化建議,以推動統(tǒng)計工作對業(yè)務(wù)運營指導作用的發(fā)揮,可以為實現(xiàn)鐵路物流基地高質(zhì)量發(fā)展提供有力的數(shù)據(jù)支持。