魏寶紅 周 慶
(1. 西安鐵路職業(yè)技術(shù)學(xué)院 陜西西安 710014;2. 陜西易通人力資源開發(fā)有限責(zé)任公司 陜西西安 710014)
隨著市場經(jīng)濟(jì)的深入,鐵路運(yùn)輸企業(yè)如何能把握住市場脈搏,滿足旅客對(duì)出行交通工具和旅途服務(wù)的需求,贏得運(yùn)輸市場,提高鐵路運(yùn)營效率,是擺在鐵路部門面前的關(guān)鍵問題,旅客出行行為研究就顯得非常重要。為了準(zhǔn)確地研究其行為,筆者采用Aprior方法從模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中提取隱含的、有用的信息。通過對(duì)大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換和處理,從中提取輔助管理決策的關(guān)鍵性數(shù)據(jù),對(duì)旅客進(jìn)行細(xì)分,以地域、收入水平、偏好等大量的旅客歸類,明確旅客服務(wù)增殖的目標(biāo)乘客。
該論文以西成高鐵客運(yùn)通道為例,對(duì)西成高鐵的旅客特征和乘客價(jià)值進(jìn)行分析,利用Aprior技術(shù)探討高鐵旅客用戶行為和需求,為鐵路運(yùn)輸管理者建言獻(xiàn)策,也為日后其他高鐵客運(yùn)專線運(yùn)營提供參考價(jià)值。
旅客出行行為是指旅客為某一目的出行(通勤、探親、出差、休閑)乘坐高鐵從出發(fā)地到目的地的移動(dòng)的行為。本研究于2019年11月和12月期間,收集了西成高鐵在該年的11月1日至11月30日鐵路客戶服務(wù)中心系統(tǒng)后臺(tái)日志數(shù)據(jù),所獲取的數(shù)據(jù)跨越30天,數(shù)據(jù)總量共達(dá)到了3.67GB。該系統(tǒng)的日志數(shù)據(jù)詳細(xì)記錄了旅客乘坐西成高鐵的出行及獲得相關(guān)服務(wù)的信息,如旅客證件信息、旅客進(jìn)出站記錄、購票記錄、改簽及退換票記錄、接入網(wǎng)絡(luò)的IP地址及終端信息、乘坐車次、列車發(fā)車時(shí)間、旅客使用高鐵訂餐相關(guān)服務(wù)的記錄等。
為進(jìn)一步明確西成高鐵旅客用戶行為與其對(duì)西成高鐵服務(wù)的需求,我們從中篩選了部分利用西成高鐵增值服務(wù)比較頻繁的旅客用戶,對(duì)其利用西成高鐵增值服務(wù)的相關(guān)數(shù)據(jù)信息進(jìn)行了獲取與挖掘。通過對(duì)用戶登陸鐵路服務(wù)系統(tǒng)以及車站安檢系統(tǒng)中的用戶行為數(shù)據(jù)與其IP地址和其預(yù)留在中鐵路服務(wù)系統(tǒng)中的個(gè)人身份信息進(jìn)行匹配,我們獲得了用戶個(gè)人信息、用戶使用高鐵服務(wù)的信息,這些數(shù)據(jù)約占到了總記錄數(shù)的32.75%。用戶通過鐵路服務(wù)系統(tǒng)所能夠獲得的高鐵服務(wù)主要有車票查詢服務(wù)、列車運(yùn)行信息查詢服務(wù)、人工售票服務(wù)、自助售票服務(wù)、人工檢票服務(wù)、自助檢票服務(wù)、便捷通道服務(wù)、站內(nèi)咨詢服務(wù)、餐飲服務(wù)、商品零售服務(wù)、WIFI與電源服務(wù)、醫(yī)療服務(wù)、睡眠膠囊服務(wù)、時(shí)刻表售賣服務(wù)、托運(yùn)服務(wù)、休閑娛樂服務(wù)等服務(wù)。
Aprior算法的基本思想是以遞歸的方式反映從數(shù)據(jù)集中尋找出現(xiàn)頻次多的項(xiàng)集,進(jìn)而產(chǎn)生選項(xiàng)集,對(duì)達(dá)到最小支持度要求的候選項(xiàng)集進(jìn)行保留,而刪除那些不滿足要求的數(shù)據(jù)。在該算法執(zhí)行的過程中,通常將最大前項(xiàng)數(shù)據(jù)的閾值設(shè)置為1,而小最置信度數(shù)據(jù)設(shè)置為10%,其具體流程如圖1所示。
圖1 基于Aprior算法流程圖
表1顯示了基于Aprior算法的西成高鐵旅客用戶數(shù)據(jù)聚類結(jié)果。可以看出通過數(shù)據(jù)聚類,鐵路服務(wù)系統(tǒng)各項(xiàng)服務(wù)之間的關(guān)聯(lián)規(guī)則被揭示出來。車票查詢和自助售票兩項(xiàng)服務(wù)之間的關(guān)聯(lián)性最強(qiáng),其次是列車運(yùn)行和車票查詢兩項(xiàng)服務(wù),再次是自助售票和自助檢票,說明旅客用戶利用西成高鐵出行最基本的幾項(xiàng)服務(wù)之間具有比較高的關(guān)聯(lián)性,并且也是置信度最高的幾項(xiàng)關(guān)聯(lián)規(guī)則,這說明西成高鐵的大部分旅客用戶在利用鐵路服務(wù)系統(tǒng)進(jìn)行車票與列車相關(guān)查詢操作后,會(huì)選擇優(yōu)先到車站的自助設(shè)備上完成購票、取票或檢票等操作,西成高鐵若要宣傳和推廣自身的增值服務(wù),將這些基本服務(wù)與增值服務(wù)建立起相應(yīng)的關(guān)聯(lián)關(guān)系是當(dāng)務(wù)之急。置信度比較高的關(guān)聯(lián)規(guī)則還有便捷通道和托運(yùn)服務(wù)之間關(guān)聯(lián)規(guī)則,說明西成高鐵的許多旅客用戶在選擇通過車站提供的便捷通道進(jìn)入候車區(qū)域后,還會(huì)選擇將使用車站提供的托運(yùn)服務(wù)使自己享受到進(jìn)一步的便捷服務(wù)。此外,我們還發(fā)現(xiàn)了便捷通道與休閑娛樂、站內(nèi)咨詢與餐飲服務(wù)、休閑娛樂與WIFI電源、商品零售與休閑娛樂、列車運(yùn)行與托運(yùn)服務(wù)、自助檢票與WIFI電源等服務(wù)之間關(guān)聯(lián)性,這些關(guān)聯(lián)規(guī)則的揭示,都有利于西成高鐵對(duì)當(dāng)前的系統(tǒng)與服務(wù)進(jìn)行改進(jìn),更好地提升用戶對(duì)西成高鐵服務(wù)的利用率。
表1 關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的高鐵增值業(yè)務(wù)
?
總體來看,本研究運(yùn)用K-means算法和Aprior算法對(duì)西成高鐵旅客用戶的出行及其活動(dòng)行為進(jìn)行分析,揭示了西成高鐵旅客用戶行為與需求進(jìn)行了挖掘。通過K-means算法進(jìn)行聚類分析,我們得出了六個(gè)類:第1類用戶對(duì)西成高鐵路服務(wù)系統(tǒng)的利用及其出行行為與活動(dòng)處于中等水平,其目的主要以一般服務(wù)的使用為主,這類旅客用戶對(duì)西成高鐵增值服務(wù)的使用頻次并不高,因此西成高鐵可重點(diǎn)關(guān)注這類用戶在出行目的地及其在出行過程中的服務(wù)使用記錄,有針對(duì)性地為這些旅客推薦一些出行或休閑相關(guān)的信息,以使?jié)M足這類旅客用戶的出行需求;第2類旅客用戶的出行次數(shù)以及出行中的活動(dòng)行為數(shù)量都相對(duì)較少,且增值服務(wù)使用行為所占的比重相對(duì)較高,其桌面端的用戶占多數(shù),這與本研究之前所得出的結(jié)論保持一致。針對(duì)這類用戶,西成高鐵在進(jìn)行高鐵服務(wù)精確推送的同時(shí),還可通過各種系統(tǒng)服務(wù)平臺(tái)與短信等渠道為其推薦更多的服務(wù)、資源供其選擇;第3類僅包含26個(gè)記錄,且該聚類下的一般服務(wù)使用次數(shù)、增值服務(wù)使用次數(shù)、出行中的活動(dòng)次數(shù)、活動(dòng)持續(xù)時(shí)間、利用高鐵服務(wù)數(shù)量的值均要遠(yuǎn)大于其他五個(gè)類,該類存在異常的情況,故而舍去;第4類和第5類用戶屬于兩類行為相反的用戶群,第4類的用戶屬于以一般服務(wù)使用為主要目的,主要利用桌面端設(shè)備進(jìn)行操作,會(huì)在鐵路服務(wù)系統(tǒng)中留下比較多的服務(wù)使用記錄,以獲取精確的服務(wù)項(xiàng)目的用戶群,該類用戶進(jìn)行其他的情況相對(duì)較少,而第5類的用戶屬于更愿意利用鐵路服務(wù)系統(tǒng)中其他服務(wù)的用戶,這類用戶以利用智能設(shè)備為主;第6類用戶一般服務(wù)行為和增值服務(wù)使用行為的頻次上都不算多,但其活動(dòng)記錄的次數(shù)卻達(dá)到了117.54次,說明這類用戶比較喜歡漫無目的在鐵路服務(wù)系統(tǒng)進(jìn)行相關(guān)無關(guān)操作,這類用戶利用西成高鐵出行的需求并不明確,需要為之提供必要的指導(dǎo)。
另外,從基于Aprior算法的西成高鐵旅客用戶數(shù)據(jù)聚類結(jié)果揭示的各項(xiàng)服務(wù)之間的關(guān)聯(lián)規(guī)則來看,車票查詢和自助售票兩項(xiàng)服務(wù)之間的關(guān)聯(lián)性最強(qiáng),其次是列車運(yùn)行和車票查詢兩項(xiàng)服務(wù),再次是自助售票和自助檢票,說明旅客用戶利用西成高鐵出行最基本的幾項(xiàng)服務(wù)之間具有比較高的關(guān)聯(lián)性,并且也是置信度最高的幾項(xiàng)關(guān)聯(lián)規(guī)則。置信度比較高的關(guān)聯(lián)規(guī)則還有便捷通道和托運(yùn)服務(wù)之間關(guān)聯(lián)規(guī)則,說明西成高鐵的許多旅客用戶在選擇通過車站提供的便捷通道進(jìn)入候車區(qū)域后,還會(huì)選擇將使用車站提供的托運(yùn)服務(wù)使自己享受到進(jìn)一步的便捷服務(wù)。這些關(guān)聯(lián)規(guī)則的揭示,都有利于西成高鐵對(duì)當(dāng)前的系統(tǒng)與服務(wù)進(jìn)行改進(jìn),更好地提升用戶對(duì)西成高鐵服務(wù)的利用率。