朱文斌 上海鐵路局新上鐵實業(yè)發(fā)展集團有限公司
鐵路客站商業(yè)大數據的采集與應用
朱文斌 上海鐵路局新上鐵實業(yè)發(fā)展集團有限公司
隨著鐵路客運配套商業(yè)的高速發(fā)展,傳統數據庫技術已無法滿足海量的客站商業(yè)數據處理運用的需求,客站商業(yè)大數據的管理和使用成為突出問題。如何通過大數據技術來采集、分析、處理和應用客站商業(yè)數據,及時掌握旅客消費傾向,動態(tài)調整客站業(yè)態(tài)布局,就變得尤為重要。
客站商業(yè);大數據;數據處理技術
客站商業(yè)是鐵路客運的重要組成部分,直接影響廣大旅客出行的消費需求。因此必須準確掌握旅客出行需求,及時動態(tài)調整客站業(yè)態(tài)分布,在服務好旅客的同時也提升了企業(yè)的效益。近年來,由于新線新站的大量開發(fā)以及電子商務的迅速崛起,傳統的技術手段已無法滿足龐大的客站商業(yè)數據的處理需要,需要引入更先進的大數據處理技術,才能更好地從龐大的數據海中挖掘的更有價值的商業(yè)信息。
1.1名家揭開大數據序幕
2013年5月10日,阿里巴巴集團董事局主席馬云在淘寶十周年晚會上,將卸任阿里集團CEO的職位,并在晚會上做卸任前的演講,馬云說,大家還沒搞清PC時代的時候,移動互聯網來了,還沒搞清移動互聯網的時候,大數據時代來了。
早在1980年,托夫勒在《第三次浪潮》中就提到過大數據。他說:“如果說IBM的主機拉開了信息化革命的大幕,那么大數據則是第三次浪潮的華彩樂章”。最早提出“大數據時代到來”的,是全球頂級管理咨詢公司麥肯錫。麥肯錫宣稱:“數據,已經滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”而真正把大數據推向公眾視野的是牛津大學教授維克托,他潛心研究大數據10年,成為最早洞見大數據時代發(fā)展趨勢的科學家之一,他的《大數據時代》專著是國際大數據研究先河之作。維克托思維的深邃之處在于,他明確指出,大數據時代最大的轉變就是,放棄對因果關系的渴求,取而代之的是關注相關關系,只要知道“是什么”,而不需要知道“為什么”。這是對千百年來人類思維慣例的顛覆。
1.2大數據到底有多大
大數據到底有多大?互聯網上一天產生的信息量有多少?據統計,每天有2 940億封電子郵件發(fā)出,如果這些是紙質信件,在美國需要花2年時間來處理;每天有200萬篇博客文章在網上發(fā)布,這些文章相當于美國《時代》雜志刊發(fā)770年的總量;每天有2.5億張照片上傳至社交網站Facebook,如果把它們都打印出來,摞在一起能有80個埃菲爾鐵塔那么高;每天有86.4萬h的視頻被上傳至視頻網站YouTube,這相當于不間斷播放視頻98年。累積起來,互聯網一天之內產生的信息總量,可以裝滿1.68億張DVD光盤。 全球數據總量每18個月翻一番。據麥肯錫調查報告,美國15個主要行業(yè)中每家公司過去一年所產生的數據量,就超過了同期美國國會圖書館所存儲的數據量。自從人類發(fā)明印刷術以來,以往一千多年來所有印刷材料相當于200 PB(1 PB=1 015 B),而2011年全球數據量就達到了1.8 ZB (1 ZB=1 021 B)。據IDC發(fā)布的2012年數字宇宙研究報告中預測,到2020年數字宇宙的規(guī)模為35 ZB。
1.3“大數據戰(zhàn)略”——未來的新石油
從海量數據中“提純”出有用的信息,這對網絡架構和數據處理能力而言也是巨大的挑戰(zhàn)。在經歷了幾年的批判、質疑、討論、炒作之后,大數據終于迎來了屬于它的時代。2010年7月,聯合國發(fā)布了《大數據促發(fā)展:挑戰(zhàn)與機遇》白皮書,指出大數據對于全世界是一個歷史性的機遇。2012年3月22日,奧巴馬政府宣布投資2億美元拉動大數據相關產業(yè)發(fā)展,將“大數據戰(zhàn)略”上升為國家戰(zhàn)略。奧巴馬政府甚至將大數據定義為“未來的新石油”。
1.4大數據的特點及所需的處理技術
大數據的特點是具有“4V”,或者說有四個層面:第一,數據體量巨大。從TB級別,躍升到PB級別;第二,數據類型繁多。如網絡日志、視頻、圖片、地理位置信息等等。第三,價值密度低,商業(yè)價值高。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數據僅僅有一兩秒。第四,處理速度快。1 s定律。最后這一點也是和傳統的數據挖掘技術有著本質的不同。所以業(yè)界將其歸納為4個“V”--Volume(大量),Variety(多樣),Value(價值),Velocity(高速)。
從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式計算架構。它的特色在于對海量數據的挖掘,但它必須依托云計算的分布式處理、分布式數據庫、云存儲或虛擬化技術。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》一書中是這樣描寫的:大數據是指不用隨機分析法(抽樣調查)這樣的捷徑,而是采用所有數據的方法。
由于大數據的“4V”特點,普通的數據處理技術已無法滿足,因此大數據處理需要新的數據庫技術。EMC數據計算事業(yè)部大中國區(qū)總經理劉偉光指出“新型數據庫應該具備如下特點:首先,應該采用支持大規(guī)模并行處理的分布式架構;其次,應該使用基于符合工業(yè)標準的開放硬件和系統平臺,保證成本可控;第三,隨著開源技術不斷成熟,創(chuàng)新速度快,新型數據庫平臺應該易于與新的開源技術進行融合;第四,新的數據庫平臺應該可以實現與Hadoop(分布式處理的開源的軟件框架)平臺的無縫集成,實現跨結構化、半結構化、非結構化海量數據的混合分析能力。”大數據環(huán)境下,必須能對數據進行快速的捕獲、管理、存儲和分析。目前,大數據解決方案主要有Hadoop和NoSQL(Not Only SQL分布式數據管理系統)。
1.5大數據的價值
大數據時代已經來臨,它將在眾多領域掀起變革的巨浪。但我們要冷靜的看到,大數據的核心在于為客戶挖掘數據中蘊藏的價值,而不是軟硬件的堆砌。大數據到底能給企業(yè)帶來什么價值?本質上說,大數據本身沒有太多價值,基于大數據的處理和分析才能為企業(yè)帶來巨大的利益。大數據里面包含企業(yè)運營的各種信息,如果能對它們及時進行充分的整理和分析,可以迅速有效地幫助企業(yè)業(yè)務決策,響應客戶需求,提升競爭力。因此,針對不同領域的大數據應用模式、商業(yè)模式研究將是大數據產業(yè)健康發(fā)展的關鍵。那么,鐵路客站商業(yè)的大數據信息又能帶來怎么樣的機遇與挑戰(zhàn)?
2.1客站商業(yè)大數據采集方式
客站商業(yè)大數據的研究與應用,首先要考慮的是數據采集的渠道與方式,這就需要依托手機APP來完成。通過手機移動客戶端,采集旅客的去向、消費習慣和偏好等信息,經分析、處理、整合后,適當調整客站餐飲、食品、百貨、服務業(yè)態(tài)比例,使商鋪資源得到合理配比。利用O2O移動消費數據采集為旅客推廣他們感興趣的信息,并通過LBS技術的定位功能為旅客提供客站路線圖、客站周邊服務等內容,在服務旅客、方便旅客的同時,也為客站商鋪帶來了更多的商機。
所以,客站大數據的采集與先進的技術手段密不可分。傳統商業(yè)運營模式的數據可通過POS機采集后經ERP系統整理分析后得出,此部分數據僅為線下已消費數據,并不能全面反映旅客真實全面的消費意向及需求,尤其是隨著智能手機的普及和移動商務的興起,線下消費模式不再是旅客消費的全部,O2O(online to offline)的模式已被越來越多的人群所接受。所謂O2O是指把線上的消費者帶到線下去,即在線支付購買線下的產品和服務,且到線下實體店去享受服務。O2O和B2C(Business to Customer)相比,將“線上”“線下”的競爭關系轉化為互助關系,是真正促進傳統企業(yè)互聯網化的有效途徑。將務實的體驗與服務融入電子商務中,這樣既滿足了消費者便捷、實惠的體驗需求,又為商家增加了銷量、提高了效益。尤其是隨著近幾年高鐵新線新站開發(fā)接近尾聲,客站商業(yè)營業(yè)面積增長基本已接近飽和,如要打破實體營業(yè)面積不再增加的瓶頸,勢必要將O2O的移動商務模式引入客站商業(yè)中。
此外,除了傳統的線下消費模式和新興的線上消費線下體驗外,客戶關注與搜索的內容也是我們必須要掌握的重要數據信息,這部分數據將有利于我們把握潛在的消費客戶群體,改進我們現有的商業(yè)布局,并將是我們引入新品牌和新業(yè)態(tài)的重要依據。例如我們可以大膽設想,在客站引入小型影院,嘗試播放時間不長、熱門的微電影,或是嘗試引入棋牌室、桌游店、兒童游樂園等受大眾歡迎的娛樂場所??偠灾?,旅客所關注的地方就是商機所在,我們要改變旅客在鐵路客站被動消費的習慣,逐步引導旅客養(yǎng)成主動消費、積極消費的良好勢頭,才能使客站高鐵商業(yè)長期、健康、穩(wěn)步地發(fā)展。
2.2客站商業(yè)大數據的分析與應用
完成了客站商業(yè)大數據的采集后,就需從大數據中挖掘出有意義的新的關聯模式和趨勢,以便提高管理者決策準確度。通過大數據分析,商家可通過O2O模式下的精準營銷,向移動用戶推送準確適用關聯信息,提高客戶粘性。顧客方面則可獲取更全面、更實用的客站商家信息,并通過手機APP客站導航功能,找到準確的商鋪行進路線,使一些偏遠的商鋪減少因旅客無法準確定位而造成的客源流失。
我們還能通過對客站商業(yè)大數據挖掘,發(fā)掘出更多決策依據。例如通過對客站租售比(固定租金/銷售收入)的分析我們可以得出,商鋪商家的經營壓力和盈利空間,以此來提高或減免租金;通過對每年的當月客流與營業(yè)額的分析我們可以得出,每年的4月、5月(清明、五一小長假)和7月、8月(暑運)將迎來客流消費高峰,屆時集團公司可提前做好應對準備,避免貨源短缺情況發(fā)生;而每年春節(jié)期間,客流量雖高,但客流人均消費比例較低,可適當增加中低檔消費產品,重點做好物業(yè)維保工作。通過客站人均消費(銷售額/客流量)情況比較我們得出,合肥南站和寧波站兩個大站客單價水平較低,虹橋站旅客消費水平最高,其中:寧波站全年平均客單價僅6.8元,合肥南站全年平均客單價7.18元,虹橋站全年平均客單價14.59元,通過數據挖掘我們可以分析出,寧波、合肥南兩站的客流平均消費水平較低,不適宜引入高端商業(yè)品牌入駐,而虹橋站擁有巨大的客流且旅客具有較高的消費水平,可適當考慮引入部分高端品牌以滿足旅客的購物需求。
除此之外,大數據挖掘還需建立相應客戶檔案,這有助于我們發(fā)掘重點目標客戶。通過推廣手機APP和辦理客站會員卡(局管客站內可享9.8折優(yōu)惠)等手段,記錄的每個目標客戶的消費信息,從中找出10%的VIP客戶,并根據消費情況對VIP客戶進行評級,VIP客戶分級享受重點旅客待遇。例如:VIP1客戶可通過VIP通道進站,VIP2客戶在享有VIP1客戶的權利外,進站還后可免費領取一瓶礦泉水和一份點心,VIP3客戶在享用VIP1、VIP2的權利外,還享有行李免費交由服務人員搬運到站臺的權利,以此類推,VIP等級越高的客戶能享受的特殊待遇也越多,VIP客戶等級評定的主要依據是目標客戶在客站內最近一年內的累計消費額,VIP等級越高,站內消費時折扣就越多,享受的VIP服務項目就越多。這有利于刺激高端客戶進行消費,提高高端客戶的粘性,也縮小了客站商業(yè)營銷范圍,避免了對無效客戶進行營銷造成的資源浪費,降低了客站商業(yè)營銷成本。
以上是客站大數據最淺顯地采集與應用方式,隨著客站商業(yè)軟、硬件配套設施的增強與客站商業(yè)營銷手段的多樣化發(fā)展,大數據的信息量將越來越豐富,可挖掘出更多有價值的信息,使企業(yè)對未來趨勢分析及領導作出決策提供更為詳盡依據。
黨的十八屆五中全會明確提出,實施“互聯網+”行動計劃,發(fā)展分享經濟,實施國家大數據戰(zhàn)略,國務院隨即發(fā)布《促進大數據發(fā)展行動綱要》,將大數據發(fā)展確立為國家戰(zhàn)略。而就本企業(yè)層面來說,新上鐵集團公司作為一個以客站商業(yè)為主營業(yè)務的公司,已在2013年提前將目光鎖定在了客站商業(yè)大數據相關領域,組織專業(yè)人員成立了客站ERP數據分析部門并在2014年成立了電子商務O2O研究推進小組,相信在不久的將來,我們能通過商業(yè)大數據分析斬獲更多有價值的信息,商業(yè)客站大數據還將擁有更遠大的發(fā)展前景。
[1]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.《大數據時代》[M].浙江人民出版社.2012年12月,30-32.
責任編輯:萬寶安
來稿日期:2016-05-13