焦梓婷
[摘 要]大數(shù)據(jù)時(shí)代將帶來(lái)深刻的思維轉(zhuǎn)變,大數(shù)據(jù)不僅將改變每個(gè)人的日常生活和工作方式,還將改變商業(yè)組織和社會(huì)組織的運(yùn)行方式。大數(shù)據(jù)開(kāi)啟了一次重大的時(shí)代轉(zhuǎn)型,如何在大數(shù)據(jù)時(shí)代挖掘和利用隱蔽于數(shù)據(jù)內(nèi)部未被激發(fā)的潛在價(jià)值,從而實(shí)現(xiàn)在經(jīng)濟(jì)、交通、教育、醫(yī)療、能源、軍事等領(lǐng)域的革新,取決于我們是否能夠從以往的小數(shù)據(jù)思維及時(shí)轉(zhuǎn)換成大數(shù)據(jù)思維。本文在研讀文獻(xiàn)基礎(chǔ)上,介紹了大數(shù)據(jù)思維產(chǎn)生的背景,闡述了大數(shù)據(jù)帶來(lái)的思維變革,分析展望了建立大數(shù)據(jù)思維促進(jìn)中國(guó)鐵路創(chuàng)新發(fā)展。
[關(guān)鍵詞]大數(shù)據(jù) 大數(shù)據(jù)思維 鐵路創(chuàng)新發(fā)展
中圖分類號(hào):TM76;TM63 文獻(xiàn)標(biāo)識(shí)碼:B 文章編號(hào):1009-914X(2016)25-0373-03
1 引言
半個(gè)世紀(jì)以來(lái),隨著人類對(duì)自然和社會(huì)認(rèn)識(shí)的進(jìn)一步加深及人類活動(dòng)的進(jìn)一步擴(kuò)展,科學(xué)研究、互聯(lián)網(wǎng)應(yīng)用、電子商務(wù)、移動(dòng)通信等諸多應(yīng)用領(lǐng)域產(chǎn)生了多種多樣的數(shù)量巨大的數(shù)據(jù)。這不僅使得世界充斥著比以往更多的信息,而且其增長(zhǎng)速度也在加快。信息總量的變化最終導(dǎo)致了質(zhì)變,最先經(jīng)歷信息爆炸的學(xué)科,如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個(gè)概念。時(shí)至今日,這個(gè)概念幾乎已應(yīng)用到了所有人類致力發(fā)展的領(lǐng)域中。大數(shù)據(jù)(BIG DATA)的出現(xiàn)對(duì)傳統(tǒng)的數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和數(shù)據(jù)挖掘提出了新的挑戰(zhàn),同時(shí)也深刻地影響著人類的生活、工作和思維。
2 什么是大數(shù)據(jù)
2.1 大數(shù)據(jù)的概念
說(shuō)起大數(shù)據(jù),從字面意思來(lái)講就是巨量數(shù)據(jù)集合,到底有多大?可能很多人并沒(méi)有很具體的概念。一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國(guó)兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬(wàn)個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量);賣出的手機(jī)為37.8萬(wàn)臺(tái),高于全球每天出生的嬰兒數(shù)量37.1萬(wàn)。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長(zhǎng)為1.2ZB,2011年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說(shuō)過(guò)的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過(guò)去兩年內(nèi)產(chǎn)生的。
然而大數(shù)據(jù)并非一個(gè)確切的概念。對(duì)于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義?!按髷?shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來(lái)適應(yīng)海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。而麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)、多樣的數(shù)據(jù)類型(Variety)和價(jià)值密度低(Value)四大特征,即4V特征。在維克托·邁爾-舍恩伯格及肯尼斯·庫(kù)克耶編寫的《大數(shù)據(jù)時(shí)代》中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。業(yè)界學(xué)者楊善林認(rèn)為在海量數(shù)據(jù)的量化基礎(chǔ)上,同時(shí)具備大分析(Big Analytics)、大帶寬(Big Bandwidth)、大內(nèi)容(Big Content)等三大要素的巨大數(shù)據(jù)集。謝國(guó)忠則認(rèn)為大數(shù)據(jù)的本質(zhì)是利用企業(yè)內(nèi)部信息,將龐大的信息進(jìn)行有效整合,并結(jié)合新的數(shù)據(jù)類型為企業(yè)創(chuàng)造價(jià)值。
2.2 大數(shù)據(jù)的特點(diǎn)
大數(shù)據(jù)有有它自己的特征。目前工業(yè)界普遍認(rèn)為大數(shù)據(jù)具有 4V+1C 的特征:
(1)數(shù)據(jù)量大(Volume)。存儲(chǔ)的數(shù)據(jù)量巨大,拍字節(jié)級(jí)別是常態(tài),因而對(duì)其分析的計(jì)算量也大。
(2)多樣(Variety)。數(shù)據(jù)的來(lái)源及格式多樣,數(shù)據(jù)格式除了傳統(tǒng)的格式化數(shù)據(jù)外,還包括半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),比如用戶上傳的音頻和視頻內(nèi)容,而隨著人類的活動(dòng)的進(jìn)一步拓寬,數(shù)據(jù)的來(lái)源更加多樣。
(3)快速(Velocity)。數(shù)據(jù)增長(zhǎng)速度快,同時(shí)要求對(duì)數(shù)據(jù)的處理速度也要快,以便能夠從數(shù)據(jù)中及時(shí)地提取知識(shí),發(fā)現(xiàn)價(jià)值。
(4)價(jià)值密度低(Value)。需要對(duì)大量的數(shù)據(jù)處理挖掘其潛在的價(jià)值,因而,大數(shù)據(jù)對(duì)我們提出的明確要求是設(shè)計(jì)一種在成本可接受的條件下,通過(guò)快速采集、發(fā)現(xiàn)和分析從大量、多種類別的數(shù)據(jù)中提取價(jià)值的體系架構(gòu)。
(5)復(fù)雜度(Complexity)。對(duì)數(shù)據(jù)的處理和分析難度大。
IBM在此基礎(chǔ)上又提出了5V特征,即在4V的基礎(chǔ)上增加了真實(shí)性(Veracity)。
3 什么是大數(shù)據(jù)思維
要想大數(shù)據(jù)為人所用, 必須改變?cè)袑?duì)數(shù)據(jù)的認(rèn)識(shí),將大數(shù)據(jù)與創(chuàng)意結(jié)合,并能充分利用數(shù)據(jù)分析技術(shù),為企業(yè)和國(guó)家決策提供依據(jù)。大數(shù)據(jù)研究專家維克托·邁爾-舍恩伯格指出,大數(shù)據(jù)時(shí)代,人們對(duì)待數(shù)據(jù)的思維方式會(huì)發(fā)生如下三個(gè)變化:第一,人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù);第二,由于是全樣本數(shù)據(jù),人們不得不接受數(shù)據(jù)的混雜性,而放棄對(duì)精確性的追求;第三,人類通過(guò)對(duì)大數(shù)據(jù)的處理,放棄對(duì)因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相關(guān)關(guān)系。事實(shí)上,大數(shù)據(jù)時(shí)代帶給人們的思維方式的深刻轉(zhuǎn)變遠(yuǎn)不止上述三個(gè)方面。我認(rèn)為,大數(shù)據(jù)思維最關(guān)鍵的轉(zhuǎn)變?cè)谟趶淖匀凰季S轉(zhuǎn)向智能思維,使得大數(shù)據(jù)像具有生命力一樣,獲得類似于“人腦”的智能,甚至智慧。
大數(shù)據(jù)思維是一種總體思維。過(guò)去,人們對(duì)搜集數(shù)據(jù)、處理數(shù)據(jù)形成了一個(gè)思維定勢(shì),那就是我們不可能搜集到相當(dāng)多數(shù)量的數(shù)據(jù),我們只能在力所能及的條件下選擇一小部分去分析和處理,為了讓數(shù)據(jù)處理變得更簡(jiǎn)單,對(duì)數(shù)據(jù)的選擇就盡可能到最少,也由于當(dāng)時(shí)信息處理水平的限制,導(dǎo)致所選的數(shù)據(jù)不具備代表性,盲目因素太多。當(dāng)我們進(jìn)行抽樣調(diào)查來(lái)分析數(shù)據(jù)的時(shí)候,往往會(huì)以調(diào)查問(wèn)卷的形式選擇一部分樣本進(jìn)行分析,這為人們提供了不少的便捷,但相應(yīng)的缺點(diǎn)也是一覽無(wú)余,這種樣本分析法不管你有多深入的去挖掘,它都只能代表總體數(shù)據(jù)中的一小部分,不能代表全部數(shù)據(jù),也許樣本調(diào)查的準(zhǔn)確性會(huì)達(dá)到90%以上,但是依然會(huì)遺漏一些很有價(jià)值的數(shù)據(jù),就會(huì)導(dǎo)致數(shù)據(jù)的失真。但是隨著大數(shù)據(jù)時(shí)代的到來(lái),我們可能還沒(méi)有意識(shí)到我們已經(jīng)具備處理和分析大數(shù)據(jù)的能力,我們的思維正在一點(diǎn)點(diǎn)的改變,首先,我們不能一直依靠對(duì)小部分?jǐn)?shù)據(jù)樣本進(jìn)行分析,而是轉(zhuǎn)向?yàn)榉治鋈繑?shù)據(jù)。
大數(shù)據(jù)思維是一種容錯(cuò)思維。在小數(shù)據(jù)時(shí)代,由于收集的樣本信息量比較少,所以必須確保記錄下來(lái)的數(shù)據(jù)盡量結(jié)構(gòu)化、精確化,否則,分析得出的結(jié)論在推及總體上就會(huì)“南轅北轍”,因此,就必須十分注重精確思維。然而,在大數(shù)據(jù)時(shí)代,得益于大數(shù)據(jù)技術(shù)的突破,大量的非結(jié)構(gòu)化、異構(gòu)化的數(shù)據(jù)能夠得到儲(chǔ)存和分析,這一方面提升了我們從數(shù)據(jù)中獲取知識(shí)和洞見(jiàn)的能力,另一方面也對(duì)傳統(tǒng)的精確思維造成了挑戰(zhàn)。維克托·邁爾-舍恩伯格指出,“執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物。只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無(wú)法利用,只有接受不精確性,我們才能打開(kāi)一扇從未涉足的世界的窗戶”。也就是說(shuō),在大數(shù)據(jù)時(shí)代,思維方式要從精確思維轉(zhuǎn)向容錯(cuò)思維,當(dāng)擁有海量即時(shí)數(shù)據(jù)時(shí),絕對(duì)的精準(zhǔn)不再是追求的主要目標(biāo),適當(dāng)忽略微觀層面上的精確度,容許一定程度的錯(cuò)誤與混雜,反而可以在宏觀層面擁有更好的知識(shí)和洞察力。
大數(shù)據(jù)思維是一種相關(guān)思維。在小數(shù)據(jù)世界中,人們往往執(zhí)著于現(xiàn)象背后的因果關(guān)系,試圖通過(guò)有限樣本數(shù)據(jù)來(lái)剖析其中的內(nèi)在機(jī)理。小數(shù)據(jù)的另一個(gè)缺陷就是有限的樣本數(shù)據(jù)無(wú)法反映出事物之間的普遍性的相關(guān)關(guān)系。而在大數(shù)據(jù)時(shí)代,人們可以通過(guò)大數(shù)據(jù)技術(shù)挖掘出事物之間隱蔽的相關(guān)關(guān)系,獲得更多的認(rèn)知與洞見(jiàn),運(yùn)用這些認(rèn)知與洞見(jiàn)就可以幫助我們捕捉現(xiàn)在和預(yù)測(cè)未來(lái),而建立在相關(guān)關(guān)系分析基礎(chǔ)上的預(yù)測(cè)正是大數(shù)據(jù)的核心議題。通過(guò)關(guān)注線性的相關(guān)關(guān)系,以及復(fù)雜的非線性相關(guān)關(guān)系,可以幫助人們看到很多以前不曾注意的聯(lián)系,還可以掌握以前無(wú)法理解的復(fù)雜技術(shù)和社會(huì)動(dòng)態(tài),相關(guān)關(guān)系甚至可以超越因果關(guān)系,成為我們了解這個(gè)世界的更好視角。維克托·邁爾-舍恩伯格指出,大數(shù)據(jù)的出現(xiàn)讓人們放棄了對(duì)因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相關(guān)關(guān)系,人們只需知道“是什么”,而不用知道“為什么”。我們不必非得知道事物或現(xiàn)象背后的復(fù)雜深層原因,而只需要通過(guò)大數(shù)據(jù)分析獲知“是什么”就意義非凡,這會(huì)給我們提供非常新穎且有價(jià)值的觀點(diǎn)、信息和知識(shí)。也就是說(shuō),在大數(shù)據(jù)時(shí)代,思維方式要從因果思維轉(zhuǎn)向相關(guān)思維,努力顛覆千百年來(lái)人類形成的傳統(tǒng)思維模式和固有偏見(jiàn),才能更好地分享大數(shù)據(jù)帶來(lái)的深刻洞見(jiàn)。
大數(shù)據(jù)思維是一種智能思維。大數(shù)據(jù)使得人可以被量化,但卻讓計(jì)算機(jī)更具智能。工業(yè)革命使得需要人完成的工作只用機(jī)器就可以完成了,但大數(shù)據(jù)卻可以使得機(jī)器有了分析問(wèn)題的能力。衛(wèi)星定位系統(tǒng)積累的大量數(shù)據(jù),可以制作電子地圖和導(dǎo)航,還可以通過(guò)分析數(shù)據(jù)開(kāi)發(fā)出無(wú)人駕駛汽車,讓機(jī)器變得擁有智慧。如何讓計(jì)算機(jī)擁有智慧,除了要擁有大數(shù)據(jù)外,必須變革思維,創(chuàng)新分析思路與過(guò)程,不斷探索新的方法,讓堆積如山的數(shù)據(jù)不斷創(chuàng)造新的價(jià)值。例如手機(jī)上常用的地圖軟件,可以搜索很多路況同步數(shù)據(jù),為用戶提供出行信息。這只是大數(shù)據(jù)最基礎(chǔ)的應(yīng)用,繼續(xù)延伸, 是否可以根據(jù)上下班時(shí)段的交通流量估算失業(yè)率;是否可以通過(guò)對(duì)主要商圈的監(jiān)控估算消費(fèi)情況;是否可以將廢棄的數(shù)據(jù)重新創(chuàng)造價(jià)值;是否可以利用用戶在拼寫過(guò)程中的拼寫錯(cuò)誤讓拼寫檢查軟件更優(yōu)化;是否可以通過(guò)分析各實(shí)體和產(chǎn)業(yè)之間的關(guān)聯(lián)關(guān)系,預(yù)測(cè)各行業(yè)發(fā)展趨勢(shì),找出關(guān)鍵影響因素;是否可以分析顧客的偏好,量體裁衣式的為顧客提供更好的服務(wù); 是否可以運(yùn)用大數(shù)據(jù)模擬現(xiàn)實(shí)情境,發(fā)掘出新的需求和更好的回報(bào);是否可以創(chuàng)新大數(shù)據(jù)的使用模式,將大數(shù)據(jù)深加工,用戶可以很方便地結(jié)合自身情況選擇適合自己的產(chǎn)品。
4 建立大數(shù)據(jù)思維促進(jìn)中國(guó)鐵路創(chuàng)新
4.1 以數(shù)據(jù)為核心
大數(shù)據(jù)時(shí)代,計(jì)算模式也發(fā)生了轉(zhuǎn)變,從“流程”核心轉(zhuǎn)變?yōu)椤皵?shù)據(jù)”核心。Hadoop體系的分布式計(jì)算框架已經(jīng)是“數(shù)據(jù)”為核心的范式。非結(jié)構(gòu)化數(shù)據(jù)及分析需求,將改變IT系統(tǒng)的升級(jí)方式:從簡(jiǎn)單增量到架構(gòu)變化。例如:IBM將使用以數(shù)據(jù)為中心的設(shè)計(jì),目的是降低在超級(jí)計(jì)算機(jī)之間進(jìn)行大量數(shù)據(jù)交換的必要性。大數(shù)據(jù)下,云計(jì)算找到了破繭重生的機(jī)會(huì),在存儲(chǔ)和計(jì)算上都體現(xiàn)了數(shù)據(jù)為核心的理念。大數(shù)據(jù)和云計(jì)算的關(guān)系:大數(shù)據(jù)與云計(jì)算是一個(gè)問(wèn)題的兩面,一個(gè)是問(wèn)題,一個(gè)是解決問(wèn)題的方法。而大數(shù)據(jù)比云計(jì)算更為落地,可有效利用已大量建設(shè)的云計(jì)算資源,最后加以利用。中國(guó)鐵路信息化歷經(jīng)50余年的發(fā)展,取得廣泛的應(yīng)用,擁有海量的資源,大數(shù)據(jù)將成為推動(dòng)中國(guó)鐵路創(chuàng)新發(fā)展的新引擎。隨著中國(guó)鐵路信息化的到來(lái),中國(guó)鐵路發(fā)展的戰(zhàn)略需求也發(fā)生了改變,數(shù)據(jù)的處理分析成為了一個(gè)關(guān)注重點(diǎn),軟件也將從編程為主轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為中心。如何高效地從海量數(shù)據(jù)中分析、挖掘所需的信息和規(guī)律,結(jié)合已有經(jīng)驗(yàn)和數(shù)學(xué)模型等生成更高層次的決策支持信息,獲得各類分析、評(píng)價(jià)數(shù)據(jù),為設(shè)備管理、網(wǎng)絡(luò)狀態(tài)評(píng)估等提供決策支持,為鐵路工作人員提供有用信息,成為鐵路未來(lái)發(fā)展的趨勢(shì)。
4.2 全樣本考慮
統(tǒng)計(jì)學(xué)里頭最基本的一個(gè)概念就是,全部樣本才能找出規(guī)律。為什么能夠找出行為規(guī)律?一個(gè)更深層的概念是人和人是一樣的,如果是一個(gè)人特例出來(lái),可能很有個(gè)性,但當(dāng)人口樣本數(shù)量足夠大時(shí),就會(huì)發(fā)現(xiàn)其實(shí)每個(gè)人都是一模一樣的。在大數(shù)據(jù)時(shí)代,無(wú)論是商家還是信息的搜集者,會(huì)比我們自己更知道你可能會(huì)想干什么?,F(xiàn)在的數(shù)據(jù)還沒(méi)有被真正挖掘,如果真正挖掘的話,通過(guò)信用卡消費(fèi)的記錄,可以成功預(yù)測(cè)未來(lái)5年內(nèi)的情況。大數(shù)據(jù)的核心就是預(yù)測(cè),大數(shù)據(jù)能夠預(yù)測(cè)體現(xiàn)在很多方面。大數(shù)據(jù)不是要教機(jī)器像人一樣思考,相反,它是把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來(lái)預(yù)測(cè)事情發(fā)生的可能性。正因?yàn)樵诖髷?shù)據(jù)規(guī)律面前,每個(gè)人的行為都跟別人一樣,沒(méi)有本質(zhì)變化。例如:大數(shù)據(jù)助微軟準(zhǔn)確預(yù)測(cè)世界懷。微軟大數(shù)據(jù)團(tuán)隊(duì)在2014年巴西世界足球賽前設(shè)計(jì)了世界懷模型,該預(yù)測(cè)模型正確預(yù)測(cè)了賽事最后幾輪每場(chǎng)比賽的結(jié)果,包括預(yù)測(cè)德國(guó)隊(duì)將最終獲勝。預(yù)測(cè)成功歸功于微軟在世界杯進(jìn)行過(guò)程中獲取的大量數(shù)據(jù),到淘汰賽階段,數(shù)據(jù)如滾雪球般增多,常握了有關(guān)球員和球隊(duì)的足夠信息,以適當(dāng)校準(zhǔn)模型并調(diào)整對(duì)接下來(lái)比賽的預(yù)測(cè)。世界杯預(yù)測(cè)模型的方法與設(shè)計(jì)其它事件的模型相同,訣竅就是在預(yù)測(cè)中去除主觀性,讓數(shù)據(jù)說(shuō)話。利用大數(shù)據(jù)技術(shù)可以從鐵路的客票系統(tǒng)、貨票系統(tǒng)、貨運(yùn)電子商務(wù)平臺(tái)、運(yùn)輸信息集成平臺(tái)等信息系統(tǒng)采集海量的原始信息,這些信息可以為市場(chǎng)分析和預(yù)測(cè)提供有力的支撐。與傳統(tǒng)方法側(cè)重于對(duì)調(diào)查抽樣統(tǒng)計(jì)數(shù)據(jù)的分析不同,基于大數(shù)據(jù)技術(shù)的市場(chǎng)分析和預(yù)測(cè)技術(shù)既能夠利用上述海量數(shù)據(jù),分析客、貨運(yùn)量完整全面的變化過(guò)程,深入挖掘運(yùn)量變化的規(guī)律性,進(jìn)而預(yù)測(cè)市場(chǎng)的未來(lái)走勢(shì);還能夠利用GPS、傳感器等物聯(lián)網(wǎng)手段采集獲取精細(xì)的運(yùn)輸數(shù)據(jù),并且通過(guò)互聯(lián)網(wǎng)接入的政治、經(jīng)濟(jì)、其他交通方式、氣候等影響因素?cái)?shù)據(jù),將旅客和貨物流量流向的精細(xì)化分析與影響因素關(guān)聯(lián)性分析相結(jié)合,挖掘各影響因素對(duì)鐵路運(yùn)量變化影響的方向和時(shí)滯,量化各因素對(duì)運(yùn)量變化的影響。在對(duì)典型設(shè)備故障診斷與狀態(tài)預(yù)測(cè)方面,可以綜合利用GSM-R接口監(jiān)測(cè)數(shù)據(jù)、網(wǎng)絡(luò)管理信息、場(chǎng)強(qiáng)和服務(wù)質(zhì)量動(dòng)態(tài)檢測(cè)數(shù)據(jù)、無(wú)線干擾檢測(cè)監(jiān)測(cè)數(shù)據(jù)等數(shù)據(jù)源,采用數(shù)據(jù)挖掘技術(shù),研究監(jiān)測(cè)檢測(cè)數(shù)據(jù)綜合分析方法、多源數(shù)據(jù)關(guān)聯(lián)分析方法和適用于通信業(yè)務(wù)數(shù)的故障診斷分析方法,建立典型故障診斷模型、GSM-R網(wǎng)絡(luò)QoS測(cè)試綜合評(píng)價(jià)模型、CTCS-3列控系統(tǒng)降級(jí)故障表示模型等,對(duì)列車控制的車載系統(tǒng)、地面控制系統(tǒng)、無(wú)線通信網(wǎng)絡(luò)交互作用進(jìn)行可靠性評(píng)估和故障綜合診斷,為列車控制系統(tǒng)降級(jí)原因分析、GSM-R網(wǎng)絡(luò)維護(hù)、網(wǎng)絡(luò)優(yōu)化等提供支持。
4.3 用信息找人
互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,是一個(gè)從人找信息,到信息找人的過(guò)程。先是人找信息,人找人,信息找信息,現(xiàn)在是信息找人的這樣一個(gè)時(shí)代。信息找人的時(shí)代,就是說(shuō)一方面我們回到了一種最初的,廣播模式是信息找人,我們聽(tīng)收音機(jī),我們看電視,它是信息推給我們的,但是有一個(gè)缺陷,不知道我們是誰(shuí),后來(lái)互聯(lián)網(wǎng)反其道而行,提供搜索引擎技術(shù),讓我知道如何找到我所需要的信息,所以搜索引擎是一個(gè)很關(guān)鍵的技術(shù)。例如:從搜索引擎——向推薦引擎轉(zhuǎn)變。今天,后搜索引擎時(shí)代已經(jīng)正式來(lái)到,什么叫做后搜索引擎時(shí)代呢?使用搜索引擎的頻率會(huì)大大降低,使用的時(shí)長(zhǎng)也會(huì)大大的縮短,為什么使用搜索引擎的頻率在下降?時(shí)長(zhǎng)在下降?原因是推薦引擎的誕生。就是說(shuō)從人找信息到信息找人越來(lái)越成為了一個(gè)趨勢(shì),推薦引擎就是說(shuō)它很懂我,知道我要知道的東西。例如,我們結(jié)合12306網(wǎng)站數(shù)據(jù)及實(shí)名制購(gòu)票資料,對(duì)出行旅客的個(gè)人信息、出行線路、出行時(shí)間周期進(jìn)行的統(tǒng)計(jì)分析,同時(shí)借助互聯(lián)網(wǎng)大數(shù)據(jù)預(yù)報(bào)人員遷徙情況,最后完全勾勒出旅客的需求,使鐵路可以充分了解每一位旅客,實(shí)時(shí)的知道他們旅行目的地,以及出發(fā)時(shí)間及需要的服務(wù)層次,有針對(duì)性地推送一些旅游服務(wù)、餐飲、住宿、景觀等方面的產(chǎn)品,使得營(yíng)銷工作更加精準(zhǔn),營(yíng)銷效率也更高。
5 大數(shù)據(jù)思維帶來(lái)的挑戰(zhàn)
大數(shù)據(jù)的發(fā)展速度有目共睹,想要在競(jìng)爭(zhēng)社會(huì)中走的更遠(yuǎn),人人都需要建立大數(shù)據(jù)思維。那么在建立大數(shù)據(jù)思維中,有哪些挑戰(zhàn)呢?
第一,大數(shù)據(jù)應(yīng)用和商業(yè)回報(bào)間的矛盾。未來(lái)的大數(shù)據(jù)應(yīng)用一定是可定制的、可在云上打包的服務(wù),即將業(yè)務(wù)、數(shù)據(jù)、分析能力多面定制,一起打包。企業(yè)需要可快速部署和有明確投資回報(bào)率的應(yīng)用,這涉及到數(shù)據(jù)的質(zhì)量和豐富度及業(yè)務(wù)人員對(duì)數(shù)據(jù)的依賴度。這需要企業(yè)內(nèi)各個(gè)部門的有效協(xié)作,并規(guī)避無(wú)法確定的風(fēng)險(xiǎn),比如分析結(jié)果的不確定性,業(yè)務(wù)場(chǎng)景的復(fù)雜性,人員的能力缺失等。傳統(tǒng)手段,比如通過(guò)社交媒體、郵件、網(wǎng)絡(luò)文本等獲得的數(shù)據(jù)量非常龐大,但解破這些數(shù)據(jù)的關(guān)系和價(jià)值卻給企業(yè)帶來(lái)巨大挑戰(zhàn)。企業(yè)希望成為數(shù)據(jù)的主人,但在辨析數(shù)據(jù)的有效性、能帶來(lái)哪些商業(yè)回報(bào),以及如何幫助決策等方面卻缺乏有效工具。
第二,海量數(shù)據(jù)與核心數(shù)據(jù)間的矛盾。要做大數(shù)據(jù),首先要了解自己的企業(yè),或者企業(yè)所在的行業(yè)的核心是什么。我們發(fā)現(xiàn),有很多企業(yè)在競(jìng)爭(zhēng)過(guò)程中,最終不是被現(xiàn)有競(jìng)爭(zhēng)對(duì)手打敗,而是被很多潛在未知的競(jìng)爭(zhēng)對(duì)手打敗的。舉例來(lái)說(shuō),大部分人都認(rèn)為亞馬遜是做電商的,但其實(shí)亞馬遜現(xiàn)在最主要的收入來(lái)自云服務(wù),也就意味著亞馬遜的核心數(shù)據(jù)(價(jià)值)是云服務(wù)。只有在此基礎(chǔ)上,亞馬遜建立的大數(shù)據(jù)才是有效的、服務(wù)于戰(zhàn)略的。
第三,內(nèi)部數(shù)據(jù)與外圍數(shù)據(jù)間的矛盾。企業(yè)所獲取的數(shù)據(jù),很大一部分是內(nèi)部數(shù)據(jù),這讓企業(yè)面對(duì)另一個(gè)挑戰(zhàn),如何讓內(nèi)部數(shù)據(jù)與外圍相關(guān)數(shù)據(jù)產(chǎn)生聯(lián)系并使之成長(zhǎng)。只有讓內(nèi)外部數(shù)據(jù)的交融在用戶場(chǎng)景中,才能為業(yè)務(wù)用戶描繪更精準(zhǔn)的業(yè)務(wù)發(fā)展空間。
第四,規(guī)律發(fā)現(xiàn)和規(guī)律失效間的矛盾。調(diào)研顯示,從大數(shù)據(jù)應(yīng)用總結(jié)出的規(guī)律來(lái)看,建立失效預(yù)警是特別必要的。當(dāng)企業(yè)通過(guò)大數(shù)據(jù)分析發(fā)現(xiàn)一個(gè)規(guī)律,并在現(xiàn)實(shí)中應(yīng)用時(shí),必須要設(shè)立一些預(yù)警指標(biāo)。當(dāng)指標(biāo)達(dá)到一定程度,既表明之前發(fā)現(xiàn)的規(guī)律已經(jīng)失效,必須發(fā)現(xiàn)新的規(guī)律、建立新相關(guān)指標(biāo),這稱為數(shù)據(jù)價(jià)值的有效性。沒(méi)有根據(jù)實(shí)際應(yīng)用場(chǎng)景的變化而及時(shí)更新的數(shù)據(jù),挖掘得再多都是無(wú)謂的浪費(fèi),熟練應(yīng)用失效預(yù)警,企業(yè)才能培養(yǎng)起團(tuán)隊(duì)對(duì)數(shù)據(jù)真實(shí)有效的敏感性。
6 結(jié)語(yǔ)
大數(shù)據(jù)思維把人們從舊的發(fā)展觀、價(jià)值觀中解放出來(lái),復(fù)雜技術(shù)的涌現(xiàn)和科技進(jìn)步促使人們開(kāi)始從大數(shù)據(jù)思維視角重新審視世界,從而獲取正確理解世界的角度性工具。大數(shù)據(jù)思維是客觀存在,大數(shù)據(jù)思維是新的思維觀。用大數(shù)據(jù)思維方式思考問(wèn)題,解決問(wèn)題是當(dāng)下企業(yè)潮流。中國(guó)鐵路正處于加快轉(zhuǎn)變發(fā)展方式的新形勢(shì)下,為了適應(yīng)市場(chǎng)化經(jīng)營(yíng)要求,構(gòu)建鐵路運(yùn)輸企業(yè)的核心競(jìng)爭(zhēng)力,提升鐵路的持續(xù)發(fā)展能力和盈利能力,應(yīng)用大數(shù)據(jù)思維去推動(dòng)鐵路創(chuàng)新發(fā)展具有極其重要的現(xiàn)實(shí)意義。
參考文獻(xiàn):
[1]李國(guó)杰,程學(xué)旗.大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國(guó)科學(xué)院院刊.2012(06)
[2]孟小峰,慈祥.大數(shù)據(jù)管理: 概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1)
[3]王衛(wèi)東,徐貴紅,劉金朝,張文軒,邢小琴.鐵路基礎(chǔ)設(shè)施大數(shù)據(jù)的應(yīng)用與發(fā)展[J].2015(05)
[4]維克托·舍恩伯格,肯尼斯·庫(kù)克耶.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013.
[5]王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào). 2013(06)
[6]劉婷,徐寰春.淺析大數(shù)據(jù)時(shí)代背景下智慧城市規(guī)劃[J].智能城市.2016(09)
[7]李藝杰.淺談大數(shù)據(jù)時(shí)代數(shù)據(jù)信息現(xiàn)狀及發(fā)展[J].中國(guó)新技術(shù)新產(chǎn)品. 2014(15)
[8]馮永強(qiáng),張良,馮怡,朱尚杰.大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J].信息化建設(shè). 2015(12)
[9]張保國(guó).淺議大數(shù)據(jù)在公交經(jīng)營(yíng)管理中的應(yīng)用[J].城市公共交通.2016(03)
[10]方巍,鄭玉,徐江.大數(shù)據(jù):概念、技術(shù)及應(yīng)用研究綜述[J].南京信息工程大學(xué)學(xué)報(bào)(自然科學(xué)版).2014(05)
[11]鄔賀銓.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].求是.2013(04)
[12]王浩,張怡.大數(shù)據(jù)時(shí)代下人類思維方式變革的趨勢(shì)[J]. 新西部(理論版). 2015(02)
[13]張康之,張桐.大數(shù)據(jù)中的思維與社會(huì)變革要求[J]. 理論探索. 2015(05)
[14]黃欣榮.大數(shù)據(jù)時(shí)代的思維變革[J]. 重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)). 2014(05)
[15]代明睿,朱克非,鄭平標(biāo).我國(guó)鐵路應(yīng)用大數(shù)據(jù)技術(shù)的思考[J]. 鐵道運(yùn)輸與經(jīng)濟(jì). 2014(03)