邢帆
進(jìn)入大數(shù)據(jù)時(shí)代,數(shù)據(jù)信息的作用遠(yuǎn)不止步于銀行與電信業(yè)的業(yè)務(wù)發(fā)展中,政府行業(yè)對(duì)于數(shù)據(jù)的使用與價(jià)值的開發(fā)正逐漸實(shí)現(xiàn)著數(shù)據(jù)的更深層次價(jià)值。從人口普查到總統(tǒng)選舉,數(shù)據(jù)的大作為正以迅猛的速度滲透到各個(gè)行業(yè)。
數(shù)據(jù)的正能量
大數(shù)據(jù)被用來描述信息爆炸所產(chǎn)生的海量數(shù)據(jù)。Jim Gray的新摩爾定理認(rèn)為,每18個(gè)月全球新增的信息量是計(jì)算機(jī)有史以來全部信息量的總和。截至2010年,人類擁有的信息總量大約是1.2ZB(1ZB等于1萬億GB)。IDC預(yù)計(jì),到2020年,世界上的數(shù)據(jù)存儲(chǔ)總量將達(dá)35ZB。數(shù)據(jù)之所以增長如此之快,源于各類傳感器、智能終端的劇增。而高清晰圖像和視頻,更使得數(shù)據(jù)呈指數(shù)級(jí)增長。如何收集、管理和分析數(shù)據(jù)日益成為信息通信技術(shù)創(chuàng)新的重中之重。
對(duì)此,工信部信息化推進(jìn)司副司長董寶青曾表示,要積極看待大數(shù)據(jù)熱潮。大數(shù)據(jù)的興起,不完全源于信息技術(shù)變革到了一個(gè)多么了不起的高度,而源于一國政府、企業(yè)、國民的信息化應(yīng)用和創(chuàng)新思維到了一個(gè)嶄新的高度。大數(shù)據(jù)的本質(zhì)是對(duì)信息資源、知識(shí)資源、智慧資源開發(fā)利用的高度重視與創(chuàng)新。而我國在中辦、國辦34號(hào)文件里已經(jīng)深刻闡述過這一理念,現(xiàn)在需要更加積極地去推動(dòng)。
有資料顯示,在發(fā)達(dá)國家,制造業(yè)、銀行業(yè)、消費(fèi)營銷行業(yè)等較早進(jìn)入大數(shù)據(jù)時(shí)代,各類顧客點(diǎn)擊、瀏覽、反饋和交易記錄,都構(gòu)成了大數(shù)據(jù)的基礎(chǔ)。百度目前數(shù)據(jù)總量接近1000PB,存儲(chǔ)的網(wǎng)頁數(shù)量接近10000億,每天還會(huì)對(duì)這些數(shù)據(jù)進(jìn)行更新,響應(yīng)用戶的請(qǐng)求也是幾十億次。通用電氣正投資15億美元建設(shè)全球軟件和分析中心,擬雇傭400名數(shù)據(jù)科學(xué)家,協(xié)調(diào)全球1萬名軟件工程師通過共同的平臺(tái)工作。IBM商業(yè)價(jià)值研究院和牛津大學(xué)商學(xué)院對(duì)全球數(shù)千名企業(yè)高管的調(diào)查顯示,有63%的企業(yè)管理者希望大數(shù)據(jù)技術(shù)能與企業(yè)運(yùn)營管理實(shí)踐相結(jié)合,形成企業(yè)新的核心優(yōu)勢(shì),28%的受訪者所在企業(yè)已經(jīng)開始試點(diǎn)部署大數(shù)據(jù)。
正如我們所看到的,數(shù)據(jù)的力量已經(jīng)不再止步于金融和電信這些傳統(tǒng)的“數(shù)據(jù)大戶”,政府行業(yè)正逐漸向著服務(wù)的標(biāo)準(zhǔn)靠近,數(shù)據(jù)對(duì)政府部門的作用正在逐漸擴(kuò)大。
2008年,奧巴馬利用網(wǎng)絡(luò)力量當(dāng)選美國總統(tǒng),被譽(yù)為首位“網(wǎng)絡(luò)總統(tǒng)”。而就在不久前,奧巴馬再次借助超強(qiáng)的“大數(shù)據(jù)”能力成功連任,其背后幾十人的數(shù)據(jù)分析與挖掘團(tuán)隊(duì)也浮出水面。它幫助奧巴馬在獲取有效選民、投放廣告、募集資金方面起到了不可忽視的作用。
中國聯(lián)通研究院副院長童曉渝認(rèn)為,無論從獲取、存儲(chǔ)、處理和服務(wù)哪個(gè)環(huán)節(jié)看,大數(shù)據(jù)產(chǎn)業(yè)都正在快速形成。要推動(dòng)其發(fā)展,應(yīng)從戰(zhàn)略的高度去做好頂層設(shè)計(jì)和行業(yè)的發(fā)展規(guī)劃,標(biāo)準(zhǔn)規(guī)范,示范工程,還要前瞻性地完善制度建設(shè),用法律法規(guī)來保證大數(shù)據(jù)的公共性、真實(shí)性、安全性和隱私保護(hù)等。
從挑戰(zhàn)到機(jī)遇
為了從數(shù)據(jù)中獲得有價(jià)值的信息,做出更快更好的決策,企業(yè)對(duì)信息解決方案、服務(wù)和資源的投資所產(chǎn)生的價(jià)值成為信息回報(bào)。由結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、以及半結(jié)構(gòu)化數(shù)據(jù)組成的大數(shù)據(jù),是企業(yè)當(dāng)前面臨的挑戰(zhàn)。同時(shí)非結(jié)構(gòu)化數(shù)據(jù)在未來的增速將是結(jié)構(gòu)化數(shù)據(jù)的3倍。社交媒體、移動(dòng)互聯(lián)網(wǎng)將構(gòu)成大數(shù)據(jù)重要的部分。
面對(duì)數(shù)據(jù),想讓其從挑戰(zhàn)變成機(jī)遇,首先在不同的行業(yè)里要了解如何在產(chǎn)生大數(shù)據(jù)的時(shí)候去分析用戶的商業(yè)價(jià)值,我們要了解它管理信息的戰(zhàn)略。當(dāng)然也要了解整體數(shù)據(jù),到底是從什么系統(tǒng)來,做什么用,最后和哪些客戶有關(guān)系,目前處理的,大部分還是跟內(nèi)部的系統(tǒng)有關(guān)系。另一方面,這些數(shù)據(jù)即使幾個(gè)PB、幾十個(gè)PB也都是小部分,這些數(shù)據(jù)的質(zhì)量到底如何?如何讓幾天獲得的信息在幾秒鐘之內(nèi)達(dá)到更高的質(zhì)量?數(shù)據(jù)從哪里來?意味著什么?以及通過績效管理和在不同的行業(yè)里去分析數(shù)據(jù)產(chǎn)生的同時(shí),做財(cái)務(wù)相關(guān)的分析、人力相關(guān)的分析,供應(yīng)量相關(guān)的分析,比如核心銀行的客戶系統(tǒng)的分析,電信網(wǎng)絡(luò)的分析,BSS系統(tǒng)的分析等。
其次,企業(yè)需要面對(duì)的最大的挑戰(zhàn)就是數(shù)據(jù)的競(jìng)爭(zhēng)。數(shù)據(jù)已經(jīng)成為了現(xiàn)在生產(chǎn)過程中的基本要素和資產(chǎn)。數(shù)據(jù)如何競(jìng)爭(zhēng)?投資回報(bào)率如何建立?數(shù)據(jù)投資回報(bào)是數(shù)據(jù)價(jià)值除以數(shù)據(jù)成本,第一,需要降低數(shù)據(jù)成本,提升數(shù)據(jù)價(jià)值。而降低數(shù)據(jù)成本有很多做法,其中最重要的就是把低活躍度的數(shù)據(jù)轉(zhuǎn)移到低成本的存貯器上去。怎樣增加數(shù)據(jù)的價(jià)值呢?要收集更多、更全面的數(shù)據(jù),比如說社交化ERP。第二,要針對(duì)數(shù)據(jù)質(zhì)量有一個(gè)數(shù)據(jù)治理的隊(duì)伍和流程。第三,要有很好的數(shù)據(jù)分析的能力,“數(shù)據(jù)可視化”是當(dāng)前的大趨勢(shì),通過圖形、圖像、動(dòng)畫等等一同展示數(shù)據(jù),讓數(shù)據(jù)淺層的關(guān)系得到更好的理解和發(fā)現(xiàn)。
農(nóng)夫山泉首席信息官胡健說:“運(yùn)用內(nèi)存數(shù)據(jù)庫平臺(tái)進(jìn)行實(shí)時(shí)海量數(shù)據(jù)處理,運(yùn)費(fèi)報(bào)表從原來的24小時(shí)縮短到只需3.6秒即可生成,速度提升了兩萬多倍,促進(jìn)業(yè)務(wù)優(yōu)化,擺脫了傳統(tǒng)的IT維護(hù)和數(shù)據(jù)滯后的問題,整個(gè)生產(chǎn)環(huán)境呈現(xiàn)出更順暢的運(yùn)營、更準(zhǔn)確的數(shù)據(jù)和更高效的性能,大幅提升我們應(yīng)對(duì)市場(chǎng)變化的能力。消費(fèi)品行業(yè)競(jìng)爭(zhēng)激烈,但只要我們比人家快一步,我們就可以占得先機(jī),就可以占領(lǐng)市場(chǎng)?!比毡救閳?bào)株式會(huì)社,生物信息和基因組分析方面的專家建立了一個(gè)實(shí)時(shí)的分析數(shù)據(jù)庫平臺(tái),通過采用復(fù)雜的、迭代算法,并使用Hadoop進(jìn)行基因組序列預(yù)處理,成功地把基因組分析的時(shí)間從以數(shù)天縮短到幾分鐘。
諸如此類,大數(shù)據(jù)對(duì)于企業(yè)能夠創(chuàng)造出多大的價(jià)值是不能夠給出定論的。數(shù)據(jù)的價(jià)值也并不在于挖掘與分析,而是從收集和存儲(chǔ)就已開始。運(yùn)營商想要從中獲益就必須高度重視大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)建設(shè),還要對(duì)寬帶網(wǎng)絡(luò)進(jìn)行智慧管理。金融行業(yè)則需盡快完善其在安全領(lǐng)域受到的注目,利用能多信息實(shí)現(xiàn)信息增值。而在政治領(lǐng)域,服務(wù)型社會(huì)中,數(shù)據(jù)將“大”有作為。