報(bào)告:《Big data: The next frontier for innovation, competition, and productivity》
發(fā)布:麥肯錫全球研究院(McKinsey Global Institute)
麥肯錫全球研究院(MGI)成立于1990年,是麥肯錫公司的業(yè)務(wù)和經(jīng)濟(jì)研究部。該院的使命是幫助商界、公共部門以及社會(huì)各界的領(lǐng)導(dǎo)人更好地了解全球經(jīng)濟(jì)發(fā)展趨勢(shì),為在關(guān)鍵領(lǐng)域的管理和政策提供決策支持。在2011年,麥肯錫全球研究所發(fā)布了報(bào)告《大數(shù)據(jù):下一個(gè)創(chuàng)新,競(jìng)爭(zhēng)和生產(chǎn)力前沿》(簡(jiǎn)稱《大數(shù)據(jù)》),討論了大數(shù)據(jù)給商業(yè)和經(jīng)濟(jì)發(fā)展帶來(lái)的新的可能性,并預(yù)測(cè)到2018年,僅美國(guó)就存在14萬(wàn)~19萬(wàn)數(shù)據(jù)深入分析人才的缺口。
一個(gè)600美元的磁盤能存下全世界的音樂(lè);2010年全球手機(jī)使用量達(dá)50億部;“臉譜”網(wǎng)上每個(gè)月發(fā)帖量300億;到2011年4月,美國(guó)國(guó)會(huì)圖書館已儲(chǔ)存了235TB的數(shù)據(jù);全球消費(fèi)者每年通過(guò)使用個(gè)人定位數(shù)據(jù),節(jié)約6000億美元;零售商因利用大數(shù)據(jù),經(jīng)營(yíng)利潤(rùn)可能提高60%;到2018年,全球僅美國(guó)就需要?jiǎng)?chuàng)建14萬(wàn)~19萬(wàn)個(gè)數(shù)據(jù)深入分析崗位,以及150萬(wàn)精通數(shù)據(jù)分析的管理人才;我們的世界正經(jīng)歷一場(chǎng)前所未有的數(shù)據(jù)大爆炸。這對(duì)我們來(lái)說(shuō)到底意味著什么?
何謂“大數(shù)據(jù)”?
“大數(shù)據(jù)”是當(dāng)下炙手可熱的名詞,各行各業(yè)都在挖掘大數(shù)據(jù)的價(jià)值。很多公司在利用大數(shù)據(jù)方面都取得了成功。比如,樂(lè)購(gòu)?fù)诰蛄讼M(fèi)者的大量數(shù)據(jù),在此基礎(chǔ)上進(jìn)行消費(fèi)者市場(chǎng)劃分和針對(duì)性的促銷活動(dòng);亞馬遜利用消費(fèi)者的購(gòu)買信息,向消費(fèi)者進(jìn)行個(gè)性化商品推薦,每當(dāng)消費(fèi)者瀏覽某商品時(shí),Amazon都會(huì)通過(guò)協(xié)同過(guò)濾(collaborative filtering)機(jī)制,顯示“您可能還會(huì)喜歡……”“購(gòu)買此商品的顧客也同時(shí)購(gòu)買……”之類的信息;菲律賓移動(dòng)運(yùn)營(yíng)商Smart通過(guò)分析其滲透力、零售商覆蓋率,以及城鎮(zhèn)用戶的平均工資水平等數(shù)據(jù),將公司的業(yè)務(wù)重點(diǎn)放在具有最大潛力的小眾市場(chǎng)……
那么,“大數(shù)據(jù)”到底是什么呢?“大數(shù)據(jù)”是指超過(guò)現(xiàn)有一般數(shù)據(jù)處理軟件抓取、儲(chǔ)存、處理和分析數(shù)據(jù)的能力的數(shù)據(jù)??梢钥闯觯@是一個(gè)動(dòng)態(tài)的定義,隨著科技的發(fā)展,能被稱為“大”的條件在不斷提升。此外,“大數(shù)據(jù)”的定義也因部門領(lǐng)域不同、使用的軟件工具不同而有所差異。對(duì)于一些部門而言,十幾TB的數(shù)據(jù)就有可能被稱為“大數(shù)據(jù)”;而對(duì)于另一些部門而言,用PB衡量的數(shù)據(jù)才能有此“殊榮”。(注:1TB=1024GB,1PB=1024TB)
大數(shù)據(jù)可視化
人類在理解和消化大數(shù)據(jù)上的能力有限。據(jù)說(shuō),人類的短時(shí)記憶只能處理大約7條信息。加州大學(xué)圣地亞哥分校的羅杰·博恩和詹姆斯·肖特發(fā)現(xiàn),從1980年到2008年,消費(fèi)者通過(guò)各種媒體每小時(shí)對(duì)數(shù)據(jù)的消化只增長(zhǎng)了2.8%。經(jīng)濟(jì)學(xué)家赫伯特·西蒙曾說(shuō),信息的富有造成了注意力的貧窮。如何比較容易地理解大數(shù)據(jù)所傳達(dá)的信息呢?這就得依賴數(shù)據(jù)可視化技術(shù)。目前,有很多大數(shù)據(jù)處理軟件已被開(kāi)發(fā),比如,Big Table、Business intelligence、Cassandra、Cloud computing、Data mart、Data warehouse。
標(biāo)簽云(tag cloud)。標(biāo)簽云是根據(jù)詞匯出現(xiàn)的頻度,將數(shù)據(jù)可視化的。出現(xiàn)頻度越高的詞匯,在標(biāo)簽云中顯示得越大,相反,出現(xiàn)頻度越低的詞匯在標(biāo)簽云中顯示得越小。這種方式的數(shù)據(jù)可視化,能幫助讀者在龐大的文本中迅速抓住核心概念。
空間信息流 (Spatial information flow)??臻g信息流展示信息在空間的流動(dòng)。比如,可視化的空間信息流名為“New York Talk Exchange”,顯示了紐約和世界其他城市之間的IP數(shù)據(jù)流。某個(gè)城市的光域越大,那么這個(gè)城市與紐約之間的信息交換量越大。從中,我們可以清楚地看到哪個(gè)城市和紐約的信息聯(lián)系最密切。
工作流歷史記錄 (History flow)。工作流歷史記錄,用圖表的形式將許多作者對(duì)同一個(gè)文檔的操作過(guò)程記錄下來(lái)。比如,維基百科“Islam”詞條的工作流歷史記錄,橫坐標(biāo)表示時(shí)間,縱坐標(biāo)表示作者對(duì)文本的貢獻(xiàn)。每個(gè)作者在圖表中都擁有一個(gè)色彩條,色彩條縱向的長(zhǎng)度顯示了該作者的貢獻(xiàn)量。從“Islam”詞條工作流歷史記錄中,我們可以得出很多信息。比如,隨著參與編輯詞條的人越來(lái)越多,詞條文本越來(lái)越長(zhǎng);但在某些時(shí)候,可以看到文本被大量刪減,即縱向長(zhǎng)度縮短;有時(shí)甚至可以看到對(duì)文本的肆意“破壞”,即詞條文本在某時(shí)被完全刪除,有趣的是,文本很快就被重寫或修復(fù)。
大數(shù)據(jù)的變革力
為了弄清楚大數(shù)據(jù)到底在多大程度上創(chuàng)造價(jià)值,報(bào)告《大數(shù)據(jù)》從5個(gè)方面進(jìn)行了深度研究:醫(yī)療保健、公共部門、個(gè)人定位數(shù)據(jù)、零售和制造業(yè)。這5個(gè)領(lǐng)域差不多占到2010年全球GDP的40%。下面,從上述領(lǐng)域中選取2個(gè)方面做簡(jiǎn)要介紹。
醫(yī)療保?。绹?guó))。醫(yī)療保健業(yè)是美國(guó)最大的產(chǎn)業(yè)之一,占美國(guó)GDP的17%,在美國(guó)所有的工作崗位總數(shù)中占11%。在未來(lái)的10年,美國(guó)平均每年的醫(yī)保投入增長(zhǎng)率將會(huì)超過(guò)DGP增長(zhǎng)率的2個(gè)百分點(diǎn)。美國(guó)平均每人的醫(yī)保投入位居世界第一,效果卻不盡人意。美國(guó)如能在醫(yī)保方面充分利用大數(shù)據(jù),將會(huì)在臨床手術(shù)、支付、定價(jià)、研發(fā)、公共衛(wèi)生等方面創(chuàng)造更多的價(jià)值。
有效性對(duì)比研究(comparative effectiveness research),就是在醫(yī)保領(lǐng)域利用大數(shù)據(jù)的案例之一。醫(yī)保的過(guò)程、效果和費(fèi)用會(huì)受到諸多因素的影響,比如,醫(yī)保提供者、地理位置或醫(yī)保人。大范圍地對(duì)病人特性、醫(yī)保費(fèi)用、醫(yī)保效果等海量數(shù)據(jù)進(jìn)行綜合分析,就能在比較中,找出對(duì)于某位患者來(lái)說(shuō)最有效且最省錢的醫(yī)療方案。除美國(guó)之外,英國(guó)、德國(guó)、加拿大和澳大利亞等很多國(guó)家都已采用這種研究方式,避免醫(yī)保過(guò)程中的“過(guò)度治療”或“治療不足”。
除了有效性對(duì)比研究,大數(shù)據(jù)在醫(yī)保的臨床決策支持系統(tǒng)、病人遠(yuǎn)程監(jiān)控、改善公共衛(wèi)生監(jiān)測(cè)等方面都有發(fā)揮重要作用的潛力。據(jù)預(yù)測(cè),美國(guó)如果在醫(yī)保方面繼續(xù)挖掘大數(shù)據(jù)的價(jià)值,每年將節(jié)省3000億美元的支出。
公共部門(歐盟)。很多國(guó)家和地區(qū)的政府行政效率都有待提高,尤其是在經(jīng)濟(jì)危機(jī)的影響下,如何才能在預(yù)算壓縮的同時(shí),保持高水平的公共服務(wù)?麥肯錫全球研究院通過(guò)對(duì)歐盟公共部門的研究發(fā)現(xiàn),大數(shù)據(jù)在幫助公共部門提高信息透明度、提供決策支持上大有用武之地,并預(yù)計(jì)可為歐洲公共部門減少15%~20%的行政支出。德國(guó)聯(lián)邦勞工局對(duì)大數(shù)據(jù)價(jià)值的挖掘使用,就是很好的例子。該機(jī)構(gòu)旨在為失業(yè)人員提供一系列的咨詢與支持服務(wù),它利用大數(shù)據(jù)能更加準(zhǔn)確地分析和評(píng)估失業(yè)和半失業(yè)人員的特征……近些年來(lái),該機(jī)構(gòu)節(jié)省了約100億歐元的支出。
責(zé)任編輯:尹穎堯