申學舟
大數(shù)據(jù)時代,對數(shù)據(jù)的有效利用將是所有企業(yè)共同競爭的核心。
“我們所說的大數(shù)據(jù),其實并沒有創(chuàng)造新的數(shù)據(jù),它只是把企業(yè)忽視的、遺漏的數(shù)據(jù)重新挖掘出來,然后進行統(tǒng)一、交叉的分析??墒莻鹘y(tǒng)的數(shù)據(jù)分析理念,根本無力解決海量數(shù)據(jù)的問題。”2016年12月中旬,瑞金麟集團聯(lián)合創(chuàng)始人&瑞雪科技CEO洪斌在“瑞雪分析云”發(fā)布會上表示。
他認為,目前傳統(tǒng)數(shù)據(jù)分析理念由于技術(shù)的先天局限,其實是在不斷引導企業(yè)拋棄細節(jié)數(shù)據(jù),數(shù)據(jù)每匯總一次都是分析潛力的喪失?!笆袌鲂枨笤诓粩嗌墸偁幁h(huán)境在不斷升級,競爭對手的管理精細度在不斷升級。當新的分析目標不斷產(chǎn)生時,就會不斷地發(fā)現(xiàn)找不到數(shù)據(jù)了。因為數(shù)據(jù)已經(jīng)被匯總了,原始數(shù)據(jù)不見了。”
對此,洪斌表示,Data Lake(數(shù)據(jù)湖泊)是能夠較好解決上述問題的方式。該概念在2010年由James Dixon首次提出,但當時并沒有引起足夠的重視。“我認為,這是大數(shù)據(jù)時代最偉大、最具顛覆性的發(fā)明創(chuàng)造。簡單地講,就是存儲每一個可能有用的細節(jié)數(shù)據(jù),當需要時再一站式分析的理念?!焙楸蠼忉尅?