郝智偉
硅谷創(chuàng)業(yè)教父保羅·格拉厄姆曾有句名言:“活在未來,再把缺失的做出來。(Live in the future, then build what's missing.)”它成為諸多企業(yè)競相追逐的目標(biāo)。但必須明白的是,要“活在未來”,首先得“看見未來”。
“要看見未來,大數(shù)據(jù)恰是最好的望遠(yuǎn)鏡?!卑⒗锇桶图瘓F(tuán)商業(yè)智能部副總裁、數(shù)據(jù)委員會會長車品覺說道,正是因為有了大數(shù)據(jù),才有了對過去和曾經(jīng)的理解,有了對當(dāng)下的判斷和實(shí)時處理,最后才導(dǎo)出對以后和將來的認(rèn)知。
近兩年,阿里因為大數(shù)據(jù)而風(fēng)光無限——淘寶、天貓等無限客戶端快速優(yōu)化,緊隨移動互聯(lián)大潮的脈動,而成立不足2年的阿里小貸更是異常耀眼,用0.78%不良貸款率和超快的貸款循環(huán)震撼著傳統(tǒng)銀行圈……
這些年,阿里拿著數(shù)據(jù)望遠(yuǎn)鏡,不斷窺見未來,將“缺失”的部分做出來,逐漸“吹盡狂沙見真金”,按照雅虎最新財報顯示,阿里單季收入超17.37億美元,較去年同比增長61%,凈利潤增至7.17億美元,較去年同期上升145%。
顯然,手握上百PB數(shù)據(jù)的阿里,經(jīng)過大數(shù)據(jù)洗禮,正逐漸蛻變?yōu)橐活^“數(shù)據(jù)派猛獸”,也影響著整個電商生態(tài)的大數(shù)據(jù)體系。但在車品覺的眼中,阿里在大數(shù)據(jù)上八年鑄劍,這不過才是開始。
從童蒙到精深
如歌德《浮士德》里土地之神吟唱道:“生潮中,業(yè)浪里……我架起時辰的機(jī)杼,替神織造生動的衣裳。”阿里編制大數(shù)據(jù)“生動的衣裳”始于2005年。當(dāng)時,其下淘寶剛剛完成對易趣的逆襲,業(yè)務(wù)和品類快速擴(kuò)張,數(shù)據(jù)量也隨之躍升,淘寶開始意識到不能再拍腦袋做經(jīng)營決策。于是,設(shè)立商業(yè)智能部,開始引入“數(shù)據(jù)分析師”職位。
“這個職位的設(shè)立,意味著一家企業(yè)開始正視數(shù)據(jù)了。”車品覺解釋道,而阿里也終于擁有了自己第一款真正的數(shù)據(jù)產(chǎn)品“淘數(shù)據(jù)”,它是一份經(jīng)營數(shù)據(jù)的報表,為各業(yè)務(wù)部門提供經(jīng)營報表的檢索、生成工具,從此,阿里有了各種界定公司運(yùn)營的指標(biāo)。
在車品覺眼中,這正是數(shù)據(jù)的本質(zhì),雖然“報表”的模式看起來十分基礎(chǔ)。從基礎(chǔ)的財務(wù)、運(yùn)營數(shù)據(jù)開始,用什么樣的數(shù)據(jù)體現(xiàn)什么樣的價值,讓什么樣的人更明白什么樣的決策,始終是大數(shù)據(jù)必須堅守的準(zhǔn)則。
時至2009年,“淘數(shù)據(jù)”從一個內(nèi)部報表系統(tǒng)躍升為內(nèi)部數(shù)據(jù)統(tǒng)稱。此時,商業(yè)智能部團(tuán)隊又開發(fā)出可以預(yù)警的“KPI系統(tǒng)”和提供給業(yè)務(wù)部門使用的“數(shù)據(jù)門戶”。同時,阿里的對外數(shù)據(jù)產(chǎn)品也開始浮出水面。脫胎于“雅虎統(tǒng)計”的工具“量子恒道”為外部的商戶提供了統(tǒng)計、分析自有店鋪中的流量、點(diǎn)擊、購買等數(shù)據(jù)變化的工具。
而到了2010年,淘寶推出了一款劃時代的產(chǎn)品“數(shù)據(jù)魔方”。之前,阿里數(shù)據(jù)團(tuán)隊接到了寶潔公司的建議,對方希望對行業(yè)數(shù)據(jù)有所了解,其中一位員工提出,與其逐一為這樣的大佬解決問題,不如直接產(chǎn)品化,以幫助商家經(jīng)營決策。
就這樣,阿里數(shù)據(jù)的價值開始從內(nèi)而外,向整個生態(tài)體系延伸,阿里第一次向市場開放了全局市場數(shù)據(jù)?!皵?shù)據(jù)魔方”后來成了眾多大中型商戶追捧的數(shù)據(jù)利器,甚至引來了諸多第三方機(jī)構(gòu)參與阿里系數(shù)據(jù)的解讀與分享,構(gòu)建出電商最早的數(shù)據(jù)分析體系。
“分水嶺出現(xiàn)在2011年?!避嚻酚X解釋道,那一年,馬云提出了從“數(shù)據(jù)化運(yùn)營”到“運(yùn)營數(shù)據(jù)”。在此之前,阿里產(chǎn)生的數(shù)據(jù)都是“量”上的變化,但缺乏“質(zhì)”上的提升,從未有人主動地想過,如果要指導(dǎo)阿里的運(yùn)作,需要刻意收集哪些數(shù)據(jù),收集到這些數(shù)據(jù)后,可能對企業(yè)產(chǎn)生怎樣的影響,能否誕生出新的商業(yè)模式……也是在這一年,車品覺來到了阿里旗下的支付寶,著力于提升阿里在大數(shù)據(jù)分析上的“質(zhì)”。
當(dāng)時,支付寶高層手持報表,可以看到太多數(shù)據(jù),可惜關(guān)聯(lián)性不足,難以快速全局診斷;而另一邊,則是一線運(yùn)營總喊數(shù)據(jù)不夠,獲取數(shù)據(jù)的間隔嚴(yán)重,同樣無法獲得關(guān)聯(lián)性。
于是,車品覺對癥下藥,做了兩款產(chǎn)品,一款名為“觀星臺”,它表現(xiàn)為一個高度可視化的儀表盤,選擇最關(guān)鍵的數(shù)據(jù),讓高管在幾秒內(nèi)能明了全局運(yùn)營狀況;另一款叫“地動儀”,可以讓一線運(yùn)營者看到當(dāng)下用戶投訴最多的功能是什么,甚至可以調(diào)動最原始的客服電話錄音,及時發(fā)現(xiàn)和補(bǔ)救問題。
沒過多久,車品覺轉(zhuǎn)身進(jìn)入淘寶,也開發(fā)了兩款產(chǎn)品。一款“黃金策”,能夠綜合700多項變量進(jìn)行疊加,數(shù)秒內(nèi)可以就特定人群和特定應(yīng)用場景行為的推導(dǎo)查詢;而另一款產(chǎn)品“無量神針”則提供對淘寶數(shù)百萬賣家的實(shí)時洞察,可以可視化圖表直接提示可能存在的風(fēng)險,每當(dāng)數(shù)據(jù)“異動”發(fā)生,比如遭遇“惡拍”(網(wǎng)絡(luò)“打手”買下產(chǎn)品,等產(chǎn)品上門后,以各種理由拒收,以此要挾“保護(hù)費(fèi)”或打擊競爭對手),就會及時向?qū)?yīng)的運(yùn)營者發(fā)出預(yù)警。
有基于此,阿里從大數(shù)據(jù)的童蒙摸索,到有方向的縱深挖掘,逐漸“玩”出了感覺。
玩轉(zhuǎn)大數(shù)據(jù)“寶刀”
毫無疑問,遠(yuǎn)不止是阿里,當(dāng)下,任何企業(yè)遇到難題時,都希望能通過大數(shù)據(jù)找到解決之法。這種“欲與關(guān)公借寶刀”的想法是很自然的,但要明白的是,要玩好大數(shù)據(jù)這把“寶刀”,還須有關(guān)公的臂力和技藝,而這些則需要在實(shí)踐中不斷磨練,阿里也不例外。
“你必須面對大數(shù)據(jù)的各種困境,尋求解決之道?!避嚻酚X告訴記者。
首先,便是應(yīng)對企業(yè)內(nèi)部各方的需求。
一來,管理層對大數(shù)據(jù)有極高的期望,他們認(rèn)為它應(yīng)該對公司產(chǎn)生很大的價值;二來,中層管理者對大數(shù)據(jù)沒有太多感覺,讓他們突然去想數(shù)據(jù)這個事情,并不了解其中原委,他們只會說:“我根本不知道有什么數(shù)據(jù)可用”;如此,做數(shù)據(jù)的人會感覺到無力,因為他們所做的數(shù)據(jù)距離具體的商業(yè)場景“萬水千山”。最終,三者都達(dá)不到自己期望的境界。
為此,阿里就必須琢磨著如何跨越后兩者的“鴻溝”,從而達(dá)到管理層的期望。
按照車品覺的說法,這就需要專門的中間層人才,要么讓業(yè)務(wù)中層去學(xué)習(xí)大數(shù)據(jù)的技法,要么懂得數(shù)據(jù)分析的工程師去學(xué)習(xí)業(yè)務(wù),以此造就出中間層人才,讓他們可以看到業(yè)務(wù),馬上在腦海中形成數(shù)據(jù)分析的構(gòu)架,也能在看到數(shù)據(jù)后,感知到它對業(yè)務(wù)層面的意義,如此,他們在業(yè)務(wù)層、數(shù)據(jù)工作層之間充當(dāng)“翻譯”,進(jìn)而彌合雙方的信息不對稱?,F(xiàn)在看來,數(shù)據(jù)分析師學(xué)習(xí)業(yè)務(wù),是更易行的方法,畢竟數(shù)據(jù)分析技術(shù)要求太高,學(xué)起來很吃力。
其次,要保持?jǐn)?shù)據(jù)的“干凈”,數(shù)據(jù)必須要經(jīng)過“清洗”。
幾年前,曾有一個用數(shù)據(jù)的分析師,找到數(shù)據(jù)收集部門,責(zé)怪他們更改了一個數(shù)據(jù),卻沒有通知他,結(jié)果因為這個數(shù)據(jù)出錯,造成一系列分析上的差池,而事實(shí)上,負(fù)責(zé)數(shù)據(jù)收集的人并沒有想到自己對一個數(shù)據(jù)的處理會產(chǎn)生這樣的“蝴蝶效應(yīng)”。
不難想象,數(shù)據(jù)一旦被擺放出來,就可能為人所用,它可以來自于八個系統(tǒng),二十多個開發(fā)組,其中任何一個數(shù)據(jù)“人為”或“非人為”的污染(采集錯誤或口徑不同),都可能改變整組數(shù)據(jù)的“性質(zhì)”,故而,所有數(shù)據(jù)必須被“清洗干凈”。
為此,阿里集團(tuán)內(nèi)的數(shù)據(jù)大多都經(jīng)過這般旅程——譬如消費(fèi)者在淘寶上的一個收藏動作,產(chǎn)生一條數(shù)據(jù),先在淘寶網(wǎng)的前端服務(wù)器上產(chǎn)生一條日志,這條日志隨后被傳送存儲到專用的服務(wù)器上,其間經(jīng)過淘寶團(tuán)隊的清洗。然后,在數(shù)據(jù)平臺事業(yè)部的服務(wù)器上,這條數(shù)據(jù)將再被檢查其日志格式是否正確,是否有過變動,為何變動……如此清洗后,它被編入數(shù)據(jù)庫,接著與其他若干數(shù)據(jù)一同被分入分主題的數(shù)據(jù)集市。當(dāng)分析師們進(jìn)行數(shù)據(jù)挖掘時,它再度接受挑選,看其是否受用。
再次,則必須保持?jǐn)?shù)據(jù)的快速更新,實(shí)時可用。
懂得數(shù)據(jù)倉庫的人都明白,數(shù)據(jù)倉庫里面的最大的瓶頸,一般都是IBM、Oracle、EMC(IOE)的商用系統(tǒng)構(gòu)架。隨著數(shù)據(jù)量的快速增加,阿里已發(fā)現(xiàn)這種傳統(tǒng)數(shù)據(jù)庫越發(fā)力不從心,越來越多業(yè)務(wù)部門的分析師發(fā)現(xiàn)他們早晨9點(diǎn)上班看數(shù)據(jù)時難以獲得結(jié)果,而實(shí)際上,數(shù)據(jù)庫的工程師們每晚忙到11、12點(diǎn)才能下班——越來越多的數(shù)據(jù)讓傳統(tǒng)商用機(jī)器難以按時計算完成。
由此,與大數(shù)據(jù)的裂變同步,原微軟亞洲研究院常務(wù)副院長王堅出任阿里首席構(gòu)架師,開始主導(dǎo)阿里從原來的IOE商用系統(tǒng)向Hadoop的分布式平臺遷移,后者較前者不僅成本低廉,而且可擴(kuò)展性極強(qiáng),Google等互聯(lián)網(wǎng)巨頭都是采用此大規(guī)模計算體系。也是在此體系下,阿里才能實(shí)現(xiàn)全集團(tuán)實(shí)時數(shù)據(jù)的打通、整合管理和共享。
基于此,阿里小貸才能玩得如此出彩,因為它能夠?qū)栀J者做實(shí)時的信用評分,五分鐘之前的數(shù)據(jù)判斷可能和五分鐘之后大相徑庭,由此,及時發(fā)現(xiàn)風(fēng)險,將違約降到最低。與之類似,曾有客戶的余額寶賬號被盜,其中10萬元被盜轉(zhuǎn),好在,基于實(shí)時數(shù)據(jù)分析的支付寶風(fēng)控系統(tǒng)發(fā)現(xiàn)其中異常,硬是在數(shù)秒內(nèi)攔下了其中的6萬元。
總而言之,問題越多,磨練越多,橫逆窮困恰是鍛煉企業(yè)大數(shù)據(jù)能力的爐錘,能受其鍛煉,則得益匪淺,不受其鍛煉,則損失匪輕。這在大數(shù)據(jù)早入化境的金融業(yè)已被證明了太多次。
商業(yè)化的成本、收益
其實(shí),無論用大數(shù)據(jù)提升效率,還是用它降低成本,總歸是為了實(shí)現(xiàn)商業(yè)的增值,既如此,它也不得不按照商業(yè)的法則運(yùn)營。
曾有人說,數(shù)據(jù)越多越全,分析就能越準(zhǔn)確,但現(xiàn)實(shí)絕非如此。之前,車品覺與一些大數(shù)據(jù)玩家討論,發(fā)現(xiàn)對方很少有人做過數(shù)據(jù)備份,因為本來只需要50臺存儲的,現(xiàn)在卻要100臺,成本倍增,根本不符合商業(yè)法則。雖然車品覺并不認(rèn)同無備份的做法,但如何在數(shù)據(jù)存儲和商業(yè)成本上平衡,卻是不得不考慮的問題
更進(jìn)一步說,半年前的消費(fèi)者購買行為數(shù)據(jù)還有價值么?要知道這半年間,網(wǎng)頁設(shè)計優(yōu)化了N次,產(chǎn)品更替了N次,可點(diǎn)擊的鏈接也變化了N次,原本的數(shù)據(jù)已經(jīng)與當(dāng)下的行為不存在聯(lián)系,這樣的數(shù)據(jù)已經(jīng)失去挖掘的意義,經(jīng)過檢驗后,就應(yīng)當(dāng)被放棄。而此時大數(shù)據(jù)的負(fù)責(zé)人也必須向老板解釋清楚,它們不再是企業(yè)的資產(chǎn),而是增加成本的負(fù)累。
而真正不能舍棄的,是那些“今日不收集,明日會后悔”的數(shù)據(jù),或者是“下一小時,機(jī)房爆炸,一小時內(nèi)必須備份”的數(shù)據(jù),因此各種入庫的數(shù)據(jù)必須被標(biāo)明優(yōu)先級,“高價資產(chǎn)”則必須被牢牢守住,為之投入存儲成本,必定是物有所值。
另一方面,在此基礎(chǔ)上,馬云明確表態(tài),“平臺、數(shù)據(jù)、金融”是阿里的未來所在,2011年收購數(shù)據(jù)屬性公司CNZZ,近期又接連收購友盟,入股新浪微博和高德,數(shù)據(jù)源頭開始不斷展開。甚至在物流體系中,阿里先是由天貓主導(dǎo)建設(shè)了與各大物流公司對接的“天網(wǎng)體系”,如今又出面牽頭成立了全國智能骨干物流網(wǎng)絡(luò)“菜鳥科技”,并提供物流信息數(shù)據(jù)平臺。
顯然,阿里在構(gòu)建自己的“全息”數(shù)據(jù)商業(yè)平臺,謀劃大數(shù)據(jù)收益。
要知道,不同系統(tǒng)的數(shù)據(jù)產(chǎn)生不同的價值,但是總歸是為了更好地了解用戶。每個人在不同的平臺反映出不同的側(cè)面,而只有掌握了一個人在各方面的數(shù)據(jù)“碎片”,才能顯示出一個人完整特征,激化出數(shù)據(jù)最大的商業(yè)價值,因此,阿里渴望以體系外的數(shù)據(jù)彌補(bǔ)自身的局限。
比如,在即將到來的“1111天貓購物節(jié)”,阿里就在投入3億元紅包,并通過社交網(wǎng)絡(luò)分享。分享者仍將保留原紅包,甚至有可能在共享之后,自己紅包價值獲得翻倍。由此,引入社交元素,對阿里而言,相當(dāng)于投資3億元的“石塊”入“消費(fèi)者”大湖中,觀察其“漣漪”,明晰消費(fèi)者“朋友圈”的關(guān)系,并能看出社交因素對網(wǎng)購的刺激效應(yīng)。
就這樣,阿里手中掌握的數(shù)據(jù)碎片越來越多,涉及互聯(lián)網(wǎng)用戶的方方面面,包括實(shí)體類商品消費(fèi)數(shù)據(jù)、社交關(guān)聯(lián)數(shù)據(jù)、金融相關(guān)數(shù)據(jù)等,其數(shù)據(jù)平臺的商業(yè)化價值不斷提升,或許在不遠(yuǎn)的將來,阿里會以自己的數(shù)據(jù)平臺為中心建立數(shù)據(jù)交易中心。也就是說,誰想獲得數(shù)據(jù),上這個平臺來,要么用貨幣來換,要么用數(shù)據(jù)來換。
眼下,如何成為一家徹底的數(shù)據(jù)公司,如何在內(nèi)外提供數(shù)據(jù)價值,正成為阿里新的攻堅戰(zhàn)。
從最初的用數(shù)據(jù),到后來的“玩轉(zhuǎn)”數(shù)據(jù),再到現(xiàn)在的甄選、整合、激發(fā)數(shù)據(jù),阿里不斷在大數(shù)據(jù)中蛻變。值得強(qiáng)調(diào)的是,大數(shù)據(jù)對于任何企業(yè)而言,都不是“畢其功于一役”的魔法,而是不斷學(xué)習(xí)、優(yōu)化的過程,其前途不可限量,即便是阿里,現(xiàn)在也只是走到了“大數(shù)據(jù)的海邊”,窺見的,也只是未來的一角。