李玥
在LinkedIn,我是大數(shù)據(jù)的宣傳者,同時也是實踐者。實際上,大數(shù)據(jù)是被“炒過頭”的一個概念,很少有人去了解它的定義是什么。
2003年,我剛到美國時做的是氣侯模型建模,比如說氣侯變暖、臭氧層空洞,所有這些結(jié)論都是通過氣侯模型模擬出來的。我的博士課題研究的就是運(yùn)用氣侯模型對臭氧空洞的形成和進(jìn)化進(jìn)行研究。。當(dāng)時,我們用的數(shù)據(jù)規(guī)模比現(xiàn)在很多公司大得多。我所在的研究生院里,有美國最先進(jìn)的一個超級計算機(jī)中心,都是最快的計算機(jī)并行起來運(yùn)算。我們有很多數(shù)據(jù),但那個時候,從來沒有人講過大數(shù)據(jù)。大概在2009年左右,“大數(shù)據(jù)” 的概念開始流行起來。第一次聽到這個詞時,我覺得很有意思,因為實際上從來美國的第一天起,我就在大數(shù)據(jù)領(lǐng)域工作了。
接下來,我講下大數(shù)據(jù)在LinkedIn的商業(yè)模型中起的作用。上線之初,社交網(wǎng)絡(luò)最重要的是讓人能進(jìn)來注冊,告訴他們?yōu)槭裁匆獊碜?,能在這個平臺上做哪些事情,這是我們最開始注重的地方。當(dāng)足夠多的會員進(jìn)入平臺,他們的行為會產(chǎn)生很多數(shù)據(jù),通過數(shù)據(jù)我們可以了解到:什么樣的產(chǎn)品、產(chǎn)品的哪些方面對大家是最有用的。之后根據(jù)這些反饋,我們再去做更有價值的產(chǎn)品和服務(wù)。
一般而言,大家用LinkedIn是免費的。我們有一些付費服務(wù),比如給招聘人員用的、給銷售人員用的、或者給市場人員用的。所有這些都是通過對數(shù)據(jù)、用戶附加價值的分析,做出來的新產(chǎn)品。
我們這個團(tuán)隊具體做了哪些事情?
第一步,把數(shù)據(jù)做好,包括能夠采集正確的數(shù)據(jù),保證數(shù)據(jù)的質(zhì)量和對數(shù)據(jù)進(jìn)行管理。有了這些才能告訴你,公司以前發(fā)生了什么事情,數(shù)據(jù)對公司產(chǎn)生了什么影響。接著,你可以拿這些分析商業(yè)回報,畢竟它是有投入的。
第二步,信息和知識。通過數(shù)據(jù)分析,可以知道以前那些事情為什么會發(fā)生?這時對商業(yè)的回報會有增加。
第三步,預(yù)測什么將會發(fā)生。
最后一步,洞察力。這是給能做商業(yè)決定的人一些建議,或者一些策略。根據(jù)對數(shù)據(jù)的分析,可以得出怎樣的策略能讓公司有最好的回報。這時,你會看到在商業(yè)回報里達(dá)到的最佳值,當(dāng)然這是循序漸進(jìn)的過程。現(xiàn)在,我們團(tuán)隊集中精力在做洞察力。
最后介紹一下LinkedIn。我們現(xiàn)在有3億多用戶,整體看,LinkedIn在英語和西班牙語的國家里發(fā)展更好一些。數(shù)據(jù)顯示,每個月有多于1.8億用戶訪問LinkedIn網(wǎng)站,并且用戶數(shù)量還在以非常快的速度在增長, 每秒鐘大約會增加兩個新用戶。