編譯 秦建秀
產(chǎn)生數(shù)據(jù)很容易—有效地使用數(shù)據(jù)則并不易。
在最近的一篇文章中,GigaOm闡述了Netflix所使用的復(fù)雜的數(shù)據(jù)分析方法,在最初實(shí)施的幾輪分析中,已引起了激烈的爭(zhēng)論,與每年生產(chǎn)超過50個(gè)實(shí)驗(yàn)的有線電視網(wǎng)相競(jìng)爭(zhēng),并同時(shí)取得了出乎意料的成功。就此我們可以看出,Netflix公司利用大數(shù)據(jù)的方式,可以在任何組織,無論小型企業(yè)還是大型企業(yè),都可以進(jìn)行復(fù)制。
大多數(shù)組織都有存儲(chǔ)在不同地點(diǎn)的孤立數(shù)據(jù),其實(shí)根本不曾使用。而從這些囤積的數(shù)據(jù)中獲得任何價(jià)值的最好辦法就是辨別哪些是可以用來描述理想客戶的數(shù)據(jù),以及客戶最想要的是什么。例如,Netflix公司發(fā)現(xiàn),75%的用戶都會(huì)從公司推薦的清單中選擇電影節(jié)目。因此,該公司的成功很大程度上取決于其能否推薦給觀眾恰如其分的建議。
盡管Netflix從來不愿意分享其絕密算法,但從下面的清單里我們?nèi)匀豢梢钥纯此麄兙烤故占四男┬畔?,用來?yōu)化完善其推介系統(tǒng):
●超過來自2500萬用戶的數(shù)據(jù)
●每天約3000萬次的視頻播放,而且跟蹤電影播放過程中的每次快退、快進(jìn)、暫停
●超過20億小時(shí)的視頻流
●每天400萬次的評(píng)價(jià)
●每天300萬次搜索
●地理位置數(shù)據(jù)
●設(shè)備信息
●每周、每天時(shí)段信息(Netflix公司已經(jīng)歸納驗(yàn)證—用戶平時(shí)觀看更多的電視娛樂綜藝節(jié)目,周末則更青睞電影)
●來自第三方的源數(shù)據(jù)
●來自Facebook和Twitter的社交媒體數(shù)據(jù)
Netflix公司充分審視分析自身服務(wù),如捕捉視頻的JPEG截圖和時(shí)間信息。正如有線電視所提出的建議,“仔細(xì)斟酌多種因素,如聲音、色調(diào)及場(chǎng)景,對(duì)于了解觀眾的喜好,非常有意義。”
使用公司所收集到的大數(shù)據(jù)資源,Netflix公司越來越善于為受眾找到恰當(dāng)?shù)目晒┻x擇的推薦節(jié)目。GigaOm認(rèn)為,搞清楚某些特定受眾的喜好簡(jiǎn)直是太容易了。通過分析觀眾正在觀看的節(jié)目——《監(jiān)獄風(fēng)云》、《火線》、《黑道家族》、《護(hù)士貝蒂》、《嗜血法醫(yī)》或《單身毒媽》,Netflix公司的預(yù)測(cè)模型就可以很容易地找到相通的主題或元素,找到如出一轍的系列電視,甚至考慮到數(shù)據(jù)的誤差,包括某些社交偏見。
Netflix的當(dāng)前熱播劇《鐵窗紅顏》橫空出世,在首播的第一周,有顯著數(shù)據(jù)的觀眾觀看了更長(zhǎng)時(shí)間的節(jié)目,超過之前其它任何一部。以后所有Netflix公司參與制作的節(jié)目都不得不選擇了類似元素—一個(gè)以監(jiān)獄為背景題材的黑色喜劇,這正是通過對(duì)收視行為趨勢(shì)所做出的分析而得到的結(jié)論,熱播電視的核心元素如“系列、監(jiān)獄、犯罪、黑色喜劇以及女主角領(lǐng)銜主演”。
對(duì)視頻的分析將大有作為,構(gòu)成實(shí)現(xiàn)成功熱播電視的必要元素。Netflix可以精確測(cè)量收集到在片頭就被觀眾按暫停的時(shí)間點(diǎn),進(jìn)而該公司就可以制定出更多數(shù)據(jù)驅(qū)動(dòng)的決策,如增加更多被觀眾重放的畫面,去掉那些被觀眾快進(jìn)或跳過的情節(jié)畫面,以確保他們所推薦的片花內(nèi)容可以立刻引人注目。
“有句名言我很欣賞—無法實(shí)施的創(chuàng)意只能是垃圾?!盢etflix首席內(nèi)容官泰德·薩蘭多斯說。
對(duì)于大多數(shù)公司來說,大數(shù)據(jù)是一個(gè)全新的領(lǐng)域。隨著數(shù)據(jù)量的增加,分析技術(shù)只會(huì)變得越來越時(shí)尚、精明;無論對(duì)于大型還是小型企業(yè)來說,都很難想象,一旦沒有了數(shù)據(jù)所提供的承諾為基礎(chǔ),企業(yè)該如何運(yùn)作決策。