沈祿政
《紙牌屋》的原版是英國的一部迷你電視劇,Netflix買下版權(quán),請來導(dǎo)演大衛(wèi)·芬奇和老戲骨凱文·史派西在Netflix網(wǎng)絡(luò)上做獨(dú)播,首次進(jìn)軍原創(chuàng)劇集就一炮而紅,在美國及 40 多個(gè)國家成為最熱門的在線劇集。這部劇也是互聯(lián)網(wǎng)從業(yè)者討論的重點(diǎn),不僅僅是劇集劇情和明星,而是其特別的誕生方式。
《紙牌屋》的誕生最重要的一個(gè)關(guān)鍵詞是大數(shù)據(jù)。在任何一個(gè)國家的電視劇行業(yè)都沒有什么是確定的。特別是美國這種競爭充分的市場,即便是找齊了金牌導(dǎo)演、實(shí)力演員和時(shí)下最流行的題材劇本,結(jié)果很可能仍然不受觀眾的待見。但在《紙牌屋》這部劇集上,Netflix通過業(yè)務(wù)所沉淀的用戶數(shù)據(jù)判斷用戶喜好,成功催生了熱門劇集。應(yīng)該說《紙牌屋》的成功得益于 Netflix 海量的用戶數(shù)據(jù)積累和分析。
對于《紙牌屋》劇集的播放,Netflix采取這樣的策略——一開始就把整季內(nèi)容全放出來,而不是以前傳統(tǒng)美劇采用的周播制,以每周一集的方式吊足觀眾胃口??赡苡腥藭?huì)質(zhì)疑這樣會(huì)剝奪觀眾等待劇集的樂趣。但Netflix的觀點(diǎn)是,由于DVD 和網(wǎng)絡(luò)劇集的流行,很多觀眾已經(jīng)習(xí)慣了一下子就能得到整部劇集??傮w來說,后者會(huì)讓觀眾獲得更大的滿足感。這就是互聯(lián)網(wǎng)用戶的觀看習(xí)慣。網(wǎng)絡(luò)讓用戶有更多選擇的同時(shí),用戶也期望得到更多。顯然Netflix比其他的電視劇制作商更了解用戶。也正是基于用戶大數(shù)據(jù)的挖掘才讓Netflix有更多的底氣投入一億美元來賭《紙牌屋》的成功。
如今的海量數(shù)據(jù)中,包括各種各樣的數(shù)據(jù)類型,最常見的普通文本、照片、視頻等等,還有像位置信息、鏈接信息等XML類型的數(shù)據(jù)。這些數(shù)據(jù)很難通過傳統(tǒng)的技術(shù)手段進(jìn)行提煉和分析。這是絕大多數(shù)企業(yè)面對大數(shù)據(jù)無所適從的主要原因,這也催生了企業(yè)之間的跨界合作,即便是Netflix也不是獨(dú)立完成所有的數(shù)據(jù)挖掘工作,也有賴于Amazon的協(xié)作。依靠Amazon,Netflix每天可以分析超過3000萬條播放記錄,包括用戶在何時(shí)、何地、何種設(shè)備上觀看什么內(nèi)容,用戶給節(jié)目添加的恐怖、必看等個(gè)性標(biāo)簽,并在記錄暫停、倒退、快進(jìn)、評(píng)分、搜索的同時(shí),進(jìn)行大量截圖,試圖分析用戶在音量、畫面色彩甚至場景選取上的喜好。
大數(shù)據(jù)時(shí)代不可抗拒,應(yīng)該是毋庸置疑的,但對于絕大多數(shù)企業(yè)來說大數(shù)據(jù)本身僅是一個(gè)空泛的概念,不僅難以參與,更難于控制。大數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)分析有很大的不同,它有四個(gè)特點(diǎn):第一,數(shù)據(jù)體量巨大,從TB級(jí)別躍升到PB級(jí)別;第二,數(shù)據(jù)類型繁多,網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等無所不包;第三,價(jià)值密度低,商業(yè)價(jià)值高。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅有一兩秒;第四,處理速度快。這都和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。
大數(shù)據(jù)技術(shù)的意義確實(shí)不在于掌握規(guī)模龐大的數(shù)據(jù)信息,而在于對這些數(shù)據(jù)進(jìn)行智能處理,從中分析和挖掘出有價(jià)值的信息,但前提是擁有大量的數(shù)據(jù)。這個(gè)全局?jǐn)?shù)據(jù)的時(shí)代很快就會(huì)來臨,現(xiàn)在所要做的就是擁有并尊重?cái)?shù)據(jù)。endprint