■(加拿大)林 青
數(shù)據(jù)一詞并不新鮮,從有計算機開始就有數(shù)據(jù)。但大數(shù)據(jù)則是近幾年隨著云計算、衛(wèi)星定位及多媒體應用而產(chǎn)生的現(xiàn)象。簡單地說,大數(shù)據(jù)就是通過改變數(shù)據(jù)應用規(guī)模和形態(tài)而形成的不斷增長的數(shù)據(jù)及其能力。就數(shù)據(jù)本身而言,它包括“原面貌的”數(shù)據(jù)資料,諸如數(shù)字化的一個網(wǎng)頁、一張照片、一段視頻、一首歌曲,以及“經(jīng)過加工提煉的”數(shù)據(jù)資料。由于數(shù)據(jù)得到越來越多的分享和互聯(lián),因此在一定程度上它可以揭示出產(chǎn)業(yè)活動所透露的價值和意義,而這種有意義的數(shù)據(jù)只要被發(fā)現(xiàn),經(jīng)過加工處理,就可形成一定的應用,這正是大數(shù)據(jù)產(chǎn)業(yè)的使命。
數(shù)據(jù)產(chǎn)業(yè)發(fā)展經(jīng)歷了兩個階段。第一階段在20世紀90年代,互聯(lián)網(wǎng)的信息改變了數(shù)據(jù)形態(tài)和應用規(guī)模,特別是與文化相關的、面向公共大眾的信息。這一階段的核心是利用信息系統(tǒng)分析信息、更有效地服務客戶,它的主要邏輯是通過專家支持,檢索出客戶所需內(nèi)容的網(wǎng)站。第二階段發(fā)生在20世紀90年代末和21世紀初,90年代后期網(wǎng)站從百萬數(shù)量級發(fā)展到2013年兩億個網(wǎng)站的規(guī)模,計算機要分析的數(shù)據(jù)規(guī)模已不僅僅是幾百萬個網(wǎng)站,而是數(shù)以億計的網(wǎng)頁或資料。鑒于全球網(wǎng)站數(shù)據(jù)迅速增長的狀況,以雅虎為代表的那種專家支持形成的網(wǎng)站分級分類(年鑒)目錄式的檢索方式已不適用,逐漸被谷歌式的數(shù)據(jù)處理方式所取代,即將指令自動化處理,并更注重關聯(lián)內(nèi)容,而不是網(wǎng)站或機構本身。最有價值的是查詢出來的內(nèi)容,而網(wǎng)站或個人不過是所查內(nèi)容衍生出來的附帶結果。
在經(jīng)歷指令自動化處理和內(nèi)容驅(qū)動查詢這兩個形態(tài)轉變后,大數(shù)據(jù)處理又面臨新的挑戰(zhàn)。第三個轉變要解決的問題是:如何利用數(shù)學方法分析數(shù)以十億計的超本文鏈接結構,從而自動評價出網(wǎng)站內(nèi)容的價值。
正是經(jīng)歷了上述幾個階段的演變,以及社交網(wǎng)絡、移動終端、電商和計算機應用軟件的普及。大數(shù)據(jù)的應用時代才真正到來,截至2012年底,谷歌的搜索量已經(jīng)達到20 000億次/年。根據(jù)資料顯示,截止《大數(shù)據(jù)大文化》①報告發(fā)表時2013年的統(tǒng)計數(shù)據(jù),谷歌和FACEBOOK各有近12億用戶/月;微軟有9億多用戶/月;雅虎和騰訊各有8億多用戶/月;而蘋果、百度各有約6億和近6億的用戶/月,亞馬遜的用戶量也達到6億/月②。這種大規(guī)模數(shù)據(jù)的應用已經(jīng)對文化經(jīng)濟產(chǎn)生巨大的推動作用。當今,人們對此越來越重視,因為大數(shù)據(jù)是一種不斷擴張的數(shù)據(jù)能力,它在人類決策活動中日益成為不可或缺的依據(jù)。但需要說明的是,這種數(shù)據(jù)呈指數(shù)形態(tài)的增長實際上是不可控的,它不斷地發(fā)生規(guī)模和形態(tài)上的改變,而且?guī)资陙聿煌5刈晕夜┙o,不斷激發(fā)新發(fā)明,不斷完善由信息發(fā)掘而生的基本服務,不管這些新發(fā)明是必需的,還是隨機而成的。
數(shù)據(jù)幾乎無處不在,數(shù)據(jù)來源有公開數(shù)據(jù)、私人數(shù)據(jù)和半私人數(shù)據(jù)(社交網(wǎng)絡),而且數(shù)據(jù)之間相互交叉、相互激發(fā),它們可以創(chuàng)造出多種機遇和靈感,應用更是五花八門。美國領先的大數(shù)據(jù)公司帕朗泰爾(Pa1antir)的“放大鏡頭技術”(Zoomer)就可以在任何時間,提供世界任何一個城市的一個社區(qū)的準確信息,監(jiān)測到居民和企業(yè)的工作、消費和生活情況。這些技術的應用導致的問題是:數(shù)據(jù)采集發(fā)掘的技術可能性遠遠超出我們管理數(shù)據(jù)的能力。大數(shù)據(jù)產(chǎn)業(yè)剛剛誕生,發(fā)展超前,使人們既窺見到機會,也感覺到潛在風險。而就文化產(chǎn)業(yè)而言,《大數(shù)據(jù)大文化》報告指出:文化生態(tài)畢竟是以文化為核心的系統(tǒng),不能只讓數(shù)據(jù)技術人員來定義未來文化經(jīng)濟的游戲規(guī)則,對數(shù)據(jù)兇猛發(fā)展的態(tài)勢應當迅速警覺并找出解決數(shù)據(jù)發(fā)展失控的方法。
大數(shù)據(jù)市場是個新興市場,近年來發(fā)展強勁,逐漸成為個人資料價值化的產(chǎn)業(yè)。2012年全球大數(shù)據(jù)產(chǎn)業(yè)市場規(guī)模估計在63億美元。雖然這是一個非常年輕的產(chǎn)業(yè),但增長極為強勁,近年來每年的數(shù)據(jù)產(chǎn)業(yè)收入平均增長率為40%以上。展望2018年,這一產(chǎn)業(yè)的市場規(guī)模可以達到500億美元。未來五年受大數(shù)據(jù)影響的最可期待的產(chǎn)業(yè)是錄制音樂產(chǎn)業(yè)。2012年錄制音樂的收入為165億美元,其中34%為數(shù)字化關聯(lián)產(chǎn)品。
但對數(shù)據(jù)的控制和使用卻集中在大型企業(yè)手中。根據(jù)2012年的統(tǒng)計,2%~5%的大中型企業(yè)開始體驗并使用大數(shù)據(jù);而對規(guī)模企業(yè)而言,17%~30%的企業(yè)使用大數(shù)據(jù);而美國前500強大企業(yè)中有90%使用大數(shù)據(jù)。但在2012年,真正上規(guī)模的大數(shù)據(jù)項目不過數(shù)十個而已。實際上,擁有大數(shù)據(jù)基礎設施對運營是至關重要的,但在世界范圍內(nèi)這些設施卻集中在為數(shù)不多的幾家大公司手中。在經(jīng)歷了創(chuàng)新浪潮,建設大規(guī)模信息處理設施后,大數(shù)據(jù)產(chǎn)業(yè)轉向了數(shù)據(jù)增值應用,企業(yè)調(diào)整方向,投資更多傾注到不同行業(yè)、不同體量的應用解決方案之上。2013年,公共領域、電信運營商和娛樂/媒體產(chǎn)業(yè)成為大數(shù)據(jù)最主要的用戶。在今后幾年中,參與大數(shù)據(jù)項目的企業(yè)會越來越多,而且各有所求。一方面,吸引傳統(tǒng)的互聯(lián)網(wǎng)用戶在移動互聯(lián)網(wǎng)上使用數(shù)據(jù);另一方面,大規(guī)模建設移動互聯(lián)網(wǎng)和云計算設施也是為了緩解數(shù)據(jù)龍頭企業(yè)搜索業(yè)務的運營壓力。
首先,大數(shù)據(jù)處理能力高度集中在少數(shù)龍頭企業(yè),勢必形成行業(yè)統(tǒng)治地位。這些龍頭企業(yè)在文化經(jīng)濟中取得的成就和影響力代表著一種穩(wěn)重和持續(xù)發(fā)展的趨勢。大規(guī)模處理數(shù)字化信息的能力使這些企業(yè)獲得了得天獨厚的優(yōu)勢,能夠制定一般經(jīng)濟領域,特別是文化經(jīng)濟領域的游戲規(guī)則。比如,蘋果就利用其優(yōu)勢地位在世界范圍內(nèi)強化一種應用標準,制定出廣告、市場推廣、分銷、傳播、銷售以及在線音樂消費的新的游戲規(guī)則。同樣,谷歌和FACEBOOK在各自強項領域內(nèi)也獨占鰲頭。在信息搜索和基于互聯(lián)網(wǎng)的社區(qū)服務中,這兩個巨頭分別占據(jù)了互聯(lián)網(wǎng)50%以上的用戶。它們各自用戶量均超過10億。這樣的強勢地位不僅使它們可以定義廣告的游戲規(guī)則,而且還可以隨意改變這些規(guī)則(Ad 1ibitum)。例如,2012年推出的Know1edge Graph就試圖直接回答互聯(lián)網(wǎng)用戶的問題,特別是有關文化的問題(地點、人物、藝術作品等)。這一新形態(tài)徹底打破了搜索與網(wǎng)頁內(nèi)容提供者相依共存的傳統(tǒng)模式。谷歌不再像以前那樣系統(tǒng)地將用戶轉到網(wǎng)址,而是通過直接回答客戶問題的方式,讓客戶在谷歌網(wǎng)頁上找到這些網(wǎng)址。谷歌的做法從某種程度上講使得現(xiàn)有的互聯(lián)網(wǎng)純玩家的經(jīng)濟模式變得越來越不穩(wěn)定,去中介化的傾向極為明顯。由這種模式建立的語義學網(wǎng)絡為這項新服務積累了大量的素材。目前已經(jīng)有5.7億數(shù)字化的物品以及經(jīng)過加工的數(shù)字化信息,這些素材和信息完全可以進行“自我描述”,也就是說可以直接將這些作為答案回復給一些基本的、由事實構成的問題。
再有,所謂大數(shù)據(jù)的基礎設施(大量的存儲及網(wǎng)絡運營設備,以及相關的軟件)多為龍頭企業(yè)所有,因此它們有能力通過采集用戶的“投票”,評估其使用偏好,并依次加諸并實施新的游戲規(guī)則。而就所謂“投票”原則來說③,占統(tǒng)治地位的龍頭企業(yè)表現(xiàn)出愿意相互接受這類游戲規(guī)則的傾向,因為從本質(zhì)上講,這些游戲規(guī)則符合他們倡導的消費者偏好為先的邏輯。比如,F(xiàn)acebook近來推出一個新的廣告服務,在這項服務中,F(xiàn)acebook可以將用戶的姓名和照片置入廣告,除非用戶事先聲明不允許這樣做。在看到這項服務被廣大用戶接受后,谷歌也采用了這樣的邏輯并在其Goog1e+社交網(wǎng)絡上應用。
而在軟件功能的游戲規(guī)則制定上,谷歌公司也占據(jù)著絕對的統(tǒng)治地位,2012年谷歌的安卓系統(tǒng)在已售出的智能手機市場占據(jù)80%的份額。目前,這兩大巨頭一個在搜索和手機軟件方面占有絕對優(yōu)勢,一個在社交網(wǎng)絡上獨領風騷。兩個巨頭公司就這樣用新的游戲規(guī)則強化各自的地位,使所有的業(yè)內(nèi)其他企業(yè)望塵莫及。
掌握在巨頭公司手中的信息基礎設施本身就反映出大量的資金投入和對其他相關企業(yè)的收購,這是大部分其他公司可望而不可即的。對于文化企業(yè)而言,這些巨頭獲得的領先地位是它們在中短期無法趕超的,而且就目前而言,差距越來越大。報告預見:在未來幾年中,文化企業(yè)只要能挖掘利用數(shù)據(jù),更好地服務于文化活動,并從這些變化中獲利,就有可能成為這些巨頭的客戶,有些企業(yè)還可能成為它們的追隨者。
對文化產(chǎn)業(yè)影響最大的,也是改變其經(jīng)營形態(tài)的數(shù)據(jù)使用有兩種:一種是利用數(shù)據(jù)作為市場推廣的依據(jù),即對客戶消費偏好的數(shù)據(jù)加以分析,有的放矢地進行市場推廣,既激發(fā)消費,又可引導數(shù)字化產(chǎn)品的生產(chǎn)。這方面在美國做得最好的是以視頻文化產(chǎn)品租賃服務為主的Netf1ix公司和以個性化自動音樂組合服務為主的Pandora公司。另一種是利用數(shù)據(jù)參與公司本身的管理。數(shù)據(jù)不僅是文化產(chǎn)品消費和分析的結果,具有一定的導向性,而且數(shù)據(jù)本身也參與公司的運營管理之中。這方面比較有代表性的公司是美國的游戲公司Synga和社區(qū)游戲公司EA。
1997年Netf1ix創(chuàng)建于硅谷,業(yè)務是通過網(wǎng)站租賃DVD,并通過美國郵局做租賃物流,它的服務簡單,選擇豐富,比當時美國B1ock Buster的價格要便宜。2007年起,Netf1ix抓住機會,在網(wǎng)上開展了視頻流點播業(yè)務??蛻艨梢陨暇W(wǎng)租看電影和連續(xù)劇,消費成本大大降低,公司的競爭力得到提高。2013年Netf1ix在網(wǎng)上實現(xiàn)了通過各種上網(wǎng)終端(電視、游戲機、智能手機、平板電腦等)點播電影和電視連續(xù)劇的服務。Netf1ix從2006年600多萬用戶發(fā)展到2013年4000多萬注冊用戶,其中3100萬為美國用戶,業(yè)務已覆蓋近40個國家。
Netf1ix運營的最大特點是,它的訂單引擎不僅有一般的搜索功能,還能夠根據(jù)客戶的趣好和意見為客戶推薦新的選擇。這一系統(tǒng)的核心就是知識應用(Savoirfaire)。從2000年起,Netf1ix推出了Cinematch的個性化服務。這項推薦服務不僅在回答客戶搜索中體現(xiàn),而且配以相應的廣告。還有部分推薦是通過郵件傳遞給客戶的。2006年Cinematch每天已經(jīng)能夠產(chǎn)生10億個推薦。這樣巨大的數(shù)據(jù)處理有時難免產(chǎn)生與客戶需求不相符合的推薦,為此,公司利用從48萬個客戶那里獲得的上億條涉及17 770部電影的匿名資料對推薦進行了改進。2009年,Netf1ix開始了視頻流(Streaming video)注冊用戶服務,客戶選片錯誤可以瞬間改正。這項服務的成功使推薦價值(是否采用)更少地依賴于對電影的注釋,而更多地依賴于消費者使用和行為的偏好。由此Netf1ix將改善推薦的準確度轉變成對客戶消費信息的研究,諸如客戶使用什么設備觀看、觀看的時間表(每周的哪些天,什么時間)、他們的地理位置等信息。需要指出的是,直到2013年,Netf1ix推薦機制仍然沒有完全自動化,公司有超過40個人每天以手工方式對每一部電影或電視連續(xù)劇做種類、時長、演員名稱等注釋。Netf1ix目前75%被觀看的內(nèi)容都是通過推薦引擎所實現(xiàn)的。實際上,每天由客戶產(chǎn)生的電影注釋多達400萬,注冊用戶每天在線消費視頻的總時數(shù)超過10億小時(晚上流媒體占美國互聯(lián)網(wǎng)流量的33%,為壟斷的份額)。因此,Netf1ix仍在努力并拿出每個季度10億多美元營收的一部分投入到運營及推薦數(shù)據(jù)的自動分析系統(tǒng)。
2005年,提姆·外司特哥林和他的同事利用“音樂類型計劃”(The Music Genome Project,MGP)創(chuàng)辦了基于網(wǎng)絡的“Pandora”⑤音樂電臺,這個電臺的獨特之處就在于它通過計算機的算法將音樂題目和風格自動分門別類。Pandora運營的基本思路與Netf1ix一致。Pandora在運營中也遵循著以聽眾趣好為導向的邏輯,聽眾可以在網(wǎng)上建立自己的一個或幾個電臺,這種創(chuàng)建電臺的過程完全是自動化的,是由程序根據(jù)聽眾的趣好而形成的。2013年,Pandora已經(jīng)擁有超過100萬個標注識別的曲目,分成500個不同的音樂類別。每個月有超過7200萬人使用這個音樂平臺,而僅2013年第二季度,Pandora就為聽眾播放了40多億小時的音樂。
Pandora的成功取決于根據(jù)聽眾的趣好和音樂家人工分析所形成的把握聽眾脈搏的智慧,并通過程序提供自動化的服務。這種聽眾與程序之間的互動,構成了一個持續(xù)性的“觸點”,再加上人工分析干預,使整個系統(tǒng)可以不斷捕獲新的音樂趨勢、音樂類別和聽眾趣好。這個機制實際上就是一種客戶的投票,所選曲目可以幫助系統(tǒng)不斷完善,并更貼近客戶的需求。2013年8月,Pandora就已收錄了近300億條選曲形成的“投票”。
游戲市場是文化經(jīng)濟的支柱之一,近十年來,全球基于互聯(lián)網(wǎng)的數(shù)字游戲玩家從2億發(fā)展到10億。個人電腦、智能手機以及平板電腦都成了游戲的載體。商家更注重對游戲平臺衍生出的資料進行開發(fā),使這些數(shù)據(jù)成為游戲管理和盈利模式的基礎。在這方面成就最大的是以社交游戲為主的2007年在舊金山創(chuàng)立的Zynga公司。這家公司最獨特的開發(fā)思路是:游戲創(chuàng)新、挖掘和升級由始至終要以數(shù)據(jù)為導向,游戲要通過社交網(wǎng)絡獲得客戶和玩家的忠誠度。最成功的一款游戲是2012年9月上線運營的“農(nóng)莊城2”(Farmvi11e 2)。從當年11月起,每個月玩家都超過6900萬,游戲覆蓋180個國家。在最活躍的時候,玩家平均每天生產(chǎn)出3.5億個收獲,每秒鐘平均種下約8000塊田地。2013年第一季度,Zynga游戲每天平均產(chǎn)生近700億個事件(鼠標按動一次即為一個事件),這些活動是由每天5200萬玩家完成的。這樣大規(guī)模的數(shù)據(jù)分析和開掘可以更準確地根據(jù)玩家的趣好改善產(chǎn)品,引導消費,促使他們購買更多的游戲虛擬物品,同時,還可用游戲點或游戲幣招募其他玩家。時間貨幣化是游戲盈利的重要手段之一,為了更長時間地留住玩家,玩家資料數(shù)據(jù)就成為開發(fā)者和設計者創(chuàng)造游戲,創(chuàng)造游戲環(huán)節(jié),延長游戲時間的最好依據(jù)。資料數(shù)據(jù)還可以用來引導盈利模式,諸如根據(jù)游戲中的交互性回饋機制,在游戲中加入虛擬物品買賣(比如購買農(nóng)莊城的拖拉機)、產(chǎn)品植入和廣告穿插。
但是利用數(shù)據(jù)也不是成功的保證,游戲市場是有周期的,最好的游戲玩家最終也會失去興趣,因此必須持續(xù)性地發(fā)掘一些新的游戲感覺并將其產(chǎn)品化。掌控數(shù)據(jù)也不是萬能的,在數(shù)字游戲競爭的環(huán)境中需要不斷地創(chuàng)造新的開發(fā)背景及其標準。
EA(E1ectronic Arts)最早是做電子游戲的,2001年公司轉型投資在線游戲平臺和在線游戲。2012年公司已經(jīng)成為世界上第三大數(shù)字游戲供應商,年營業(yè)額超過40億美元,其中有10多億來自數(shù)字化游戲。EA獨具創(chuàng)新的游戲是將活生生的場景植入到游戲當中,而玩家正是這種游戲最重要的角色。為了將不同場景呈現(xiàn)給玩家,設計者將玩家每天的不同時段和游戲體驗進行分析,做出適合各個時段和玩家設備的游戲場景。比如:早餐時可以在電腦上玩一局短游戲;上班路上重新看看游戲狀況并在論壇上聊上幾句;中午吃飯時可以按部就班地推進游戲;下班的路上可以玩幾把在智能手機上設定好的游戲,晚上回到家可以玩一局時間長的游戲。
除了這種貼身適時的游戲設計外,EA也和Zynga一樣特別重視增值服務,諸如:注冊用戶收費、虛擬物品買賣、產(chǎn)品植入、廣告元素設定等。而這些增值服務模式是根據(jù)客戶趣好和游戲規(guī)則組合而成的,并且隨時可變。EA的商業(yè)策略完全像編碼一樣寫入了游戲規(guī)則之中,其目的就是要刺激玩家興趣,刺激他們花更多的錢,刺激他們更長時間的滯留,從而間接帶來廣告和商品植入的效果。
利用數(shù)據(jù)進行管理和分析是為了更好地引導玩家消費。比如,在一款游戲中,玩家資料就可以顯示出玩家開的飯店(Burgers)的數(shù)量,以及他們?yōu)榇嘶ㄙM的虛擬幣(Donus)。這種持續(xù)的數(shù)據(jù)統(tǒng)計有利于改進游戲,并可以證實公司的決策和新的應用是否受到玩家的贊賞,是否有利于游戲的回報。而最值得稱道的是EA利用數(shù)據(jù)資料制成了玩家活動地圖,玩家可以一目了然地看到哪些游戲空間用得最多。這些地圖標識可以起到建議作用,讓玩家有一個更好的環(huán)境,游戲更適合他們的趣味,甚至可以建議有同樣趣味的玩家組合在一起玩游戲。再有,EA利用玩家數(shù)據(jù)可以分析不同時段的收入和玩家數(shù)量之間的關系。同時,在線游戲還可以改造成適于其他媒體的電子游戲,對此公司根據(jù)不同載體的特點和玩家使用的頻率做出相應的市場推廣。
數(shù)據(jù)挖掘和應用能否成為文化產(chǎn)業(yè)發(fā)展的催化劑?這恐怕還要經(jīng)歷幾年的發(fā)展才可做出判斷。但利用數(shù)據(jù)資料開發(fā)應用,并且促進文化經(jīng)濟發(fā)展已經(jīng)是不爭的事實。文化經(jīng)濟越來越倚重于由數(shù)據(jù)作為導向的管理。文化企業(yè)多為中小企業(yè),往往不具備技術能力,因此需要專業(yè)的數(shù)據(jù)運營及服務商幫助它們實現(xiàn)文化領域的數(shù)據(jù)服務,比如云計算服務商、移動運營商、新興的數(shù)據(jù)服務企業(yè)和IT巨型公司。同時還需要指出,數(shù)據(jù)產(chǎn)業(yè)也要與文化相關的行業(yè)緊密結合,形成所謂文化生態(tài)系統(tǒng),這個系統(tǒng)的外延遠遠超出相對局限的文化產(chǎn)業(yè),比如旅游產(chǎn)業(yè)。同時還要注意的是:利用大數(shù)據(jù)發(fā)展文化產(chǎn)業(yè)不能被大型數(shù)據(jù)服務商所捆綁,未來數(shù)字化文化經(jīng)濟的游戲規(guī)則不能單獨地憑由它們制定。
每年赴法國的外國游客高達7700萬人次,這樣大的群體完全值得數(shù)據(jù)產(chǎn)業(yè)很好地挖掘。世界各國都非常重視旅游產(chǎn)業(yè)的發(fā)展,金磚四國這幾年來旅游業(yè)的增長一直是兩位數(shù)。而旅游業(yè)在法國帶來的直接就業(yè)人口為100萬,關聯(lián)的就業(yè)人口也達100萬之多。2012年,旅游消費產(chǎn)值達1380億歐元,占法國國內(nèi)生產(chǎn)總值的7%。這樣一個與文化息息相關的產(chǎn)業(yè)正是各個國家高度重視發(fā)展的產(chǎn)業(yè)。所謂旅游景點大多是由不同的文化遺跡、文化設施、文化場所或其他文化元素構成的,因此廣義地說,旅游業(yè)就是文化經(jīng)濟的一部分。因此大數(shù)據(jù)在這一領域的開發(fā)應用理所當然就是對文化的促進。
2011年法國旅游發(fā)展局與MFG公司合作發(fā)起了一個項目,該項目旨在通過社交網(wǎng)絡分享法國旅游及文化照片。由此可以統(tǒng)計出哪些是外國人最喜歡、去的最多的景點。這項實驗的結果可以針對外國游客促銷法國旅游并為管理提供依據(jù)。2012年,法國藍色海岸旅游區(qū)域委員會(CRT)與法國著名的移動通訊運營商Orange合作,發(fā)起了一個導航體驗,一方面要將游客的存在與流動進行量化與模型化試驗。諸如:檢測游客最喜歡參觀的景點、最喜歡的住宿服務、每個景點平均過夜數(shù)、從到達藍色海岸旅游區(qū)到離開的天數(shù)等。另一方面從移動電話收集的信息中提取潛藏的意義,以為當?shù)芈糜喂芾聿块T提供便捷化、產(chǎn)業(yè)化的決策依據(jù)。這些數(shù)據(jù)制成統(tǒng)計表格和形象的圖標,解釋并導出相關的旅游服務決策:最佳的酒店配置、歡迎外國游客的方式、不同類型不同國籍的游客對景點和最流行的旅游活動的認同度、餐館/酒吧/演藝夜間的光顧頻率,等。比如,在2012年旅游旺季的夏天,Marine1and地區(qū)附近的酒店入住不足,這種反差直接導出管理建議:改善當?shù)鼐频昃幼l件,加大景點晚間的吸引力以增加游客流量和黏度。
而從游客在社交網(wǎng)絡上發(fā)布的旅游照片做數(shù)據(jù)分析,也可以試圖理解游客是怎樣感知一個國家的?!白弑榉▏笔欠▏糜伟l(fā)展局的網(wǎng)站,這個網(wǎng)站就利用社交網(wǎng)絡用戶的信息資料(照片)推導出不同國籍游客所選出的最喜歡的旅游景點。而這些信息反過來又可以指導“走遍法國”網(wǎng)站的景點推薦和根據(jù)游客人數(shù)制定的市場宣傳策略。
這些在社交網(wǎng)站發(fā)布的照片數(shù)據(jù)經(jīng)過認證和分類,然后與“走遍法國”抽樣調(diào)查的結果進行比較,就可以得出多種不同的結果。在幾百萬張照片基礎上,根據(jù)照片源頭信息和位置信息,制出一張由游客參與而成的帶有標識的參考地圖。這樣的地圖建立在這樣一種假設上:一個景點越多人拍照,也就越有名。實際上一張照片就是一個攝影師的選票,對法國文化遺產(chǎn)和愛國情緒有影響。
“走遍法國”對分享在社交媒體上的資料挖掘是非常有效果的,被認作旅游情報學。它與過去在機場采訪外國游客,給人多種選擇的問卷調(diào)查大不一樣。社交媒體上的資料雖然弱,但數(shù)量巨大,可以從中提析出很有價值的信息。當數(shù)據(jù)自動地從社交媒體上提取出來并被分析,其成本相比傳統(tǒng)的問卷和其他類型的調(diào)查要低廉得多。2013年,“走遍法國”還更有針對性地利用數(shù)據(jù)進行旅游促銷,主要針對亞洲客戶(中國人和日本人)和俄羅斯人,他們在亞洲最知名的社交網(wǎng)絡投放了一些照片使游客能更好地理解法國,精準地做一些市場促銷。2013年9月,“走遍法國”還和西班牙的世界票務預訂專業(yè)公司Forward Data SL達成戰(zhàn)略合作關系,通過國際旅客預測旅游目的地的客流趨勢和頻率。
數(shù)據(jù)應用最典型的例子是迪士尼大型娛樂公園為游客準備的神奇手鐲。迪士尼是世界級的媒體巨人,也是世界第一的大型娛樂公園。全世界所有迪士尼公園總游客量超過1.2億人次/年。在移動互聯(lián)網(wǎng)時代,游客越來越習慣于通過互聯(lián)網(wǎng)得到服務。神奇手鐲是近年來迪士尼研發(fā)的一個名為“我的神奇幫手”(My Magic P1us)的項目。這個項目就是要為游客在游覽全程中提供便捷的人性化的服務:從預定娛樂景點門票,園中全程游覽一直到客人返回住所。這個手鐲(也叫“神奇手帶”)有個數(shù)字存儲器,可以將公園門票、景點和餐館預訂、客房鑰匙和付款方式的數(shù)據(jù)存儲下來,同時可以收集游客在公園的任何時刻的信息,包括他的購買記錄、他的選擇和愛好等。這種設計的最初動機是:盡可能地滿足游客個性化的體驗,讓他們玩得簡單舒適,而且需要時還可以隨時改善他們不滿意的服務,即所謂的“神奇體驗”。第二個動機是:為迪士尼創(chuàng)造更多的收入,比如為游客提供個性化的建議,影響游客消費;或使公園的服務更符合游客消費習慣和偏好。
采集和分析游客數(shù)據(jù)的平臺需要的投資預計為10億美元,第一個試點是最大的佛羅里達迪士尼公園,已經(jīng)有20萬游客享受到這項服務,預計在接下來的幾個月中(即2013年第四季度)迪士尼將會為所有游客佩戴“神奇手帶”。如果試驗成功,平臺將會為全球所有迪士尼公園的1.26億(2012年)的游客提供服務。
對公共數(shù)據(jù)的專業(yè)挖掘是數(shù)據(jù)行業(yè)細分的必然趨勢,也是很多中小數(shù)據(jù)公司得以生存的縫隙。在這方面做得比較出色的是“旅行顧問媒體集團”(Tripadvisor Media Group)。該集團公司在五大洲27個國家擁有不同品牌的17家旅游網(wǎng)站。公司根據(jù)各個網(wǎng)站的用戶交流推薦的旅游信息,衍生出超過一億條有關酒店、餐館、景點等服務的評審和意見,這些信息經(jīng)過加工整理,分門別類地上傳到各個網(wǎng)站,為全球3200萬注冊用戶提供服務。2013年9月“旅行顧問”推出了一項名為“高明的旅行顧問”的專業(yè)服務:對客戶交流和建議的數(shù)據(jù)(文字/圖片)進行統(tǒng)計,為旅游專業(yè)人員提供旅游目的地的發(fā)展趨勢和建議?!奥眯蓄檰枴痹谥袊墓倬W(wǎng)是“到到網(wǎng)”(www.daodao.com)。
另一個是Ye1p公司,該公司利用公共數(shù)據(jù)提供特色鮮明的地圖服務。2004年該公司成立于舊金山,2011年在紐交所上市(NYSE:YELP),在此之前,曾避免了谷歌和雅虎的收購。2013年7月,Ye1p推出以城市旅游和文化景點地理信息為數(shù)據(jù)的地圖服務,地圖通過不同標識標出旅游“熱點”,同時游客還可以通過關鍵詞尋找文化場館。
類似服務模式也應用到政府的公共服務中,2004年,英格蘭藝術委員會就曾發(fā)起一個研究計劃,名為“倫敦文化地圖”。這個項目的目的是要讓老百姓了解倫敦城的文化建設基金都用到了什么地方,提高政策執(zhí)行的透明度?!皞惗匚幕貓D”可以讓觀眾和專業(yè)人士獲得有關倫敦文化活動的信息。地圖數(shù)據(jù)同時還可以顯示出文化基礎設施地圖標識、每個居民和每個居民社區(qū)的文化消費支出情況、文化習慣等。同時這些信息又和交通等信息結合在一起,看上去非常直觀、量化。比如,可以看到在哪些社區(qū)舉辦經(jīng)典的、市民踴躍參加的文化活動。對區(qū)域文化基礎設施密度及消費程度差別也有鮮明的標注。2011年這項計劃又和英格蘭藝術委員會支持的“倫敦文化普及”任務相結合,以更好地理解公眾的需求,精準地為他們服務,增加服務黏度,讓他們更愿意光顧文化場所。這一舉措是倫敦市利用城市及市民文化活動數(shù)據(jù)對文化進行管理的第一階段嘗試,它同時牽涉到社會、技術、經(jīng)濟和政治等因素。
智慧城市的本質(zhì)是要使城市基礎設施投資能夠互相利用,使城市平衡發(fā)展,達到綜合效益最大化,更好地回報參與建設的各方。智慧城市在社區(qū)、大學和政治領域,而不是技術層面,對城市發(fā)展的管理有幫助。智慧城市是大數(shù)據(jù)最有發(fā)展前景的計劃,是發(fā)展文化經(jīng)濟最理想的實驗目標。
2010年前在西班牙Santander市啟動的一項智慧城市計劃被認為是智慧城市領域的典范。該項目布設了覆蓋率極高的大數(shù)據(jù)基礎設施,現(xiàn)在已利用數(shù)據(jù)開始在多個領域提供相關的服務:在健康領域,智慧城市系統(tǒng)檢測采集的污染源(空氣、水和噪音)并發(fā)布相關的信息;在能源服務方面,三年中安裝了20 000個數(shù)據(jù)采集設備,通過數(shù)據(jù)分析,制定出節(jié)能策略,安排好照明、供暖方面服務;在垃圾回收方面,數(shù)據(jù)可以幫助實現(xiàn)垃圾桶滿裝情況下的最優(yōu)收集安排;在交通方面,客流數(shù)據(jù)可以用來確定公共汽車時間表,并給出可用的停車位數(shù)量。2013年起,智慧城市的數(shù)據(jù)應用開始向區(qū)域商業(yè)、旅游業(yè)和文化業(yè)擴展。特別是通過和相關企業(yè)、居民和游客合作,文化產(chǎn)業(yè)在充分利用這些數(shù)據(jù)的基礎上,可以打造出城市旅游文化的特色。
其他的智慧城市計劃(舊金山、溫哥華、西雅圖、紐約、倫敦、巴黎、柏林、東京、首爾、上海等)也表明:不同領域的數(shù)據(jù)分享有利于創(chuàng)造有價值的經(jīng)濟和社會新形式,形成新的城市生態(tài)系統(tǒng),當然也包括文化產(chǎn)業(yè)。
下面舉兩個智慧城市應用的例子。
2013年6月,Ubisoft公司做了一個“我們是數(shù)據(jù)”的推廣活動。這個項目的目的是要建立一個網(wǎng)站(Jeu Watch Dogs),將倫敦、巴黎和柏林的社交網(wǎng)絡(Tweet,Photo d’instagram,F(xiàn)1ickr,Checks de Foursquare)⑥和其他熱點(地鐵、自行車道、互聯(lián)網(wǎng)上網(wǎng)點、高速無線上網(wǎng)點、移動電話入網(wǎng)點、自動銀行機及自動售票機、交通指示燈、公共衛(wèi)生間、監(jiān)控攝像頭等)的數(shù)據(jù)狀況制成實時的區(qū)位地圖。這類地圖還可以分區(qū)域得出一些統(tǒng)計數(shù)字,如居民收入狀況、失業(yè)率、犯罪率、在線消費狀況,以及來源于Facebook的持續(xù)活動狀況。
卡耐基大學發(fā)起了一個名為Livehoods的項目,這個項目是要研究一個城市的居民在社交網(wǎng)絡上的活動是如何幫助人們理解這個城市的社會結構的??突髮W項目小組與大型社交網(wǎng)絡(Twitter,F(xiàn)oursquare)合作收集公共信息,用來分析北美幾個大城市的社會活躍程度及其構成,以及不同城市區(qū)域人口流動的頻率和相關的形態(tài),諸如紐約、舊金山、溫哥華、西雅圖等。這個獲得幾百萬美元資助的項目得到很多公共和私營機構的關注,特別是政府機構和不動產(chǎn)促銷機構,因為它們認為這種方法可以用到公共衛(wèi)生領域(在傳染病流行時可以預防病毒或疾病的傳播)。文化活動密度和場所的客流數(shù)據(jù)與城市公共健康數(shù)據(jù)的結合是非常有意義的,它可以指導文化消費場所的疾病預防和文化產(chǎn)業(yè)的發(fā)展,比如在推出新的文化產(chǎn)品和服務時,如何讓老百姓意識到大型文化活動有可能造成有損公共健康的風險。
智慧城市利用大數(shù)據(jù)已不單單在一個領域,它涉及諸多的領域,只有社會、經(jīng)濟、政治等領域的共同介入才構成真正意義上的大數(shù)據(jù)生態(tài)系統(tǒng)。實際上在不同領域數(shù)據(jù)的背后多少會有一定的關聯(lián),而這種關聯(lián)反映出人類生存更深層次的自然關系。智慧城市絕不是一小部分技術專家想當然發(fā)明并施展的一種包含海量信息的技術構架,而是真正有需求的合作方采集并分享數(shù)據(jù)資料而形成的服務形態(tài)。這種數(shù)據(jù)間的耦合恰恰可以使智慧城市計劃不斷迸出新的價值。數(shù)據(jù)耦合產(chǎn)生新的價值鏈,不僅在文化行業(yè)之間,而且在智慧城市發(fā)展中所涉及的各個領域之間發(fā)生關系:文化、教育、旅游、交通、住宿/社區(qū)、城市化、能源、健康、餐飲/食品供應、農(nóng)業(yè)、貿(mào)易,以及以數(shù)據(jù)為原材料的信息和通信產(chǎn)業(yè)。
《大數(shù)據(jù)大文化》研究報告的目的是要解析大數(shù)據(jù)行業(yè)如何影響文化產(chǎn)業(yè)發(fā)展,探討文化產(chǎn)業(yè)如何接受大數(shù)據(jù)帶來的新的文化消費形態(tài),從而描述大數(shù)據(jù)時代文化生態(tài)系統(tǒng)的狀況。報告的亮點是較為全面系統(tǒng)地介紹了西方,尤其是美國互聯(lián)網(wǎng)文化公司在數(shù)據(jù)與文化相結合方面的成功經(jīng)驗。有些商業(yè)應用在中國已經(jīng)實現(xiàn),如社交網(wǎng)絡的一些應用;有些則是比較新穎的,如以客戶需求為導向的視頻和音頻數(shù)據(jù)分析和軟件算法。這些海外的創(chuàng)新對中國文化產(chǎn)業(yè)發(fā)展有借鑒意義。另外,需要指出的是,這篇報告對文化領域的大數(shù)據(jù)產(chǎn)業(yè)的宏觀描述及相關數(shù)據(jù)并不太關注,而比較注重具有壟斷地位的互聯(lián)網(wǎng)公司的市場數(shù)據(jù)。一方面,互聯(lián)網(wǎng)巨頭公司已經(jīng)形成壟斷,它們的市場數(shù)據(jù)某種程度上代表了市場走向;另一方面,每個公司的應用都有各自特點,代表一個領域,相互之間的數(shù)據(jù)可比性不大,而且難以歸類。因此,宏觀數(shù)據(jù)的采集不作為這個報告的重點。通過上面的介紹和評述,我們認為西方數(shù)據(jù)和文化產(chǎn)業(yè)緊密結合的發(fā)展思路對中國文化產(chǎn)業(yè)發(fā)展有一定的借鑒意義。
該研究報告的題目為“大數(shù)據(jù)大文化”,顧名思義正是有了大數(shù)據(jù),才有了大文化的概念。大數(shù)據(jù)應用于文化及關聯(lián)產(chǎn)業(yè)相比電商和金融等行業(yè)來說相對滯后,但影響不容小視。從商業(yè)角度講,大數(shù)據(jù)改變了文化產(chǎn)業(yè)運營模式和形態(tài);而從社會角度看,它改變著人們的生活方式及社會結構。面對這一迅速膨脹的產(chǎn)業(yè),如何把握時機,乘勢促進文化產(chǎn)業(yè),是我們需要思考的問題。
第一,在發(fā)展文化領域大數(shù)據(jù)產(chǎn)業(yè)時,大公司基于對數(shù)據(jù)占有和處理能力的優(yōu)勢,制定有利于巨頭公司運營的游戲規(guī)則,這種做法既改變了傳統(tǒng)的產(chǎn)業(yè)鏈相互依存的模式,又改變了文化消費形態(tài)和行業(yè)游戲規(guī)則,衍生出更多的文化產(chǎn)品。從文化產(chǎn)業(yè)發(fā)展角度看,無疑有正面的作用,但在文化產(chǎn)品消費形態(tài)上有可能形成“一統(tǒng)天下”的趨勢,如國內(nèi)出現(xiàn)不久的微信產(chǎn)品。微信在短時期內(nèi)聚集了數(shù)以億計的用戶,初期在微信平臺上推出了幾款產(chǎn)品,隨后根據(jù)客戶使用行為的數(shù)據(jù),又不斷完善豐富產(chǎn)品,從而聚集更多的用戶。在擁有數(shù)量巨大的客戶前提下,制定有利于商業(yè)公司的游戲規(guī)則是不可避免的,從某種角度講也是正當?shù)摹_@種互聯(lián)網(wǎng)行業(yè)的一邊倒的現(xiàn)象算不算壟斷?又如何界定?現(xiàn)在下結論還為時過早。筆者個人認為,只要公平競爭的市場環(huán)境可以保障,只要所涉及的市場利益足夠大,一邊倒或暫時壟斷的現(xiàn)象就有可能打破。以前常說,互聯(lián)網(wǎng)行業(yè)只有老大,沒有老二,但從近十多年的發(fā)展看,情況似乎并不是這樣的,早幾年門戶網(wǎng)站相互之間打得不可開交,有你無我,可現(xiàn)在卻形成了各大勢力平分天下的局面;電商市場也如是,先是為數(shù)不多的幾家,后來多家蜂擁而上,形成“諸侯割據(jù),群雄爭霸”的局面,有天貓、京東、蘇寧易購、亞馬遜、國美系(庫巴、國美)、當當、易迅、一號店、凡客、唯品會等。模式也較以前更加豐富且各具特色。微信出來后,又有“來往”、“易信”冒出來競爭。也許更應當引起注意的是,基于大數(shù)據(jù)導致的文化消費形態(tài)的變化,迅速擠壓傳統(tǒng)的文化行業(yè),改變著我們的生活方式,獲取知識的途徑,以及文化產(chǎn)品的形態(tài)。《大數(shù)據(jù)大文化》只是在數(shù)據(jù)及基礎設施占有導致商業(yè)游戲規(guī)則制定方面提出了問題,但并未涉及由此導致的社會及生活方式的改變,而在此方面產(chǎn)生的深層影響還需觀察。但有一個趨勢是比較明顯的,為了保持相對壟斷的地位,各個領域的巨頭公司在不斷擴張地盤,大肆兼并收購。中美皆是如此。
第二,在利用數(shù)據(jù)推動文化企業(yè)發(fā)展方面,西方一些公司的數(shù)據(jù)開發(fā)應用和創(chuàng)新經(jīng)驗值得借鑒,比如Netf1ix和Pandora。數(shù)據(jù)本身蘊含著大量的商業(yè)機會,對裸數(shù)據(jù)的二次甚至多次開發(fā)實際上就是一種商業(yè)模式的創(chuàng)新。視頻和音頻產(chǎn)業(yè)在中國有很大的發(fā)展空間,關鍵是要在數(shù)據(jù)開發(fā)深度上下功夫,尤其是音頻(音樂)市場,需要專業(yè)音樂人士和軟件開發(fā)人員共同探索自動處理海量數(shù)據(jù)的方式。中國的在線音頻市場目前發(fā)展情況與美國市場相比還有一定差距,雖然有眾多的mp3形式的音樂網(wǎng)站,但在運營模式和商業(yè)模式上似乎不太成熟,沒有形成像美國的Pandora和Sirius XM(美國車載衛(wèi)星廣播公司,Nasdaq上市公司)那樣以注冊客戶為主的清晰盈利模式。這里既有如何利用數(shù)據(jù)開發(fā)出符合消費習慣的軟件問題,又有知識產(chǎn)權保護困難的問題。而相比音頻市場,中國的視頻市場的發(fā)展要規(guī)范得多,大的門戶網(wǎng)站都有視頻服務,且版權保護做得比較到位,包括百度奇藝、搜狐視頻、QQ視頻等,而且還有獨立視頻網(wǎng)站,如優(yōu)酷、PPTV、樂視等。在盈利模式方面,中國和美國的公司側重不同:中國公司注重貼片廣告,而美國倚重注冊收費模式。但只要堅持規(guī)范化運作,尊重知識產(chǎn)權,隨時根據(jù)客戶需求調(diào)整運營模式,中國公司的發(fā)展前景是可以期待的。
第三,要逐漸打破行業(yè)壁壘,使各個行業(yè)的數(shù)據(jù)得以相互分享整合,衍生新的產(chǎn)品和服務。從《大數(shù)據(jù)大文化》所列的行業(yè)看,旅游和智慧城市是綜合利用數(shù)據(jù),提供文化服務最合適的領域。中國旅游產(chǎn)業(yè)發(fā)展很快,智慧城市也被列入重點發(fā)展的領域,這兩個領域中的每個環(huán)節(jié)和局部都有很大的數(shù)據(jù)挖掘潛力,應當說是今后幾年數(shù)據(jù)產(chǎn)業(yè)發(fā)展的理想空間。旅游和智慧城市都關系到民生,需要多行業(yè)、多領域的協(xié)作整合,因此,政府主導扶植的角色是不可或缺的。
第四,大數(shù)據(jù)的來源主要是個人信息,有游戲、娛樂、旅游、社交網(wǎng)絡、位置、文化愛好等信息?;ヂ?lián)網(wǎng)、移動電話、移動互聯(lián)網(wǎng)和監(jiān)控攝像都可以透露出個人的位置信息,甚至一些內(nèi)容信息。在大力挖掘這類信息用于商業(yè)的同時,要有相應的規(guī)章制度約束。公開信息和私人信息的界限應當有明確的規(guī)定和使用限制,盡管這些數(shù)據(jù)對文化產(chǎn)業(yè)是必要的。
注釋:
①《大數(shù)據(jù)大文化:數(shù)據(jù)不斷增長的力量及對文化經(jīng)濟的展望》(BIG DATA:BIG CULTURE Le Pouvoir grandissant de 1a data et ses perspectives pour 1'économie de 1a cu1ture),作者:Phi1ippe Torres/Mathieu Sou1é,法國巴黎銀行研究所(L'Ate1ier BNP Paribas),參見www.forum - avignon.org。
②《大數(shù)據(jù)大文化》,第24頁、31頁和9頁,需要指出的是在報告中采用的數(shù)據(jù)因公布的時間不同略有偏差。
③這一原則即所謂的“測試并了解”(test and 1earn),數(shù)字領域領軍企業(yè)視其為“民主”的基本原則,同時也把它當作“不可抗拒”的市場工具,來刺激消費者大規(guī)模地接受這些游戲規(guī)則,而消費者并不能看到所涉及的問題。
④Netf1ix為美國Nasdaq上市公司。
⑤“音樂類型計劃”利用150個技術指標或標準來定義Pop/Rock(流行/搖滾)風格的音樂;350個技術指標來定義Hip-Hop/E1ectronica(說唱/電聲)風格的音樂;400個定義爵士樂;300和500個分別定義世界音樂和古典音樂。參見:《大數(shù)據(jù)大文化》,第44頁。Pandora為美國NYSE上市公司。
⑥這些社交網(wǎng)站大多都有視頻或圖片分享服務。