基于用戶閱讀及相關(guān)行為的數(shù)據(jù)挖掘和開發(fā)是出版行業(yè)新的盈利增長點(diǎn)和核心競爭力之所在,只要出版集團(tuán)給予其靈活的試錯(cuò)機(jī)制,一定能給出版機(jī)構(gòu)帶來新的業(yè)務(wù)領(lǐng)域和社會(huì)價(jià)值。
近來,大數(shù)據(jù)成為社會(huì)熱議,其技術(shù)特征成為人們津津樂道的話題,每個(gè)行業(yè)都在了解和評估其對自身的潛在影響。對于出版業(yè)來講,信息技術(shù)的沖擊已不陌生,十余年前開始就在探討數(shù)字化出版,這些年來從出版介質(zhì)、出版內(nèi)容、到出版流程都發(fā)生了很大變化。當(dāng)新一代信息技術(shù)又在深刻影響社會(huì)時(shí),我們關(guān)注的是,從數(shù)字化和數(shù)據(jù)化,到底有什么觀念性的變革?在認(rèn)識(shí)大數(shù)據(jù)技術(shù)特點(diǎn)的同時(shí),如何識(shí)別和研判出版業(yè)的可能性行動(dòng)空間?
據(jù)國際數(shù)據(jù)公司(IDC)統(tǒng)計(jì),僅2011年全球被創(chuàng)建和復(fù)制的數(shù)據(jù)量即達(dá)1.8ZB,相當(dāng)于有史以來所有印刷材料數(shù)據(jù)量的近萬倍,而這樣龐大的數(shù)據(jù)量每兩年將翻一番。海量數(shù)據(jù)蘊(yùn)涵著高昂價(jià)值。全球知名咨詢公司麥肯錫提出,“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來”。
與大數(shù)據(jù)的增長形成對比的是,傳統(tǒng)媒介面臨的沖擊并沒有縮減趨勢。最近幾年,美國《洛基山新聞報(bào)》《舊金山紀(jì)事報(bào)》《芝加哥論壇報(bào)》《塔克森市民報(bào)》和《費(fèi)城問詢報(bào)》等報(bào)紙先后破產(chǎn)或宣布破產(chǎn);《基督教科學(xué)箴言報(bào)》和《西雅圖郵報(bào)》轉(zhuǎn)型為電子報(bào);就連《華爾街日報(bào)》也出現(xiàn)變賣房地產(chǎn)緩解資金緊張狀況。中國廣告協(xié)會(huì)報(bào)刊分會(huì)、央視市場研究媒介智訊發(fā)布的《中國報(bào)紙廣告市場分析報(bào)告》中稱,2013年6月,報(bào)紙廣告降幅從1~5月的3.6%急劇擴(kuò)大到6.1%,雖然還小于去年同期7.6%的降幅,但報(bào)紙廣告持續(xù)下降的趨勢、降幅進(jìn)一步擴(kuò)大的可能在加劇[1]。
而紙質(zhì)圖書出版也不容樂觀,中國出版科學(xué)研究所公布的第5次“全國國民閱讀調(diào)查”顯示,2008年網(wǎng)絡(luò)閱讀首次超過了紙質(zhì)閱讀。其中,紙質(zhì)閱讀和網(wǎng)絡(luò)閱讀分別占閱讀總量的34.7%和36.5%。從近十年的情況來看,傳統(tǒng)的發(fā)行方式也備受挑戰(zhàn),書店業(yè)務(wù)不斷縮減。2003年的“全國國民閱讀調(diào)查”時(shí)我國讀者選書信息渠道占前三位的主要是讀者“自己逛書店、書攤、書市”,“報(bào)紙雜志上的書評與推薦”和“聽別人介紹”;如今網(wǎng)絡(luò)銷售早就成為圖書銷售的第一渠道,互聯(lián)網(wǎng)上的書評與推薦等數(shù)字信息的作用愈加顯著。
互聯(lián)網(wǎng)帶來的數(shù)據(jù)大爆炸已經(jīng)持續(xù)了十幾年,信息不再是稀缺資源,而積累得越來越多的海量數(shù)據(jù)讓社會(huì)民眾對深加工、條理化乃至信息背后社會(huì)規(guī)律的需求也開始提升,紙質(zhì)媒體的產(chǎn)品形態(tài)和傳播介質(zhì)難以滿足民眾的信息消費(fèi)需求,因此轉(zhuǎn)型是必然選擇。
一、資源聚合:大數(shù)據(jù)的規(guī)?;尸F(xiàn)
海量的平凡數(shù)據(jù)匯集起來的力量越來越受關(guān)注。大數(shù)據(jù)的核心在于對人類行為規(guī)律以及社會(huì)問題發(fā)展的預(yù)測,而預(yù)測系統(tǒng)之所以能夠成功,關(guān)鍵在于它們建立在海量數(shù)據(jù)基礎(chǔ)之上。大數(shù)據(jù)為人類生活創(chuàng)造了前所未有的可量化的維度,以前很多單純依靠人類經(jīng)驗(yàn)的判斷會(huì)被基于海量數(shù)據(jù)量化計(jì)算的預(yù)測替代。
大數(shù)據(jù)對出版業(yè)來說是一場脫胎換骨的產(chǎn)品形態(tài)和業(yè)務(wù)形態(tài)革命。報(bào)紙通常具有豐富的信息資源優(yōu)勢。長期以來,報(bào)紙累積了豐富的信息資料庫,是報(bào)紙的重要“不動(dòng)產(chǎn)”,目前有一些行業(yè)報(bào)開始借助自身的信息和資源優(yōu)勢,通過對現(xiàn)有資源的深度挖掘,創(chuàng)新性地選擇開發(fā)新的稀缺內(nèi)容成果,這可能成為未來行業(yè)報(bào)轉(zhuǎn)型的重要方向之一。
如行業(yè)報(bào)在多年的運(yùn)作中,積累了多年來行業(yè)市場的變化數(shù)據(jù),《中國黃金報(bào)》積累了精確到國內(nèi)每個(gè)礦每月黃金生產(chǎn)量的數(shù)據(jù),甚至還有不少國外的數(shù)據(jù)。這些連續(xù)的稀缺資源以往只堆積在報(bào)社內(nèi)部,簡單作為寫作的參考,只需進(jìn)一步深加工,就能對行業(yè)的發(fā)展情況得到第三方的客觀分析,發(fā)揮巨大的潛在價(jià)值。除此之外,報(bào)紙還積累了對歷時(shí)較長的某些重大事件走向、政策變遷的橫向信息積累和縱向信息梳理,這些都是大數(shù)據(jù)時(shí)代的“小分子”。
此外,在自身報(bào)道領(lǐng)域內(nèi)的延伸數(shù)據(jù)的挖掘也可以給報(bào)社帶來新的效益,不少報(bào)紙針對自身的報(bào)道領(lǐng)域和輿情信息成立了數(shù)據(jù)挖掘部門,為行業(yè)提供參考。環(huán)球輿情調(diào)查中心是《環(huán)球時(shí)報(bào)》旗下專業(yè)從事輿情調(diào)查研究和咨詢服務(wù)的機(jī)構(gòu),通過對熱點(diǎn)事件的輿情監(jiān)測和調(diào)查,服務(wù)社會(huì)公共利益,透視中國社會(huì)主流訴求,并有效擴(kuò)大媒體的影響力?!吨袊噲?bào)》目前已經(jīng)建立起了國家級(jí)汽車產(chǎn)業(yè)資訊、信息數(shù)據(jù)庫——“有數(shù)”平臺(tái)?!坝袛?shù)”每天從包括國內(nèi)外專業(yè)傳統(tǒng)媒體、門戶網(wǎng)站的汽車頻道、相關(guān)部委和汽車廠商的官方網(wǎng)站,以及新聞、論壇、博客在內(nèi)的8000多個(gè)網(wǎng)站收集超過百萬次新聞資訊、帖子、博客等內(nèi)容,進(jìn)而從中搜索、發(fā)現(xiàn)、整合出汽車行業(yè)的“信息脈搏”,形成了自己的拳頭產(chǎn)品——中國汽車品牌排行榜,為行業(yè)和企業(yè)的進(jìn)一步品牌塑造提供參考。
通過成立新型的數(shù)據(jù)挖掘部門,報(bào)紙的業(yè)務(wù)領(lǐng)域不斷拓展,報(bào)紙?zhí)峁┑男畔?nèi)容和服務(wù)可以衍生到行業(yè)相關(guān)的學(xué)術(shù)部門、政府部門、公關(guān)公司、甚至廣告商本身等方面,大大拓展了媒體信息服務(wù)的空間和盈利空間。
二、用戶挖掘:大數(shù)據(jù)的情境化開發(fā)
在圖書出版業(yè),對出版物印數(shù)、售價(jià)、庫存的預(yù)測更考驗(yàn)著出版社對市場的把握能力。因此,讀者的“大數(shù)據(jù)”蘊(yùn)藏著尚未被挖掘的巨大價(jià)值,行為數(shù)據(jù)可用于使得出版物更能吸引讀者,并為內(nèi)容發(fā)行商帶來更大的利益,利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營銷將會(huì)極大地提高出版企業(yè)的競爭能力。
在出版新業(yè)態(tài)中,原有產(chǎn)業(yè)鏈條上的印制環(huán)節(jié)大為削弱,設(shè)計(jì)環(huán)節(jié)愈發(fā)重要。最重要的新特點(diǎn)之一是互動(dòng)性的增強(qiáng),如何讓出版物更受歡迎?如何給出版物定價(jià)?如何預(yù)測銷售情況從而調(diào)整出版量和庫存情況?以往往往依賴于傳統(tǒng)的經(jīng)驗(yàn),但在大數(shù)據(jù)時(shí)代,社會(huì)化媒體和電子閱讀習(xí)慣的逐漸普及使得基于社會(huì)網(wǎng)絡(luò)上諸如用戶行為記錄、用戶需求信息、用戶交易記錄、用戶評價(jià)信息、甚至閱讀強(qiáng)度等各類數(shù)據(jù)唾手可得。這些海量的數(shù)據(jù)都可以作為影響出版物內(nèi)容走向的重要信息。通過這些信息,可以得到讀者對于出版內(nèi)容的評價(jià),如果能量化用戶對于書籍的閱讀題材、閱讀場所、閱讀時(shí)長、標(biāo)注章節(jié)和重復(fù)瀏覽內(nèi)容,大數(shù)據(jù)暢銷書生產(chǎn)會(huì)爆發(fā)出更強(qiáng)的生命力。
出版社已經(jīng)開始運(yùn)用這些數(shù)據(jù)。Coliloquy出版的電子書允許讀者自己設(shè)計(jì)人物角色和情節(jié)線索,經(jīng)數(shù)據(jù)分析,讓作家調(diào)整故事迎合大眾口味[2]。出版《哈利·波特》小說的Scholastic出版社通過建立在線游戲,追蹤最吸引人的線索和角色,以此為構(gòu)思基礎(chǔ)創(chuàng)作了《39條線索》系列小說,成為又一本全球暢銷書[3]。
我國也有出版機(jī)構(gòu)已經(jīng)開始重視對這些數(shù)據(jù)的搜集和挖掘,很多出版集團(tuán)的網(wǎng)站都不僅僅只是新書發(fā)布的平臺(tái),也承擔(dān)起了新書銷售的任務(wù)。新華文軒出版?zhèn)髅皆诖蛟熳约何能幘W(wǎng)上售書平臺(tái)的同時(shí)還打造了“九月網(wǎng)”數(shù)字推送平臺(tái)。網(wǎng)站對傳統(tǒng)紙質(zhì)圖書進(jìn)行數(shù)字化,深度加工成電子書,向廣大讀者提供了搜書、閱讀、互動(dòng)分享、購買于一體的網(wǎng)絡(luò)服務(wù)平臺(tái)。用戶可以在直接在網(wǎng)站上對書籍先進(jìn)行試讀,然后再?zèng)Q定是否購買電子書或者紙質(zhì)圖書,同時(shí)擁有紙墨書香和電子版的便捷。用戶在購買或者免費(fèi)獲得電子書以后,用戶能夠在線閱讀和下載到本地閱讀。而用戶在購書的同時(shí),留下的各種數(shù)據(jù)可以被深加工作為出版物生產(chǎn)和銷售的依據(jù)。除官網(wǎng)之外,文軒網(wǎng)的平臺(tái)上還在外部和一些合作媒體,或者其他電商平臺(tái)開展合作以獲取數(shù)據(jù)。文軒通過搭建出版物協(xié)同供應(yīng)平臺(tái),與當(dāng)當(dāng)網(wǎng)、亞馬遜、京東、天貓等知名電商以及上千家網(wǎng)絡(luò)小說書店合作,目前已處理訂單80萬張,交易金額50億。
三、關(guān)系經(jīng)濟(jì):大數(shù)據(jù)的結(jié)構(gòu)化經(jīng)營
過去50年,《紐約時(shí)報(bào)》共產(chǎn)生了30億單詞,而現(xiàn)在Twitter每一天都產(chǎn)生80億單詞;人類每一天產(chǎn)生約15PB數(shù)據(jù),是全美學(xué)術(shù)類圖書館圖書的8倍。自從2004年社交媒體出現(xiàn)之后,所有的情況都改變了。今天80%的數(shù)據(jù)都是非結(jié)構(gòu)化的數(shù)據(jù),并且這些數(shù)據(jù)都是個(gè)人行為的數(shù)據(jù)。
隨著社會(huì)化媒體的來臨,未來數(shù)據(jù)挖掘的核心業(yè)務(wù)除了傳統(tǒng)的具體量化數(shù)據(jù),還有一類抽象數(shù)據(jù)——社會(huì)關(guān)系更值得關(guān)注:社會(huì)關(guān)系超過信息本身成為勾連起整個(gè)社會(huì)最為核心的資源。精確的具體數(shù)據(jù)一旦與社交媒體的關(guān)系數(shù)據(jù)相結(jié)合,對未來的預(yù)測會(huì)非常準(zhǔn)。賓夕法尼亞州政府曾分析全州感冒藥品的銷量,對比系統(tǒng)保存的歷史數(shù)據(jù),以確定可能發(fā)生的大面積流感。分析兒童的就癥率,對比歷史數(shù)據(jù),以確定可能發(fā)生的大面積流感。同時(shí)州政府對Twitter進(jìn)行文本分析,實(shí)時(shí)監(jiān)控各個(gè)地區(qū)的流感爆發(fā)、傳播、分布情況。
整合量化數(shù)據(jù)和關(guān)系數(shù)據(jù)對傳媒行業(yè)而言也有1+1>2的效果。據(jù)國外消息報(bào)道,路透社根據(jù)中國相關(guān)的新聞公開報(bào)道,建立了中國縣團(tuán)級(jí)以上領(lǐng)導(dǎo)的工作關(guān)系和社會(huì)活動(dòng)的數(shù)據(jù)庫資源,可以隨時(shí)對任何縣團(tuán)級(jí)以上的官員之間的社會(huì)關(guān)系進(jìn)行直觀化呈現(xiàn),這種對關(guān)系數(shù)據(jù)的挖掘和再生產(chǎn)能夠有效提高內(nèi)容生產(chǎn)的效率和質(zhì)量。
而對于出版業(yè)而言,除了在內(nèi)容生產(chǎn)上的幫助,量化數(shù)據(jù)和關(guān)系數(shù)據(jù)的挖掘和整合還對出版物的發(fā)行和銷售有非常重要的意義。通過對用戶注冊信息、用戶行為記錄、用戶交易記錄、用戶評價(jià)信息等具體數(shù)據(jù)背后的關(guān)系進(jìn)行整合,出版業(yè)能夠?qū)Τ霭嫖镞M(jìn)行更高效的推送,方便讀者從海量的出版物中尋找到自己心儀的內(nèi)容產(chǎn)品。對于出版業(yè)來說,關(guān)系挖掘和關(guān)系再生產(chǎn)成為挖掘的核心業(yè)務(wù),在具體業(yè)務(wù)上可以表現(xiàn)為以下幾個(gè)方面:
第一是基于關(guān)系挖掘的內(nèi)容服務(wù)。通過關(guān)系數(shù)據(jù)的挖掘,拓展內(nèi)容生產(chǎn)的邊界,提高內(nèi)容生產(chǎn)的質(zhì)量;通過關(guān)系數(shù)據(jù)的挖掘,了解讀者的個(gè)性化需求,并為讀者提供更能滿足其需求的內(nèi)容服務(wù)。
第二是基于關(guān)系挖掘的廣告服務(wù)。通過數(shù)據(jù)挖掘和呈現(xiàn)為廣告主服務(wù),強(qiáng)調(diào)廣告即內(nèi)容,通過社交興趣圖譜將內(nèi)容推送給可能感興趣的用戶,激勵(lì)用戶分享創(chuàng)造口碑效應(yīng),還可以利用數(shù)據(jù)中心,對廣告效果進(jìn)行評估,不斷優(yōu)化方案。
第三是基于關(guān)系挖掘的監(jiān)測服務(wù)??梢酝ㄟ^技術(shù)手段對客戶的數(shù)據(jù)挖掘和數(shù)據(jù)分析,掌握用戶的基本社會(huì)網(wǎng)絡(luò)及潛在需求;另外通過關(guān)系流監(jiān)測,可以向用戶提供一些實(shí)用化和個(gè)性化的收費(fèi)信息,如向商務(wù)人士提供整合后的商界名人對經(jīng)濟(jì)形勢深度分析等信息。
第四是關(guān)系挖掘的整合、嫁接服務(wù)。整合整個(gè)行業(yè)的數(shù)據(jù),勾連產(chǎn)業(yè)鏈條不同環(huán)節(jié),使得所有數(shù)據(jù)匯合,在整個(gè)社會(huì)中創(chuàng)建有效利益分享機(jī)制,內(nèi)容公司、廣告公司、數(shù)據(jù)公司、應(yīng)用公司等構(gòu)成有機(jī)的生態(tài)鏈和產(chǎn)業(yè)鏈。
出版業(yè)的數(shù)據(jù)挖掘雖然現(xiàn)在還處在探索階段,但未來的發(fā)展趨勢應(yīng)該比較明確:出版業(yè)未來從事的是關(guān)系經(jīng)濟(jì)(Ties economic),即基于社會(huì)關(guān)系之間的嵌入、維系、沉淀、連接、整合等一系列行為而產(chǎn)生的經(jīng)濟(jì)效益和社會(huì)效益都可以成為關(guān)系經(jīng)濟(jì)[4]?;谟脩糸喿x及相關(guān)行為的數(shù)據(jù)挖掘和開發(fā)是出版行業(yè)新的盈利增長點(diǎn)和核心競爭力之所在,只要給予其靈活的試錯(cuò)機(jī)制,一定能給出版機(jī)構(gòu)帶來新的業(yè)務(wù)領(lǐng)域和社會(huì)價(jià)值。
(作者單位:中國人民大學(xué)新聞學(xué)院)
參考文獻(xiàn)
[1] 晉雅芬. 報(bào)告稱上半年報(bào)紙廣告全方位衰退[N].中國新聞出版報(bào),2013-07-31.
[2] Dennis Abrams. Coliloquy: Choosing Your Own Adventure 21st-Century Style, Publishing Perspectives. http://publishingperspectives.com/2012/10/coliloquy-choosing-your-own-adventure-21st-century-style.
[3] 圖書館和出版社如何迎接大數(shù)據(jù)時(shí)代?[N].中國出版?zhèn)髅缴虉?bào),2013-08-20.
[4] 李彪. 微博盈利模式之惑——以新浪微博為例[J].青年記者,2012(16):66-68.