徐麗芳+池呈
亞馬遜和蘋(píng)果分別對(duì)Goodreads和BookLamp的收購(gòu)是兩者在閱讀市場(chǎng)上角力的具現(xiàn)化最新縮影。哪個(gè)選擇更正確?現(xiàn)在還很難說(shuō)。
熱詞:圖書(shū)”基因”分析 BookLamp 閱讀市場(chǎng)博弈
幾乎每一家購(gòu)書(shū)網(wǎng)站和閱讀社交網(wǎng)站都會(huì)向讀者推薦圖書(shū),但它們往往是基于讀者既往的購(gòu)買(mǎi)史和閱讀史做出推薦。那么,有沒(méi)有一項(xiàng)服務(wù)能基于圖書(shū)本身的內(nèi)容和語(yǔ)言進(jìn)行推薦,而不被圖書(shū)的流行程度、“水軍”的造勢(shì)或者出版商的營(yíng)銷(xiāo)手段等外部因素所左右呢?美國(guó)愛(ài)達(dá)荷州的一家大數(shù)據(jù)圖書(shū)分析服務(wù)提供商書(shū)燈公司(BookLamp)就可以提供此類(lèi)圖書(shū)推薦服務(wù)。BookLamp的前身是成立于2003年6月的新奇計(jì)劃公司(Novel Projects, Inc.),這家公司希望通過(guò)語(yǔ)義的不斷計(jì)算與挖掘,開(kāi)發(fā)出各類(lèi)新穎的軟件和服務(wù)。2007年2月,他們將語(yǔ)義技術(shù)結(jié)合出版產(chǎn)業(yè),創(chuàng)立了BookLamp公司。這個(gè)團(tuán)隊(duì)最有代表性的項(xiàng)目是2010年8月上線(xiàn)的“圖書(shū)基因組計(jì)劃”(Book Genome Project),該服務(wù)利用自然語(yǔ)言分析技術(shù)為用戶(hù)推薦圖書(shū),并為出版行業(yè)提供幫助。
一、核心技術(shù):圖書(shū)“基因”分析技術(shù)
一直以來(lái),購(gòu)書(shū)網(wǎng)站上的圖書(shū)推薦引擎提供服務(wù)的方式不外乎以下幾種:“購(gòu)買(mǎi)了某本書(shū)的人還購(gòu)買(mǎi)了這些書(shū)……”“這些書(shū)是編輯精選……”“這些書(shū)正在熱銷(xiāo)……”“這些書(shū)廣受好評(píng)……”。然而,就算購(gòu)買(mǎi)了同一本書(shū),不同讀者的閱讀興趣和閱讀習(xí)慣仍然可能存在巨大差異;作者熱門(mén)或圖書(shū)賣(mài)得好也不甚靠譜;而流行趨勢(shì)、編輯精選等基本就是營(yíng)銷(xiāo)造勢(shì)的結(jié)果。以上推薦方法都不能準(zhǔn)確地幫讀者找到自己喜歡的書(shū),因?yàn)樗鼈兌际腔谝槐緯?shū)外在的特征、條件和狀況,而不是根據(jù)圖書(shū)的題材、內(nèi)容、語(yǔ)言風(fēng)格以及作者能力和水平等更內(nèi)在的特點(diǎn)來(lái)做出推薦——因此是不全面的,很多時(shí)候也是不準(zhǔn)確的。
BookLamp的圖書(shū)“基因”分析技術(shù)則另辟蹊徑,不關(guān)注作者也不關(guān)注讀者,僅根據(jù)書(shū)籍自身的“基因”來(lái)作出閱讀推薦。具體來(lái)說(shuō),BookLamp將一本書(shū)的“基因”總結(jié)為語(yǔ)言風(fēng)格和故事情節(jié)兩方面,其中,語(yǔ)言風(fēng)格DNA由語(yǔ)言密度、語(yǔ)言節(jié)奏、對(duì)話(huà)、描述和運(yùn)動(dòng)組成;故事情節(jié)DNA則由關(guān)鍵主題詞組和寫(xiě)作手法組成。對(duì)于后一點(diǎn),BookLamp的創(chuàng)始人亞倫·史坦頓(Aaron Stanton)曾在接受媒體采訪(fǎng)時(shí)打過(guò)一個(gè)恰如其分的比喻,“就像你吃了一塊很好吃的巧克力蛋糕,如果你想找到其他口味類(lèi)似的蛋糕,你所需要知道的不僅僅只有其成分,還需要知道各個(gè)成分的比例?!睆倪@個(gè)角度來(lái)看,一本書(shū)的關(guān)鍵主題就是其成分,而寫(xiě)作手法就是其成分比例。在對(duì)一本書(shū)進(jìn)行分析時(shí),BookLamp會(huì)對(duì)書(shū)的內(nèi)容進(jìn)行掃描,將全文分解為一百個(gè)場(chǎng)景,然后依據(jù)自然語(yǔ)言算法分析每個(gè)場(chǎng)景的“DNA”——語(yǔ)言、情節(jié)、寫(xiě)作思路、主題及形式等(BookLamp總結(jié)了2000多個(gè)特性),同時(shí)計(jì)算不同主題所占成分(BookLamp總結(jié)了132個(gè)主題),多方位評(píng)估書(shū)的內(nèi)容,并基于評(píng)估結(jié)果繪制圖書(shū)的“基因圖譜”。比如說(shuō),史蒂芬·金的《午夜行兇》(Salem's Lot)在圖書(shū)基因組計(jì)劃中被解析出四個(gè)主要特征:吸血鬼/超自然;葬禮/死亡/追悼;家庭/家庭環(huán)境;痛苦恐懼/消極情緒。BookLamp將這四個(gè)特征隨故事線(xiàn)進(jìn)展所占比例的變化用圖表描繪出來(lái),遂形成《午夜行兇》的基因圖譜,如圖1所示。
圖1 《午夜行兇》基因圖譜
二、用戶(hù)價(jià)值及商業(yè)模式
“基因圖譜”分析有助于讀者找到心儀的圖書(shū)。用戶(hù)在使用BookLamp支持的服務(wù)時(shí),先選取自己喜歡的一本或幾本書(shū),BookLamp會(huì)將該書(shū)的“基因圖譜”與數(shù)據(jù)庫(kù)中的進(jìn)行適配,為用戶(hù)推薦同類(lèi)型的、用戶(hù)也可能喜歡的圖書(shū)。用戶(hù)會(huì)驚喜地發(fā)現(xiàn),BookLamp為自己推薦的圖書(shū)與自己喜歡的書(shū)具有相似的語(yǔ)氣、觀點(diǎn)、描述,甚至有類(lèi)似的戲劇沖突。舉例而言,如果讀者喜歡《達(dá)·芬奇密碼》,想要找一本類(lèi)似的小說(shuō),BookLamp會(huì)先拉取系統(tǒng)此前對(duì)該小說(shuō)的分析數(shù)據(jù)。分析數(shù)據(jù)顯示,《達(dá)·芬奇密碼》有18.6%的內(nèi)容涉及宗教和宗教機(jī)構(gòu),9.4%的內(nèi)容涉及警方和謀殺案的調(diào)查,8.2%的內(nèi)容涉及藝術(shù)和藝術(shù)畫(huà)廊,6.7%的內(nèi)容涉及秘密結(jié)社,以及歷史文化、旅行、尋求真相等其他元素。然后該系統(tǒng)會(huì)用這些故事情節(jié)DNA數(shù)據(jù)以及該書(shū)的語(yǔ)言風(fēng)格DNA數(shù)據(jù)去比對(duì)數(shù)據(jù)庫(kù)中的其他書(shū)籍,最后返回《失落的秘符》《最后的圣殿騎士》《巴拉巴德的七把鑰匙》等小說(shuō),這些書(shū)的內(nèi)容都包含與《達(dá)·芬奇密碼》相似的元素與元素比例、語(yǔ)言風(fēng)格,如圖2所示。
圖2 《達(dá)·芬奇密碼》的基因圖譜及與之相似的圖書(shū)
上文分析了BookLamp能為讀者創(chuàng)造的價(jià)值,那么,BookLamp采用怎樣的商業(yè)模式呢?一方面,和Pandora或者豆瓣類(lèi)似,BookLamp所推薦的圖書(shū)都帶有一些電商鏈接,比如eBay、亞馬遜等,當(dāng)用戶(hù)購(gòu)買(mǎi)行為產(chǎn)生時(shí),BookLamp可以獲得一定的提成。另一方面也是更重要的一個(gè)收入模式,BookLamp為出版商及分銷(xiāo)商提供圖書(shū)數(shù)據(jù)分析服務(wù)。BookLamp利用自己收集并分析的各類(lèi)書(shū)籍信息,幫助各類(lèi)出版商和分銷(xiāo)商來(lái)更改他們的目標(biāo)定位和宣傳,以更好地影響那些本來(lái)就愛(ài)看這類(lèi)書(shū)的人。此外,BookLamp的數(shù)據(jù)分析服務(wù)還給出版商提供了一個(gè)平臺(tái),出版商可以通過(guò)這個(gè)平臺(tái)來(lái)篩選手稿,分析一本書(shū)籍在特定讀者群中的受歡迎程度,或者其市場(chǎng)預(yù)算應(yīng)該為多少。BookLamp的主要客戶(hù)包括亞馬遜、蘋(píng)果,還有像蘭登書(shū)屋這樣的圖書(shū)出版商。蘭登書(shū)屋和肯辛頓圖書(shū)公司(Kensington Books)已經(jīng)讓BookLamp分析了他們的兩萬(wàn)本書(shū)。
三、BookLamp VS Goodreads:巨頭間的競(jìng)爭(zhēng)
BookLamp先進(jìn)的圖書(shū)分析技術(shù)吸引了相關(guān)競(jìng)爭(zhēng)領(lǐng)域巨頭公司的關(guān)注。亞馬遜曾與BookLamp展開(kāi)過(guò)收購(gòu)談判,但它最終于2013年3月收購(gòu)了BookLamp的競(jìng)爭(zhēng)對(duì)手——Goodreads。Goodreads是一個(gè)閱讀社交網(wǎng)站,可供用戶(hù)搜索、分享書(shū)籍,或發(fā)表書(shū)評(píng)、更新讀書(shū)進(jìn)程等,就像豆瓣讀書(shū)一樣。作為世界上最大的在線(xiàn)讀書(shū)俱樂(lè)部,Goodreads上有一千多萬(wàn)用戶(hù)標(biāo)注自己想讀和正在讀的書(shū),但是它提供的圖書(shū)推薦服務(wù)是基于社交網(wǎng)絡(luò)的,無(wú)法提供像BookLamp一樣基于書(shū)籍自身內(nèi)容的圖書(shū)推薦功能。BookLamp與之相比,更像是潘多拉音樂(lè)盒(Pandora)——Pandora按照“Music Genome Project(音樂(lè)基因組項(xiàng)目)”算法給喜歡音樂(lè)的人推薦曲目,BookLamp同樣也是通過(guò)掃描內(nèi)容以獲得可量化的相似點(diǎn)來(lái)完成推薦。
2014年7月,蘋(píng)果公司被曝以1000萬(wàn)美元至1500萬(wàn)美元的價(jià)格收購(gòu)了BookLamp及其“Book Genome Project(圖書(shū)基因組計(jì)劃)”技術(shù)。之后,BookLamp在一份聲明中稱(chēng)將不再向用戶(hù)推出原有服務(wù),也證明這份收購(gòu)確已成立。蘋(píng)果對(duì)BookLamp公司的收購(gòu)戰(zhàn)略意圖明顯——這筆收購(gòu)使蘋(píng)果公司成功地在閱讀市場(chǎng)布下一顆棋子,為其在閱讀推薦領(lǐng)域和亞馬遜的競(jìng)爭(zhēng)贏得了足可抗衡的籌碼。一方面,收購(gòu)中斷了BookLamp為亞馬遜提供的服務(wù),使其此后只為蘋(píng)果提供服務(wù),同時(shí)也讓蘋(píng)果獲得了其客戶(hù);而更重要的是,該公司的技術(shù)和人才可以幫助蘋(píng)果在閱讀領(lǐng)域中打造更有競(jìng)爭(zhēng)力的產(chǎn)品,更好地對(duì)抗亞馬遜。
亞馬遜和蘋(píng)果分別對(duì)Goodreads和BookLamp的收購(gòu)是兩者在閱讀市場(chǎng)上角力的具現(xiàn)化最新縮影。隨著電子書(shū)經(jīng)銷(xiāo)商提供的書(shū)籍越來(lái)越多,任何公司想在電子書(shū)領(lǐng)域有所作為,顯然不能維持現(xiàn)狀——單純銷(xiāo)售圖書(shū)。它們需要想辦法來(lái)為這些書(shū)籍增值——對(duì)于用戶(hù)而言,買(mǎi)書(shū)在哪兒不是買(mǎi),它們必須為用戶(hù)提供額外的價(jià)值,比如符合用戶(hù)個(gè)人特點(diǎn)的個(gè)性化推薦。如果蘋(píng)果或亞馬遜給出的推薦能夠得到用戶(hù)認(rèn)可,那么用戶(hù)就可能更加信賴(lài)它,并進(jìn)一步購(gòu)買(mǎi)或者租賃書(shū)籍。對(duì)此,亞馬遜和蘋(píng)果作出了不同的選擇。亞馬遜收購(gòu)Goodreads,是選擇了基于社交網(wǎng)絡(luò)與口碑傳播的閱讀推薦,讓用戶(hù)的熟人或志趣相投的網(wǎng)絡(luò)圈子關(guān)于某本書(shū)的新鮮事引導(dǎo)用戶(hù)發(fā)現(xiàn)圖書(shū)。而蘋(píng)果對(duì)BookLamp的收購(gòu)則是選擇了基于書(shū)籍自身內(nèi)容的閱讀推薦。蘋(píng)果的iBook Store電子書(shū)平臺(tái)提供“編輯精選”一類(lèi)的服務(wù),但是沒(méi)有突出用戶(hù)個(gè)性化的特點(diǎn),在亞馬遜收購(gòu)Goodreads搶先奪取了用戶(hù)數(shù)據(jù)的情況下,要憑借什么與Kindle Store競(jìng)爭(zhēng)呢?顯然BookLamp的內(nèi)容和風(fēng)格分析法可以派上用場(chǎng)。
哪個(gè)選擇更正確,現(xiàn)在還很難說(shuō)。但我們能知道的是,BookLamp將幫助強(qiáng)化蘋(píng)果公司的電子書(shū)服務(wù),成為其和亞馬遜在閱讀市場(chǎng)博弈的武器。
[作者單位系武漢大學(xué)數(shù)字出版研究所,本文為自科基金項(xiàng)目“科技信息用戶(hù)價(jià)值模型構(gòu)建與實(shí)證研究(71373196)的研究成果]