文_王卓爾
王卓爾
浙江日?qǐng)?bào)報(bào)業(yè)集團(tuán)辦公室
技術(shù)驅(qū)動(dòng)媒體融合向縱深發(fā)展,已成為一種共識(shí)。而驅(qū)動(dòng)技術(shù)發(fā)展的,正是數(shù)據(jù)。如何利用好數(shù)據(jù),用數(shù)據(jù)驅(qū)動(dòng)決策,不僅是媒體深度融合領(lǐng)域繞不開(kāi)的命題,還是大型媒體集團(tuán)向數(shù)字化轉(zhuǎn)型的關(guān)鍵所在。
數(shù)據(jù)的運(yùn)用推動(dòng)著思維方式的改變,人們?cè)絹?lái)越無(wú)法對(duì)單純用直覺(jué)下的定論感到信服,必須依據(jù)客觀數(shù)據(jù)。1981 年,美國(guó)一位學(xué)者借助計(jì)算機(jī)統(tǒng)計(jì)了《紅樓夢(mèng)》中的詞頻,處理分析后得出結(jié)論,120 回全都出自一人之手。但這個(gè)說(shuō)法很快遭到質(zhì)疑,因?yàn)樗麖脑兄怀槿×?萬(wàn)字樣本進(jìn)行研究,且變量也只有14個(gè)。復(fù)旦大學(xué)數(shù)學(xué)系畢業(yè)的陳大康為了駁斥這個(gè)結(jié)論,手動(dòng)對(duì)《紅樓夢(mèng)》全書(shū)的字、詞、句進(jìn)行了全面的統(tǒng)計(jì)分析,73萬(wàn)字的原著,他數(shù)了上百遍,獲得約2萬(wàn)個(gè)數(shù)據(jù),發(fā)現(xiàn)了一些專用詞如“端的”“越性”“索性”在各回中出現(xiàn)的情況,最終得出結(jié)論:前80 回為曹雪芹一人所寫(xiě),后40 回為另一人所寫(xiě),但包含了一部分曹雪芹殘本。
能和數(shù)據(jù)對(duì)抗的,還是數(shù)據(jù)。過(guò)去,數(shù)據(jù)驅(qū)動(dòng)著學(xué)術(shù)研究;現(xiàn)在,以數(shù)據(jù)為中心進(jìn)行決策和行動(dòng)就更普遍了。比如,訂票網(wǎng)站根據(jù)搜索量分析,未來(lái)兩周是出行高峰,于是決定提高機(jī)票價(jià)格。但是,這僅僅是以數(shù)據(jù)為參考,并沒(méi)有真正做到數(shù)據(jù)驅(qū)動(dòng)決策。數(shù)據(jù)驅(qū)動(dòng)是指以海量數(shù)據(jù)為基礎(chǔ)構(gòu)建模型,圍繞業(yè)務(wù)目標(biāo)持續(xù)優(yōu)化參數(shù),自動(dòng)做出決策的一種方法。目前,人工智能領(lǐng)域快速發(fā)展,聊天機(jī)器人等帶給人們太多驚喜。一個(gè)錯(cuò)誤的認(rèn)知是,技術(shù)驅(qū)動(dòng)媒體融合就是引進(jìn)專業(yè)的數(shù)據(jù)工程師,或是購(gòu)買AI工具就可以了。其實(shí),更為關(guān)鍵的步驟在于利用好自己擁有的數(shù)據(jù),將其轉(zhuǎn)化為有意義、有見(jiàn)解的必要技能。谷歌、亞馬遜、Meta等科技巨頭與其他企業(yè)之間的巨大區(qū)別不在于他們數(shù)據(jù)科學(xué)家的腦力,或者他們技術(shù)的實(shí)際功能,而是他們不同凡響的數(shù)據(jù)驅(qū)動(dòng)的文化。他們利用巨大的數(shù)據(jù)資產(chǎn),并有出色的算法來(lái)解釋那些數(shù)據(jù),然而他們的關(guān)鍵戰(zhàn)略優(yōu)勢(shì)和最大資產(chǎn)卻是他們根據(jù)數(shù)據(jù)生存、呼吸和行動(dòng)。[1]以數(shù)據(jù)驅(qū)動(dòng)為主要決策導(dǎo)向,能讓企業(yè)著眼于具體目標(biāo),并借助技術(shù)工具更有效地解決問(wèn)題。
在媒體行業(yè)內(nèi)說(shuō)到數(shù)據(jù),往往會(huì)想起文章的“閱讀”“點(diǎn)贊”“評(píng)論”“轉(zhuǎn)發(fā)”這類指標(biāo),很長(zhǎng)一段時(shí)間內(nèi),這些顯而易見(jiàn)的指標(biāo)的好壞是決定一篇文章的傳播是否成功的唯一標(biāo)準(zhǔn)。雖然直觀,但這也給人們帶來(lái)了思維的固化。內(nèi)容分發(fā)出去之后,閱讀量陡然上升并不能客觀說(shuō)明傳播效果好,也許僅僅是因?yàn)橛幸粋€(gè)奪人眼球的標(biāo)題而已。統(tǒng)計(jì)特定部分的跳出率更能說(shuō)明問(wèn)題,它可以幫助內(nèi)容生產(chǎn)者對(duì)內(nèi)容進(jìn)行布局優(yōu)化和修正,B 站的高能進(jìn)度條就是如此。它在普通進(jìn)度條上方設(shè)置了波峰標(biāo)志,波峰越高的部分就是觀看人數(shù)越多、彈幕集中的部分。如果波形平緩,那就說(shuō)明視頻平平無(wú)奇,缺少爆點(diǎn)。
此外,還需對(duì)表象數(shù)據(jù)進(jìn)行穿透,挖掘出更多數(shù)據(jù),適量囤積一些數(shù)據(jù)以備后續(xù)分析。比如,從自有平臺(tái)和分布式平臺(tái)等各種渠道收集大量類似訪問(wèn)的時(shí)間、地址、入口、設(shè)備類型等方面的用戶訪問(wèn)數(shù)據(jù),再進(jìn)行更復(fù)雜的深度分析。美國(guó)數(shù)字媒體公司BuzzFeed內(nèi)部有一款數(shù)據(jù)分析工具Pound,能夠了解用戶如何在不同社交網(wǎng)絡(luò)內(nèi)分享內(nèi)容。假如網(wǎng)友將一篇文章分享給他的好友,好友轉(zhuǎn)發(fā)到推特,繼而又分享到其他社交平臺(tái)上,Pound可以把這些線索關(guān)聯(lián)起來(lái),顯示不同分享人之間的聯(lián)系,并把這個(gè)線路圖描繪出來(lái)。甚至,Pound可以根據(jù)某篇內(nèi)容的來(lái)源,預(yù)測(cè)它在該網(wǎng)絡(luò)如何傳播,進(jìn)一步幫助BuzzFeed了解受眾。
然而,大數(shù)據(jù)大量、高速、多樣的特征決定了必須有一個(gè)強(qiáng)有力的大腦來(lái)支撐其運(yùn)行,有一個(gè)足夠強(qiáng)大的數(shù)據(jù)倉(cāng)庫(kù)來(lái)存儲(chǔ)數(shù)據(jù)。隨著數(shù)據(jù)體量和業(yè)務(wù)模塊的增加,數(shù)據(jù)處理能力將會(huì)經(jīng)受不小的考驗(yàn)。服務(wù)器能否經(jīng)受高訪問(wèn)量,數(shù)據(jù)庫(kù)是否能做到實(shí)時(shí)更新,多源異構(gòu)數(shù)據(jù)是否能夠?qū)崿F(xiàn)融合和匯聚,能否承載人工智能、區(qū)塊鏈等前沿技術(shù)的數(shù)據(jù)計(jì)算能力等方面,都在考驗(yàn)著數(shù)據(jù)處理的技術(shù)能力。媒體企業(yè)也必然加大在技術(shù)硬件方面的投入,通過(guò)提升服務(wù)器硬件水平、部署分布式數(shù)據(jù)處理系統(tǒng)等方式來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)的掌控力。
積累數(shù)據(jù)不僅僅是為了訓(xùn)練模型,讓其更精準(zhǔn),更是為了從中提取有價(jià)值的信息,并利用好這些信息,進(jìn)行更有效率的傳播,更精準(zhǔn)地在用戶和信息之間構(gòu)建橋梁。
不管是文章、視頻還是新媒體產(chǎn)品,最終到達(dá)的節(jié)點(diǎn)是用戶。用戶可以不去了解文章作者是誰(shuí)、愛(ài)好是什么,但是作為內(nèi)容生產(chǎn)者和傳播者,必須對(duì)其受眾有精確的洞察,這在很大程度上影響著內(nèi)容制作的方向、特點(diǎn)、風(fēng)格和運(yùn)營(yíng)模式。而隨著平臺(tái)型媒體的增多,PGC、UGC等內(nèi)容生產(chǎn)方式層出不窮,用戶選擇可看的內(nèi)容也不僅限于“千人一面”。通過(guò)對(duì)用戶年齡、階層、行為偏好進(jìn)行數(shù)據(jù)分析,就可以向不同用戶推送不一樣的內(nèi)容,形成“千人千面”的用戶體驗(yàn)。
分析用戶數(shù)據(jù)還能實(shí)現(xiàn)精準(zhǔn)營(yíng)銷的目的?!都~約時(shí)報(bào)》專注于利用用戶數(shù)據(jù)幫助客戶實(shí)現(xiàn)廣告定位,起到產(chǎn)品建設(shè)的目的。2020年2月,《紐約時(shí)報(bào)》組建了一支由來(lái)自數(shù)據(jù)、產(chǎn)品、設(shè)計(jì)、技術(shù)和廣告領(lǐng)域的行家組成的新團(tuán)隊(duì),主要目標(biāo)是通過(guò)用戶行為和喜好為廣告商設(shè)計(jì)產(chǎn)品,實(shí)現(xiàn)精準(zhǔn)定位。[2]阿里巴巴的數(shù)據(jù)中臺(tái)通過(guò)One ID來(lái)連接用戶在阿里巴巴產(chǎn)品體系下的用戶數(shù)據(jù),將用戶在阿里系產(chǎn)品中產(chǎn)生的數(shù)據(jù)通過(guò)One ID關(guān)聯(lián)起來(lái),這樣就可以從衣食住行等各個(gè)方面來(lái)精確描繪用戶畫(huà)像和興趣,制定高轉(zhuǎn)化率的營(yíng)銷方案。[3]
除了在單一平臺(tái)上發(fā)布內(nèi)容,很多時(shí)候,還需要在不同渠道進(jìn)行內(nèi)容分發(fā),來(lái)樹(shù)立品牌形象,進(jìn)行流量引導(dǎo)。這需要根據(jù)不同平臺(tái)特性、不同目標(biāo)用戶特性,對(duì)同一款內(nèi)容進(jìn)行二次加工。比如在抖音上發(fā)布的視頻多以豎屏為主,在小紅書(shū)上更多以圖片為主,在知乎上則要緊貼問(wèn)題,不能照搬照抄。BuzzFeed開(kāi)發(fā)了一個(gè)叫Hive的項(xiàng)目,它可以幫助編輯按平臺(tái)特性個(gè)性化制作同一款內(nèi)容。舉例來(lái)說(shuō),一個(gè)包含7個(gè)步驟的燉雞菜譜網(wǎng)頁(yè)在Facebook 上變成了46 秒的視頻;在Instagram上變成15秒的短片,評(píng)論區(qū)附有烹飪要點(diǎn);如果要分享到Snapchat,它還得轉(zhuǎn)成縱向模式。同一份菜譜,一瞬間就能變成數(shù)個(gè)不同的MP4文件。
在數(shù)據(jù)驅(qū)動(dòng)思維的影響下,內(nèi)容傳播效果的評(píng)價(jià)也將用數(shù)據(jù)來(lái)替代人工經(jīng)驗(yàn),比如引入傳播力指數(shù)之類的指標(biāo)進(jìn)行檢驗(yàn)。而要形成數(shù)據(jù)評(píng)價(jià)閉環(huán),還需要對(duì)差異化的傳播結(jié)果進(jìn)行對(duì)比測(cè)試,來(lái)指導(dǎo)新聞生產(chǎn)環(huán)節(jié)的改造、提升傳播效果和轉(zhuǎn)化率。數(shù)據(jù)驅(qū)動(dòng)中比較典型的方法是A/B測(cè)試,它也被稱為對(duì)比測(cè)試和分桶測(cè)試,旨在用于對(duì)比測(cè)試(A)版本與變量(B)版本兩個(gè)版本的內(nèi)容的效果,識(shí)別哪一個(gè)版本對(duì)于用戶更具吸引力。字節(jié)跳動(dòng)在推出抖音之前做過(guò)很多產(chǎn)品小樣,起了很多名字,也設(shè)計(jì)了很多l(xiāng)ogo。它將不同名字和logo放在不同應(yīng)用市場(chǎng),在位置、預(yù)算等條件一致的前提下,測(cè)試了各自對(duì)用戶的吸引力程度、下載轉(zhuǎn)化率等指標(biāo),最終確定了“抖音”作為新產(chǎn)品的名字。
在A/B 測(cè)試的基礎(chǔ)上,也有諸如《華盛頓郵報(bào)》這樣的媒體引入了MAB(multi-armed bandit)測(cè)試,即“多臂老虎機(jī)”。它是一種動(dòng)態(tài)隨機(jī)最優(yōu)化的范疇,是特殊類型的動(dòng)態(tài)隨機(jī)控制模型,用于處理如何最優(yōu)地進(jìn)行稀缺資源的分配。相比A/B 測(cè)試,它更加靈活,在測(cè)試運(yùn)行過(guò)程中可以增加或者刪減變量,比如同時(shí)測(cè)試標(biāo)題、圖片縮略圖、視頻、推薦文章、熱門文章等。當(dāng)編輯添加一個(gè)變量到其MAB 模塊并對(duì)網(wǎng)頁(yè)進(jìn)行發(fā)布時(shí),MAB 測(cè)試的算法會(huì)自動(dòng)注冊(cè)一個(gè)有關(guān)新變量與默認(rèn)變量的新測(cè)試,同時(shí)發(fā)布到網(wǎng)站上,開(kāi)始在測(cè)試頁(yè)上跟蹤與測(cè)試相關(guān)的用戶反饋,并根據(jù)實(shí)時(shí)反饋,選出最佳變量。這種最新的測(cè)試方法的優(yōu)勢(shì)不僅在于變量的組合能夠最大限度地引起用戶的參與,并且能夠花費(fèi)最小的成本探索出最佳的變量組合。[4]
雖然A/B 測(cè)試可以用較小的流量獲得優(yōu)選結(jié)果,但是,它在國(guó)內(nèi)媒體中的應(yīng)用還處于初級(jí)階段。字節(jié)跳動(dòng)旗下火山引擎做過(guò)的一項(xiàng)市場(chǎng)調(diào)研顯示,在企業(yè)的日常業(yè)務(wù)和管理中,A/B測(cè)試的普及率并不高,滲透率不足30%。一個(gè)比較實(shí)際的原因在于,部署A/B測(cè)試需要有很強(qiáng)的底層技術(shù)支撐,包括服務(wù)器的實(shí)時(shí)響應(yīng)能力和處理速度等,來(lái)保證科學(xué)的流量分割、流量層直接的正交互斥,使得實(shí)驗(yàn)不受干擾,中小企業(yè)不具備相應(yīng)的技術(shù)條件。A/B 測(cè)試也并不是萬(wàn)能的,它需要投入一定的試錯(cuò)成本,很可能較好的測(cè)試結(jié)果并不是內(nèi)容生產(chǎn)者希望出現(xiàn)的。當(dāng)然,評(píng)價(jià)傳播效果不只有A/B 測(cè)試這樣一種方法,我們真正需要的是以用戶需求為導(dǎo)向,借助數(shù)據(jù)分析工具,更好地強(qiáng)化媒體與受眾的連接,提升內(nèi)容傳播效果。
能夠超越技術(shù)的不是技術(shù),是人;能夠成功讓技術(shù)引領(lǐng)媒體深度融合的也不是技術(shù),是組織。新技術(shù)的運(yùn)用,需要與之相適應(yīng)的組織變革,其潛能才可以充分釋放出來(lái)。相對(duì)來(lái)說(shuō),組織變革更加復(fù)雜艱巨,因?yàn)樯婕叭伺c人生產(chǎn)關(guān)系的改變,而且要克服組織惰性。[5]在技術(shù)驅(qū)動(dòng)媒體深度融合發(fā)展的背景下,技術(shù)人才并不只是待在幕后,而是走向編輯室,將技術(shù)融入更多內(nèi)容生產(chǎn)之中。
例如,澎湃新聞《海拔四千米之上》H5產(chǎn)品就由技術(shù)人員發(fā)起創(chuàng)意。在預(yù)判會(huì)獲得大量精美影像材料的基礎(chǔ)上,前端工程師采用全景視頻的方式進(jìn)行內(nèi)容呈現(xiàn)并提供基礎(chǔ)框架,使用了普通拍攝、航拍、延時(shí)拍攝、360全景圖片、定點(diǎn)VR視頻、漫游VR視頻、互動(dòng)熱點(diǎn)、交叉嵌合等方式,實(shí)現(xiàn)了多種技術(shù)和表現(xiàn)形式的大融合。產(chǎn)品最終獲得第二十九屆中國(guó)新聞獎(jiǎng)融合創(chuàng)新類作品一等獎(jiǎng)。
媒體競(jìng)爭(zhēng)關(guān)鍵是人才競(jìng)爭(zhēng),媒體優(yōu)勢(shì)核心是人才優(yōu)勢(shì)。根據(jù)波士頓咨詢公司《數(shù)字經(jīng)濟(jì)下就業(yè)與人才研究報(bào)告》,數(shù)字技術(shù)融入各行各業(yè),善用數(shù)字技術(shù)成為諸多崗位的“必修課”,如傳統(tǒng)營(yíng)銷轉(zhuǎn)型為數(shù)字化營(yíng)銷,商業(yè)情報(bào)分析轉(zhuǎn)型為大數(shù)據(jù)分析。因此,掌握綜合化的不易被數(shù)字技術(shù)所取代的技能及素質(zhì)將享有更廣泛的職業(yè)發(fā)展空間,而爭(zhēng)奪此類人才也勢(shì)必會(huì)成為“人才爭(zhēng)奪戰(zhàn)”的重中之重。無(wú)論是技術(shù)架構(gòu)的搭建還是業(yè)務(wù)場(chǎng)景的深化,都需要數(shù)據(jù)分析師掌握分析工具、具備用數(shù)據(jù)分析問(wèn)題的能力,并對(duì)業(yè)務(wù)有深入的理解和豐富的經(jīng)驗(yàn),如此才能對(duì)媒體行業(yè)的數(shù)據(jù)指標(biāo)有準(zhǔn)確的判斷。
此外,媒體單位的組織方式也需要適應(yīng)互聯(lián)網(wǎng)時(shí)代,變得更靈活、更多元、更扁平化。傳統(tǒng)媒體中逐級(jí)上報(bào)、決策滯后的模式將會(huì)是快速響應(yīng)網(wǎng)絡(luò)的阻礙。如何建立數(shù)據(jù)與內(nèi)容生產(chǎn)相適應(yīng)的考核機(jī)制,也是傳統(tǒng)媒體需要突破的難題之一。