牛媛媛 劉慶振
隨著大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)的快速發(fā)展,算法、個性化分發(fā)、推薦系統(tǒng)等概念正在為內(nèi)容產(chǎn)業(yè)乃至整個傳媒產(chǎn)業(yè)帶來新的思維方式、生產(chǎn)方式和消費(fèi)方式。在今天,中國至少有超過6億以上的人、全球至少有超過25億以上的人借助于算法來獲取每天所消費(fèi)的內(nèi)容產(chǎn)品。本文將聚焦于重點(diǎn)探討短視頻、影視作品等內(nèi)容產(chǎn)品的個性化推薦算法及其對影視傳媒產(chǎn)業(yè)可能產(chǎn)生的重要影響。
短視頻是內(nèi)容推薦系統(tǒng)的典型應(yīng)用場景之一,用戶在看完一段短視頻之后,系統(tǒng)就會自動推薦一段新的短視頻,用戶只需要動動手指點(diǎn)擊觀看即可,而不再需要自己輸入關(guān)鍵詞、點(diǎn)擊搜索并篩選內(nèi)容這一繁瑣過程。這就是推薦引擎和搜索引擎的差異,也正是因?yàn)檫@種差異,短視頻的推薦系統(tǒng)才必須要更好地了解用戶需求以便向他們推薦更加合適的視頻內(nèi)容。很多用戶在使用不同的短視頻移動應(yīng)用時,都會有類似的體會:有的應(yīng)用體驗(yàn)非常好,能讓人沉迷進(jìn)去無法自拔,有的應(yīng)用推薦的內(nèi)容卻根本不感興趣,讓人覺得無聊至極以致直接卸載該應(yīng)用。事實(shí)上,這就是不同應(yīng)用程序所采用的推薦算法之間的差異。如果一款短視頻應(yīng)用所采用的推薦算法不夠優(yōu)秀,所完成的內(nèi)容畫像和用戶畫像不夠精準(zhǔn),就完全有可能導(dǎo)致該系統(tǒng)向用戶推薦的內(nèi)容無法實(shí)現(xiàn)個性化的精準(zhǔn)匹配,從而進(jìn)一步導(dǎo)致用戶體驗(yàn)差、粘著性差、卸載率高等嚴(yán)重影響該產(chǎn)品市場競爭力的惡果。
由于短視頻本身存在短、小、輕、薄等特征,這就在很大程度上提高了對推薦內(nèi)容的精準(zhǔn)度的要求,不恰當(dāng)?shù)囊粍t短視頻會與上一則內(nèi)容之間產(chǎn)生明顯的違和感、突兀感,從而使得用戶無法沉浸在對內(nèi)容的流暢體驗(yàn)中。所以,在短視頻行業(yè)經(jīng)過了一年多的快速爆發(fā)和嚴(yán)厲整頓后,下半場的競爭將會更多地聚焦在推薦算法的競爭上,算法強(qiáng)則核心競爭力強(qiáng)、推薦精準(zhǔn)度高則市場占有率高將會成為短視頻領(lǐng)域競爭的殘酷法則。對于短視頻應(yīng)用而言,無論其推薦系統(tǒng)所采用的技術(shù)如何先進(jìn)或者其算法對不同維度的數(shù)據(jù)賦予的權(quán)重如何不同,其根本目的都是要最大化地實(shí)現(xiàn)內(nèi)容與用戶的精準(zhǔn)匹配,只有這樣它才可能在爭奪用戶注意力的戰(zhàn)場上勝出。
在這一點(diǎn)上,快手的思路是非常清晰的,它通過精準(zhǔn)刻畫用戶的意圖,組合運(yùn)用不同的算法來針對性地推薦個性化的視頻、全面地覆蓋用戶的不同需求,以期能夠提升其用戶的點(diǎn)擊率和觀看率。具體而言,在一位新用戶尚未注冊登陸的情況下,它在沒有形成一個較為完善的用戶畫像的時候,主要通過簡潔的界面、隨機(jī)的展示和體驗(yàn)友好的瀑布流等方式鼓勵用戶根據(jù)自身的興趣愛好選擇相應(yīng)的短視頻內(nèi)容。在用戶已經(jīng)點(diǎn)擊觀看了幾則短視頻內(nèi)容并刷新之后,推薦系統(tǒng)就會根據(jù)用戶已經(jīng)選擇的內(nèi)容向他展示更多與前幾條短視頻相類似的內(nèi)容。在用戶完成注冊并登錄之后,推薦系統(tǒng)主要通過組合“關(guān)注”“發(fā)現(xiàn)”和“同城”等幾種不同的推薦算法力圖做到用戶在不同場景下的不同內(nèi)容需求?!鞍l(fā)現(xiàn)”推薦的內(nèi)容綜合運(yùn)用了協(xié)同推薦系統(tǒng)和內(nèi)容過濾推薦系統(tǒng)兩種方式,前者通過歷史數(shù)據(jù)推斷用戶的興趣偏好并據(jù)此向用戶推薦新的內(nèi)容,而后者則主要向用戶推薦與他們之前看過的內(nèi)容高度相似的短視頻?!瓣P(guān)注”向用戶呈現(xiàn)的則是他已經(jīng)關(guān)注了的短視頻生產(chǎn)者創(chuàng)作的內(nèi)容,推薦系統(tǒng)也會根據(jù)這些內(nèi)容與用戶需求之間的匹配程度進(jìn)行排序。畢竟同一作者發(fā)布的內(nèi)容也可能截然不同,如果不利用算法進(jìn)行過濾就可能會直接影響用戶的體驗(yàn)。推薦系統(tǒng)會對發(fā)布的內(nèi)容進(jìn)行類型化和標(biāo)簽化,并利用機(jī)器快速地完善其畫像,然后再根據(jù)算法模型判斷這則視頻與該用戶之前觀看的視頻是否高度相似,從而決定是否向他推薦?!巴恰眲t是主要基于地理位置的遠(yuǎn)近來決定優(yōu)先向用戶推薦哪些短視頻內(nèi)容。利用多種算法進(jìn)行組合推薦的好處在于它可以在很大程度上規(guī)避掉單一算法可能存在的明顯不足,從而最大可能地向用戶提供符合其需求的短視頻推薦服務(wù)。此外,如果用戶使用微博賬號或者微信賬號登錄快手的話,推薦系統(tǒng)還會使用社會化過濾推薦系統(tǒng)向用戶推薦其社會化媒體中的好友看過、點(diǎn)贊過和評論過的短視頻內(nèi)容。
另外一款短視頻應(yīng)用抖音為了更好地連接內(nèi)容與用戶,也在其推薦算法上面花費(fèi)了大量的心思。有人將抖音對新上傳內(nèi)容的推薦方式總結(jié)為“賽馬機(jī)制”,其基本的邏輯是:向每一則新上傳的短視頻內(nèi)容隨機(jī)地分配一個比較平均的流量池,對這些新上傳視頻的綜合數(shù)據(jù)進(jìn)行比較,并進(jìn)一步向那些表現(xiàn)較好的視頻內(nèi)容分配一個更大的流量池,經(jīng)過幾輪疊加和不斷強(qiáng)化的推薦之后,抖音的爆款內(nèi)容也就出現(xiàn)了。當(dāng)然,這種推薦機(jī)制更多地是從打造爆款內(nèi)容的角度出發(fā),其思路在于:已經(jīng)有100W+的用戶喜歡這則短視頻內(nèi)容了,那么它是值得推薦給更多用戶的,沒看過這則短視頻的用戶或許也會喜歡。也恰恰正是這樣的思路使得抖音的推薦系統(tǒng)更多地向用戶推薦了那些看上去更熱門的內(nèi)容,而非更符合用戶真正需求的內(nèi)容。而為了解決推薦過程中存在的類似問題,抖音采用了“算法推薦+人工精選”的組合機(jī)制。一方面利用最新的機(jī)器學(xué)習(xí)技術(shù)設(shè)計(jì)相應(yīng)的算法規(guī)則,確保推薦系統(tǒng)能夠按照一定的頻率和節(jié)奏向用戶推薦相似短視頻,但同時將這種推薦控制在一定的限度之內(nèi)從而避免用戶產(chǎn)生審美疲勞。另一方面,抖音會經(jīng)常性地人工精選出不同類型、不同領(lǐng)域、不同作者的優(yōu)質(zhì)內(nèi)容,根據(jù)相應(yīng)的推薦規(guī)則和不同的用戶標(biāo)簽向他們推薦不同的精選內(nèi)容。隨著學(xué)術(shù)領(lǐng)域?qū)π畔⒗O房問題的深入探討以及政策層面對低俗內(nèi)容的強(qiáng)勢整頓,很多短視頻應(yīng)用也逐漸意識到自身推薦系統(tǒng)存在的各類瑕疵并加大力度完善其算法。事實(shí)上,好的推薦算法并不是站在流量經(jīng)濟(jì)的立場上一味迎合并向用戶推薦相似度很高的內(nèi)容,而是要從更多元化的角度向他針對性地推薦其視野范圍之外的有價值內(nèi)容。
算法推薦的最重要價值在于它能夠提高內(nèi)容分發(fā)的效率,尤其是在今天內(nèi)容產(chǎn)品以爆炸式的速度增長的語境之下,無論對于用戶需求還是對于內(nèi)容本身,個性化推薦系統(tǒng)無疑都是一個實(shí)現(xiàn)精準(zhǔn)匹配、解決信息過載問題的重要手段。具體到影視領(lǐng)域,個性化推薦系統(tǒng)的價值也是顯而易見的。今天的用戶在互聯(lián)網(wǎng)上消費(fèi)影視產(chǎn)品的時候,他們面對的是數(shù)十萬乃至上百萬部影視作品的巨大庫存,而且這個數(shù)字每年還在陸續(xù)地增加。單就國內(nèi)來看,從2012-2017過去的五年間,我國的電影產(chǎn)量年均超過1000部、電視劇產(chǎn)量年均超過10000集。如果一名用戶每天24小時不吃不睡只用來觀看這些新增的影視作品,他的時間都是不夠用的。在過去,幾乎所有的視頻網(wǎng)站都傾向于采用熱門影視劇推薦的方式向所有用戶進(jìn)行千篇一律的內(nèi)容推薦,舉例而言,用戶A和用戶B登錄某一家視頻網(wǎng)站的時候,在兩位用戶的登錄首頁所看到的推薦作品是一樣的,幾乎都是最近一段時間比較熱門的影視劇集,視頻網(wǎng)站并不會因?yàn)閮晌挥脩舻牡男詣e、年齡、地域、職業(yè)、興趣等差異化的屬性向他們分別推薦更符合他們各自口味的影像內(nèi)容。這就會導(dǎo)致所有視頻網(wǎng)站的幾乎絕大部分流量都流向少數(shù)的所謂“頭部”內(nèi)容,出現(xiàn)80/20現(xiàn)象:即80%的流量流向了20%的熱門作品,其余80%的作品分享了剩余的20%流量。這種粗放式的經(jīng)營方式在過去個性化推薦技術(shù)尚不流行的時代還有其生存的空間,但是隨著流量紅利的褪去以及內(nèi)容產(chǎn)業(yè)競爭的加劇,面向用戶進(jìn)行的更集約化、更精準(zhǔn)化的運(yùn)營方式對影視作品的個性化推薦系統(tǒng)提出了更高的要求,算法推薦也成為影視作品分發(fā)環(huán)節(jié)的標(biāo)配。
從國際上看,Netflix在全球范圍內(nèi)都可以算得上較早進(jìn)行影像內(nèi)容個性化推薦的先行者,它從2006年懸賞百萬美元進(jìn)行推薦算法大賽開始,就一直致力于不斷優(yōu)化面向用戶消費(fèi)需求的影像內(nèi)容推薦系統(tǒng),并取得了令人矚目的業(yè)績。截至到2017年12月31日,Netflix全球用戶總數(shù)已經(jīng)達(dá)到1.1758億人,其中付費(fèi)用戶超過6000萬,每天在其網(wǎng)站上的觀看時長超過1億小時,這在很大程度上得益于其面向用戶進(jìn)行個性化匹配的算法推薦系統(tǒng)。更值得一提的是,根據(jù)Netflix官方的粗略估算,其推薦系統(tǒng)每年為它節(jié)約的運(yùn)營費(fèi)用為10億美元左右。正是因?yàn)镹etflix對其推薦系統(tǒng)的高度自信,所以它大膽地在用戶登錄的首頁就采用了個性化的推薦算法,用戶登陸后首先看到的不是熱門影視內(nèi)容的推薦,而是為每名用戶量身打造的差異化內(nèi)容呈現(xiàn)。
事實(shí)上,這一策略也為Netflix帶來了很好的回報(bào):用戶的平均每3個小時的視頻播放時長中就有2個小時是來自于用戶登錄首頁的個性化推薦內(nèi)容。為了減少用戶漫無目的進(jìn)行內(nèi)容搜索與過濾的時間,Netflix綜合運(yùn)用了多種算法在登陸首頁的最重要位置進(jìn)行推薦,針對每位不同的用戶都會有40行個性化的影視作品可供瀏覽選擇,每行又有75部根據(jù)不同算法、不同標(biāo)簽和不同需求組合而成的推薦列表,而且每一部作品都清晰直白地向用戶說明了為什么進(jìn)行推薦的理由,例如用戶喜歡的演員陣容或網(wǎng)絡(luò)評分等。涉及到具體的推薦算法,Netflix會根據(jù)用戶的瀏覽記錄選擇相似的影像作品進(jìn)行推薦、會根據(jù)內(nèi)容排行榜的短期熱點(diǎn)和周期性熱點(diǎn)進(jìn)行推薦、會根據(jù)繼續(xù)觀看的場景和用戶搜索的場景進(jìn)行推薦、會根據(jù)付費(fèi)用戶更加個人化的興趣點(diǎn)進(jìn)行推薦等。通過近幾年不斷改進(jìn)和優(yōu)化自身的算法,Netflix已經(jīng)顯著提高了它向用戶推薦的影視作品的接受度,提升了這些內(nèi)容的被播放比率。
除了Netflix之外,YouTube也是全球范圍內(nèi)在影像領(lǐng)域運(yùn)用推薦系統(tǒng)進(jìn)行個性化分發(fā)的典型企業(yè)。2016年在美國波士頓舉辦的第十屆全球ACM推薦系統(tǒng)大會上,谷歌的研發(fā)團(tuán)隊(duì)發(fā)表了一篇題為《YouTube推薦系統(tǒng)中的深度學(xué)習(xí)網(wǎng)絡(luò)》的論文,首次詳細(xì)地公布了YouTube如何運(yùn)用深度學(xué)習(xí)策略提升其推薦效果的技術(shù)細(xì)節(jié)?!案雀杵渌I(lǐng)域的產(chǎn)品一樣,YouTube同樣經(jīng)歷了用深度學(xué)習(xí)來解決所有通用學(xué)習(xí)問題的根本性范式轉(zhuǎn)變?!边@也就意味著,推薦系統(tǒng)將會針對用戶的歷史數(shù)據(jù)、即時場景以及各種其他復(fù)雜因素的不斷變化而動態(tài)性地調(diào)整其所推薦的內(nèi)容列表。
國內(nèi)以影視作品為主的互聯(lián)網(wǎng)企業(yè)在推薦算法方面起步較晚,2006年Netflix嘗試運(yùn)用推薦系統(tǒng)進(jìn)行作品分發(fā)的時候,國內(nèi)的優(yōu)酷、土豆等視頻網(wǎng)站剛剛成立。盡管如此,國內(nèi)的互聯(lián)網(wǎng)企業(yè)近幾年來也快速地在自身的業(yè)務(wù)領(lǐng)域加大了應(yīng)用推薦系統(tǒng)的力度。例如,優(yōu)酷在其首頁上線了“優(yōu)酷懂你”,向用戶宣稱看得越多其推薦的內(nèi)容便會越符合用戶的口味;騰訊視頻上線了“你的專屬頻道”,通過算法為每位用戶精挑細(xì)選量身打造一個個性化的內(nèi)容頻道;愛奇藝上線了“猜你喜歡”,以期借助于對過往瀏覽數(shù)據(jù)的挖掘找到用戶可能會喜歡的同類內(nèi)容;豆瓣的電影頻道則專注于通過用戶的“興趣圖譜”來挖掘標(biāo)簽體系和社交關(guān)系對于個性化影視作品推薦的巨大價值。事實(shí)上,未來的影視作品分發(fā)領(lǐng)域,版權(quán)和算法將是各大互聯(lián)網(wǎng)企業(yè)能否在激烈的市場競爭環(huán)境下持續(xù)保持優(yōu)勢地位的兩大關(guān)鍵要素。而隨著數(shù)據(jù)挖掘、深度學(xué)習(xí)和人工智能技術(shù)不斷地迭代進(jìn)化,應(yīng)用層面對于“千人千面”分發(fā)策略的不斷完善也將推動著個性化推薦系統(tǒng)向著它的理想狀態(tài)演進(jìn),從而使得內(nèi)容平臺方對用戶的服務(wù)模式也逐漸從過去的主觀臆斷向基于數(shù)據(jù)的客觀預(yù)測轉(zhuǎn)變。
在一篇題為《2018年傳媒業(yè)技術(shù)趨勢報(bào)告》的文章中,未來今日研究所提到了作為傳媒從業(yè)者我們應(yīng)該重點(diǎn)關(guān)注的75個重要技術(shù)發(fā)展趨勢,這其中的很多趨勢與我們今天所提及的個性化推薦系統(tǒng)和智能算法息息相關(guān),例如深度學(xué)習(xí)、機(jī)器閱讀理解、計(jì)算傳播學(xué)、5G通信網(wǎng)絡(luò)等,這些技術(shù)都在以前所未有的程度影響著當(dāng)前的影像內(nèi)容乃至更多信息產(chǎn)品的分發(fā)模式朝著更加智能化的方向演進(jìn)。舉例而言,實(shí)時機(jī)器學(xué)習(xí)技術(shù)(Real-Time Machine Learning)意味著已經(jīng)開發(fā)出來的計(jì)算機(jī)算法和智能硬件完全可以做到在獲取數(shù)據(jù)的同時馬上根據(jù)已經(jīng)取得的這些數(shù)據(jù)調(diào)整相應(yīng)的模型了。在這樣的前提下,真正能夠稱得上個性化的推薦算法就可以根據(jù)用戶當(dāng)前在手機(jī)應(yīng)用(如抖音或騰訊視頻)的瀏覽速度、關(guān)注焦點(diǎn)、乃至用戶情緒進(jìn)行更加精準(zhǔn)的內(nèi)容推薦,或者實(shí)時調(diào)整頁面的字體、顏色、風(fēng)格以更適應(yīng)不同用戶的觀看習(xí)慣。再如,這個研究所進(jìn)行的更有意思的一項(xiàng)研究是,它的科學(xué)家正在訓(xùn)練機(jī)器人觀看電視節(jié)目,而且在觀看了大量的YouTube視頻以及類似《絕望的主婦》這樣的電視劇之后,這臺基于人工智能的機(jī)器人設(shè)備已經(jīng)能夠非常準(zhǔn)確地預(yù)測視頻中的人物的下一個動作將要握手、擊掌、擁抱或者親吻了。這就意味著算法可以根據(jù)對影像內(nèi)容的預(yù)測以及對用戶需求的預(yù)測實(shí)時地調(diào)整其所推薦內(nèi)容的播放速度以更加符合用戶的觀看體驗(yàn)。
事實(shí)上,無論是影像內(nèi)容的分發(fā)環(huán)節(jié),還是信息產(chǎn)品的產(chǎn)消流程,都將在已經(jīng)開啟的算法時代進(jìn)行本質(zhì)上的重構(gòu)。推薦系統(tǒng)、人工智能、深度學(xué)習(xí)等技術(shù)創(chuàng)新背后的全新邏輯正在以更加廣泛、更加深刻和更加具體的方式重塑著信息、內(nèi)容、傳播等領(lǐng)域的理論基礎(chǔ)和現(xiàn)實(shí)基礎(chǔ),改造著我們通過媒體手段、內(nèi)容產(chǎn)品和傳播方式所建立起來的自身與他人之間的互動關(guān)系,并從根本上升華著每位用戶的世界觀和方法論。通過全新的算法邏輯和智能生態(tài),推薦系統(tǒng)能更精確地依靠目標(biāo)人群的興趣圖譜、用戶畫像和標(biāo)簽體系實(shí)現(xiàn)精準(zhǔn)匹配,從而實(shí)現(xiàn)由“人找信息”到“信息找人”的本質(zhì)性轉(zhuǎn)變。因此在未來的理想化的內(nèi)容分發(fā)和信息傳播景觀中,任何非智能化、非個性化的內(nèi)容推薦都在一定程度上可以被視為某種信息噪音,而如何過濾這些噪音則是推薦系統(tǒng)不斷進(jìn)化的核心使命。