近年來,算法推薦在商業(yè)媒體平臺中獲得巨大成功,對信息傳播的作用日益凸顯。但商業(yè)媒體算法以追求流量為目標(biāo),一味迎合用戶喜好,不可避免帶來信息繭房、內(nèi)容低俗化等問題。主流媒體承擔(dān)著引領(lǐng)導(dǎo)向、成風(fēng)化人等職責(zé)使命,無法照搬商業(yè)媒體算法,必須建立符合主流媒體特點(diǎn)的先進(jìn)算法技術(shù)。總臺算法建立內(nèi)容感知能力,自動(dòng)感知當(dāng)前部署的宣傳內(nèi)容和精品內(nèi)容,通過多模態(tài)混合推薦技術(shù)與用戶喜好內(nèi)容靈活融合,讓算法驅(qū)動(dòng)思想性、藝術(shù)性和商業(yè)性的協(xié)調(diào)統(tǒng)一。
2019年1月25日,在十九屆中央政治局第十二次集體學(xué)習(xí)時(shí),習(xí)近平總書記明確指出:“我們要增強(qiáng)緊迫感和使命感,推動(dòng)關(guān)鍵核心技術(shù)自主創(chuàng)新不斷實(shí)現(xiàn)突破,探索將人工智能運(yùn)用在新聞采集、生產(chǎn)、分發(fā)、接受、反饋中,用主流價(jià)值導(dǎo)向駕馭‘算法’,全面提高輿論引導(dǎo)能力?!?/p>
近年來,總臺在新媒體建設(shè)的過程中積極研發(fā)總臺算法,并將其納入總臺“十四五”科技發(fā)展規(guī)劃和媒體深度融合發(fā)展三年行動(dòng)計(jì)劃中。2021年,總臺算法率先在總臺兩大旗艦新媒體平臺之一的央視頻上線應(yīng)用,取得良好效果,未來將逐步向全臺新媒體推廣。
“信息繭房”的概念最初是哈佛大學(xué)教授桑斯坦在2006年出版的《信息烏托邦》一書中提出的,其含義是,受眾出于天性偏向關(guān)注自己熟悉或喜歡的信息,久而久之,形成個(gè)人的信息壁壘,好像作繭自縛。
在算法日益普及的當(dāng)下,人的注意力被引導(dǎo)線索、社會關(guān)系和獎(jiǎng)勵(lì)因子牽引影響,其背后是媒體平臺這一推手。算法如一味投受眾所好,則更容易加劇信息繭房現(xiàn)象。商業(yè)媒體平臺往往僅根據(jù)用戶喜好這樣的單一維度參數(shù),不斷強(qiáng)化同類信息投送;與之相對,打破信息繭房,將內(nèi)容導(dǎo)向與用戶喜好有機(jī)融合,則是主流媒體平臺所追求的。
此外,相比于商業(yè)媒體對于信息質(zhì)量甄別門檻較低,易于陷入低俗化誤區(qū),主流媒體平臺是優(yōu)質(zhì)內(nèi)容的信任背書。主流媒體算法需要從海量內(nèi)容中篩選出優(yōu)質(zhì)的精品內(nèi)容進(jìn)行推薦,使得這些內(nèi)容展現(xiàn)在受眾眼前,得到更廣泛的傳播。
智媒體時(shí)代,主流媒體算法擔(dān)負(fù)了更重大的社會責(zé)任。一方面,要在持續(xù)供給優(yōu)質(zhì)精品內(nèi)容的同時(shí),向用戶主動(dòng)推薦更具公共價(jià)值的信息,盡可能地矯正用戶“偏食”,打破信息繭房;另一方面,要在吸取商業(yè)算法可行經(jīng)驗(yàn)的同時(shí),形成具有多維度價(jià)值取向的新算法,從借鑒到超越,實(shí)現(xiàn)破繭成蝶。
平臺算法對于信息篩選與展現(xiàn)方式起到?jīng)Q定性的作用。自2021年開始在央視頻平臺應(yīng)用以來,總臺算法持續(xù)優(yōu)化信息的呈現(xiàn)方式,兼顧信息環(huán)境均衡,幫助用戶突破信息繭房,促進(jìn)更良性、更多樣的內(nèi)容生態(tài)形成。
總臺算法平臺的整體方案由引擎系統(tǒng)、算法工作臺、算法測試系統(tǒng)和知識結(jié)構(gòu)四部分組成。這四部分的閉環(huán)結(jié)構(gòu)形成了獨(dú)特的運(yùn)行機(jī)制,實(shí)現(xiàn)了總臺算法的可用、可管、可控。(見圖1)
推薦引擎是進(jìn)行數(shù)據(jù)處理與推薦計(jì)算的核心系統(tǒng),通過大數(shù)據(jù)與人工智能技術(shù)驅(qū)動(dòng)優(yōu)質(zhì)內(nèi)容與用戶精準(zhǔn)匹配,是算法推薦的“發(fā)動(dòng)機(jī)”??偱_算法的推薦引擎基于深度學(xué)習(xí)模型建立技術(shù)框架,其中,多路召回、多目標(biāo)學(xué)習(xí)等是關(guān)鍵模型,模型的多樣化有助于避免過于單一的考量維度窄化篩選范圍。多路召回綜合了用戶興趣、宣傳引導(dǎo)、共性熱點(diǎn)等多種因子進(jìn)行粗排序;多目標(biāo)學(xué)習(xí)兼顧播放次數(shù)、播放時(shí)長、曝光次數(shù)、完播率、用戶留存等多指標(biāo)變化,避免陷入對一個(gè)或幾個(gè)指標(biāo)的片面追求。此外,推薦引擎中還設(shè)入重排模型,對于粗排和精排進(jìn)行糾偏,保證黃金池、精品池節(jié)目必須占據(jù)一定的曝光率。
圖1
圖2
算法工作臺,是總臺算法區(qū)別于商業(yè)媒體平臺的重要應(yīng)用創(chuàng)新,是打通媒資系統(tǒng)的樞紐,如同 “駕駛艙”。算法工作臺具有智能運(yùn)營輔助功能,推薦引擎關(guān)鍵環(huán)節(jié)的模型在此封裝為預(yù)設(shè)的算法規(guī)則,經(jīng)由算法工作臺發(fā)出控制信號調(diào)用算法規(guī)則,從而干預(yù)算法推薦的運(yùn)行過程。目前,總臺算法工作臺可為運(yùn)營人員提供賬號和視頻內(nèi)容兩個(gè)維度的干預(yù)能力,可以對推薦結(jié)果進(jìn)行人工強(qiáng)干預(yù),以彌補(bǔ)機(jī)器只能識別標(biāo)簽和點(diǎn)擊量,而無法準(zhǔn)確判斷內(nèi)容價(jià)值的弊端。此外,算法工作臺不僅能夠?qū)偱_算法實(shí)際效果進(jìn)行跟蹤和比對,還聚合了微信、微博、抖音、快手、頭條、B站等商業(yè)平臺熱門內(nèi)容,為熱點(diǎn)運(yùn)營提供參考。
AB-test算法測試系統(tǒng)是算法效果驗(yàn)證系統(tǒng)。首先基于算法測試系統(tǒng)使客戶端用戶分流為實(shí)驗(yàn)組和非實(shí)驗(yàn)組用戶,抽取一部分樣本通過隨機(jī)方式分流給策略A和策略B,得出量化數(shù)值進(jìn)行對照。A/B測試對照實(shí)驗(yàn)主要觀測用戶類指標(biāo)、播放類指標(biāo)、曝光類指標(biāo)這三大類28項(xiàng)指標(biāo)(含11項(xiàng)重點(diǎn)指標(biāo))。通過對比人均播放、停留、曝光這些數(shù)據(jù)指標(biāo),評判各個(gè)版本的效果優(yōu)劣,從而支撐運(yùn)營策略和算法策略調(diào)整。
內(nèi)容大數(shù)據(jù)和用戶大數(shù)據(jù)是總臺算法的“底盤”,對總臺的節(jié)目內(nèi)容和用戶畫像進(jìn)行數(shù)據(jù)化關(guān)聯(lián),使內(nèi)容和用戶特征與數(shù)據(jù)緊密“糾纏”在一起,形成知識結(jié)構(gòu)。對內(nèi)容而言,在創(chuàng)作階段、傳播階段、畫像階段和運(yùn)營階段,會相應(yīng)產(chǎn)生推薦曝光數(shù)據(jù)、熱度畫像、內(nèi)容元數(shù)據(jù)、標(biāo)簽數(shù)據(jù)、標(biāo)準(zhǔn)化數(shù)據(jù)等。在用戶畫像方面,從地理位置、設(shè)備信息、生命周期、社會屬性、內(nèi)容偏好、形態(tài)偏好、行為心理等維度被賦予各種標(biāo)簽元數(shù)據(jù)。這些數(shù)據(jù)是算法推薦的重要基礎(chǔ)。(見圖2)
從算法學(xué)習(xí)的角度看,總臺算法比商業(yè)媒體平臺算法更為復(fù)雜。對于商業(yè)媒體算法,提升流量是唯一目標(biāo),通過以“投其所好”為目的的內(nèi)容推薦,快速獲取用戶流量,滾雪球式做大數(shù)據(jù),再以大數(shù)據(jù)喂養(yǎng)算法,不斷進(jìn)行算法迭代。而總臺算法的參照系有主流價(jià)值、藝術(shù)價(jià)值、商業(yè)價(jià)值三條坐標(biāo)軸,這種升維躍遷,是對算法的巨大考驗(yàn)。
好的算法不僅要精準(zhǔn),更要兼具靈活性、預(yù)測性和多元性。這不僅對于打破信息繭房具有意義,更是充分理解并考慮到了人性中共存的矛盾。如,用戶在某個(gè)時(shí)段內(nèi)偏好相對穩(wěn)定,而時(shí)過境遷,偏好又發(fā)生了轉(zhuǎn)移或擴(kuò)展;用戶雖然喜歡被“熟悉”與“滿足”包圍,但也需要“奇遇”和“驚喜”,去開拓視野發(fā)現(xiàn)世界的多面。總臺算法以小步迭代、人機(jī)協(xié)同、分眾分類等方式,逐步接近理想目標(biāo)。
1.小步快跑,不斷優(yōu)化
總臺算法通過不斷測試、小步迭代實(shí)現(xiàn)學(xué)習(xí)、成長,進(jìn)而達(dá)到大規(guī)模穩(wěn)定應(yīng)用的目標(biāo)。
上線以來,總臺算法經(jīng)歷了從V1.0、V1.1、V1.2到V1.3的四次迭代升級。總臺算法在央視頻平臺上的建設(shè),首先在央視頻影視板塊開始應(yīng)用,然后逐漸推廣到綜藝、音樂、少兒、動(dòng)漫、汽車、美食、文史、紀(jì)錄、法治等10個(gè)垂直內(nèi)容板塊。在垂類板塊積累了應(yīng)用經(jīng)驗(yàn)之后,再在央視頻首頁上線,替換原有的首頁推薦邏輯。目前,每天有5%的央視頻首頁用戶被選中成為總臺算法的使用者,他們的使用數(shù)據(jù)將成為對照數(shù)據(jù),為總臺算法的進(jìn)一步優(yōu)化提供依據(jù)。
下一步,總臺算法將逐步實(shí)現(xiàn)垂類和首頁的全覆蓋,并向全臺新媒體平臺推廣。目前圍繞總臺算法建設(shè),總臺正在研究制定融媒體大數(shù)據(jù)標(biāo)準(zhǔn),為建設(shè)總臺的融媒體用戶畫像倉庫,支持總臺算法的全面應(yīng)用打下基礎(chǔ)。
2.人機(jī)協(xié)同,融合價(jià)值
算法本身只是一種先進(jìn)的技術(shù),但算法的設(shè)計(jì)者和運(yùn)用者天然帶有價(jià)值立場,因而算法背后的導(dǎo)向決定了內(nèi)容推薦的價(jià)值取向??偱_算法將主流價(jià)值植入算法之中,使算法推薦與主流媒體的運(yùn)營緊密協(xié)同,為算法掌舵,以導(dǎo)向駕馭算法。
混合編排是央視頻應(yīng)用總臺算法的一大特色??蛻舳苏闲麄鲀?nèi)容與算法推薦內(nèi)容兩個(gè)內(nèi)容流,將兩種內(nèi)容打散混合,實(shí)現(xiàn)價(jià)值導(dǎo)向均衡。運(yùn)行流程包括三個(gè)環(huán)節(jié):一是首次的算法初始化,選擇“主品類”或“主賬號”模式,配置品類,配置賬號;二是日常的混合編排,人工編排節(jié)目并固定位置,其余交給算法;三是偶爾的內(nèi)容提權(quán)或屏蔽,宣推的內(nèi)容加入黃金池提權(quán),對不宜的內(nèi)容通過標(biāo)簽批量屏蔽或單個(gè)屏蔽。
隨著總臺算法在央視頻平臺的各個(gè)業(yè)務(wù)板塊逐步鋪開,針對版權(quán)長視頻、feeds流(短視頻信息流)、直播等業(yè)務(wù)形態(tài)分別進(jìn)行了推薦引擎的細(xì)化拆分,使得每項(xiàng)業(yè)務(wù)更有針對性。在直播推薦上更注重共性熱點(diǎn),在短視頻推薦上更注重興趣選擇,在版權(quán)長視頻推薦上則以精品內(nèi)容為主,爭取用戶對劇集的連續(xù)收看。“短帶長”是總臺算法的一個(gè)特色功能,對于二次創(chuàng)作的短視頻,通過AI能力關(guān)聯(lián)上對應(yīng)的電影、電視劇、綜藝節(jié)目,便于用戶的關(guān)聯(lián)播放。
總臺算法組合使用多樣性打散、特征工程和冷啟動(dòng)模塊,一旦察覺用戶的興趣過度收斂,適當(dāng)插入正能量內(nèi)容和陌生領(lǐng)域內(nèi)容,對新的興趣點(diǎn)進(jìn)行試探和引導(dǎo)。
3.分眾匹配,分類關(guān)聯(lián)
總臺算法基于用戶洞察和內(nèi)容感知,實(shí)施用戶分眾化匹配和不同節(jié)目類別的分類關(guān)聯(lián)。
用戶分眾化是個(gè)性化推薦的前提,總臺算法首先基于興趣、地域、生命周期等特征維度對受眾進(jìn)行人群劃分,然后按照分類熱點(diǎn)內(nèi)容進(jìn)行推薦匹配。如,對追劇分眾用戶推薦正在追的劇目,對防疫重點(diǎn)地區(qū)受眾推薦當(dāng)?shù)刈钚乱咔閯?dòng)態(tài),對央視精品欄目受眾推薦更多的類似精品欄目等。這一策略可以在受眾行為數(shù)據(jù)尚不夠多的冷啟動(dòng)階段,發(fā)揮基礎(chǔ)作用,而接下來就可以根據(jù)用戶的進(jìn)一步點(diǎn)播瀏覽動(dòng)作判斷其興趣,進(jìn)行個(gè)性化推薦服務(wù)。
圖3
圖4
總臺算法對主題宣傳、精品節(jié)目和個(gè)性化節(jié)目實(shí)行不同的分類算法,并盡量兼顧各個(gè)類別之間的比例平衡。對于重大主題宣傳類節(jié)目,采用內(nèi)容感知算法,即按照主題選取通過臺內(nèi)審核的報(bào)道內(nèi)容,作為種子節(jié)目,建立“節(jié)目—節(jié)目”的直接關(guān)聯(lián),訓(xùn)練學(xué)習(xí)出更多的相關(guān)節(jié)目,推動(dòng)宣推鋪開。對于總臺精品節(jié)目的分類算法,則添加受眾喜好這一因子,在第一階段分眾推送之后,根據(jù)受眾反饋信息,篩選出最受歡迎的100個(gè)左右精品節(jié)目,作為種子訓(xùn)練學(xué)習(xí)出更多的相關(guān)節(jié)目,精準(zhǔn)擴(kuò)大精品節(jié)目庫。同時(shí),在不同節(jié)目類別之間實(shí)行多賽道混合推薦算法,按照“宣推、精品、個(gè)性化”三個(gè)賽道分別計(jì)算、召回,再在各個(gè)賽道間進(jìn)行均衡混合,實(shí)現(xiàn)主流價(jià)值、藝術(shù)價(jià)值和商業(yè)價(jià)值內(nèi)容的有機(jī)融合。
自總臺算法在央視頻逐漸鋪開以來,影視、綜藝、少兒、音樂等10多個(gè)業(yè)務(wù)板塊播放次數(shù)、播放時(shí)長、次日留存等指標(biāo)均呈現(xiàn)較大程度增長。近半年統(tǒng)計(jì)數(shù)據(jù)顯示,播放時(shí)長增長幅度最為明顯,在綜藝、動(dòng)漫、少兒、音樂、文史等垂類實(shí)現(xiàn)翻番,即增長超過100%,而在影視、紀(jì)錄、法治等板塊增長也超過60%。播放次數(shù)和次日留存指標(biāo)在動(dòng)漫、音樂、綜藝、少兒等板塊增長最為明顯,其中,動(dòng)漫板塊播放次數(shù)增長達(dá)到72%,音樂板塊播放次數(shù)增長49%。次日留存在動(dòng)漫板塊增長達(dá)40%,綜藝板塊增長也接近40%。(見圖3)
2022年4月以來,總臺算法在央視頻首頁也獲得了較好應(yīng)用效果。無論是在算法推薦位范圍內(nèi),還是將算法推薦與人工編排相混合,對比算法組和對照組,在曝光人均VD(播放時(shí)長)、曝光人均VV(播放次數(shù))、CTR(點(diǎn)擊通過率)、UTR(用戶轉(zhuǎn)化率)、人均曝光次數(shù)、完播率等各項(xiàng)指標(biāo),算法的運(yùn)用均帶來不同程度提升。(見圖4)
持續(xù)不斷優(yōu)化完善總臺算法,是總臺作為主流媒體的職責(zé)所在,也是媒體融合的實(shí)際需求。當(dāng)前,主流媒體算法依然面臨著許多挑戰(zhàn),在提高數(shù)據(jù)資源數(shù)量和提升技術(shù)發(fā)展水平等方面還有較大的增長空間。首先,必須盡可能做大內(nèi)容資源和用戶數(shù)據(jù)。大數(shù)據(jù)是滋養(yǎng)算法成長的重要“原材料”,也是實(shí)現(xiàn)精準(zhǔn)推薦的前提。如今,商業(yè)平臺通過用戶生成內(nèi)容形成海量內(nèi)容庫,相比之下,主流媒體的節(jié)目內(nèi)容資源更顯“少而精”。其次,主流媒體平臺的用戶規(guī)模與商業(yè)媒體平臺相比尚存在一定差距。因此,主流媒體應(yīng)盡可能生產(chǎn)出更多優(yōu)質(zhì)產(chǎn)品、豐富產(chǎn)品樣態(tài),擴(kuò)大內(nèi)容資源池。第三,打出內(nèi)容感召、有效宣推的組合拳,吸引更多用戶進(jìn)入平臺,形成人氣聚集的良性循環(huán)。
應(yīng)持續(xù)提高技術(shù)自主創(chuàng)新能力,使主流媒體的算法技術(shù)水平具備強(qiáng)大的競爭力。優(yōu)化信息識別精度,考慮為節(jié)目內(nèi)容打更多、更細(xì)分的標(biāo)簽,讓產(chǎn)品畫像更精準(zhǔn),更準(zhǔn)確地匹配到不同類型、不同偏好的用戶。持續(xù)升級算法技術(shù),繼續(xù)推進(jìn)算法工作臺新增數(shù)據(jù)統(tǒng)計(jì)工具、用戶畫像展示等功能開發(fā),進(jìn)一步研究推進(jìn)知識圖譜等相關(guān)技術(shù)應(yīng)用,推進(jìn)擴(kuò)充搜索環(huán)節(jié)周延內(nèi)容、優(yōu)化搜索結(jié)果相關(guān)功能,以技術(shù)賦能提升用戶體驗(yàn)。