陳丹
“當前,愛奇藝基于機器學習的多時間窗口預測中,電影票房預測,提前半年方差準確率為77%;電視劇流量預測方面,提前半年到1年方差準確率為88%?!睈燮嫠噭?chuàng)始人、CEO龔宇最近在幾個不同的場合都提到這組數(shù)據(jù)。
“愛奇藝的愿景是做以科技創(chuàng)新為驅(qū)動的偉大娛樂公司,驅(qū)動力不僅來自內(nèi)容創(chuàng)意,同時來自科技創(chuàng)新。科技創(chuàng)新‘這臺機器正大幅提高社會生產(chǎn)效率,創(chuàng)造巨大的娛樂市場。同時,AI(人工智能)技術(shù)的運用也使得愛奇藝深刻理解內(nèi)容、用戶和合作伙伴多方需求?!饼徲畋硎?,人工智能的算法已經(jīng)貫穿愛奇藝劇本創(chuàng)作、選角、流量預測、審核、編碼、剪輯、運營、搜索、推薦、宣發(fā)、熱點預測、熱點提取、追星、廣告投放、在線交互等諸多環(huán)節(jié)。
助力內(nèi)容決策
愛奇藝首席技術(shù)官湯興告訴《綜藝報》,針對在愛奇藝平臺播出的所有內(nèi)容,愛奇藝有一套多時間窗口預測模型,時間窗口通常為半年到1年?!拔覀儧Q定買某個版權(quán)的時間通常會提前半年到一年,需要精確知道這個劇或者綜藝未來能夠帶來多少流量。”湯興介紹,流量預測模型參考的因素極多且非常復雜,包括社會輿論、對該IP的討論度、粉絲群體的反饋、前期宣發(fā)效果,以及題材、角色和平臺的擬合度等,甚至排播形式的不同也會產(chǎn)生不同的模型。“這個模型的數(shù)據(jù)來源也很復雜,包括觀影數(shù)據(jù)、搜索數(shù)據(jù)、社交行為、輿論監(jiān)督等,我們需要監(jiān)控整個互聯(lián)網(wǎng)的輿情?!?/p>
目前,愛奇藝這套流量預測系統(tǒng)的準確率還在持續(xù)上升?!暗降资裁磿r候達到極限,我們目前不知道。它得出的是統(tǒng)計范疇上的準確度。內(nèi)容上線之后,模型可以快速修正,一星期之后對流量的預測可以到93%-97%的精準率。這種預測能解決的實際問題是——你做100次決定,我能保證你80次都對,但不能保證你其中某一次肯定對?!睖d表示。
這套算法系統(tǒng)的意義不僅僅在于預測流量,也為愛奇藝節(jié)目制作提供了參考指標,能反過來指導節(jié)目策劃。典型的例子是《中國有嘻哈》,愛奇藝在小眾音樂領(lǐng)域,大投入做了這檔音樂節(jié)目,并獲得成功。這在外界看來有“賭”的成分。其實,節(jié)目背后,愛奇藝的數(shù)據(jù)分析系統(tǒng)亦提供了決策幫助。節(jié)目籌備之前,愛奇藝分析了嘻哈在年輕人群中的滲透率——“非常之高”;分析了嘻哈粉絲的受教育程度——同樣“非常之高”,這些特點有助于分析嘻哈這種小眾文化類型在中國的發(fā)展?jié)摿??!斑@個品類(嘻哈)在中國社會是有發(fā)展基礎的,這些都是我們后臺系統(tǒng)分析得出的結(jié)論,利用同樣的邏輯,我們正在準備三檔大節(jié)目。”龔宇在今年的百度世界大會上透露。
提升營銷效率 深度理解用戶
在愛奇藝的營銷側(cè)和用戶側(cè),AI技術(shù)同樣應用廣泛。
在營銷領(lǐng)域,愛奇藝利用AI技術(shù)進行場景識別和商品識別。譬如,在直播場景中,愛奇藝營銷部門可以把畫面中實際出現(xiàn)的礦泉水瓶換成另一個廣告客戶的產(chǎn)品。龔宇說:“這些都能實時完成,即使畫面移動,用戶也看不出這是一個應用了人工智能技術(shù)替換過的產(chǎn)品。”再譬如,愛奇藝曾做過一個案例,當視頻畫面中出現(xiàn)吃飯情景,旁邊就會出現(xiàn)百度外賣的圖標,這也得益于AI技術(shù)。
“視頻目前最主要的變現(xiàn)形式是通過信息流,而衡量信息流最重要的一個標準是精準度?!睖d告訴《綜藝報》,現(xiàn)在很多廣告都通過點擊量付費,單純的廣告展示并不能帶來收入。因此,廣告推送的一定得是用戶感興趣的內(nèi)容,AI技術(shù)需要識別廣告的品類、推送人群的屬性以及附著內(nèi)容的標簽?!斑@三項標簽之間匹配度越高,轉(zhuǎn)化率也越高?,F(xiàn)在的信息流廣告非常依賴AI技術(shù)的更新?lián)Q代,算法提高了一個點,轉(zhuǎn)化率就會提升一個點?!?/p>
作為愛奇藝首席技術(shù)官的湯興亦是泡泡社區(qū)創(chuàng)始人。經(jīng)過兩年發(fā)展,泡泡社區(qū)目前日活躍用戶最大值為6849萬。AI技術(shù)也深度應用于泡泡社區(qū)的日常運營。如何基于不同對泡泡圈子(泡泡社區(qū)內(nèi)部不同的社群)分發(fā)適合的內(nèi)容,包括圖文、視頻、評論、新聞資訊等,需要建立清晰的用戶畫像,同時構(gòu)建推送內(nèi)容的標簽體系,這一過程,湯興稱之為“AI驅(qū)動的媒體內(nèi)容分發(fā)”。在他看來,目前所謂AI的應用,只是對傳統(tǒng)內(nèi)容(例如簡單圖文)的理解,而對視頻內(nèi)容的理解及標注對AI技術(shù)提出了更高要求?!叭撕苋菀卓偨Y(jié)一個視頻講的是什么,這對于機器卻非常難做到,只有當機器可以總結(jié)一個視頻的內(nèi)容大意時,才是真正的視頻理解,這是AI最關(guān)鍵或者說最難的一點。”
在百度世界大會上,龔宇現(xiàn)場演示了愛奇藝AI技術(shù)對于一段視頻的剪輯成果。在長達一個半小時的視頻播放過程中,隨著播放進度,視頻下方的播放條也隨之移動,并基于AI理解自動打分,分數(shù)越高,視頻越精彩。打分依據(jù)包括識別技術(shù)、語音、隔音分析、觀眾互動程度等。與此同時,界面右側(cè)已經(jīng)生成8個精彩片斷,系統(tǒng)自動檢測明星人物,并配上人物簡介。
“用戶喜歡什么?用什么樣的片段能夠吸引用戶實現(xiàn)導流?AI在視頻領(lǐng)域應用的關(guān)鍵在于,對內(nèi)容的識別以及對用戶的識別。”湯興總結(jié)說。
AI團隊構(gòu)建
在愛奇藝內(nèi)部,AI業(yè)務沒有獨立的技術(shù)團隊,而是由湯興技術(shù)部門下的工程師負責體系架構(gòu),為所有有AI需求的業(yè)務部門提供公共服務。除此之外,在愛奇藝所有需要應用AI技術(shù)的業(yè)務線內(nèi),都有自己的算法團隊,負責具體的AI業(yè)務。
湯興表示,“AI更多是基礎性的技術(shù)框架,所有有可能用到這個技術(shù)的團隊都需要去掌握。對于未來的工程師而言,AI也將是一門基礎的計算機語言?!痹趷燮嫠噧?nèi)部,至少有20多個環(huán)節(jié)都涉及AI技術(shù)。在湯興看來,讓一個團隊負責所有的AI業(yè)務并不現(xiàn)實,因為負責基礎設施的工程師并不熟悉愛奇藝的具體業(yè)務?!癆I的核心就是數(shù)據(jù)、計算力,算法要和場景息息相關(guān)。一定要讓每個業(yè)務線上基本的工作人員來做AI算法,這樣才能最終有效,最終落地,不然AI技術(shù)只能是鏡中花、水中月?!眅ndprint