居松 江蘇省廣播電視總臺
當(dāng)今世界處于數(shù)據(jù)爆炸的時代,用戶數(shù)據(jù)作為寶貴的資源顯得愈發(fā)重要。在國家層面推進(jìn)三網(wǎng)融合發(fā)展及三網(wǎng)融合業(yè)務(wù)快速發(fā)展的大背景下,如何充分利用IPTV電視的網(wǎng)絡(luò)特性,收集利用真實全量的數(shù)據(jù),對新媒體的發(fā)展、節(jié)目開發(fā)、業(yè)務(wù)運(yùn)營有著重要的戰(zhàn)略意義。研究針對海量用戶數(shù)據(jù)的多維度建模方法,設(shè)計聚類、分類相結(jié)合的數(shù)據(jù)挖掘算法,可起到為三網(wǎng)融合、新媒體的發(fā)展增加催化劑、助推劑的作用。
EPG探針即外掛式的EPG腳本,嵌入在EPG代碼中,用于監(jiān)聽用戶點擊行為,觸發(fā)用戶點擊事件,并實時向后端發(fā)送固定規(guī)范的消息文本。
在EPG服務(wù)器各節(jié)點掛載EPG探針,用戶打開頁面并收看節(jié)目時,會觸發(fā)探針事件產(chǎn)生采集行為,機(jī)頂盒對用戶操作信息進(jìn)行計算機(jī)編碼匯聚后,以負(fù)載均衡集群的方式,實時地將固定規(guī)范的收視數(shù)據(jù)轉(zhuǎn)發(fā)到后端大數(shù)據(jù)統(tǒng)計和分析系統(tǒng),生成業(yè)務(wù)部門所需要的各類智能報表。
EPG探針的應(yīng)用具有如下優(yōu)勢:
(1)更客觀
忠實的記錄了用戶使用IPTV業(yè)務(wù)過程中的每一次行為動作,避免了不確定性的人工干預(yù),保證了原始數(shù)據(jù)的客觀性。
圖1 采集處理流程
(2)更實時
可基于Flume+ Spark Streaming實時采集計算框架,不僅能實時采集處理用戶的收視行為數(shù)據(jù),還能根據(jù)業(yè)務(wù)需求實時向用戶反饋推薦信息。
(3)更精確
無論是采集還是回傳,秒級的顆粒度,對于節(jié)目運(yùn)營、產(chǎn)品推送、頁面設(shè)計等有著革命性的指導(dǎo)意義。
(4)更全面
探針相較于傳統(tǒng)的收視統(tǒng)計手段,有著更全面的采集能力,比如頁面、專題、流向等相關(guān)數(shù)據(jù),傳統(tǒng)的收視數(shù)據(jù)里是沒有的。
入口的價值用不著多說,這里的入口,既指EPG推薦位入口,亦泛指各EPG頁面及頁面入口。傳統(tǒng)的話單數(shù)據(jù),并沒有入口相關(guān)的數(shù)據(jù)支持,所以業(yè)務(wù)運(yùn)營人員對于入口的認(rèn)知更加依賴于長期的運(yùn)營經(jīng)驗,偏主觀一點。相比之下,EPG探針可根據(jù)實際業(yè)務(wù)需求,在需要統(tǒng)計的入口位置進(jìn)行埋碼,這樣收集到的數(shù)據(jù)就客觀且準(zhǔn)確得多了。實時大數(shù)據(jù)統(tǒng)計分析系統(tǒng)(以下簡稱“實時系統(tǒng)”)生成的入口數(shù)據(jù)報表,對實際運(yùn)營的指導(dǎo)作用,可參考以下幾個維度:
(1)同一節(jié)目在各頁面占比率
以《瘋狂動物城》為例,這部片子可以推送到EPG主模板,也可以推送到電影子專區(qū)或少兒子專區(qū),根據(jù)實時系統(tǒng)生成的報表能夠看到《瘋狂動物城》在各個頁面各個位置的占比率,這對于業(yè)務(wù)運(yùn)營人員在什么頁面什么入口推送什么類型的增值產(chǎn)品,具有客觀的指導(dǎo)意義。
(2)同一頁面在各入口點擊率
對同一個頁面中的不同位置進(jìn)行埋碼,根據(jù)實時系統(tǒng)生成的報表能夠看到各個位置的點擊率,這不僅能夠指導(dǎo)業(yè)務(wù)運(yùn)營人員對于頁面入口的價值評估及相應(yīng)的產(chǎn)品推送,還能夠指導(dǎo)頁面設(shè)計人員對于頁面入口的設(shè)計評估及優(yōu)化。
(3)頁面占比及轉(zhuǎn)化率
對不同頁面進(jìn)行埋碼,實時系統(tǒng)能夠統(tǒng)計到各個頁面實時在線人數(shù),各頁面之間的跳轉(zhuǎn)路徑,以及各頁面的轉(zhuǎn)化率,在頁面邏輯優(yōu)化方面,給予頁面設(shè)計人員更多的設(shè)計思路
內(nèi)容一直是業(yè)務(wù)運(yùn)營的主體,傳統(tǒng)的內(nèi)容運(yùn)營,在保證直輪播、點播及回看質(zhì)量的同時,更注重的是推送的入口。在實時大數(shù)據(jù)的潮流面前,內(nèi)容不僅僅是內(nèi)容本身,它與更多的元素(用戶、時間等)產(chǎn)生聯(lián)系,所以內(nèi)容運(yùn)營不可避免會做出相應(yīng)的優(yōu)化。這對實際運(yùn)營的指導(dǎo)作用,可參考以下幾個維度:
(1)內(nèi)容熱度
實時系統(tǒng)可以輕松統(tǒng)計出各類內(nèi)容的熱度排行,為業(yè)務(wù)運(yùn)營人員對各個版塊的內(nèi)容推送、以及后續(xù)的內(nèi)容采購提供了數(shù)據(jù)支撐。
(2)時間趨勢
同一內(nèi)容在不同時間段的表現(xiàn),也不盡相同。工作日和雙休日,早晨、中午和晚上,都有著一定的差異性和規(guī)律性。實時系統(tǒng)可以實時統(tǒng)計出各類內(nèi)容在不同時間段的收視表現(xiàn),業(yè)務(wù)運(yùn)營人員可據(jù)此有針對地推送更易轉(zhuǎn)化的增值內(nèi)容。
(3)產(chǎn)品定價
增值產(chǎn)品是IPTV業(yè)務(wù)盈利的重要工具,內(nèi)容如何定價,定價多少,都得有可靠的數(shù)據(jù)支撐。實時系統(tǒng)可以統(tǒng)計各類定價產(chǎn)品的訂購情況,輔助業(yè)務(wù)運(yùn)營人員制定定價策略,同時可以實時驗證定價變更后的訂購效果。
(4)內(nèi)容標(biāo)簽
內(nèi)容本身的編目信息,決定了內(nèi)容標(biāo)簽的先天屬性。而用戶是有標(biāo)簽屬性的,根據(jù)不同用戶不同時段的點擊,實時系統(tǒng)可以豐富內(nèi)容的標(biāo)簽屬性,內(nèi)容庫中數(shù)百萬計的內(nèi)容標(biāo)簽,是各類智能推薦的數(shù)據(jù)前提。
“智能推薦”“千人千面”,是近年來百談不厭的話題。電視機(jī)前手拿遙控器的到底是什么樣的用戶?他或她在不同時段下的收視偏好是什么?這些都是業(yè)務(wù)運(yùn)營人員迫切想要知道的。實時系統(tǒng)能夠根據(jù)用戶行為對用戶進(jìn)行畫像,并針對不同用戶不同時段進(jìn)行個性化推送。有時,一廂情愿只會事倍功半,而投其所好卻能四兩撥千斤。這對實際運(yùn)營的指導(dǎo)作用,可參考以下幾個維度:
(1)用戶畫像
用戶的屬性從哪里來?用戶的每一次行為都會被實時系統(tǒng)記錄,并對用戶的頁面跳轉(zhuǎn)路徑、觀看內(nèi)容屬性、產(chǎn)品訂購行為等進(jìn)行分析,以生成用戶的屬性。生成的屬性有很多,可以是收視標(biāo)簽、行為標(biāo)簽、身份等級等。根據(jù)相關(guān)的智能推薦算法,可以在EPG各推薦位、詳情頁、播控頁面或者推薦專區(qū)等位置,針對各個用戶進(jìn)行個性化內(nèi)容的推送。
(2)時段精分
IPTV是一項以家庭為收看對象的電視服務(wù),而每個家庭收視群體又是由不同年齡性別的家庭成員構(gòu)成。那么同一機(jī)頂盒用戶在一天或一段時間里的表現(xiàn),也不盡相同。比如在工作日的白天,中老年人占比更多;晚上小孩放學(xué)、年輕人下班,對應(yīng)的占比會更多等。實時系統(tǒng)可以針對各個用戶各個時段里不同收視特征進(jìn)行建模分類,生成每個家庭用戶各自的分時段收視偏好標(biāo)簽庫,以生成個性化內(nèi)容推送給用戶。
IPTV因其基于IP網(wǎng)絡(luò)的特點,天生具有雙向互動的優(yōu)勢,既能夠采集到所有用戶的行為數(shù)據(jù),也能夠?qū)崟r地向用戶進(jìn)行反饋推送。通過EPG探針定制采集全網(wǎng)用戶操作行為數(shù)據(jù),可實時展示用戶在線情況等數(shù)據(jù),并通過每日深入分析獲得詳細(xì)的運(yùn)行情況;在內(nèi)容、用戶、產(chǎn)品、頁面、時間等多維度給予運(yùn)營工作更多的支持;憑借統(tǒng)計實時業(yè)務(wù)數(shù)據(jù)和用戶流向來合理調(diào)配節(jié)目推薦,優(yōu)化頁面編排,增加節(jié)目收視等;配合運(yùn)營部門, 實現(xiàn)從業(yè)務(wù)到數(shù)據(jù),數(shù)據(jù)到指標(biāo),指標(biāo)到?jīng)Q策,再從決策來優(yōu)化業(yè)務(wù),實現(xiàn)用戶體驗和業(yè)務(wù)盈利的提升。