摘 要:大數(shù)據(jù)價(jià)值創(chuàng)造的關(guān)鍵在于大數(shù)據(jù)的應(yīng)用,隨著大數(shù)據(jù)技術(shù)飛速發(fā)展,大數(shù)據(jù)應(yīng)用已經(jīng)融入各行各業(yè)。對于通信公司的5G數(shù)字內(nèi)容推薦模型的研究就是大數(shù)據(jù)應(yīng)用的一個(gè)實(shí)例。5G數(shù)字內(nèi)容推薦模型主要從客戶數(shù)字偏好行為角度出發(fā),對用戶收視數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析和圖形化畫像展示,精準(zhǔn)顯示其活躍度、付費(fèi)行為、收視內(nèi)容與欄目的偏好等信息。同時(shí),通過大數(shù)據(jù)信息規(guī)整,對全部用戶群體進(jìn)行典型畫像描述,便于管理人員和運(yùn)營人員更加知曉用戶行為習(xí)慣和喜好信息。
關(guān)鍵詞: 大數(shù)據(jù)技術(shù) "大數(shù)據(jù)應(yīng)用 "5G數(shù)字內(nèi)容推薦模型 "5G信息技術(shù)
中圖分類號(hào):TN929.5;TP311.13
The Application of Big Data Technology in 5G Digital Content Recommendation Model
DAI Yiwen
Shanghai University of Medicine amp; and Health Sciences, Shanghai, 201318 China
Abstract: The key to creating value through big data lies in its application. With the rapid development of big data technology, big data applications have been integrated into various industries. The research on 5G digital content recommendation models for communication companies is an example of big data applications. The 5G digital content recommendation model mainly starts from the perspective of customer digital preference behavior, conducts statistical analysis and graphical portrait display of user viewing data, and accurately displays information such as activity, payment behavior, viewing content, and program preferences. At the same time, by organizing big data information and providing typical portrait descriptions of all user groups, it is easier for managers and operatorsfacilitates management and operation personnel to better understand user behavior habits and preferences.
Key Wwords: Big data technology; Big data application; 5G digital content recommendation model; 5G iInformation tTechnology
隨著大數(shù)據(jù)技術(shù)的飛速發(fā)展,大數(shù)據(jù)的應(yīng)用是大數(shù)據(jù)價(jià)值創(chuàng)造的關(guān)鍵所在[1],并且大數(shù)據(jù)的應(yīng)用已經(jīng)融入社會(huì)的各個(gè)行業(yè),5G信息技術(shù)的推廣也離不開大數(shù)據(jù)的支持[2]。為了保證營銷資源的精準(zhǔn)投放和充分利用,需要進(jìn)行數(shù)據(jù)探索分析,確定優(yōu)先的目標(biāo)客戶群體,進(jìn)一步篩選出迫切需要或者有潛在需求的目標(biāo)客戶群體。為提升當(dāng)前的5G數(shù)字內(nèi)容運(yùn)營效果,達(dá)到用戶訴求與運(yùn)營需求的平衡[3],基于當(dāng)前的用戶數(shù)據(jù)包深度分析技術(shù)(Deep Packet"Inspection,DPI[wl3]"[L4]")解析數(shù)據(jù)、數(shù)字內(nèi)容類標(biāo)簽數(shù)據(jù)和大屏影視媒體資源信息[4],建立5G數(shù)字內(nèi)容推薦模型,達(dá)到“數(shù)字內(nèi)容+大數(shù)據(jù)”的科學(xué)結(jié)合[5],實(shí)現(xiàn)千人千面的智能推薦,為5G時(shí)代的數(shù)字業(yè)務(wù)提供最佳的輔助運(yùn)營解決方案[6]。因此,大數(shù)據(jù)技術(shù)在5G數(shù)字內(nèi)容推薦模型中的應(yīng)用是十分重要的。
1 "應(yīng)用大數(shù)據(jù)技術(shù)建立5G數(shù)字內(nèi)容推薦模型
算法中5G數(shù)字內(nèi)容推薦模型,基于數(shù)字內(nèi)容的個(gè)性化推薦可以分為4類,分別是顯式的標(biāo)簽特征推薦、向量式的偏好特征推薦、基于協(xié)同過濾的相似用戶推薦和當(dāng)前熱點(diǎn)內(nèi)容推薦。
1.1 "顯式的標(biāo)簽特征推薦
如果數(shù)字內(nèi)容是由標(biāo)簽來描述的,那么這些標(biāo)簽可以用來表征數(shù)字內(nèi)容。用戶的偏好畫像也可以基于用戶對數(shù)字內(nèi)容的行為打上對應(yīng)的標(biāo)簽。以寬帶電視上的電影推薦來舉例,如果用戶過去看了科幻和恐怖兩類電影,那么恐怖、科幻就是用戶的偏好標(biāo)簽。每個(gè)數(shù)字內(nèi)容的標(biāo)簽可以是包含權(quán)重的,而用戶對數(shù)字內(nèi)容的操作行為也是有權(quán)重的,從而用戶的偏好標(biāo)簽是有權(quán)重的。在具體推薦時(shí),可以將用戶的偏好標(biāo)簽關(guān)聯(lián)到的數(shù)字內(nèi)容推薦給用戶。
1.2 "向量式的偏好特征推薦
進(jìn)行向量式的偏好特征推薦需要3個(gè)步驟,分別是:構(gòu)建數(shù)字內(nèi)容特征、構(gòu)建用戶特征、基于用戶及數(shù)字內(nèi)容特征為用戶推薦數(shù)字內(nèi)容。[wl5]"[L6]
1.2.1 "構(gòu)建數(shù)字內(nèi)容特征
將標(biāo)簽按序排列,每個(gè)標(biāo)簽看成一個(gè)維度,每個(gè)數(shù)字內(nèi)容可用一個(gè)N維向量(N是標(biāo)簽的個(gè)數(shù))來表示,若數(shù)字內(nèi)容包含某個(gè)標(biāo)簽,向量在相應(yīng)標(biāo)簽的分量上的值為1,否則為0,即轉(zhuǎn)化為機(jī)器學(xué)習(xí)中的獨(dú)熱編碼(one-hot code)。數(shù)字內(nèi)容向量可通過余弦相似度方法計(jì)算用戶潛在的偏好內(nèi)容。
1.2.2 "構(gòu)建用戶特征
用戶的偏好向量的構(gòu)建,可以通過該用戶點(diǎn)擊、瀏覽的數(shù)字內(nèi)容所對應(yīng)向量的平均向量來表示。[wl7]"[L8]"多種策略[wl9]"[L10]"可以用來表示用戶偏好向量,比如:基于用戶對操作過的數(shù)字內(nèi)容的評(píng)分以及時(shí)間加權(quán)來獲取用戶的加權(quán)偏好向量,而不是直接取平均。
根據(jù)用戶操作過的數(shù)字內(nèi)容之間的相似度,為用戶構(gòu)建多個(gè)偏好向量(比如對數(shù)字內(nèi)容聚類,用戶在某一類上操作過的向量均值作為用戶在這個(gè)類別上的偏好向量),以更好地表達(dá)用戶多方位的興趣偏好。
根據(jù)用戶的偏好向量及數(shù)字內(nèi)容特征向量,基于向量相似性,計(jì)算用戶對數(shù)字內(nèi)容的偏好度,再基于偏好度大小為用戶推薦數(shù)字內(nèi)容。
1.2.3 "基于數(shù)字內(nèi)容特征為用戶推薦數(shù)字內(nèi)容[wl11]"[L12]"
通過向量的余弦相似度計(jì)算用戶與數(shù)字內(nèi)容之間的相似度。根據(jù)用戶對每個(gè)數(shù)字內(nèi)容的相似度,基于相似度降序排列,取TopN推薦給用戶。
余弦相似度計(jì)算公式:
式(1)中:x表示用戶變量,y表示數(shù)字內(nèi)容變量。
1.3 "基于協(xié)同過濾的相似用戶推薦
協(xié)調(diào)過濾是比較成熟且應(yīng)用比較廣泛的推薦技術(shù),它不僅有堅(jiān)實(shí)的理論基礎(chǔ),更有很強(qiáng)的現(xiàn)實(shí)意義。推薦系統(tǒng)核心是預(yù)測用戶對物品的喜歡程度。
協(xié)同過濾也稱為社會(huì)過濾,它計(jì)算用戶間偏好的相似性,在相似用戶的基礎(chǔ)上自動(dòng)的為目標(biāo)用戶進(jìn)行過濾和篩選,其基本思想為具有相同或相似的價(jià)值觀、思想觀、知識(shí)水平和興趣偏好的用戶,其對信息的需求也是相似的。因此,相對于傳統(tǒng)的推薦方法,協(xié)同過濾技術(shù)體現(xiàn)出的一個(gè)顯著的優(yōu)勢是能夠推薦一些難以進(jìn)行內(nèi)容分析的項(xiàng)目,如信息質(zhì)量、個(gè)人品味等抽象的資源對象。協(xié)同過濾技術(shù)能夠有效使用其他興趣相似用戶的評(píng)價(jià)信息,從而利用較少的用戶反饋,加快個(gè)性化學(xué)習(xí)的速度,同時(shí)也利于發(fā)現(xiàn)用戶的隱藏興趣。
1.4 "當(dāng)前熱點(diǎn)內(nèi)容推薦
1.4.1" 熱點(diǎn)內(nèi)容庫建設(shè)[wl15]"[L16]"
基于網(wǎng)關(guān)的DPI解析規(guī)則,按照性別、年齡、地域、流量、競品、競品付費(fèi)用戶、內(nèi)容類別等不同維度在統(tǒng)計(jì)期內(nèi)(日、周、月)來統(tǒng)計(jì)每個(gè)維度用戶使用的(如:視頻類App、音樂類App、閱讀類App、游戲類App)Top 1000的內(nèi)容明細(xì);實(shí)現(xiàn)多維度組合并按日、周、月統(tǒng)計(jì)、分析出用戶使用的Top 1 000(視頻類App、音樂類App、閱讀類App、游戲類App)熱點(diǎn)內(nèi)容。
1.4.2" 熱點(diǎn)內(nèi)容推薦算法
根據(jù)熱點(diǎn)內(nèi)容庫保存的視頻、閱讀、音樂、游戲四大類業(yè)務(wù),各按維度劃分的熱門(TOP 100)的內(nèi)容。
對視頻、閱讀、游戲、音樂四大類業(yè)務(wù)的使用用戶數(shù),按維度及組合分類統(tǒng)計(jì),用戶量從高到低排序,取前100的內(nèi)容形成熱點(diǎn)內(nèi)容集合,整合去重后生成當(dāng)前各組合用戶的熱點(diǎn)數(shù)字內(nèi)容進(jìn)行推薦。
2 "模型輸入
5G數(shù)字內(nèi)容推薦模型須輸入的用戶數(shù)字內(nèi)容標(biāo)簽見表1。
利用用戶行為數(shù)據(jù)對用戶進(jìn)行畫像處理,需要各種用戶行為數(shù)據(jù),包括搜索、點(diǎn)擊、播放、展現(xiàn)、功能使用、訂購等行為。利用本網(wǎng)媒體資源數(shù)據(jù)對用戶進(jìn)行畫像處理,同時(shí)需要各種影視媒資數(shù)據(jù)提供標(biāo)簽,構(gòu)造熱點(diǎn)內(nèi)容庫詳見表2。
3 "模型輸出
5G數(shù)字內(nèi)容推薦模型輸出用戶對影視內(nèi)容的個(gè)性化消費(fèi)需求,做到更細(xì)致、更精準(zhǔn)的數(shù)據(jù)庫營銷,具體模型輸出要素詳見表3。
4 "應(yīng)用場景
從客戶數(shù)字偏好行為角度出發(fā),在5G數(shù)字內(nèi)容推薦模型中應(yīng)用大數(shù)據(jù)技術(shù),對用戶收視數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析和圖形化畫像展示,精準(zhǔn)顯示其活躍度、付費(fèi)行為、收視內(nèi)容與欄目的偏好等信息。同時(shí),通過大數(shù)據(jù)信息規(guī)整,對全部用戶群體進(jìn)行典型畫像描述,便于管理人員和運(yùn)營人員更加知曉用戶行為習(xí)慣和喜好信息。
5" 標(biāo)簽輸出
5G數(shù)字內(nèi)容推薦模型可提供如下新增標(biāo)簽(見表4)。
6 "結(jié)語
把大數(shù)據(jù)技術(shù)應(yīng)用在5G數(shù)字內(nèi)容推薦模型中,從而進(jìn)行深度商業(yè)挖掘,精準(zhǔn)視頻營銷,在對客戶分群知悉的基礎(chǔ)上,把握用戶對影視內(nèi)容的個(gè)性化消費(fèi)需求,做到更細(xì)致、更精準(zhǔn)的數(shù)據(jù)庫營銷:結(jié)合集中運(yùn)營平臺(tái),生成個(gè)性化的點(diǎn)播單,為電視和手機(jī)視頻用戶推薦具有高度相關(guān)性的其他[A26]"[L27]"節(jié)目。[A28]"[L29]
參考文獻(xiàn)
[1] 盤和林,鄧思堯,韓至杰.5G大數(shù)據(jù)[wl30]"[L31]"—數(shù)據(jù)資源賦能中國經(jīng)濟(jì)[M].北京:中國人民大學(xué)出版社,2021.
[2] CICIOGLU M.Performance Analysis of Handover Management in 5G Small Cells [J].Computer Standards amp; Interfaces,2021,75:103502.
[3] 徐海霞.基于大數(shù)據(jù)的5G網(wǎng)絡(luò)性能分析與優(yōu)化策略[J] .信息系統(tǒng)工程,2024(11):80-83.
[4] 龔達(dá)寧,王雪梅,曹磊.全球5G商用發(fā)展及趨勢展望[J].信息通信技術(shù)與政策,2020(12):7-10.
[5] 武軼敏.大數(shù)據(jù)在智慧城市建設(shè)中的應(yīng)用探究[J].新城建科技,2024,33(10):48-50.
[6] WU Y L,MA Y X,DAI H N,et al.Deep Learning for Privacy Preservation in Autonomous Moving Platforms Enhanced 5G Heterogeneous Networks[J].Computer Networks,2020,185(7):107743.