亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于興趣推薦算法的短視頻傳播模式研究

        2022-05-18 06:39:50任立國
        江西電力 2022年4期
        關(guān)鍵詞:標(biāo)簽維度受眾

        任立國,張 熇,朱 桂

        (1.國家電網(wǎng)公司客戶服務(wù)中心黨委黨建部(黨委宣傳部),天津 300309;2.國網(wǎng)智聯(lián)電商有限責(zé)任公司南方交付部,天津 300000)

        0 引言

        推薦算法可分為:1)內(nèi)容分析推薦算法。利用受眾對觀看內(nèi)容的停留時間和認(rèn)同(包括但不限于點(diǎn)贊、轉(zhuǎn)發(fā)、評論等)操作,將受眾貼上標(biāo)簽,系統(tǒng)將會對標(biāo)簽標(biāo)記用戶推送類似關(guān)聯(lián)性很大的ITEM;2)協(xié)同過濾算法。將單獨(dú)個人標(biāo)簽關(guān)聯(lián)的ITEM 推薦給自己的密切聯(lián)系人;3)混合推薦算法。融合了“內(nèi)容分析算法”和“協(xié)同過濾算法”以加權(quán)或者串、并聯(lián)等方式,利機(jī)械學(xué)習(xí)進(jìn)行建模[1-2]。

        其算法各具特色,“內(nèi)容分析推薦算法”與其他兩種算法不同點(diǎn)在于,可減少ITEM 的起步時間,避免因某些ITEM 沒有被瀏覽過而消殺。而弊端在于此方法重復(fù)性強(qiáng),會反復(fù)推薦同一屬性內(nèi)容。無論以何種算法建模,我們都需要用到特征工程和、模型學(xué)習(xí)。

        1 特征工程

        現(xiàn)有短視頻APP 中,一個完整的作品會有賬號、視頻、音頻、文案組成,利用NLP,CV,AUDIO 等學(xué)習(xí)模型,來標(biāo)記其中的差異,讓每一個單獨(dú)的個體具備其自己的特征標(biāo)簽,這樣就形成了一對一映射的ITEM特征。在受眾使用的過程中,其注冊的個人信息會形成用戶基本特征信息,受眾在使用過程中,觀看視頻的時長,何時點(diǎn)贊、轉(zhuǎn)發(fā)、評論等操作,會形成用戶基本交互信息,一般我們抽取并標(biāo)簽的交互信息有三個部分,分別是用戶基本特征信息(user_ID,user_CITY),視頻特征標(biāo)簽(item_ID,item_CITY,author,duration_time,song)和用戶基本交互信息(did,channel)。

        利用我們標(biāo)記的標(biāo)簽信息,利用FM 算法和自主學(xué)習(xí)模型,可以更多的發(fā)現(xiàn)潛在關(guān)系(用戶興趣方向、目標(biāo)年齡與興趣關(guān)系、目標(biāo)性別興趣差異等)。

        2 算法介紹

        上述算法主要是挖掘潛在的交互特征,數(shù)據(jù)信息為:x特征值;y是輸出結(jié)果;n是相互交互層級。每提升一層級合數(shù)越復(fù)雜。一般來說特征值分為離散和稠密兩種特征,category 的特征需要one-hot 編碼,其相互交互后,會產(chǎn)生高維度的特征,一般的服務(wù)器處理能力較低,會產(chǎn)生較多硬件問題。但在實驗環(huán)節(jié)中,一般維度會控制n<2的范圍內(nèi)。

        3 特征類別

        一般我們會將受眾的瀏覽記錄、轉(zhuǎn)發(fā)、點(diǎn)贊交互信息記錄下來,按照時間順序排布生成的有利于映射歷史數(shù)據(jù)的信息我們稱為時間信息,這類數(shù)據(jù)信息可以計算受眾之后的行為,我們把這類可以利用全部歷史數(shù)據(jù)來推測未來的行為特征信息統(tǒng)稱為全局特征,利用一小部分歷史數(shù)據(jù)來推測未來行為的特征信息統(tǒng)稱為局部特征。

        3.1 整體特征

        整體特征從SVD 解析、Statistics 特征、TIME 特征等進(jìn)行特征的匯總。

        SVD解析一般是特征的降維和主要元素的解析,運(yùn)用SVD可以把維度較高的特征進(jìn)行降維,再將降維后的數(shù)據(jù)在模型中進(jìn)行反復(fù)計算、測試和優(yōu)化,例如用戶的ITEM,我們可以創(chuàng)建一個ITEM矩陣,其中的元素則表示此受眾是否和ITEM之間有無關(guān)系,有關(guān)系則記錄為1,無關(guān)則記錄為0,我們將這個不稠密的高緯度矩陣,利用SVD分析,收集前n個主要數(shù)據(jù)生成一個較稠密的特征,在模型中受訓(xùn),可以減少大量的算力。

        Statistics 特征中一般我們會分解為U-item,Uauthor,U-title 后進(jìn)行特征的統(tǒng)計,基本統(tǒng)計方式有方差、條件概率等。(P(did|uid),P(channel|uid),P(did|item_id),P(channel|item_id),P(item_author|uid),P(item_city|uid),P(uid_city|item_id))

        TIME 特征是這些特征是基于用戶的觀看時間節(jié)點(diǎn)、用戶的觀看頻次等數(shù)據(jù)進(jìn)行深度分析,而產(chǎn)生的用戶時間維度的興趣關(guān)聯(lián)。

        3.2 局部特征

        局部特征(見圖1)是把歷史數(shù)據(jù)按照時間排序進(jìn)行劃分,未劃分的數(shù)據(jù)視作訓(xùn)練數(shù)據(jù),利用以前的數(shù)據(jù)排列成特征組合,再將訓(xùn)練數(shù)據(jù)的元素按照時間排序進(jìn)行歸納分析,前25%的數(shù)據(jù)當(dāng)作訓(xùn)練數(shù)據(jù),剩下的作為以前的數(shù)據(jù),過程中可再次進(jìn)行劃分來優(yōu)化模型,按照10%的數(shù)據(jù)依次劃分。根據(jù)馬爾可夫理論,當(dāng)前的狀態(tài)一般只和前面一個狀態(tài)相關(guān),這也是為何如此劃分?jǐn)?shù)據(jù)集的依據(jù)。

        圖1 特征圖

        在上述過程里mean 和regression 只針對目標(biāo)finish 和like 進(jìn)行計算,這些特征只記錄了用戶的歷史行為,count_from_past,count,count_from_future,這些特征從時間角度上統(tǒng)計了用戶從歷史-現(xiàn)在-未來的行為。matrix_factorization 特征是通過FM 算法計算的只利用user和item信息的一個特征,這樣即利用了fm的信息,計算量又小。詳見圖2、圖3。

        圖2 信息流程

        圖3 邏輯流程

        4 結(jié)語

        完成特征的構(gòu)建我們就可以讓機(jī)器學(xué)習(xí)的算法來進(jìn)行模型的重復(fù)訓(xùn)練。一般算法有基于boost算法的決策樹和dnn 算法。針對不同特征使用不同的訓(xùn)練器訓(xùn)練流程,feature0 代表局部特征,feature1 代表全局特征,最后將兩個框架的結(jié)果進(jìn)行融合。由于整體特征在like 任務(wù)的表現(xiàn)一直不理想,所以基于該特征的xdeepfm 并未進(jìn)行實驗。詳細(xì)的參數(shù)選擇和特征選擇后,F(xiàn)inal最終提交public結(jié)果。

        猜你喜歡
        標(biāo)簽維度受眾
        淺論詩中“史”識的四個維度
        中華詩詞(2019年7期)2019-11-25 01:43:00
        無懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        用創(chuàng)新表達(dá)“連接”受眾
        傳媒評論(2018年6期)2018-08-29 01:14:40
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        用心感動受眾
        新聞傳播(2016年11期)2016-07-10 12:04:01
        媒體敘事需要受眾認(rèn)同
        新聞傳播(2016年14期)2016-07-10 10:22:51
        電視節(jié)目如何做才能更好地吸引受眾
        新聞傳播(2016年20期)2016-07-10 09:33:31
        光的維度
        燈與照明(2016年4期)2016-06-05 09:01:45
        標(biāo)簽化傷害了誰
        “五個維度”解有機(jī)化學(xué)推斷題
        福利一区二区三区视频在线| 人人爽人人爽人人爽人人片av| 亚洲乱妇老熟女爽到高潮的片 | 成人不卡国产福利电影在线看| 一区二区三区黄色一级片| 久久熟妇少妇亚洲精品| 国产精品视频露脸| 狠狠色综合播放一区二区| 午夜黄色一区二区不卡| 精品人妻一区二区三区久久| 天码人妻一区二区三区| 在线观看无码一区二区台湾| 日韩精品一区二区三区免费观影| 伊人中文字幕亚洲精品乱码 | 在线va免费看成| 69国产成人综合久久精| 国产免费操美女逼视频| 国产精品三级av及在线观看 | 一区二区三区在线观看人妖| 蜜臀亚洲av无码精品国产午夜.| 久久亚洲中文字幕无码| 无码久久精品蜜桃| 亚洲不卡一区二区视频| 中国女人内谢69xxxx免费视频| 亚洲伊人久久大香线蕉影院| 久久狠狠髙潮曰十八女人| 丝袜人妻一区二区三区| 国产精品免费久久久久影院仙踪林| 免费无遮挡毛片中文字幕| 一区二区三区av在线| 日产学生妹在线观看| 国产亚洲欧美在线| 97久久久一区二区少妇| 国产精品久久久爽爽爽麻豆色哟哟| 无码中文字幕人妻在线一区二区三区| 国产综合精品久久久久成人| 精品久久综合日本久久综合网| 少妇aaa级久久久无码精品片| 久久av高潮av喷水av无码| 国产在线视频一区二区三区不卡| 男人和女人做爽爽视频|