亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于社會(huì)標(biāo)簽的視頻推薦系統(tǒng)的研究

        2021-06-16 05:29:24劉天成
        電子制作 2021年4期
        關(guān)鍵詞:瀏覽量權(quán)值標(biāo)簽

        劉天成

        (上海市川沙中學(xué),上海,201299)

        0 引言

        在這個(gè)信息流動(dòng)迅速的時(shí)代,視頻作為人們快速獲取信息和娛樂的渠道,被人們所喜愛。隨著大量的視頻網(wǎng)站的發(fā)展,每天用戶都有大量的視頻可以觀看,而其中有些不符合他們的興趣,有些則是質(zhì)量偏低。同時(shí),推薦系統(tǒng)的日臻完善,使得幫助用戶找到自己想要的視頻變得簡(jiǎn)單,而不需要自己花費(fèi)大量時(shí)間去尋找。

        網(wǎng)絡(luò)的社會(huì)化趨勢(shì)產(chǎn)生了越來越多的社會(huì)化標(biāo)注系統(tǒng)[1],當(dāng)用戶給視頻添加過標(biāo)簽后,便可以匹配相似標(biāo)簽來匹配,但其系統(tǒng)還存在可信度低,準(zhǔn)確度低等問題?;谕ㄓ脴?biāo)簽及其上的特定標(biāo)簽的推薦系統(tǒng)便是本文研究的主要系統(tǒng),而解決系統(tǒng)的問題及對(duì)其提出創(chuàng)新便是本文的研究意義。

        推薦系統(tǒng)是指對(duì)用戶的興趣進(jìn)行研究后,對(duì)其進(jìn)行個(gè)性化推薦,個(gè)性化推薦技術(shù),指的是系統(tǒng)智能獲取用戶的行為數(shù)據(jù),進(jìn)而主動(dòng)給用戶推薦他們感興趣的信息[2]。這種技術(shù)的想法最早出現(xiàn)在1992年,發(fā)展至現(xiàn)在,主要的推薦系統(tǒng)有:協(xié)同過濾推薦系統(tǒng),基于內(nèi)容的推薦系統(tǒng)等。

        推薦系統(tǒng)能幫助用戶找到自己想看的視頻,而本文研究的方法便是基于社會(huì)標(biāo)簽的推薦系統(tǒng),當(dāng)下的社會(huì)標(biāo)簽主要由用戶和作者及專家群體來提供,通過匹配標(biāo)簽便能實(shí)現(xiàn)推薦,

        但其系統(tǒng)也存在明顯的缺陷,因?yàn)闃?biāo)簽是由用戶創(chuàng)造和添加的,導(dǎo)致用戶可以寫出他想表示的標(biāo)簽而非真正符合視頻的標(biāo)簽,有些標(biāo)簽甚至?xí)`導(dǎo)視頻所包含的真正內(nèi)容,造成了可信度低,標(biāo)簽數(shù)量龐大,不方便匹配等問題,最終會(huì)導(dǎo)致系統(tǒng)承受巨大的負(fù)擔(dān),且會(huì)經(jīng)常出現(xiàn)錯(cuò)誤推薦。

        1 視頻推薦系統(tǒng)概述

        ■1.1 協(xié)同過濾視頻推薦系統(tǒng)

        協(xié)同過濾推薦系統(tǒng)分為基于用戶和基于物品,基于用戶的協(xié)同過濾推薦(UserCF)研究的是用戶間的關(guān)系,其在視頻推薦系統(tǒng)中的作用是匹配興趣相似的用戶,給當(dāng)前用戶推薦他沒有見過但另一用戶見過的視頻?;谖锲返膮f(xié)同過濾推薦(ItemCF)是根據(jù)用戶給物品的評(píng)分來匹配物品間的相似度而進(jìn)行匹配的,其在視頻推薦系統(tǒng)中是匹配視頻的相似度來進(jìn)行推薦的,其主要缺點(diǎn)為對(duì)于數(shù)據(jù)量有十分高的要求,缺少數(shù)據(jù)就會(huì)導(dǎo)致推薦不精確。

        ■1.2 基于社交網(wǎng)絡(luò)的視頻推薦系統(tǒng)

        基于社交網(wǎng)絡(luò)的推薦的核心是把握用戶之間的信任關(guān)系的度量,起因是學(xué)者發(fā)現(xiàn)好友的推薦往往會(huì)被重視,通過研究人的重要性,人與人之間的交往關(guān)系,匹配其相似度來進(jìn)行推薦。個(gè)性化的好友推薦是基于兩個(gè)特征來研究的:用戶間共同好友和用戶間的相似性[3]。2017 年,胡云等人提出了一種綜合評(píng)分和信任關(guān)系的社會(huì)化推薦算法,解決了用戶特征向量的精準(zhǔn)構(gòu)建及信任傳遞問題[4]。

        ■1.3 基于標(biāo)簽的視頻推薦系統(tǒng)

        此系統(tǒng)的基礎(chǔ)是社會(huì)標(biāo)簽,來源于用戶為物品所給出的標(biāo)簽,本文定義該標(biāo)簽為通用標(biāo)簽,其劣勢(shì)主要為:不精確,較為混亂。在這種標(biāo)簽之上,還有一些特定標(biāo)簽,其來源于專家或作者所給出的標(biāo)簽,這類標(biāo)簽相比通用標(biāo)簽精確度更高,但它也存在一定缺點(diǎn),比如專家及作者只考慮專業(yè)方面卻忽視了用戶對(duì)其的看法,導(dǎo)致標(biāo)簽并不適應(yīng)大眾。

        2 基于通用標(biāo)簽的視頻推薦系統(tǒng)

        ■2.1 通用標(biāo)簽的作用

        視頻因其內(nèi)容難以由系統(tǒng)概括而在推薦的時(shí)候顯得尤為困難,系統(tǒng)不能自主判斷視頻的分類,因此,需要其他人來幫忙給出標(biāo)簽,本章主要研究由用戶給出的標(biāo)簽,而此舉動(dòng)包含了兩個(gè)部分,其一是用戶添加標(biāo)簽的行為,另一是對(duì)于一個(gè)視頻的標(biāo)簽,這兩方面分別對(duì)于用戶自身的興趣研究以及視頻的信息概述都有很大的幫助。

        ■2.2 標(biāo)簽關(guān)于自身興趣的興趣預(yù)測(cè)

        用戶添加標(biāo)簽,可以反應(yīng)自身的興趣,用戶添加標(biāo)簽的這個(gè)舉動(dòng),表現(xiàn)的是用戶對(duì)于此視頻很關(guān)注,也對(duì)于視頻中的內(nèi)容很清楚,繼而可以推斷其對(duì)于同一類的視頻都會(huì)有一定的興趣,那么繼續(xù)匹配具有相似標(biāo)簽的視頻,便可以形成推薦,大大降低了推薦的難度。進(jìn)一步根據(jù)該行為進(jìn)行推薦的方法是,根據(jù)用戶給出的標(biāo)簽進(jìn)行匹配,匹配相似標(biāo)簽,具體方法如下:

        該算法用來計(jì)算該標(biāo)簽與用戶的關(guān)聯(lián)性,其中,u表示用戶,a表示一個(gè)特定標(biāo)簽,times 表示被使用的次數(shù),r表示任意標(biāo)簽,all 表示用戶所標(biāo)注過的全部標(biāo)簽,relation的值越大,就說明用戶與這個(gè)標(biāo)簽的關(guān)聯(lián)性越大,那么就可以籍此繼續(xù)推薦類似的標(biāo)簽,可以用協(xié)同過濾系統(tǒng)進(jìn)行進(jìn)一步的匹配,把有相似標(biāo)簽的視頻推薦給該用戶。

        該系統(tǒng)在遇到興趣面較為廣泛卻很少添加標(biāo)簽的用戶時(shí)會(huì)顯得較為短板,因?yàn)榇祟愑脩魩缀鯖]有自身關(guān)于標(biāo)簽的關(guān)聯(lián)性,這也就導(dǎo)致了無法利用上述算法,從而導(dǎo)致推薦無法進(jìn)行,解決方法是利用后文中的系統(tǒng)互補(bǔ),兩者分情況進(jìn)行交替使用,便可以解決不同用戶的差異所造成的問題。

        ■2.3 標(biāo)簽關(guān)于視頻分類的作用

        用戶給視頻添加的標(biāo)簽,可以對(duì)于視頻的分類產(chǎn)生幫助,當(dāng)后來看到該視頻的用戶想添加同樣的標(biāo)簽時(shí),那么此標(biāo)簽就基本可以認(rèn)定為準(zhǔn)確的標(biāo)簽,把同一類的標(biāo)簽集合起來,再去根據(jù)用戶的興趣推薦,形成的一個(gè)循環(huán),就是另一個(gè)通用標(biāo)簽的作用。這個(gè)是主要的標(biāo)簽系統(tǒng)的作用,在一個(gè)視頻下有足夠的通用標(biāo)簽后,這個(gè)視頻就可以進(jìn)行分類,分類后,系統(tǒng)就只需要匹配標(biāo)簽之間的關(guān)系就可以成功地給用戶進(jìn)行推薦。

        這個(gè)系統(tǒng)的主要兩個(gè)問題為:第一個(gè)問題,需要大量的數(shù)據(jù)量和瀏覽量,若是沒有這些瀏覽量,視頻的分類就極為不清晰,會(huì)導(dǎo)致無效推薦,而本文提出的解決方法就是與前文的系統(tǒng)結(jié)合,對(duì)于不流行,瀏覽量小的視頻主要利用前一個(gè)系統(tǒng)進(jìn)行對(duì)于用戶本身興趣的研究并給他推薦視頻,對(duì)于瀏覽量多的視頻,就主要使用后者,這樣的好處不僅僅可以互補(bǔ)兩個(gè)系統(tǒng),同時(shí),因?yàn)楸环诸惖囊曨l主要是一些較為流行的視頻,也可以有一定的質(zhì)量保證。第二個(gè)問題,用戶的標(biāo)簽過于隨意,不夠準(zhǔn)確,或是太過于繁雜,這個(gè)問題普遍存在于標(biāo)簽系統(tǒng)中,而主要的解決方法是利用下文中將提到的特定標(biāo)簽系統(tǒng),該系統(tǒng)有過濾掉大量的無用標(biāo)簽作用。

        3 基于特定標(biāo)簽的視頻推薦系統(tǒng)

        ■3.1 標(biāo)簽群體的區(qū)別

        此類標(biāo)簽主要由專家或是作者本人來給出,在給出標(biāo)簽之前,系統(tǒng)將把類似的標(biāo)簽集合起來,由專家或作者提出一個(gè)簡(jiǎn)潔明了的標(biāo)簽或是舍棄該標(biāo)簽,例如“搞笑”和“惡搞”最終合并成“娛樂”,這樣可以合并大量的類似標(biāo)簽,將最終標(biāo)簽的數(shù)量降至10個(gè)以內(nèi),這10個(gè)中有通用標(biāo)簽,也有特定標(biāo)簽,此類標(biāo)簽因?yàn)橹饕晒俜教峁?,所以精確度比較高,但是也存在特定標(biāo)簽也會(huì)不夠精確的情況,關(guān)于標(biāo)簽精確度的問題,可以使用以下算法進(jìn)行計(jì)算:

        其中a 表示該標(biāo)簽,i表示該系統(tǒng)下的全部標(biāo)簽,最終的值應(yīng)在1以內(nèi),這個(gè)值代表著特定標(biāo)簽所占的百分比,若是特定標(biāo)簽被人們所認(rèn)可,那么之后便不會(huì)再添加更多的通用標(biāo)簽,也就使得特定標(biāo)簽所占的百分比上升,相反,百分比越低,那么就代表著該特定標(biāo)簽的準(zhǔn)確度越低,若是這個(gè)值低于0.5,基本可以確定該特定標(biāo)簽是有問題的,此時(shí)應(yīng)該降低該標(biāo)簽的權(quán)值或是直接對(duì)提出標(biāo)簽的那一方提議修改,重新給出一個(gè)新的標(biāo)簽。這個(gè)值也可以一定程度反應(yīng)一個(gè)標(biāo)簽的權(quán)值,但是不夠精確,推薦視頻的時(shí)候,會(huì)根據(jù)兩種標(biāo)簽所占的權(quán)值來決定優(yōu)先級(jí),隨后進(jìn)行推薦。

        ■3.2 標(biāo)簽優(yōu)先級(jí)問題

        此系統(tǒng)屬于混合推薦系統(tǒng),而混合推薦主要有這幾個(gè)類型:加權(quán)型,分級(jí)型混合推薦系統(tǒng),合并型,瀑布型[5]。本文主要利用加權(quán)型來解決優(yōu)先級(jí)問題。權(quán)的值取決于兩種標(biāo)簽的數(shù)量,在把通用標(biāo)簽聚集成集合的時(shí)候,對(duì)于每類相同標(biāo)簽的數(shù)量進(jìn)行計(jì)算,列出一個(gè)矩陣,其縱坐標(biāo)為各個(gè)標(biāo)簽的種類,橫坐標(biāo)為數(shù)量,權(quán)值,再利用如下算法:

        ■3.3 視頻質(zhì)量推薦優(yōu)化

        在根據(jù)上文的系統(tǒng)進(jìn)行加權(quán)推薦后,會(huì)出現(xiàn)質(zhì)量參差不齊的問題,有些低質(zhì)量的視頻依然有很高的權(quán)值,導(dǎo)致在推薦的時(shí)候會(huì)推薦一些低質(zhì)量的視頻。主要解決方法是通過瀏覽量和對(duì)于作者進(jìn)行評(píng)估兩種方法,第一種方法可以與第三章中的系統(tǒng)合用,從而通過推薦瀏覽量多或評(píng)分高的視頻來一定程度上解決視頻的質(zhì)量問題。第二種方法是通過對(duì)于一個(gè)作者的以往的視頻的質(zhì)量進(jìn)行評(píng)估,可以參考的數(shù)據(jù)有:瀏覽量,評(píng)分,收藏量等,在瀏覽量一定的情況下,若是收藏量和評(píng)分都較高,那么該作者的評(píng)估就很高,在推薦他的視頻的時(shí)候,就可以適當(dāng)?shù)脑黾铀曨l的權(quán)值來使得該作者的視頻更容易被推薦,同時(shí),也能帶動(dòng)該作者的知名率,從而使得優(yōu)質(zhì)視頻得以宣傳,形成良性循環(huán),反之,低質(zhì)視頻就會(huì)被不斷的篩選,降低其權(quán)值,使其更不容易被推薦,從而降低其瀏覽量。

        4 總結(jié)與展望

        本文對(duì)基于標(biāo)簽的視頻推薦系統(tǒng)的現(xiàn)狀進(jìn)行了概述,對(duì)于幾個(gè)基于標(biāo)簽的推薦系統(tǒng)進(jìn)行了分析,提出了基于標(biāo)簽的推薦系統(tǒng),有效解決了視頻質(zhì)量較低的問題。此次研究雖然完善了基于標(biāo)簽的推薦系統(tǒng)的一些缺點(diǎn),但仍有一些問題仍未解決,例如如何確定三個(gè)系統(tǒng)的運(yùn)行優(yōu)先級(jí)。下一步研究工作本文作者將致力于研究如何推薦給用戶高質(zhì)量的視頻以及使得該系統(tǒng)運(yùn)行更穩(wěn)定。

        猜你喜歡
        瀏覽量權(quán)值標(biāo)簽
        一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
        CONTENTS
        游記表述與游客關(guān)注度的關(guān)系研究
        無懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
        標(biāo)簽化傷害了誰
        基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
        《江南Style》瀏覽量超20億
        CNZZ報(bào)告顯示中國網(wǎng)民地域分布差異明顯
        久久天天躁狠狠躁夜夜avapp| av网址大全在线播放| 亚洲av无码精品色午夜| 一区二区三区国产亚洲网站| 国产99久久无码精品| 久久免费精品视频老逼| 一本色道久久88—综合亚洲精品| 成人内射国产免费观看| 日韩精品中文字幕无码一区 | 亚洲欧美在线视频| 国产av一区二区制服丝袜美腿| 亚洲一区二区二区视频| 久久夜色精品国产欧美乱| 亚洲永久精品ww47永久入口| 国产在线播放免费人成视频播放| 麻豆精品国产专区在线观看| 亚洲av无码国产精品色午夜洪| 在线观看亚洲AV日韩A∨| 免费黄网站永久地址进入| 亚洲国产果冻传媒av在线观看| 人人狠狠综合久久亚洲| 午夜国产精品久久久久| 国产亚洲av夜间福利在线观看| 粗大的内捧猛烈进出看视频| 精品一区二区三区无码视频| 97碰碰碰人妻视频无码| 亚洲国产成人久久精品一区| 日韩av东京社区男人的天堂| 欧美成人a在线网站| 亚洲最大视频一区二区三区| 一区二区和激情视频| 女人夜夜春高潮爽a∨片传媒| 综合图区亚洲另类偷窥| 中文字幕久久久人妻人区| 又黄又硬又湿又刺激视频免费| 亚洲欧美日韩国产综合一区二区 | 人禽无码视频在线观看| 国产精品一级av一区二区| 国产青青草在线观看视频| 久久国产热这里只有精品| 欧美综合区自拍亚洲综合|