亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于觀看時長的自動評分及個性推薦系統(tǒng)

        2014-04-18 11:14:20陳旋
        視聽 2014年3期
        關鍵詞:播放器距離自動

        陳旋

        一、引言

        一個普通視頻網站經過數(shù)年的運營,會保存有十幾萬個視頻,但網站的首頁一般顯示的是最新的視頻,對一些存放時間久的節(jié)目,往往不能呈現(xiàn)在首頁上,但對于某些用戶來說,這樣的視頻也許有些是他們很感興趣的。一些網站使用網友評分的方法,這樣可以改善視頻資源浪費的缺點。通過提供網友評分平均值,讓用戶根據(jù)分值的高低判斷一個節(jié)目的受歡迎程度,從而考慮是否觀看。但是用戶興趣愛好是千差萬別的,平均分值僅僅反映的是大眾對節(jié)目的受歡迎程度,不能滿足不同背景下興趣不同用戶的信息需要。而且用戶觀看完視頻后,往往由于忘記或不積極評分等原因沒有對其評分,所以需要一種自動獲取評分的機制。

        二、數(shù)據(jù)挖掘技術

        數(shù)據(jù)挖掘(Data Mining,DM)又稱數(shù)據(jù)庫中的知識 發(fā) 現(xiàn)(Knowledge Discover in Database,KDD),是目前人工智能和數(shù)據(jù)庫相結合,從大量的、不完全的、有噪聲的、模糊的、隨機的真實數(shù)據(jù)中發(fā)現(xiàn)用戶感興趣知識的一種技術。個性推薦系統(tǒng)屬于數(shù)據(jù)挖掘領域的一種。推薦系統(tǒng)引擎會仔細審查一個用戶以前所做出的選擇,然后識別出用戶對某個還沒接觸過的條目的喜好程度。推薦系統(tǒng)依據(jù)的是用戶對節(jié)目評分產生的大量歷史數(shù)據(jù),計算出用戶間相似度,相似程度高的另一個用戶所觀看的視頻,可能也是這個用戶比較感興趣的,進而向用戶推薦系統(tǒng),達到充分利用網站資源的目的。

        三、系統(tǒng)結構

        系統(tǒng)主要包含視頻網站、節(jié)目評分、推薦引擎三大模塊。

        1.視頻網站實現(xiàn)一般視頻網站功能,提供視頻播放的基本功能,并具有用戶管理功能,完成用戶身份識別。

        2.節(jié)目評分模塊是采集用戶對節(jié)目的評分并檢驗數(shù)據(jù)是否有效的模塊。包含有自動和手動兩種。手動是用戶在界面上點擊分值圖標完成評分,這種方式能夠比較真實獲得用戶的評價。對不是很活躍的用戶,觀看節(jié)目后沒有對視頻做評分,需要一種自動評分的方法。自動評分方法根據(jù)用戶對一個視頻節(jié)目的觀看時長占節(jié)目總時長的比值,自動完成節(jié)目的評分。本文用0到5的整數(shù)表示喜歡的程度,5表示很喜歡,0表示一點都不喜歡。觀看時長與節(jié)目總時長的比為1時評分是5,比值為0時評分是0,其他分值可以通過等比計算獲得。為了比較準確地獲取觀看時長,還需要提供校正機制,防止重復觀看的時長被重復計算。

        3.推薦引擎是推薦系統(tǒng)的主體,引擎通過對采集到的用戶、節(jié)目、評分數(shù)據(jù)計算出用戶的相似度,并通過視頻網站呈現(xiàn)推薦信息。

        四、節(jié)目評分模塊設計

        播放器采用Flash 開發(fā),F(xiàn)lash 的AS(ActionScript,動作腳本)腳本語言能夠對JS(JavaScript,語言腳本)很好地支持,通過ExternalInterface.call函數(shù)調用網頁上的JS基本語法是 ExternalInterface.call(function Name:String, ... arguments)。在使用前,需要添加引用flash.external.*。

        使用js開發(fā)一個名為Collection類,用于采集數(shù)據(jù)。其屬性和方法以及相應的作用如表1、表2。

        播放器開始播放的時向Collection類ReceiveMSG方法發(fā)送消息,通知Collection對象播放器開始播放視頻,把視頻的總時長賦值給curVideoDuration,并初始化其他參數(shù)。

        表1

        表2

        播放器已經開始播放視頻后,播放器每播放一秒的視頻,需要調用一次Collection類的Watch方法對CountSencond屬性的計數(shù)。為避免回放、跳播等原因導致重復計數(shù),需要一種檢驗機制。Fragment以30秒作為一個小區(qū)間,記錄已經觀看的片段。以150分鐘的電影為例子,視頻總時長就是9000秒,將劃分成(9000/30)=300個區(qū)間。如果用戶從頭一直觀看到16.2分鐘,也就是972秒,972整除30得32,那么Fragment[0]到Fragment[31]都將標記為1(表示已觀看),其他(300-32=268)的區(qū)間都標記為0(表示未觀看)。注意到,第32個區(qū)間表示的是32×30=960秒,也就是說雖然用戶已經觀看到了第33個區(qū)間,但是還沒有看完這個區(qū)間,這個未看完的區(qū)間也標記為0。雖然這會帶來一些誤差,但是對節(jié)目的評分影響不大。在對CountSencond屬性的計數(shù)時,用Flash播放器的NetStream對象的time屬性獲得正在播放的時間點,并檢查Fragment所記錄的片段標記,如果用戶已經觀看過(也就是被標記為1),就不給予計數(shù)。

        當用戶暫停時候,播放器也停止調用Collection類的Watch方法。不繼續(xù)計數(shù)。

        當用戶播放下一個節(jié)目,或觸發(fā)關閉、刷新播放頁面事件時,Collection類通過SendCollection方法,采用Ajax(Asynchronous JavaScript and XML,異步JavaScript和XML)異步調用的方式,把計算出來的Score值以及相關的節(jié)目、用戶信息發(fā)送給服務器。

        節(jié)目評分除采用自動方式外,還提供手動方式,用戶可以直接對節(jié)目評分,評分之后Collection類停止工作。

        五、推薦引擎設計

        推薦系統(tǒng)目前有協(xié)同過濾(collaborative filter)與基于內容(content-based)兩種類型。基于內容能夠根據(jù)數(shù)據(jù)的內容之間的相似度來產生推薦,這種推薦引擎比較適合文檔類型的推薦。視頻文件在沒有經過處理的情況下,是不能夠像文檔那樣通過分詞的方式來分析相似度的,而協(xié)同過濾方法是用戶給對象(如視頻、文檔、商品等)相當程度的反饋(如評分),這些反饋被記錄下來,通過合作的機制分析數(shù)據(jù),幫助用戶篩選感興趣的對象。協(xié)同過濾推薦引擎在視頻網站中通過對節(jié)目、用戶與評分的歷史數(shù)據(jù)做整理,計算出相似度來完成針對不同的用戶提供不同的節(jié)目推薦。

        1.距離與相似度算法

        相似度是一個用于比較兩個事物的近似度的度量,類似于生活中描述兩個城市相近程度的地理距離。在度量兩個城市之間的距離時候,一般會使用經緯度坐標,而在節(jié)目或用戶虛擬的空間里,則使用“評分”作為這個空間的坐標來度量任意兩個節(jié)點的距離。假設有兩名用戶給他們打4或5分(喜歡這些視頻節(jié)目),同時有第三名用戶給它們的評分為0~3分。這樣一來,會認為前兩個用戶彼此是相似的,而與第三個是不相似的。

        由此可以看出,相似度是基于距離進行計算的,但與距離卻有所不同。距離是大于等于0的數(shù),而相似度具有取值區(qū)間,一般的取值范圍在[0,1]。距離等于0的時候,說明兩點重合。但這時候相似度取最大值。距離具有對稱性,A與B的距離等于B與A的距離,相似度也是如此。距離具有三角不等式性質,也就是“兩點之間直線最短”。對相似度而言,這個性質是得不到保持的。通過相似度與距離的性質比較,可以看出相似度與距離有著天然的互反性。

        2.用戶相似度計算

        假設有用戶User1與User2,節(jié)目集合P,User1評分過的節(jié)目集合為 P1,P1?P。User2評分過的節(jié)目為P2, P2?P。而且P1,P2≠ Φ (Φ 表示空集) P ′= P1∩P2。 p'∈ P′,User1對節(jié)目 p'的評分值是,User2對節(jié)目 p'的評分值是。根據(jù)歐氏距離的定義,遍歷每個元素可以得到由于相似度與距離從某種程度上說是互反的,可對L做些簡單的計算,滿足這樣的特性,比如歐式距離加1再取其倒數(shù),即加常數(shù)1是為了避免分母為0。但這樣做法是存在缺陷的。如果兩個用戶對同一個視頻打過分,其中一個打1分,另外一個打4分,他們評分的差值的平方為9,按以上公式得到的相似度為0.25。當有另一種情況,兩個用戶共同對三首歌曲評分,一個用戶評分為2、3、4,另一個用戶評分是3、4、5。計算出來的相似度也是0.25。第二種情況兩個用戶有3個節(jié)目而第一種情況只有一首,直觀地,第二種情況兩個用戶應更相似。因此可以把定義為樸素相似度公式。在此基礎做一些改進,把'p里的個數(shù)考慮進來。設,利用雙曲正切函數(shù)性質,可定義相似度為 sim =1- tanh(L)。

        3.向用戶推薦節(jié)目

        遍歷網站的視頻節(jié)目,計算出用戶未評論的節(jié)目估計評分值,并按預測評分值高到低向用戶推薦。

        4.用戶視頻推薦模塊設計

        設計所需的類,功能如表3。

        推薦模塊啟動時,先初始化BaseDataset,建立User、VideoItem、VideoRating實 例。RecommendSys實例在初始化過程中要完成相似矩陣的計算,保存的是兩兩用戶之間的相似度。當用戶登錄時候,啟動一個線程調用RecommendSys的recommend方法。把用戶沒有看過,但可能感興趣的視頻推薦出來。圖1是用1萬個視頻節(jié)目和300個用戶來計算,向一個名為“Bob”的用戶推薦視頻的結果。

        初次運行后,把預測的評分記錄下來,下次運行就不需要重復計算,可以節(jié)省很多時間。

        圖1

        結語

        當用戶由于某種原因離開屏幕,但視頻還在播放時,這樣獲得的觀看時長并不是用戶真實的觀看時長,得到用戶喜歡數(shù)據(jù)也不是真實的,因此在播放頁面時,提示用戶處于自動獲取評分狀態(tài),并提供手動評分功能,補充自動獲取方式的缺點。

        表3

        如果用戶數(shù)量很龐大,相似矩陣的計算將是一個很耗時的工作,需分階段計算。每個階段的計算結果保存在數(shù)據(jù)庫中下次可直接讀取。遍歷用戶沒看過的視頻節(jié)目,當節(jié)目數(shù)龐大的時候,也是耗時的工作,同樣也采用分批的策略。

        基于歐式距離的相似度算法能夠獲得很好的結果,但計算步驟比較多,可以考慮其他一些計算簡單的相似度算法,如狹義Jacquard相似度。

        1.(美)瑪若曼尼斯等著, 阿穩(wěn)、陳鋼譯:《智能Web算法 》,電子工業(yè)出版社,2011年版。

        2.(美)西格蘭著,莫映、王開福譯:《集體智慧編程》,電子工業(yè)出版社,2009年版。

        猜你喜歡
        播放器距離自動
        自動捕盜機
        學生天地(2020年5期)2020-08-25 09:09:08
        Walkman誕生40周年 索尼適時發(fā)布NW-ZX500和NW-A100系列播放器
        基于STM32的MP3播放器設計
        電子制作(2019年9期)2019-05-30 09:41:44
        Moon ACE播放器/放大器一體機
        算距離
        基于STM32的自動喂養(yǎng)機控制系統(tǒng)
        電子測試(2018年10期)2018-06-26 05:53:36
        關于自動駕駛
        汽車博覽(2016年9期)2016-10-18 13:05:41
        每次失敗都會距離成功更近一步
        山東青年(2016年3期)2016-02-28 14:25:55
        播放器背板注塑模具設計
        中國塑料(2015年8期)2015-10-14 01:10:55
        Stefan Greiner:我們?yōu)槭裁葱枰詣玉{駛?
        久久国产精品免费一区二区三区| 久久精品国产熟女亚洲| 91精品国产91久久久久久青草 | 香蕉视频www.5.在线观看| 曰本极品少妇videossexhd| 97人人超碰国产精品最新o| 91免费在线| 乱人伦人妻中文字幕无码| 亚洲国产综合专区在线电影| 久久亚洲aⅴ精品网站婷婷| 久久免费精品视频老逼| 亚洲国产精品成人一区二区三区| 中文字幕av人妻一区二区| 日本一曲二曲三曲在线| 日本一区二区三区四区在线视频| 亚洲av无一区二区三区综合| 在线亚洲精品免费视频| 久久久久免费精品国产| 精品国产乱码久久久久久婷婷| 日本边添边摸边做边爱喷水| 精品国产这么小也不放过| 久久精品国产色蜜蜜麻豆| 国产性生交xxxxx免费| 在线观看免费a∨网站| 97中文字幕在线观看| 一区二区三区国产美女在线播放 | 亚洲中字永久一区二区三区| 中文字幕亚洲精品专区| 手机看片自拍偷拍福利| a级毛片无码久久精品免费| a在线免费| 大陆啪啪福利视频| av中文字幕一区人妻| 免费a级毛片18禁网站免费| 真人做人试看60分钟免费视频| 亚洲av永久无码精品网站在线观看 | 日日av拍夜夜添久久免费| 热久久久久久久| 久久亚洲精彩无码天堂 | 国产一区二区内射最近人| 黄片一级二级三级四级|