亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于項(xiàng)目協(xié)同過濾算法的中國音樂數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)

        2019-04-23 03:29:54
        微型電腦應(yīng)用 2019年2期
        關(guān)鍵詞:相似性協(xié)同矩陣

        (寶雞職業(yè)技術(shù)學(xué)院 學(xué)前教育教研室,寶雞 721000)

        0 引言

        隨著互聯(lián)網(wǎng)的發(fā)展,信息超載[1]在人們的日常生活中越來越嚴(yán)重,信息超載的出現(xiàn)給生產(chǎn)和日常生活帶來了太多的不便[2]。例如,越來越多的音樂曲目增加了搜索優(yōu)選歌曲的難度,通常情況下,用戶會隨機(jī)聽音樂播放器中已存在的音樂,但是當(dāng)涉及到一些特殊場合時,隨機(jī)模型可能無法滿足用戶的實(shí)際需求,這就需要特定的過濾算法,從海量的中國音樂數(shù)據(jù)庫歌曲中進(jìn)行提取,并為用戶推薦特殊的個人播放列表。

        基于用戶的過濾和基于項(xiàng)目的過濾是傳統(tǒng)使用的推薦算法。在音樂大數(shù)據(jù)推薦過程中,基于用戶的過濾將用戶提供的歌曲的評分與同一首歌曲上其他用戶的評分進(jìn)行比較[3],并且根據(jù)與該用戶較高相似度的用戶的偏好來預(yù)測用戶喜歡的歌曲;基于用戶和基于項(xiàng)目的過濾識別具有相似性,但基于項(xiàng)目的是根據(jù)音樂本身來區(qū)分的,即按照音樂的相似性為用戶做出預(yù)測,該方式前提是樂曲間相似度關(guān)系的建立,建立用戶/項(xiàng)目矩陣是這兩種技術(shù)中的主要原始數(shù)據(jù)資源,如果用戶或歌曲數(shù)量過多,同時出現(xiàn)嚴(yán)重的信息不足問題,則這是一個嚴(yán)重的稀疏矩陣??上У氖?,這兩種技術(shù)在預(yù)測過程中并不能很好地解決嚴(yán)重的稀疏問題。

        協(xié)作過濾(Collaborative Filtering,CF)是通過收集來自其他類似用戶或項(xiàng)目的信息來自動預(yù)測用戶的相關(guān)值的有效方法,該方法已被廣泛應(yīng)用于電子商務(wù)系統(tǒng)中,如亞馬遜網(wǎng)絡(luò),易趣網(wǎng)等。實(shí)踐證明,CF在推薦系統(tǒng)中取得了巨大的成功。國內(nèi)外有關(guān)CF推薦的相關(guān)工作很多。Zhou[4]等結(jié)合了基于用戶的方法和基于項(xiàng)目的方法,通過采用來自其他類似用戶和類似Web服務(wù)的歷史Web服務(wù)QoS數(shù)據(jù)來預(yù)測當(dāng)前用戶的服務(wù)質(zhì)量(QoS)值;Dutta[5]等將線性組合用于項(xiàng)目評分相似度和項(xiàng)目屬性相似度,以預(yù)測對目標(biāo)用戶的評分,但改文章缺乏足夠的實(shí)驗(yàn)支持其假設(shè);Sutheera等[6]提出了一種基于項(xiàng)目的協(xié)同過濾方法,該方法將項(xiàng)目的屬性相似度與評分矩陣相似度相結(jié)合。在音樂海量數(shù)據(jù)庫中為用戶推薦合適的音樂對象,由于在音樂推薦過程中的用戶/音樂矩陣比較稀疏,因此會造成信息量的不足,為此本文提出一種更為有效的用于音樂推薦,解決音樂大數(shù)據(jù)集推薦問題的協(xié)同過濾算法。

        本文所提出的協(xié)同過濾算法通過導(dǎo)入權(quán)重因子,將基于項(xiàng)目的方法與基于用戶的方法相結(jié)合。在實(shí)施過程中,經(jīng)過幾次實(shí)驗(yàn),通過改變不同影響因素來檢驗(yàn)不同預(yù)測方法的效率;并采取平均絕對誤差(MAE)方法來評估實(shí)驗(yàn)結(jié)果,MAE越低,證明該方法的效果越好。

        1 協(xié)作過濾算法介紹

        基于用戶的協(xié)同過濾和基于項(xiàng)目的協(xié)同過濾是基于內(nèi)存過濾的兩種常用的協(xié)同方法,兩個方法的構(gòu)建過程圖,如圖1所示。

        圖1 協(xié)作過濾方法構(gòu)建過程圖

        如圖1所示,實(shí)施音樂推薦的一般協(xié)同過濾算法有3個主要步驟。首先,需要從原始數(shù)據(jù)集中獲得用戶音樂矩陣;其次,根據(jù)用戶音樂矩陣計(jì)算相似度矩陣,在基于用戶的協(xié)同過濾算法中,需要計(jì)算用戶之間的相似度,同樣,需要計(jì)算基于項(xiàng)目的過濾方法中音樂項(xiàng)目之間的相似度;最后,需要根據(jù)預(yù)測的評分值向用戶推薦音樂項(xiàng)目。這兩種算法的預(yù)測評分的計(jì)算方法是不同的,但共同目標(biāo)即是獲取準(zhǔn)確的結(jié)果,以下分別對各步驟進(jìn)行介紹[7-10]。

        (1)獲取用戶音樂矩陣

        從圖1中可以看出,第一步是獲取協(xié)同過濾算法中的用戶音樂矩陣。主要數(shù)據(jù)集由用戶信息和對應(yīng)的音樂信息組成,描述了用戶的偏好。R描述用戶音樂信息,由第一用戶評價的音樂的值存儲在矩陣R的第一行中,當(dāng)一些用戶不評價音樂片段時,矩陣中相應(yīng)位置的值將為零。評分矩陣如表1所示。

        表1 評分矩陣表

        (2)計(jì)算相似矩陣

        第二步是計(jì)算相似度矩陣。這意味著需要找出目標(biāo)用戶/音樂的鄰居用戶/音樂項(xiàng)目。該步主要區(qū)別基于用戶的方法和基于項(xiàng)目的方法,這個過程的本質(zhì)是計(jì)算兩個向量之間的相似性。Pearson相關(guān)性、余弦矢量相似性和調(diào)整余弦矢量相似性已經(jīng)被廣泛用于測量兩個矢量之間的相似性。具體計(jì)算如式(1)所示。

        Pearson相關(guān)性:

        (1)

        余弦相似性,如式(2)。

        (2)

        調(diào)整后的余弦相似度,如式(3)。

        (3)

        (3)獲取推薦結(jié)果

        最后一步既獲取用戶的最終推薦結(jié)果,通過獲取的項(xiàng)目評級列表,并且推薦活躍用戶可能評價更高值的項(xiàng)目。同樣,有不同的技術(shù)可以預(yù)測與這兩種方法相關(guān)的評級值。

        基于用戶的方案

        在基于用戶的方法中,根據(jù)用戶的相似性預(yù)測評分,如下式(4)所示:

        (4)

        基于項(xiàng)目的方案

        在基于項(xiàng)目的方法中,評分的預(yù)測與音樂項(xiàng)目的相似性有關(guān),計(jì)算式如下式(5)所示。

        (5)

        2 一種新的推薦算法

        2.1 算法介紹

        本文提出一種基于用戶和基于項(xiàng)目的共同協(xié)作算法,如式(6)為算法描述。

        (6)

        圖2 算法程序?qū)崿F(xiàn)圖

        2.2 實(shí)驗(yàn)分析

        通過MATLAB分析及比較了本文所提出的算法以及傳統(tǒng)的基于用戶和基于項(xiàng)目的算法,從百度音樂網(wǎng)站獲取數(shù)據(jù),根據(jù)實(shí)時統(tǒng)計(jì)在某時刻該音樂網(wǎng)站數(shù)據(jù)集合包含2 231 093個獨(dú)立用戶,1 474 996條MSD曲目和145 384 582條播放記錄,在本文的研究中選取894個用戶和884首歌曲以及相應(yīng)的播放記錄作為所研究的數(shù)據(jù)集。假設(shè)播放次數(shù)代表了用戶對音樂作品的偏好,即如果用戶對于某一首歌曲相比其他歌曲播放更多次數(shù),則用戶更喜歡該音樂,并假設(shè)任何人沒有播放的歌曲的評分值為零,轉(zhuǎn)換規(guī)則如表2所示。

        表2 轉(zhuǎn)換規(guī)則表

        獲取用戶音樂信息評分矩陣后,通過從原始數(shù)據(jù)集中隨機(jī)獲取訓(xùn)練集和測試集。然后通過使用這套訓(xùn)練集和測試集來進(jìn)行完成實(shí)驗(yàn)。在實(shí)驗(yàn)過程中,通過本文所提出的協(xié)作過濾算法和基于用戶及基于項(xiàng)目的過濾算法進(jìn)行預(yù)測結(jié)果,在計(jì)算用戶和音樂片段之間的相似度的過程中使用了調(diào)整后的余弦矢量相似度。

        在以下的實(shí)驗(yàn)過程中采用平均絕對誤差(MAE)來評估預(yù)測的準(zhǔn)確性,MAE通過比較其預(yù)測值來評估預(yù)測的準(zhǔn)確性。MAE的值越小,預(yù)測算法越準(zhǔn)確。MAE的計(jì)算定義如下:

        (7)

        有幾個因素會影響預(yù)測的準(zhǔn)確性,例如不同的預(yù)測方法,預(yù)測過程中鄰居的數(shù)量以及數(shù)據(jù)集中測試數(shù)據(jù)的百分比。

        (1)鄰居數(shù)量的影響結(jié)果

        為了找到實(shí)驗(yàn)中鄰居數(shù)量的影響,將其他變量設(shè)置為常量。改變所有這些預(yù)測方法的鄰居數(shù)量,得到了如圖3所示的結(jié)果。

        (2)測試數(shù)據(jù)的百分比影響結(jié)果

        在實(shí)驗(yàn)過程中,將鄰居的數(shù)量設(shè)置為常量。并且選擇了測試數(shù)據(jù)的百分比作為變量,然后得到了所有三種方法的結(jié)果,如圖4所示。

        圖3 三種方法的MAE隨著鄰居的增加而變化圖

        圖4 三種方法的MAE隨著試驗(yàn)數(shù)據(jù)的百分比的增加而變化圖

        3 總結(jié)

        本文提出一種用于音樂數(shù)據(jù)庫推薦的協(xié)同過濾算法,該算法將基于用戶的協(xié)同過濾方法和基于項(xiàng)目的協(xié)同過濾方法進(jìn)行結(jié)合,從理論上該方法可以通過導(dǎo)入權(quán)重因子參數(shù)來減少稀疏矩陣的負(fù)面影響。通過實(shí)驗(yàn)證明,該方法可以改進(jìn)推薦效果。通過結(jié)果分析,該方法的平均絕對誤差分別低于基于用戶的方法和基于項(xiàng)目的方法,表明預(yù)測評分的準(zhǔn)確性會提高。同時,隨著鄰居數(shù)量的增加,平均絕對誤差得到優(yōu)化;隨著測試數(shù)據(jù)比例的增加而變化,MAE非單調(diào)下降;但是,當(dāng)百分比為25%時,預(yù)測精度是最優(yōu)的。

        猜你喜歡
        相似性協(xié)同矩陣
        一類上三角算子矩陣的相似性與酉相似性
        蜀道難:車與路的協(xié)同進(jìn)化
        淺析當(dāng)代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        “四化”協(xié)同才有出路
        汽車觀察(2019年2期)2019-03-15 06:00:50
        三醫(yī)聯(lián)動 協(xié)同創(chuàng)新
        初等行變換與初等列變換并用求逆矩陣
        低滲透黏土中氯離子彌散作用離心模擬相似性
        矩陣
        南都周刊(2015年4期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年3期)2015-09-10 07:22:44
        矩陣
        南都周刊(2015年1期)2015-09-10 07:22:44
        天天躁日日躁狠狠很躁| 国产av无毛无遮挡网站| 亚洲av无码国产精品色午夜软件| 中文无码熟妇人妻av在线| 久久香蕉国产精品一区二区三| 欧美精品高清在线xxxx| 日本精品一区二区三区试看| 熟女无套高潮内谢吼叫免费| 国模少妇一区二区三区| 最新欧美一级视频| 国产在线观看一区二区三区av| 欧美成人国产精品高潮| 区久久aaa片69亚洲| 日本国产一区二区三区在线观看| 亚洲一区二区三区成人网| 亚洲中文字幕一区精品自拍| 少妇高潮惨叫喷水在线观看| 蜜桃视频中文在线观看| 亚洲av三级黄色在线观看| 少妇被粗大的猛烈进出免费视频 | 国产成人a∨激情视频厨房| √天堂中文官网8在线| 国产桃色精品网站| 日韩人妻精品视频一区二区三区| 忘忧草社区www日本高清| 福利一区二区三区视频午夜观看| av网站在线观看二区| 精品无码国产一区二区三区麻豆| 亚洲精品成人区在线观看| 久久久久久久久国内精品影视| 精品国产一区二区三区a| 成人午夜特黄aaaaa片男男 | 欧洲国产成人精品91铁牛tv| 久久精品亚洲国产av网站| 亚洲国产成人av在线观看| 国产精品黄网站免费观看| 久久国产精品av在线观看| 国产精品亚洲精品日韩已方 | 欲香欲色天天天综合和网| 国产午夜三级一区二区三| 国产精品玖玖资源站大全|