亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于張量分解的個(gè)性化微博推薦算法研究

        2017-10-28 18:10:21秦曉暉
        軟件工程 2017年9期

        摘 要:隨著社交媒體的發(fā)展,微博為人們提供的服務(wù)正在極大地改變著人們使用互聯(lián)網(wǎng)的習(xí)慣,然而微博上用戶(hù)發(fā)表的大量信息,以及高頻率的信息更新,使得用戶(hù)面臨信息過(guò)載的問(wèn)題而無(wú)法快速獲取他感興趣的信息。推薦系統(tǒng)是解決此問(wèn)題的一種很好的方法,它是通過(guò)研究用戶(hù)已有數(shù)據(jù)來(lái)發(fā)掘用戶(hù)興趣,從而為用戶(hù)推薦可能感興趣的對(duì)象,如產(chǎn)品、網(wǎng)頁(yè)、微博等。本文介紹了一種基于張量分解技術(shù)的微博推薦算法來(lái)預(yù)測(cè)用戶(hù)對(duì)微博的興趣度,同時(shí)考慮用戶(hù)與微博、用戶(hù)與微博發(fā)布者影響因素,以及微博與微博發(fā)布者的影響因素,提高了已有算法的準(zhǔn)確度。

        關(guān)鍵詞:微博推薦;矩陣分解;張量分解

        中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A

        Abstract:With the development of social media,the services in micro-blog have significantly changed the way people use the Internet.However,as the large amount of information posted by users and the highly frequent update on micro-blogs,users often face the problem of information overload and miss out the content they are interested in.The recommendation system,which recommends items(such as products,web pages,micro-blogs,etc.)to users based on their interests,is an effective solution to this problem.The paper introduces a micro-blog recommendation algorithm based on the tensor factorization technology to predict the user's interest degree on certain micro-blog.The experimental results on real dataset show that the proposed model achieves desirable performance in characterizing the user's interest and the preprocessing of data on micro-blog.Finally,the paper presents the experimental results which show that the method significantly outperforms the baseline method.

        Keywords:micro-blog recommendation;matrix factorization;tensor factorization

        1 引言(Introduction)

        目前,一些微博推薦算法在發(fā)掘用戶(hù)在社交媒體中的興趣和行為中表現(xiàn)出了一定的優(yōu)越性,例如基于內(nèi)容的推薦算法,但是目前大多數(shù)方法都通過(guò)內(nèi)容等顯性因素來(lái)預(yù)測(cè)用戶(hù)的興趣度而沒(méi)有考慮一些內(nèi)在的隱性因素。然而社交網(wǎng)絡(luò)中的信息是豐富且復(fù)雜的,只通過(guò)一些顯性因素來(lái)預(yù)測(cè)用戶(hù)興趣度是不夠的。因子分解模型最初被用于推薦系統(tǒng)中來(lái)對(duì)用戶(hù)感興趣的商品進(jìn)行推薦[1]。為了更好地對(duì)用戶(hù)行為建模,一些研究使用隱因子模型對(duì)用戶(hù)的興趣度進(jìn)行預(yù)測(cè),而這些無(wú)法直接獲取的隱性因素是影響用戶(hù)興趣度的主要因素。這些方法使用矩陣分解算法分別考慮用戶(hù)和微博主題,用戶(hù)和微博發(fā)布者之間的社會(huì)關(guān)系,以及微博發(fā)布者與微博主題之間的隱性因素,通過(guò)兩兩之間關(guān)系來(lái)預(yù)測(cè)用戶(hù)對(duì)微博的興趣度。然而,同樣內(nèi)容的微博被不同的發(fā)布者發(fā)布的話,用戶(hù)的興趣度是不同的,因此我們應(yīng)綜合考慮用戶(hù)與微博,以及微博發(fā)布者它們之間的隱性因素共同對(duì)微博興趣度的影響。

        張量是對(duì)向量和矩陣的擴(kuò)展[2],因此它可以表示多元數(shù)據(jù),已有的矩陣分解方法丟失了用戶(hù)與微博,以及微博發(fā)布者三者之間在三維空間上對(duì)用戶(hù)興趣度的影響而張量分解模型很好地解決推薦系統(tǒng)中存在的多元影響因素[3]。而現(xiàn)實(shí)生活中的數(shù)據(jù)一般都具有多元特征,相對(duì)復(fù)雜,因此張量模型很好地模擬了推薦系統(tǒng)中數(shù)據(jù)的多元影響關(guān)系。

        2 微博排序優(yōu)化準(zhǔn)則(Optimizing ranking criterion

        for weibo recommendation)

        3 基于張量的分解模型(Tensor factorization model)

        本文需要同時(shí)考慮用戶(hù)、微博、微博發(fā)布者這三個(gè)因素來(lái)預(yù)測(cè)用戶(hù)對(duì)微博的興趣度,即將二維矩陣拓展為三維張量來(lái)表示影響興趣度的隱性因素,也就是分解用戶(hù)—微博—發(fā)布者張量來(lái)預(yù)測(cè)用戶(hù)對(duì)微博的喜好度。

        為了和大多數(shù)的基于矩陣分解的推薦系統(tǒng)中的方法對(duì)比,我們可以將三維張量理解為在傳統(tǒng)二維矩陣的基礎(chǔ)上增加一個(gè)維度,即一種典型的張量分解方法Tucker分解,該分解模型產(chǎn)生的類(lèi)似于SVD的左右奇異矩陣子結(jié)構(gòu)方便與已有算法SVD進(jìn)行實(shí)驗(yàn)結(jié)果對(duì)比[5,6]。Tucker分解把原張量分解為一個(gè)核心張量與一系列矩陣的乘積。這里我們以對(duì)三維張量的分解為例說(shuō)明Tucker的具體分解過(guò)程,詳見(jiàn)公式(5):

        4 實(shí)驗(yàn)(Experiment)

        4.1 數(shù)據(jù)來(lái)源

        本文數(shù)據(jù)來(lái)源于新浪微博,使用爬蟲(chóng)系統(tǒng)根據(jù)本文需求爬取相關(guān)數(shù)據(jù)[7]。網(wǎng)絡(luò)爬蟲(chóng)作為一種自動(dòng)提取網(wǎng)頁(yè)信息的計(jì)算機(jī)程序或者自動(dòng)化腳本[8],它是搜索引擎的核心技術(shù)。本文先隨機(jī)選取一個(gè)微博用戶(hù)以發(fā)射狀不斷爬取該用戶(hù)的關(guān)注者的數(shù)據(jù),以及關(guān)注者的關(guān)注者的數(shù)據(jù),然后從這些數(shù)據(jù)中選出1024個(gè)微博用戶(hù)的主頁(yè)信息,但這些用戶(hù)的關(guān)注者人數(shù)需超過(guò)15。endprint

        4.2 評(píng)價(jià)標(biāo)準(zhǔn)

        本文通過(guò)平均準(zhǔn)確率評(píng)估預(yù)測(cè)結(jié)果的準(zhǔn)確度。本文推薦模型的結(jié)果是微博的排序,同時(shí)微博的排序位置還關(guān)聯(lián)了準(zhǔn)確度使得推薦模型能得到更準(zhǔn)確的評(píng)估,即微博成功推薦,如果它的排序越靠前那么平均準(zhǔn)確率就越高。如果系成功推薦的微博個(gè)數(shù)為0那么準(zhǔn)確率為0。評(píng)估公式見(jiàn)式(16):

        4.3 實(shí)驗(yàn)結(jié)果

        為了驗(yàn)證算法的有效性,本文增加其他幾種方法來(lái)對(duì)比實(shí)驗(yàn)結(jié)果,包括按照時(shí)間排序的方法、按相似度排序的方法、矩陣分解模型算法SVD[9]。張量分解算法(TF)綜合考慮用戶(hù)、微博和微博發(fā)布者三者之間的關(guān)系,較SVD更加準(zhǔn)確地評(píng)估對(duì)用戶(hù)興趣度的影響。張量分解算法使用隨機(jī)梯度算法來(lái)估計(jì)實(shí)驗(yàn)參數(shù),矩陣分解過(guò)程中K值取30準(zhǔn)確率最高。

        5 結(jié)論(Conclusion)

        時(shí)間排序的推薦方法由于依賴(lài)用戶(hù)的登錄時(shí)間而對(duì)登錄時(shí)間前后的微博轉(zhuǎn)發(fā)的概率大,因此預(yù)測(cè)的準(zhǔn)確度很低。相似度排序的算法只通過(guò)關(guān)鍵詞計(jì)算微博表面相似度來(lái)預(yù)測(cè)而忽略了內(nèi)在的語(yǔ)義。SVD只考慮用戶(hù)、微博與微博發(fā)布者兩兩之間的關(guān)系,忽略三者之間的共同作用沒(méi)有反映數(shù)據(jù)的真實(shí)信息而準(zhǔn)確度低于TF方法。

        參考文獻(xiàn)(References)

        [1] Lu J,et al.Recommender system application developments:a survey[J].Decision Support Systems,2015,74:12-32.

        [2]Jain P,Oh S.Provable tensor factorization with missing data[C].Advances in Neural Information Processing Systems,2014:1431-1439.

        [3] Ding G,Guo Y,Zhou J.Collective matrix factorization hashing for multimodal data[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014:2075-2082.

        [4] 冷亞軍,陸青,梁昌勇.協(xié)同過(guò)濾推薦技術(shù)綜述[J].模式識(shí)別與人工智能,2014,27(8):720-734.

        [5] Rendle S.Factorization machines[A].The IEEE International Conference on Data Mining.Sydney:2010:995-1000.

        [6] Cao Y.,et al.Adapting ranking SVM to document retrieval[C].The 29th Annual International SIGIR Conference.Seattle,WA:2006:186-193.

        [7] 孫立偉,何國(guó)輝,吳禮發(fā).網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的研究[J].電腦知識(shí)與技術(shù),2010,6(15):4112-4115.

        [8] 高建煌.個(gè)性化推薦系統(tǒng)技術(shù)與成用[D].中國(guó)科學(xué)技術(shù)大學(xué),

        2010.

        [9] 秦曉暉.基于協(xié)同過(guò)濾的個(gè)性化微博推薦算法研究[J].軟件工程,2017,20(3):14-17.

        作者簡(jiǎn)介:

        秦曉暉(1987-),女,碩士,助教.研究領(lǐng)域:中文信息處理,人工智能.endprint

        翘臀诱惑中文字幕人妻| 无码国产激情在线观看| 国产无码swag专区| 人妻尤物娇呻雪白丰挺| 国产精品美女久久久网站三级| 摸进她的内裤里疯狂揉她动图视频| 粗了大了 整进去好爽视频| 免费在线观看一区二区| 国产福利不卡视频在线| 麻豆亚洲av熟女国产一区二| 亚洲精品综合欧美一区二区三区| 亚洲专区一区二区在线观看| 国产亚洲av一线观看| 日韩精品人妻中文字幕有码| 99久久精品费精品国产一区二区| 精品福利一区| 麻豆视频黄片在线免费观看 | 久久午夜羞羞影院免费观看| 亚洲av日韩av永久无码色欲| 蜜芽尤物原创AV在线播放| 亚洲一区二区三区重口另类 | 亚洲av一二三区成人影片| 国内老熟妇对白xxxxhd| 国产av无码专区亚洲av麻豆| 国产免费又爽又色又粗视频| 午夜精品久久久久久中宇| 97超级碰碰碰久久久观看| 日本午夜艺术一区二区| 免费无码av一区二区| 国产日韩成人内射视频| 亚洲一区二区av偷偷| 日本熟女中文字幕在线| 久久久精品456亚洲影院| 国产精品99久久国产小草| 按摩少妇高潮在线一区| 在线播放免费人成毛片乱码| 豆国产95在线 | 亚洲| 亚洲天堂av另类在线播放| 激情人妻另类人妻伦| 秋霞鲁丝片av无码| 国产在线白浆一区二区三区在线|