亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于張量分解的個(gè)性化微博推薦算法研究

        2017-10-28 18:10:21秦曉暉
        軟件工程 2017年9期

        摘 要:隨著社交媒體的發(fā)展,微博為人們提供的服務(wù)正在極大地改變著人們使用互聯(lián)網(wǎng)的習(xí)慣,然而微博上用戶(hù)發(fā)表的大量信息,以及高頻率的信息更新,使得用戶(hù)面臨信息過(guò)載的問(wèn)題而無(wú)法快速獲取他感興趣的信息。推薦系統(tǒng)是解決此問(wèn)題的一種很好的方法,它是通過(guò)研究用戶(hù)已有數(shù)據(jù)來(lái)發(fā)掘用戶(hù)興趣,從而為用戶(hù)推薦可能感興趣的對(duì)象,如產(chǎn)品、網(wǎng)頁(yè)、微博等。本文介紹了一種基于張量分解技術(shù)的微博推薦算法來(lái)預(yù)測(cè)用戶(hù)對(duì)微博的興趣度,同時(shí)考慮用戶(hù)與微博、用戶(hù)與微博發(fā)布者影響因素,以及微博與微博發(fā)布者的影響因素,提高了已有算法的準(zhǔn)確度。

        關(guān)鍵詞:微博推薦;矩陣分解;張量分解

        中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A

        Abstract:With the development of social media,the services in micro-blog have significantly changed the way people use the Internet.However,as the large amount of information posted by users and the highly frequent update on micro-blogs,users often face the problem of information overload and miss out the content they are interested in.The recommendation system,which recommends items(such as products,web pages,micro-blogs,etc.)to users based on their interests,is an effective solution to this problem.The paper introduces a micro-blog recommendation algorithm based on the tensor factorization technology to predict the user's interest degree on certain micro-blog.The experimental results on real dataset show that the proposed model achieves desirable performance in characterizing the user's interest and the preprocessing of data on micro-blog.Finally,the paper presents the experimental results which show that the method significantly outperforms the baseline method.

        Keywords:micro-blog recommendation;matrix factorization;tensor factorization

        1 引言(Introduction)

        目前,一些微博推薦算法在發(fā)掘用戶(hù)在社交媒體中的興趣和行為中表現(xiàn)出了一定的優(yōu)越性,例如基于內(nèi)容的推薦算法,但是目前大多數(shù)方法都通過(guò)內(nèi)容等顯性因素來(lái)預(yù)測(cè)用戶(hù)的興趣度而沒(méi)有考慮一些內(nèi)在的隱性因素。然而社交網(wǎng)絡(luò)中的信息是豐富且復(fù)雜的,只通過(guò)一些顯性因素來(lái)預(yù)測(cè)用戶(hù)興趣度是不夠的。因子分解模型最初被用于推薦系統(tǒng)中來(lái)對(duì)用戶(hù)感興趣的商品進(jìn)行推薦[1]。為了更好地對(duì)用戶(hù)行為建模,一些研究使用隱因子模型對(duì)用戶(hù)的興趣度進(jìn)行預(yù)測(cè),而這些無(wú)法直接獲取的隱性因素是影響用戶(hù)興趣度的主要因素。這些方法使用矩陣分解算法分別考慮用戶(hù)和微博主題,用戶(hù)和微博發(fā)布者之間的社會(huì)關(guān)系,以及微博發(fā)布者與微博主題之間的隱性因素,通過(guò)兩兩之間關(guān)系來(lái)預(yù)測(cè)用戶(hù)對(duì)微博的興趣度。然而,同樣內(nèi)容的微博被不同的發(fā)布者發(fā)布的話,用戶(hù)的興趣度是不同的,因此我們應(yīng)綜合考慮用戶(hù)與微博,以及微博發(fā)布者它們之間的隱性因素共同對(duì)微博興趣度的影響。

        張量是對(duì)向量和矩陣的擴(kuò)展[2],因此它可以表示多元數(shù)據(jù),已有的矩陣分解方法丟失了用戶(hù)與微博,以及微博發(fā)布者三者之間在三維空間上對(duì)用戶(hù)興趣度的影響而張量分解模型很好地解決推薦系統(tǒng)中存在的多元影響因素[3]。而現(xiàn)實(shí)生活中的數(shù)據(jù)一般都具有多元特征,相對(duì)復(fù)雜,因此張量模型很好地模擬了推薦系統(tǒng)中數(shù)據(jù)的多元影響關(guān)系。

        2 微博排序優(yōu)化準(zhǔn)則(Optimizing ranking criterion

        for weibo recommendation)

        3 基于張量的分解模型(Tensor factorization model)

        本文需要同時(shí)考慮用戶(hù)、微博、微博發(fā)布者這三個(gè)因素來(lái)預(yù)測(cè)用戶(hù)對(duì)微博的興趣度,即將二維矩陣拓展為三維張量來(lái)表示影響興趣度的隱性因素,也就是分解用戶(hù)—微博—發(fā)布者張量來(lái)預(yù)測(cè)用戶(hù)對(duì)微博的喜好度。

        為了和大多數(shù)的基于矩陣分解的推薦系統(tǒng)中的方法對(duì)比,我們可以將三維張量理解為在傳統(tǒng)二維矩陣的基礎(chǔ)上增加一個(gè)維度,即一種典型的張量分解方法Tucker分解,該分解模型產(chǎn)生的類(lèi)似于SVD的左右奇異矩陣子結(jié)構(gòu)方便與已有算法SVD進(jìn)行實(shí)驗(yàn)結(jié)果對(duì)比[5,6]。Tucker分解把原張量分解為一個(gè)核心張量與一系列矩陣的乘積。這里我們以對(duì)三維張量的分解為例說(shuō)明Tucker的具體分解過(guò)程,詳見(jiàn)公式(5):

        4 實(shí)驗(yàn)(Experiment)

        4.1 數(shù)據(jù)來(lái)源

        本文數(shù)據(jù)來(lái)源于新浪微博,使用爬蟲(chóng)系統(tǒng)根據(jù)本文需求爬取相關(guān)數(shù)據(jù)[7]。網(wǎng)絡(luò)爬蟲(chóng)作為一種自動(dòng)提取網(wǎng)頁(yè)信息的計(jì)算機(jī)程序或者自動(dòng)化腳本[8],它是搜索引擎的核心技術(shù)。本文先隨機(jī)選取一個(gè)微博用戶(hù)以發(fā)射狀不斷爬取該用戶(hù)的關(guān)注者的數(shù)據(jù),以及關(guān)注者的關(guān)注者的數(shù)據(jù),然后從這些數(shù)據(jù)中選出1024個(gè)微博用戶(hù)的主頁(yè)信息,但這些用戶(hù)的關(guān)注者人數(shù)需超過(guò)15。endprint

        4.2 評(píng)價(jià)標(biāo)準(zhǔn)

        本文通過(guò)平均準(zhǔn)確率評(píng)估預(yù)測(cè)結(jié)果的準(zhǔn)確度。本文推薦模型的結(jié)果是微博的排序,同時(shí)微博的排序位置還關(guān)聯(lián)了準(zhǔn)確度使得推薦模型能得到更準(zhǔn)確的評(píng)估,即微博成功推薦,如果它的排序越靠前那么平均準(zhǔn)確率就越高。如果系成功推薦的微博個(gè)數(shù)為0那么準(zhǔn)確率為0。評(píng)估公式見(jiàn)式(16):

        4.3 實(shí)驗(yàn)結(jié)果

        為了驗(yàn)證算法的有效性,本文增加其他幾種方法來(lái)對(duì)比實(shí)驗(yàn)結(jié)果,包括按照時(shí)間排序的方法、按相似度排序的方法、矩陣分解模型算法SVD[9]。張量分解算法(TF)綜合考慮用戶(hù)、微博和微博發(fā)布者三者之間的關(guān)系,較SVD更加準(zhǔn)確地評(píng)估對(duì)用戶(hù)興趣度的影響。張量分解算法使用隨機(jī)梯度算法來(lái)估計(jì)實(shí)驗(yàn)參數(shù),矩陣分解過(guò)程中K值取30準(zhǔn)確率最高。

        5 結(jié)論(Conclusion)

        時(shí)間排序的推薦方法由于依賴(lài)用戶(hù)的登錄時(shí)間而對(duì)登錄時(shí)間前后的微博轉(zhuǎn)發(fā)的概率大,因此預(yù)測(cè)的準(zhǔn)確度很低。相似度排序的算法只通過(guò)關(guān)鍵詞計(jì)算微博表面相似度來(lái)預(yù)測(cè)而忽略了內(nèi)在的語(yǔ)義。SVD只考慮用戶(hù)、微博與微博發(fā)布者兩兩之間的關(guān)系,忽略三者之間的共同作用沒(méi)有反映數(shù)據(jù)的真實(shí)信息而準(zhǔn)確度低于TF方法。

        參考文獻(xiàn)(References)

        [1] Lu J,et al.Recommender system application developments:a survey[J].Decision Support Systems,2015,74:12-32.

        [2]Jain P,Oh S.Provable tensor factorization with missing data[C].Advances in Neural Information Processing Systems,2014:1431-1439.

        [3] Ding G,Guo Y,Zhou J.Collective matrix factorization hashing for multimodal data[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014:2075-2082.

        [4] 冷亞軍,陸青,梁昌勇.協(xié)同過(guò)濾推薦技術(shù)綜述[J].模式識(shí)別與人工智能,2014,27(8):720-734.

        [5] Rendle S.Factorization machines[A].The IEEE International Conference on Data Mining.Sydney:2010:995-1000.

        [6] Cao Y.,et al.Adapting ranking SVM to document retrieval[C].The 29th Annual International SIGIR Conference.Seattle,WA:2006:186-193.

        [7] 孫立偉,何國(guó)輝,吳禮發(fā).網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的研究[J].電腦知識(shí)與技術(shù),2010,6(15):4112-4115.

        [8] 高建煌.個(gè)性化推薦系統(tǒng)技術(shù)與成用[D].中國(guó)科學(xué)技術(shù)大學(xué),

        2010.

        [9] 秦曉暉.基于協(xié)同過(guò)濾的個(gè)性化微博推薦算法研究[J].軟件工程,2017,20(3):14-17.

        作者簡(jiǎn)介:

        秦曉暉(1987-),女,碩士,助教.研究領(lǐng)域:中文信息處理,人工智能.endprint

        无码日韩人妻AV一区免费| 中国美女a级毛片| 果冻传媒2021精品一区 | 精品久久久久一区二区国产| av东京热一区二区三区| 亚洲国产精品久久婷婷| 丰满多毛的大隂户毛茸茸 | 亚洲va久久久噜噜噜久久男同| 国产亚洲日韩欧美一区二区三区| 精品久久久无码不卡| 午夜亚洲精品视频在线| 99在线精品视频在线观看| 日日干夜夜操高清视频| 久久久久久人妻一区精品| 国语对白精品在线观看| 国产无遮挡又爽又刺激的视频老师| 欧美末成年videos在线观看| 国产精品麻豆成人av| av日韩高清一区二区| 边喂奶边中出的人妻| 性导航app精品视频| 大又黄又粗又爽少妇毛片| 丰满人妻一区二区三区视频| 亚洲精品成人区在线观看| a午夜国产一级黄片| 久久91精品国产一区二区| 精品无码国产自产拍在线观看| 亚洲中文无码成人影院在线播放| 日韩成人精品一区二区三区 | а天堂8中文最新版在线官网| 人妻熟妇乱又伦精品视频app| 亚洲国产视频精品一区二区| 久久免费看的少妇一级特黄片| 人妻丝袜av中文系列先锋影音 | 亚洲av无码片在线观看| 色窝综合网| 女人天堂av人禽交在线观看| 无码吃奶揉捏奶头高潮视频 | 人妻少妇av无码一区二区| 久久精品韩国日本国产| 人妻免费一区二区三区免费|