亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于移動用戶瀏覽行為的推薦模型

        2017-12-22 03:58:48鄭文韜秦志光
        電子科技大學學報 2017年6期
        關鍵詞:移動用戶項集算法

        丁 哲,秦 臻,鄭文韜,秦志光

        ?

        基于移動用戶瀏覽行為的推薦模型

        丁 哲,秦 臻,鄭文韜,秦志光

        (電子科技大學信息與軟件工程學院 成都 610054; 電子科技大學網絡與數(shù)據安全四川省重點實驗室 成都 610054)

        推薦算法已經被廣泛地應用于很多領域。但是如果利用傳統(tǒng)的推薦算法預測移動用戶瀏覽互聯(lián)網的行為,并在此基礎上對移動用戶進行個性化的內容推薦,傳統(tǒng)推薦算法的推薦效果往往比較差。該文通過分析移動用戶瀏覽互聯(lián)網的記錄,得出傳統(tǒng)推薦算法效果差的原因。在此基礎上,提出了一個基于移動用戶瀏覽行為的推薦模型,即RMBDMU。該模型可以對移動用戶瀏覽互聯(lián)網的行為進行預測,在預測的基礎上對移動用戶進行內容推薦。為了驗證推薦模型的有效性,在真實的移動用戶瀏覽互聯(lián)網的行為數(shù)據上進行了實驗。實驗結果顯示基于移動用戶瀏覽行為的推薦模型比傳統(tǒng)的推薦算法更為有效。

        移動用戶; 瀏覽行為的預測; 概率頻繁項集挖掘; 推薦模型

        隨著手機應用的普及,移動技術已經成為人們生活中不可或缺的一部分。人們利用手機通訊、瀏覽網上的信息等,使電商和移動運營商掌握了大量移動用戶上網行為的數(shù)據。如何利用這些數(shù)據預測移動用戶的上網行為,并在預測的基礎上對用戶進行內容推薦成為了學術界的研究熱點。目前大部分電商網站,如淘寶、亞馬遜等,都利用所掌握的用戶數(shù)據為用戶提供產品推薦

        與傳統(tǒng)的用戶購買記錄和用戶評分記錄不同,移動用戶瀏覽互聯(lián)網信息的行為記錄存在很大不確定性。這就導致了傳統(tǒng)的基于用戶購買或評分數(shù)據的推薦算法不適用于基于移動用戶瀏覽行為的推薦。移動用戶常常為了完成一個自己相對陌生的臨時任務,需要利用手機在互聯(lián)網上瀏覽大量相關的信息。當這項工作完成以后,該用戶很少瀏覽相關信息。例如,一個移動用戶去倫敦度假,他會利用手機在互聯(lián)網上瀏覽大量關于倫敦旅游景點的信息。當他度假回來,可能就很少關注倫敦旅游景點的信息。移動用戶在互聯(lián)網上的大部分瀏覽行為都是為了完成這種臨時性的任務而產生的,所以移動用戶瀏覽大部分互聯(lián)網信息的原因并不是自己的興趣,而是這種臨時的需求,這就導致了移動用戶瀏覽行為記錄存在很大的不確定性。所以很難利用傳統(tǒng)的推薦算法發(fā)現(xiàn)用戶真正感興趣的互聯(lián)網信息。為了能夠從移動用戶瀏覽行為的記錄中發(fā)現(xiàn)移動用戶的興趣,本文提出一種新的基于移動用戶瀏覽行為的推薦模型(recommendation model based on mobile user behaviors, RMBDMU)。該模型不僅分析了移動用戶瀏覽互聯(lián)網信息的次數(shù),還分析了移動用戶關注互聯(lián)網信息的天數(shù),從而分析出移動用戶的興趣。本文有以下3個貢獻。

        1) 通過分析移動用戶瀏覽互聯(lián)網信息的記錄,發(fā)現(xiàn)造成傳統(tǒng)推薦算法無法有效地應用于基于移動用戶瀏覽信息推薦的原因。

        2) 提出一種新的基于移動用戶瀏覽行為的推薦模型(RMBDMU)。

        3) 在真實的移動用戶瀏覽行為的數(shù)據上對提出的推薦模型進行實驗,實驗結果表明該推薦模型比傳統(tǒng)的推薦算法更為有效。

        1 相關工作

        最常用的協(xié)同過濾推薦算法是建立在鄰居模型的基礎上。最早的基于鄰居模型的協(xié)同過濾推薦算法是基于用戶鄰居的協(xié)調過濾推薦算法[1]。如果將基于用戶鄰居的協(xié)同過濾推薦算法應用于電商系統(tǒng),該算法需要大量的計算量,這就導致了推薦效果較差。為了解決這一問題,基于項目鄰居的協(xié)同過濾算法得到廣泛的應用[2-3]。

        基于隱語義模型推薦算法,如奇異分解,也是一種常用的協(xié)同過濾模型。隱語義模型中,隱因子建立用戶興趣和商品之間的聯(lián)系[4-5]。文獻[6]在SVD中引入了自信度,并提出基于隱反饋的推薦算法。文獻[7]利用價格之間的聯(lián)系處理推薦算法中的冷啟動問題。

        頻繁項集挖掘是數(shù)據挖掘中的一個重要的分支。1993年,文獻[8]提出了Apriori算法。為了提高項集挖掘的效率,文獻[9]提出了基于FP樹挖掘算法,基于FP樹挖掘算法相對Apriori算法,減少了挖掘頻繁項集的運行時間和所需的空間。雖然Aprior和基于FP樹挖掘算法得到了廣泛的應用,但Apriori算法和基于FP樹的挖掘算法很難直接應用于基于不確定數(shù)據集的頻繁項集挖掘。在2007年,文獻[10]提出了期望支持度的方法來計算項集在不確定數(shù)據集中的支持度。文獻[11]提出了頻繁概率來計算項集在不確定數(shù)據集中的支持度。本文利用頻繁概率作為頻繁度的度量。文獻[12]提出了一種新的挖掘概率頻繁項集的方法,該方法可以挖掘出由項集組成的集合,包含項集的個數(shù)最少,但包含的所有頻繁項集的概率很高。而文獻[12]中計算頻繁概率的方法則是建立在泊松二項分布的相關理論[13-15]基礎上。

        2 數(shù)據分析

        本文根據互聯(lián)網信息的內容對互聯(lián)網信息進行分類。由于移動用戶瀏覽互聯(lián)網信息的原因很多,并且在一時間段,移動用戶關注的時間不一定隨著瀏覽的次數(shù)增加而增加。所以傳統(tǒng)推薦算法很難在瀏覽數(shù)據中發(fā)現(xiàn)移動用戶的興趣。

        2.1 數(shù)據描述

        本文應用的數(shù)據是31660個用戶3個月的智能手機應用程序日志,這些數(shù)據來源于網絡運營商。當智能手機的應用程序訪問互聯(lián)網的資源時,就會生成其訪問資源的記錄。所使用的數(shù)據包括179 954181個訪問記錄,每個記錄是由表示其用戶ID和被訪問互聯(lián)網資源的數(shù)字編碼組成。通過使用正則表達式對不同關鍵字的匹配,得到了與被訪問的互聯(lián)網資源相匹配的主題。本文按照主題對信息進行分類,如體育類、金融類等。通過分析31660個移動用戶在2013年10月的瀏覽數(shù)據,發(fā)現(xiàn)移動用戶的瀏覽特征。

        2.2 關注時間分析

        圖1 關注時間對比分析

        通過分析31660個移動用戶在2013年10月瀏覽網絡信息的日志,獲得移動用戶瀏覽行為的特點。在2013年10月中,不同的關注天數(shù)的主題占2013年10月關注所有主題的人均百分比如圖1所示。在圖1中,橫坐標表示移動用戶對主題的關注天數(shù),縱坐標表示關注相應天數(shù)的主題數(shù)占2013年10月總關注主題數(shù)的人均百分比。從圖1可以看出,在10月份,移動用戶瀏覽的不同主題的信息,大部分主題只關注1~3天,即關注1~3天的主題數(shù)占10份關注總主題數(shù)的42%。隨著關注時間的擴大,關注主題數(shù)急劇下降。當關注時間大于20天后,關注的主題數(shù)目趨近于平穩(wěn),約占10月份關注總主題數(shù)的5%。

        2.3 瀏覽次數(shù)分析

        分析不同關注天數(shù)的主題的人均瀏覽次數(shù),如圖2所示。通過分析圖2,可以發(fā)現(xiàn)在2013年10月,移動用戶對主題的瀏覽次數(shù)并不一定隨著關注時間的增加而增加。

        圖2 瀏覽次數(shù)對比

        通過上述分析,可以得出:1)移動用戶關注大量的互聯(lián)網信息,但是只有很少的一部分是與該用戶的興趣相關的;2) 在一段時間之內,移動用戶瀏覽次數(shù)多的互聯(lián)網信息不一定與該用戶的興趣相關聯(lián)。

        3 推薦模型

        本文提出一個新的基于移動用戶瀏覽行為的推薦模型(RMBDMU)。該模型建立在概率頻繁項集挖掘的基礎上,發(fā)現(xiàn)移動用戶對于不同主題的互聯(lián)網信息的興趣度,然后根據興趣度的大小,將主題以遞減的方式排序,最后將前個主題推薦給移動用戶。

        為了使模型有更好的推薦效果,本文從兩方面對第個主題信息的興趣度的預測結果進行優(yōu)化。

        1) 利用用戶鄰居對用戶的興趣度進行優(yōu)化

        如果不同的移動用戶具有相似的行為,那么他們的興趣也可能相似,所以利用皮爾森相似度來對移動用戶行為的相似性進行度量,從而發(fā)現(xiàn)每個移動用戶的鄰居用戶,利用鄰居用戶對用戶的興趣度進行優(yōu)化。

        2) 利用主題鄰居對用戶的興趣度進行優(yōu)化

        利用皮爾森相似度,可以找到第個主題的前個鄰居,從而利用式(8)得到對于第個主題,基于鄰居主題的關注度。最終利用式(9)優(yōu)化用戶對第個主題關注度。其中是控制權重的參數(shù)。

        最后關于用戶對第個主題的興趣度,即Interesing()的預測結果是(是控制權重的參數(shù)):

        4 實驗評估

        4.1 評估度量

        本文利用移動用戶的人均1值和在測試集中,移動用戶人均瀏覽推薦主題的平均瀏覽次數(shù),對測試結果進行評估。1值是融合了正確率和召回率的指標,即是準確率和召回率的調和平均值[14]。人均1值如式(12)所示,其中表示用戶的人數(shù),Precision表示對第個用戶推薦的準確率,即對第個移動用戶推薦,并且被該用戶瀏覽的主題占為第個用戶推薦的全部瀏覽主題的百分比,Recall表示對第個用戶推薦的召回率,即對第個移動用戶推薦,并被該用戶瀏覽的主題占總該移動用戶瀏覽總主題數(shù)的百分比。

        4.2 參數(shù)調節(jié)

        利用2013年10月15日-2013年10月31日的瀏覽數(shù)據作為訓練集,2013年10月1日-2013年10月14日的瀏覽數(shù)據訓練模型中的參數(shù)。

        1) 對于參數(shù)和參數(shù)的調節(jié):為了評估隨著用戶鄰居數(shù)的變化對模型的推薦效果的影響,設置為0.1,minsup為1,和為5,的范圍從1~20。實驗結果顯示當大于等于5時,人均1值達到穩(wěn)定,所以設置等于5。在評估主題鄰居數(shù)對推薦效果的影響時,設置為0.1,minsup為1,為10,為5,從1~20,實驗結果顯示當≥5時,人均1值達到穩(wěn)定,設置為5。

        2) 對于參數(shù)進行調節(jié),設minsup為1,、和為5,當測試對推薦效果的影響時,為0.1,的取值范圍從0.1~1。實驗結果顯示當≥0.7時,人均1值達到穩(wěn)定,即52.8%,所以設置為0.7,當測試對推薦效果的影響時,設置為0.7,的取值范圍是從0.1~1。實驗結果顯示當≥0.8時,人均1值達到穩(wěn)定,即55.8%,所以設置為0.8。

        3) 最大推薦主題數(shù): 為了評估最大推薦數(shù),設minsup為1,為0.7,和為5,為0.8,為0.1。的取值范圍是從1~20,隨著的增加,推薦效果有很大的改進。當≥10,推薦效果達到穩(wěn)定狀態(tài)。此時人均1值為53.41%。所以設的最大值為10。

        4) 參數(shù):為了評估的變化對推薦效果的影響,設為10,為0.7,和為5,為0.8,minsup為1。在實驗中的取值范圍從0.1~1。實驗結果顯示人均1值隨的增大而增大,當等于0.9時,人均1值達到最大,所以實驗值設置為0.9。

        5) 最小關注天數(shù)minsup:為了發(fā)現(xiàn)最小關注天數(shù)變化對推薦結果的影響,設等于10,為0.7,和為5,為0.8,等于0.9。minsup從1~15。實驗結果顯示,人均1值隨minsup的增大而增大,當minsup≥13時,人均1值達到穩(wěn)定值。所以設置minsup為13。

        4.3 實驗結果分析

        本文有4個對比實驗,分別是:1) 基于項目鄰居的協(xié)同過濾推薦算法(collaborative filtering recommendation model based on item neighbors, CFRMIN)。該算法利用皮爾森相似度尋找用戶瀏覽過的主題的鄰居,然后利用用戶瀏覽過的主題的鄰居集合去預測用戶對自己瀏覽過的主題的感興趣程度[6]。2) 基于隱語義模型的推薦算法(rcommendationmodel based on latent factor model, RMLFM)[4]。3) 基于瀏覽次數(shù)的推薦算法(rcommendation model based on browsing times, RMBT),即將所有用戶瀏覽過的主題按用戶瀏覽次數(shù),以遞減的順序排序,將前個推薦給用戶。4) 基于用戶關注天數(shù)的推薦算法(recommendation model based on concerning a number of days, RMCD),即將用戶瀏覽過的主題按用戶關注的天數(shù),以遞減的順序排序,將前個推薦給用戶。

        圖3 第1組實驗的移動用戶人均F1值

        本文通過兩組實驗測試模型的有效性。1) 利用31660個移動用戶2013年10月日-2013年10月31日的瀏覽數(shù)據作為訓練集。并以2013年11月的瀏覽數(shù)據作為測試集,測試結果如圖3和圖4所示。2) 訓練集和參數(shù)不變,以2013年12月的瀏覽數(shù)據作為測試集,測試結果如圖5和圖6所示。本文提出的推薦模型(RMBDMU)的實驗效果總體優(yōu)于CFRMIN和RMLFM的實驗效果。正如第2.3節(jié)提到的,首先移動用戶關注的大量信息中,只有很少的一部分是和他的興趣相關的,其次,在一段時期,移動用戶瀏覽越多的信息,可能不是與其興趣相關的。所以尋找主題之間的關系,是非常困難的。CFRMIN和RMLFM都是基于主題之間的相互關系的,所以效果很差。圖3和圖5中,可以看出當?shù)扔?時,RMBDMU的人均1值分別是0.443和0.412。隨著的增大,RMBDMU的人均1值逐漸的增大。當大于等于8時,RMBDMU的人均1值到達穩(wěn)定,分別是0.594和0.591。雖然RMBDMU的人均1值隨著值得增大而增大,但是RMBDMU的人均1值與RMCD和RMBT的人均1值非常接近。這說明RMBDMU推薦的主題和RMCD和RMBT推薦給用戶的主題,用戶都有關注。但是圖4和圖6顯示,用戶人均對RMBDMU推薦主題的平均瀏覽次數(shù)遠遠大于用戶人均對RMCD和RMBT推薦給用戶主題的平均瀏覽次數(shù)。這說明RMBDMU推薦給用戶的主題,用戶的關注度更高。

        圖4 第1組實驗用戶人均瀏覽推薦主題平均瀏覽次數(shù)

        圖5 第2組實驗的移動用戶人均F1值

        圖6 第2組實驗用戶人均瀏覽推薦主題平均瀏覽次數(shù)

        5 結束語

        本文首先分析傳統(tǒng)推薦算法無法在移動用戶上網瀏覽數(shù)據上進行有效內容推薦的原因。然后提出了一種基于移動用戶瀏覽行為的推薦模型。通過在真實的移動用戶瀏覽數(shù)據上進行測試,實驗驗證了模型的有效性。

        [1] HERLOCKER J L, KONSTAN J A, BORCHERS A, et al. An algorithmic framework for performing collaborative filtering[C]//Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Berkeley: ACM, 1999: 230-237.

        [2] SCHAFER J B, DAN F, HERLOCKER J, et al. Collaborative filtering recommender systems[C]//The Adaptive Web, Methods and Strategies of Web Personalization. Berlin, Heidelberg: Spring, 2015: 46-45.

        [3] SARWAR B, KARYPIS G, KONSTAN J, et al. Item-based collaborative filtering recommendation algorithms[C]// Proceedings of the 10th International Conference on World Wide Web. Hong Kong, China: ACM, 2001: 285-295.

        [4] FUNK S. FunkSVD [EB/OL]. (2006-12-11). http:// sifter.org/~simon/journal/20061211.html.

        [5] KOREN Y, BELL R. Advances in collaborative filtering[M]. Recommender Systems Handbook. New York: Springer, 2011.

        [6] HU Y, KOREN Y, VOLINSKY C.Collaborative filtering for implicit feedback datasets[C]//Eighth IEEE International Conference on Data Mining. Pisa: IEEE, 2009: 263-272.

        [7] CHEN J, JIN Q, ZHAO S, et al. Does product recommendation meet its waterloo in unexplored categories: no, price comes to help[C]//Proceedings of the 37th International ACM SIGIR Conference on Research & Development in Information Retrieval. Gold Coast: ACM, 2014:667-676.

        [8] AGRAWAL R SRIKANT R. Fast algorithm for mining association rules[J]. Journal of Computer Science & Technology, 1994, 15(6): 619-624.

        [9] HAN J, KAMBER M, PEI J. Data mining: Concepts and techniques[M]. Netherlands:Elsevier, 2011.

        [10] CHUI C K, KAO B, HUNG E. Mining frequent item sets from uncertain data[J]. 2007, 4426: 47-58.

        [11] LEUNG K S. Uncertain frequent pattern mining[M]. Frequent Pattern Mining. New York: Springer International Publishing, 2014.

        [12] LIU C, CHEN L, ZHANG C. Summarizing probabilistic frequent patterns: a fast approach[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Chicago: [s.n.], 2013: 527-535.

        [13]BERNECKER T, CHENG R, CHEUNG D W, et al. Model-based probabilistic frequent itemset mining[J]. Knowledge and Information Systems, 2013, 37(1): 181-217.

        [14] WANG L, CHEUNG D W L, CHENG R, et al. Efficient mining of frequent item sets on large uncertain databases[J], IEEE Transactions on Knowledge and Data Engineering, 2012, 24(12): 2170-2183.

        [15] CAM L L. An approximation theorem for the Poisson binomial distribution.[J]. Pacific Journal of Mathematics, 1960, 10(4): 1181-1197.

        編 輯 蔣 曉

        A Recommendation Model Based on Browsing Behaviors of Mobile Users

        DING Zhe, QIN Zhen, ZHENG Wen-tao, and QIN Zhi-guang

        ( School of Information and Software Engineering, University of Electronic Science and Technology of China Chengdu 610054; Network and Data Security Key Laboratory of Sichuan Province, University of Electronic Science and Technology of China Chengdu 610054)

        Recommendation algorithms have been commonly adopted in many fields. However, traditional recommendation algorithms fail to achieve the expected recommendation results if they are applied to predict browsing behaviors of the mobile users and further to recommend personalized content to the mobile users. By analyzing the Internet browsing data of the mobile users, this paper proposes a recommendation model based on browsing data of mobile users, denoted as RMBDMU, to predict the future browsing activities of the mobile users and take them as the bases to recommend contents to the mobile users. An experiment on the Internet browsing behavior data of the real mobile users is conducted to verify the effectiveness of the model. The experiment result shows that the recommendation model based on browsing data of mobile users is more effective than the traditional recommendation algorithms.

        mobile users; prediction of browsing behaviors; probabilistic frequent itemset mining; recommendation model

        TP393

        A

        10.3969/j.issn.1001-0548.2017.06.020

        2016-07-21;

        2016-12-15

        國家自然科學基金( 61133016, 61300191, 61202445, 61370026);四川省科技支撐計劃(2014GZ0106, 2016JZ0020)

        丁哲(1982-),男,博士生,主要從事機器學習、推薦算法和信息安全方面的研究.

        猜你喜歡
        移動用戶項集算法
        基于MapReduce的改進Eclat算法
        Travellng thg World Full—time for Rree
        進位加法的兩種算法
        無線通信技術未來發(fā)展趨勢分析
        基于預測位置的移動用戶位置隱私保護研究
        一種改進的整周模糊度去相關算法
        聯(lián)通4個月流失移動用戶887萬
        金融理財(2015年7期)2015-07-15 08:29:02
        關聯(lián)規(guī)則中經典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        一種頻繁核心項集的快速挖掘算法
        計算機工程(2014年6期)2014-02-28 01:26:12
        用戶對移動網絡服務偏好學習技術綜述
        通信學報(2013年2期)2013-10-26 09:10:12
        无码国产亚洲日韩国精品视频一区二区三区| 蜜臀久久99精品久久久久久| 久久久久久九九99精品| 好大好硬好爽免费视频| 久久精品美女久久| va精品人妻一区二区三区| 人成午夜大片免费视频77777| 国产精品国产午夜免费看福利| 国产在线观看黄| 男女动态视频99精品| 久久婷婷国产综合精品| www国产无套内射com| 日韩一二三四精品免费| 一区二区三区亚洲免费| 国产成人精品无码一区二区三区| 久久精品国内一区二区三区| 在线a人片免费观看高清| 人妻经典中文字幕av| 少妇人妻在线无码天堂视频网| 国产精品久久久久久久久KTV| 国产三级在线观看性色av| 老熟女富婆激情刺激对白| 鸭子tv国产在线永久播放| 精品国产香蕉伊思人在线又爽又黄| 亚洲综合天堂一二三区| 国产精华液一区二区三区| 精品国产sm捆绑最大网免费站| 狠狠色狠狠色综合网老熟女| 国产在线观看一区二区三区av| 中文字字幕人妻中文| 香蕉人妻av久久久久天天| 激情五月天俺也去综合网| 中文字幕一区二区三区久久网 | 九九久久精品国产免费av| 精品国产一二三产品区别在哪| 亚洲精品有码在线观看| 国产成av人在线观看| 丁香婷婷激情综合俺也去| 97久久久久人妻精品专区 | 黄片免费观看视频播放| 午夜男女很黄的视频|