袁黃輝 孫知信 高鳳玲
摘? 要:隨著互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代的到來,資源聚合平臺(tái)逐漸成為一種趨勢(shì),而文章聚合系統(tǒng)則是其中最普遍的一種資源整合方式。一方面,它能滿足用戶對(duì)于閱讀數(shù)量的追求;另一方面,系統(tǒng)中內(nèi)容分發(fā)方式的豐富也迎合了用戶個(gè)性化的需要。該文針對(duì)平臺(tái)方實(shí)際需求,實(shí)現(xiàn)了一種融合個(gè)性化推薦的文章聚合系統(tǒng),系統(tǒng)的推薦內(nèi)核主要依賴于所提的融合用戶畫像的協(xié)同過濾推薦方法,以此為平臺(tái)方用戶提供文章推薦服務(wù)。
關(guān)鍵詞:個(gè)性化推薦? 文章聚合? 協(xié)同過濾? 用戶畫像
中圖分類號(hào):TP391.3? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-3791(2021)04(a)-0035-03
An Article Aggregation System Integrating Personalized Recommendation
YUAN Huanghui1? SUN Zhixin2? ?GAO Fengling3
(1.School of Computer Science and technology, Nanjing University of Posts and Telecommunications, Nanjing, Jiangsu Province, 210023 China; 2.School of Modern Posts, Nanjing University of Posts and Telecommunications, Nanjing, Jiangsu Province, 210003? China; 3.China Electronics System
Engineering NO.2 Construction Co., Ltd., Wuxi, Jiangsu Province, 214135? China)
Abstract: With the advent of the era of Internet big data, resource aggregation platform has gradually become a trend, and article aggregation system is one of the most common ways of resource integration.On the one hand, it can meet the user's pursuit of reading quantity; on the other hand, the rich content distribution in the system also caters to the needs of personalized users. According to the actual needs of platform, this paper presents an article aggregation system that integrates personalized recommendation. The recommendation kernel of the system mainly relies on the proposed collaborative filtering recommendation method that integrates user portrait, so as to provide article recommendation service for platform users.
Key Words: Personalized recommendation;Article aggregation;Collaborative filtering;User portrait
互聯(lián)網(wǎng)時(shí)代的到來衍生出了各類信息聚合的平臺(tái)和網(wǎng)站。不論是新浪新聞、今日頭條這類以文本信息為主的網(wǎng)站,還是類似于淘寶、京東這類的電商平臺(tái),它們都是幫用戶將海量的數(shù)據(jù)做了初步的聚合歸類,但是即便如此用戶對(duì)于便捷和效率的訴求隨著信息數(shù)據(jù)的激增依舊無(wú)法得到滿足。因此,如何針對(duì)不同用戶進(jìn)行個(gè)性化推薦是這類信息聚合平臺(tái)亟需解決的問題。
基于文章聚合系統(tǒng)的個(gè)性化服務(wù)訴求,該文結(jié)合實(shí)際場(chǎng)景設(shè)計(jì)了一種融合用戶畫像的協(xié)同過濾推薦方法進(jìn)行文章個(gè)性化推薦,使得最終的推薦結(jié)果更加準(zhǔn)確。
1? 關(guān)鍵技術(shù)概述
1.1 協(xié)同過濾推薦方法
協(xié)同過濾推薦方法主要分為兩類:基于用戶和基于內(nèi)容的協(xié)同過濾[1]?;谟脩舻膮f(xié)同過濾主要是通過用戶的歷史行為記錄來計(jì)算用戶間的相似性,使用相似用戶的其他偏好進(jìn)行推薦[2];而基于內(nèi)容的協(xié)同過濾則是根據(jù)所有用戶對(duì)項(xiàng)目的喜好來計(jì)算項(xiàng)目間的相似性,根據(jù)用戶偏好將相似的內(nèi)容推薦給用戶[3]。
1.2 用戶畫像技術(shù)
用戶畫像顧名思義就是將原本晦澀難懂的用戶數(shù)據(jù)以一種更形象的方式梳理并呈現(xiàn)出來,通常的呈現(xiàn)形式是一系列與用戶相關(guān)的結(jié)構(gòu)化標(biāo)簽集合[4-6]。此項(xiàng)技術(shù)目前已被廣泛應(yīng)用于推薦系統(tǒng)領(lǐng)域,目的就是快速、準(zhǔn)確地分析用戶的行為習(xí)慣和興趣偏好,最終實(shí)現(xiàn)個(gè)性化的內(nèi)容分發(fā)。
2? 系統(tǒng)架構(gòu)設(shè)計(jì)
該系統(tǒng)架構(gòu)自下而上分別是基礎(chǔ)數(shù)據(jù)層、特征計(jì)算層、召回策略層、排序過濾層以及展示層,以這5層架構(gòu)實(shí)現(xiàn)系統(tǒng)核心功能,具體的總架構(gòu)圖見圖1。
3? 融合用戶畫像的協(xié)同過濾推薦方法
3.1 用戶畫像標(biāo)簽體系建立
該系統(tǒng)設(shè)計(jì)的用戶畫像標(biāo)簽體系包括靜態(tài)和動(dòng)態(tài)標(biāo)簽兩部分,畫像標(biāo)簽體系見圖2。
3.2 用戶畫像構(gòu)建
基于上述用戶標(biāo)簽體系的設(shè)計(jì),將畫像模型具體表示為。第一維度表示用戶的基本信息特征,分別為用戶的性別、年齡、婚姻狀況和興趣愛好。第二維度表示用戶的主題分布特征。第三維特征和第四維特征則是用戶的閱讀頻率和一天中的閱讀時(shí)間分布。畫像模型的具體構(gòu)建方法如下。
3.2.1 用戶基本信息統(tǒng)計(jì)
用戶基本信息的具體標(biāo)簽種類如表1所示。該方法使用二進(jìn)制序列對(duì)多維特征進(jìn)行表示,例如:性別維度設(shè)一個(gè)標(biāo)志位,即性別男置1,女置0;年齡維度設(shè)6個(gè)標(biāo)志位,將對(duì)應(yīng)年齡段的標(biāo)志位置1;婚姻和興趣也根據(jù)表1中信息進(jìn)行設(shè)置。最終得到用戶靜態(tài)信息的二進(jìn)制序列表示B。
3.2.2 用戶的主題特征表示
將用戶偏好文章輸入到預(yù)訓(xùn)練好的LDA主題模型,得到文章的主題分布向量。
3.2.3 用戶閱讀頻率計(jì)算
將閱讀頻率作為用戶畫像的一維特征可以有效地區(qū)分用戶,有助于個(gè)性化推薦的精準(zhǔn)性。閱讀頻率R的具體計(jì)算公式如公式(1)所示。其中k表示統(tǒng)計(jì)到有閱讀行為的總天數(shù),Rm表示用戶在第C天閱讀的總文章數(shù)。
(1)
3.2.4 用戶閱讀時(shí)間分布統(tǒng)計(jì)
為了方便度量一個(gè)人的閱讀時(shí)間分布,該方法中將一天劃分為7個(gè)不同的時(shí)間段,即最終得到的閱讀時(shí)間分布向量有7個(gè)維度。具體計(jì)算方法如式(2),其中 RN表示每個(gè)時(shí)間段閱讀總數(shù)分布向量。
(2)
3.2.5 多維度相似性計(jì)算
對(duì)于得到的用戶多維度特征表示向量使用余弦相似度計(jì)算方法進(jìn)行計(jì)算,得到最終的用戶相似度矩陣US。計(jì)算方法如式(3)。其中PRi和PRj分別表示用戶 Vi和Vj的多維特征向量。
(3)
3.3 協(xié)同過濾生成結(jié)果集
基于得到的用戶相似度矩陣,使用K-means聚類方法對(duì)用戶進(jìn)行聚類。在對(duì)特定用戶進(jìn)行推薦時(shí),找到與其屬于同一類別的其他相似用戶,獲取到他們的偏好文章集合。再利用用戶相似度矩陣數(shù)值對(duì)每篇文章進(jìn)行加權(quán)排序,最終篩選出指定數(shù)量的結(jié)果集。
4? 結(jié)語(yǔ)
該文針對(duì)文章資源整合以及用戶個(gè)性化推薦服務(wù)的需求,設(shè)計(jì)并實(shí)現(xiàn)了一種融合個(gè)性化推薦的文章聚合系統(tǒng)。且在該系統(tǒng)的推薦內(nèi)核中設(shè)計(jì)了一種融合用戶畫像的協(xié)同過濾推薦方法來增加推薦結(jié)果的準(zhǔn)確性,并在實(shí)際的應(yīng)用場(chǎng)景中能很好地完成個(gè)性化的文章內(nèi)容分發(fā)任務(wù)。
參考文獻(xiàn)
[1] 顧明星,黃偉建,黃遠(yuǎn),等.結(jié)合用戶聚類與改進(jìn)用戶相似性的協(xié)同過濾推薦[J].計(jì)算機(jī)工程與應(yīng)用,2020,56(22):185-190.
[2] yeongwook yang,jang hongjun,byoungwook kim. A Hybrid Recommender System for Sequential Recommendation: Combining Similarity Models With Markov Chains[J].IEEE Access,2020(8):190136-190146.
[3] 王永,趙旭輝,李曉光,等.一種面向協(xié)同過濾的快速最近鄰居搜索方法[J/OL].計(jì)算機(jī)工程與應(yīng)用:1-14[2021-04-08].https://www.kns.cnki.net/kcms/detail/11.2127.TP.20201208.1533.022.html.
[4] Simsek A, Karagoz P. Wikipedia enriched advertisement recommendation for microblogs by using sentiment enhanced user profiles[J].Journal of Intelligent Information Systems,2020,54(2):245-269.
[5] Ouaftouh S, Zellou A, Idri A. Social recommendation: A user profile clustering‐based approach[J].Concurrency and Computation: Practice and Experience,2019,31(20):5330.
[6] 劉勇,吳翔宇,解本巨.基于動(dòng)態(tài)用戶畫像的信息推薦研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2018,27(6):236-239.