徐勇 汪倩 張瑋 武雅利 焦夢蕾 許崇
摘要:個性化推薦有效緩解了大數(shù)據(jù)時代“數(shù)據(jù)爆炸”的現(xiàn)象,通過事先了解用戶的潛在興趣偏好,有針對性的提供符合用戶實際需求的信息,從而提高用戶的使用效率。本文通過文獻計量的方法對2008年到2018年之間的有關(guān)個性化推薦的相關(guān)文獻進行統(tǒng)計分析,分別從時間分布、期刊分布、關(guān)鍵詞共現(xiàn)分析以及關(guān)鍵詞聚類分析幾個部分展開研究,以發(fā)現(xiàn)個性化推薦領(lǐng)域的主要研究熱點問題與發(fā)展趨勢,進而探討未來研究的走向,為個性化推薦的發(fā)展提供依據(jù)。
Abstract: Personalized recommendations effectively alleviate the phenomenon of "data explosion" in the age of big data, through the prior understanding of the user's potential interest preferences, targeted to provide information in line with the actual needs of users, so as to improve the efficiency of user use. Through the method of literature measurement, this paper makes a statistical analysis of the relevant literatures about personalized recommendations between 2008 and 2018, and studies them from several parts, such as time distribution, periodical distribution, keyword co-analysis and keyword clustering analysis, in order to find out the main research hot issues and development trends in the field of personalized recommendation. Then it discusses the trend of future research and provides the basis for the development of personalized recommendation.
關(guān)鍵詞:個性化推薦;文獻計量;研究進展
Key words: personalized recommendation;literature measurement;research progress
中圖分類號:TP274+.2 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標(biāo)識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2019)15-0142-03
0 ?引言
Web 2.0時代的到來,用戶從過去單純的瀏覽網(wǎng)絡(luò)信息到現(xiàn)在既能閱讀信息同時還能自由的在網(wǎng)絡(luò)上生成大量內(nèi)容,使得網(wǎng)絡(luò)資源數(shù)量龐大,用戶使用網(wǎng)絡(luò)獲取資源時,很難準(zhǔn)確找到所需要的信息,從而浪費用戶時間,促使互聯(lián)網(wǎng)的使用不再方便便捷。個性化推薦技術(shù)有效緩解了該現(xiàn)象,它通過事先了解用戶的需求偏好,并針對其偏好推薦相應(yīng)的內(nèi)容信息,從而滿足用戶的需求。目前,個性化推薦技術(shù)也被廣泛應(yīng)用于多個領(lǐng)域,有效促進各行各業(yè)的發(fā)展進步。因此,本文針對個性化推薦領(lǐng)域進行文獻計量分析,了解該領(lǐng)域的研究整體趨勢特征,挖掘研究熱點問題,進而更好的把握個性化推薦的研究進展?fàn)顩r[1]。
1 ?數(shù)據(jù)來源與研究方法
本文以CSSCI和EI兩個數(shù)據(jù)庫作為數(shù)據(jù)來源,并以“個性化推薦”作為“主題”“關(guān)鍵詞”“篇名”分別進行檢索,時間跨度為2008年1月1日到2018年12月31日,共獲得510篇相關(guān)研究文獻。通過人工對搜索到的文獻進行閱讀篩選,去除無關(guān)、重復(fù)等文獻后,最終獲得503篇文獻(檢索時間:2019年3月17日)。
文獻計量法是一種專門通過數(shù)學(xué)的方式統(tǒng)計文獻的如發(fā)文時間分布、期刊來源分布、作者機構(gòu)分布等文獻一般特征,并基于得到的特征了解所研究領(lǐng)域的研究整體狀況以及研究的走向,探索未來的研究發(fā)展趨勢,為更好的促進該領(lǐng)域的進一步深入提供支持。本文通過使用Excel、citespace軟件對所獲得的研究文獻進行文獻計量分析,獲得研究文獻的文獻特征,并通過對核心關(guān)鍵詞以及關(guān)鍵詞的聚類分析等來挖掘研究熱點問題,探索未來的研究發(fā)展方向。
2 ?計量結(jié)果分析
2.1 時間分布
通過對2008年到2018年間發(fā)表的503篇相關(guān)研究文獻進行統(tǒng)計分析后,繪制成發(fā)文篇數(shù)隨時間變化的折線圖,如圖 1 所示。從圖中可以看出,從2008年到2018年期間發(fā)文篇數(shù)整體呈現(xiàn)上升的趨勢,雖期間存在一定的下降,但整體相對于2008年的16篇仍是上升的。而此現(xiàn)象的出現(xiàn)正是由于互聯(lián)網(wǎng)時代的到來,越來越多的用戶使用互聯(lián)網(wǎng),造成網(wǎng)絡(luò)數(shù)據(jù)泛濫的現(xiàn)象開始出現(xiàn),為了使用戶更好的使用互聯(lián)網(wǎng),個性化推薦技術(shù)顯得尤為重要。因此,對于個性化推薦的研究越來越引起學(xué)者的重視,相關(guān)的研究文獻不斷涌現(xiàn)。
2.2 期刊分布
期刊分布能在一定程度上反映個性化推薦領(lǐng)域研究的現(xiàn)狀以及研究深度,對于想要初步了解此領(lǐng)域的學(xué)者可提供一定的相關(guān)信息[2]。通過對這503篇文獻的統(tǒng)計后,發(fā)現(xiàn)文獻共分布在103種期刊上。其中,發(fā)表文獻數(shù)量在10篇以上的期刊共有11種(如表1 所示),而這11個期刊所發(fā)表的文獻總量高達274篇。圖書情報工作發(fā)表的相關(guān)文獻數(shù)量最多,高達43篇,情報理論與實踐、現(xiàn)代情報、情報科學(xué)這3種期刊發(fā)表的文獻數(shù)量也均在30篇左右??梢园l(fā)現(xiàn),對于此領(lǐng)域的研究,學(xué)者發(fā)表的文獻主要在這11種,且大多在圖情領(lǐng)域較多。
2.3 關(guān)鍵詞共現(xiàn)分析
文獻中的關(guān)鍵詞是涵蓋該文獻主要研究內(nèi)容與研究方法,代表研究的中心思想的。因此,關(guān)鍵詞共現(xiàn)分析對于明晰個性化推薦領(lǐng)域的研究進展與現(xiàn)狀是必不可少的。使用citespace軟件進行關(guān)鍵詞分析,如圖2所示。其中,節(jié)點的大小代表其中心度的大小,節(jié)點越大,表明中心度越多高,各關(guān)鍵詞之間的連線代表其共現(xiàn)的次數(shù),連線越粗,表明共現(xiàn)次數(shù)越多。
并統(tǒng)計出頻次在10次及以上的高頻關(guān)鍵詞,如表2所示。
從表2 可以看出,詞頻在10次以上的共有16個關(guān)鍵詞,除了“個性化推薦”“個性化”“個性化服務(wù)”“個性化信息服務(wù)”這4個明顯有代表性的關(guān)鍵詞以外,其余幾個高頻關(guān)鍵詞的中心度也很高,說明這些詞在個性化推薦領(lǐng)域研究的較多。通過對這12個高頻詞進行分析,可以將其分為3個部分。第1部分包括“協(xié)同過濾”“推薦系統(tǒng)”,它是個性化推薦研究的核心構(gòu)件,目前對于個性化推薦的研究主要集中于推薦算法、推薦模型、推薦系統(tǒng)的構(gòu)建,而協(xié)同過濾技術(shù)是運用較多的一種推薦算法。第2部分是“大數(shù)據(jù)”“電子商務(wù)”“數(shù)字圖書館”“高校圖書館”“圖書館”等,表明了個性化推薦的主要應(yīng)用領(lǐng)域。第3部分由“情境感知”“用戶偏好”“數(shù)據(jù)挖掘”等組成,顯示出此研究領(lǐng)域中密切相關(guān)的技術(shù)與研究方向,是實現(xiàn)個性化推薦的關(guān)鍵部分。
2.4 關(guān)鍵詞聚類分析
通過對關(guān)鍵詞進行聚類分析,將相同主題的關(guān)鍵詞聚成一類,并對同一類別的關(guān)鍵詞進行梳理,進而挖掘個性化推薦領(lǐng)域的研究熱點話題。本文使用citespace軟件進行聚類,并過濾掉較小的類別,按時間進行展示,各聚類結(jié)果如圖3所示。
從圖中可以看出,將關(guān)鍵詞主要分為了6大類,分別為“電子商務(wù)”“用戶畫像”“個性化信息服務(wù)”“情境感知”“協(xié)同過濾”“個性化推薦”。通過對這6類的主題進行統(tǒng)計分析后,將其分為兩大主要研究類別。其一是個性化推薦技術(shù)的應(yīng)用領(lǐng)域研究。目前個性化推薦主要應(yīng)用于電子商務(wù)[3,4,5,6]、圖書情報[7,8,9]、音樂[10]、新聞推薦[11]等領(lǐng)域中,這是由于個性化推薦技術(shù)能夠有效緩解大數(shù)據(jù)時代網(wǎng)絡(luò)信息資源泛濫的情形,根據(jù)用戶喜好進行自主推薦,對于提高用戶的使用效率和主觀感受,顯得尤為重要。另一個主要研究類別是實現(xiàn)個性化推薦技術(shù)所需的推薦算法、用戶畫像、數(shù)據(jù)挖掘等技術(shù)的進一步研究。推薦算法是實現(xiàn)個性化推薦的核心所在,而目前使用較多的是協(xié)同過濾技術(shù),它通過挖掘出與目標(biāo)用戶相同喜好的其他用戶,并將其他用戶購買的物品中目標(biāo)用戶未購買的商品推薦給用戶,從而實現(xiàn)個性化推薦。而事先了解用戶的興趣偏好對于個性化推薦的實現(xiàn)是不可或缺的,用戶畫像技術(shù)也因此逐漸展開研究。通過采集用戶在網(wǎng)絡(luò)上的行為數(shù)據(jù),運用自然語言處理、機器學(xué)習(xí)等技術(shù)分析數(shù)據(jù),從而提取用戶特征標(biāo)簽,構(gòu)建用戶畫像。因此,運用用戶畫像技術(shù),能夠迅速便捷的獲取用戶偏好,從而進行有針對性的推薦,實現(xiàn)“個性化”。
3 ?結(jié)論
本文通過使用文獻計量的方法,運用citespace、Excel軟件對2008年到2018年之間的有關(guān)個性化推薦的研究文獻進行統(tǒng)計分析,分別從時間分布、期刊分布、關(guān)鍵詞共現(xiàn)以及聚類分析幾方面進行研究,以發(fā)現(xiàn)個性化推薦領(lǐng)域的主要研究熱點問題與發(fā)展趨勢。未來對于個性化推薦的研究仍需進一步提高推薦算法的推薦精度,更好的消除冷啟動、數(shù)據(jù)稀疏所造成的影響,實現(xiàn)更精準(zhǔn)的推薦。其次,需采集跨領(lǐng)域的用戶相關(guān)數(shù)據(jù),構(gòu)建更加完善的用戶畫像,以發(fā)現(xiàn)用戶的多方面的需求特征,提高推薦效果,同時考慮用戶興趣變化的特點,構(gòu)建實時的用戶畫像。然后,現(xiàn)有的個性化推薦大多應(yīng)用于電子商務(wù)、音樂、新聞等領(lǐng)域,未來可繼續(xù)擴展其應(yīng)用范圍,可將其推廣到醫(yī)療領(lǐng)域、教育領(lǐng)域等。最后,對于推薦效果的好壞如何進行評價,可構(gòu)建一個統(tǒng)一的指標(biāo)體系,提高評價的可信度,更好的實現(xiàn)個性化推薦。
參考文獻:
[1]孫湘湘,周小亮.我國產(chǎn)業(yè)經(jīng)濟學(xué)研究熱點和前沿的可視化分析[J].武漢理工大學(xué)學(xué)報(信息與管理工程版),2018,40(05):550-555,560.
[2]劉智穎,賀穎.基于CNKI數(shù)據(jù)庫的檔案用戶需求文獻計量分析(2010-2017)[J].檔案管理,2019(01):22-25.
[3]杜巍,高長元.移動電子商務(wù)環(huán)境下個性化情景推薦模型研究[J].情報理論與實踐,2017,40(10):56-61.
[4]劉晶,李妍,侯會茹.移動電子商務(wù)多源關(guān)聯(lián)個性化推薦架構(gòu)[J].情報理論與實踐,2014,37(04):98-100.
[5]陳明.基于信息流的實時電子商務(wù)動態(tài)個性化推薦[J].情報雜志,2008(08):29-30,56.
[6]邵波,宋繼偉.國內(nèi)外電子商務(wù)個性化服務(wù)研究分析[J].情報雜志,2008(07):78-80.
[7]耿立校,晉高杰,李亞函,孫衛(wèi)忠,馬士豪.基于改進內(nèi)容過濾算法的高校圖書館文獻資源個性化推薦研究[J].圖書情報工作,2018,62(21):112-117.
[8]焦玉英,袁靜.基于情景模型的數(shù)字圖書館個性化服務(wù)研究[J].中國圖書館學(xué)報,2008(06):58-63.
[9]王慶,趙發(fā)珍.基于“用戶畫像”的圖書館資源推薦模式設(shè)計與分析[J].現(xiàn)代情報,2018,38(03):105-109,137.
[10]李瑞敏,林鴻飛,閆俊.基于用戶-標(biāo)簽-項目語義挖掘的個性化音樂推薦[J].計算機研究與發(fā)展,2014,51(10):2270-2276.
[11]孟祥武,陳誠,張玉潔.移動新聞推薦技術(shù)及其應(yīng)用研究綜述[J].計算機學(xué)報,2016,39(04):685-703.