亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        我國(guó)學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦研究現(xiàn)狀探討

        2017-08-09 19:16:06孫夢(mèng)婷袁小群
        出版科學(xué) 2017年4期
        關(guān)鍵詞:協(xié)同過濾

        孫夢(mèng)婷+袁小群

        [摘 要] 通過分析2003年至2016年中國(guó)知網(wǎng)發(fā)表的“圖書情報(bào)與數(shù)字圖書館”領(lǐng)域關(guān)于協(xié)同過濾推薦的82篇文獻(xiàn),總結(jié)我國(guó)學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦的研究現(xiàn)狀。通過對(duì)文獻(xiàn)樣本進(jìn)行分類,發(fā)現(xiàn)目前該領(lǐng)域的研究重點(diǎn)主要集中于對(duì)學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾推薦的推廣和對(duì)推薦算法本身的完善兩個(gè)方面,且后者主要集中于對(duì)數(shù)據(jù)稀疏性問題和可擴(kuò)展性問題的解決。通過進(jìn)一步分析,發(fā)現(xiàn)國(guó)內(nèi)研究人員主要通過結(jié)合基于內(nèi)容的推薦、空值填補(bǔ)和推薦結(jié)果融合三種方法緩解數(shù)據(jù)稀疏性問題;通過聚類的方法緩解可擴(kuò)展性問題。

        [關(guān)鍵詞] 學(xué)術(shù)數(shù)據(jù)庫 協(xié)同過濾 資源推薦

        [中圖分類號(hào)] G230 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1009-5853 (2017) 04-0011-05

        The Literature Review of Collaborative Filtering Recommendation in Chinese Academic Databases

        Sun Mengting Yuan Xiaoqun

        (School of Information Management, Wuhan University, Wuhan, 430072)

        [Abstract] By studying 82 papers published in the CNKI from 2003 to 2016 on collaborative filtering of Information and Digital Library, we investigate the hottest topics of current and history on collaborative filtering of Information and Digital Library. By classifying these papers, we discover that domestic researchers are engaged in either propagating the collaborative filtering technique in academic databases or improving the algorithm, in which the main problems are data sparseness and extensibility. By analyzing the papers further, we discover that researchers prefer to combine the content-based recommend technique, custom data or different recommend results to solve the data sparseness problem, and turn to the clustering technique to solve the problem of extensibility.

        [Key words] Academic database Collaborative filtering Information recommendation

        1 引 言

        近年來,學(xué)術(shù)資源數(shù)據(jù)庫出版的信息數(shù)量呈幾何增長(zhǎng),“信息超載”[1]現(xiàn)象越來越嚴(yán)重,“以用戶為中心”的互聯(lián)網(wǎng)理念要求出版商從不同的角度挖掘用戶的顯性及隱性需求,為用戶提供個(gè)性化信息服務(wù),節(jié)約用戶的信息搜索成本。因此,如何利用互聯(lián)網(wǎng)技術(shù)高效精準(zhǔn)地為用戶提供個(gè)性化信息服務(wù),成為目前學(xué)術(shù)出版領(lǐng)域的研究重點(diǎn)之一。其中,協(xié)同過濾推薦技術(shù)就是解決這一問題的有效方法之一。近10年來,研究人員對(duì)如何完善協(xié)同過濾推薦技術(shù)以及如何將其應(yīng)用于學(xué)術(shù)數(shù)據(jù)庫展開了大量工作,但相應(yīng)的文獻(xiàn)總結(jié)較少。因此,本文通過分析2003年至2016中國(guó)知網(wǎng)發(fā)表的“圖書情報(bào)與數(shù)字圖書館”領(lǐng)域關(guān)于協(xié)同過濾推薦的82篇文獻(xiàn),對(duì)我國(guó)學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦研究進(jìn)行詳細(xì)調(diào)研,旨在總結(jié)目前我國(guó)學(xué)術(shù)數(shù)據(jù)庫出版協(xié)同過濾資源推薦的研究情況和研究重點(diǎn),厘清學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾的研究脈絡(luò),為后續(xù)研究提供參考,以促進(jìn)我國(guó)學(xué)術(shù)數(shù)據(jù)庫個(gè)性化信息服務(wù)的可持續(xù)發(fā)展。

        2 協(xié)同過濾推薦

        2.1 協(xié)同過濾概念

        協(xié)同過濾推薦是目前最常見的推薦技術(shù)之一,廣泛應(yīng)用于電子商務(wù)、電影網(wǎng)站、音樂社區(qū)等領(lǐng)域?!皡f(xié)同過濾”這一概念首先由戈德堡(Goldberg)等人提出[2],它基于如下假設(shè):如果用戶對(duì)某些項(xiàng)目的評(píng)分相近,那么他們對(duì)其他項(xiàng)目的評(píng)分也會(huì)相近[3]。傳統(tǒng)的協(xié)同過濾推薦分為3個(gè)步驟:(1)建立用戶-項(xiàng)目評(píng)分矩陣;(2)尋找相似鄰;(3)對(duì)用戶未訪問的信息項(xiàng)目進(jìn)行評(píng)分預(yù)測(cè)并產(chǎn)生推薦,預(yù)測(cè)和推薦的主要特征是[4]:(1)推薦的內(nèi)容是相似用戶喜歡的項(xiàng)目,而非與用戶歷史偏好相似的項(xiàng)目;(2)計(jì)算的是用戶的相似度,而非推薦內(nèi)容的相似性;(3)一個(gè)純粹的協(xié)同過濾系統(tǒng)并不分析所推薦項(xiàng)目的內(nèi)容本身。顯然,與其他的個(gè)性化推薦技術(shù)相比,協(xié)同過濾通過抓取用戶之間的社會(huì)化聯(lián)系進(jìn)行推薦,不僅適應(yīng)互聯(lián)網(wǎng)時(shí)代人際聯(lián)系日益增強(qiáng)的趨勢(shì),還回避了對(duì)領(lǐng)域知識(shí)、非結(jié)構(gòu)化推薦項(xiàng)目等復(fù)雜因素的分析。這使得協(xié)同過濾推薦具有如下優(yōu)勢(shì):(1)可以發(fā)掘用戶的潛在需求;(2)適用范圍廣,無需考慮被推薦項(xiàng)目的內(nèi)容;(3)回避了對(duì)復(fù)雜因素的分析,易于實(shí)現(xiàn)。

        但由于只考慮人與人之間的相互推薦,協(xié)同過濾也存在如下缺陷:(1)數(shù)據(jù)稀疏性:用戶評(píng)分的項(xiàng)目數(shù)量過少導(dǎo)致用戶-項(xiàng)目評(píng)分矩陣的極度稀疏,對(duì)相似度的計(jì)算造成極大干擾;(2)冷啟動(dòng):新用戶進(jìn)入推薦系統(tǒng)后,由于其尚未與系統(tǒng)產(chǎn)生交互,系統(tǒng)無法獲取偏好數(shù)據(jù)而導(dǎo)致推薦功能失效;(3)數(shù)據(jù)空間的可擴(kuò)展性:系統(tǒng)的原始數(shù)據(jù)中除性別、年齡等數(shù)據(jù)的維度較小,其他如瀏覽、收藏、點(diǎn)擊等系統(tǒng)交互行為數(shù)據(jù)的維度都較大,對(duì)算法的運(yùn)行效率和存儲(chǔ)空間提出了挑戰(zhàn)。

        2.2 協(xié)同過濾對(duì)學(xué)術(shù)出版的意義

        根據(jù)2015年10月發(fā)布的《2014年度中國(guó)出版業(yè)發(fā)展報(bào)告》,2014年我國(guó)數(shù)字出版營(yíng)業(yè)收入為3387.7億元,同比增長(zhǎng)33.4%,占全行業(yè)營(yíng)業(yè)收入的17.0%,總體經(jīng)濟(jì)規(guī)模超過出版物發(fā)行,位居行業(yè)第二。其中,互聯(lián)網(wǎng)期刊和電子書行業(yè)增長(zhǎng)18.2%,增長(zhǎng)速度遠(yuǎn)高于新聞出版業(yè)的總體水平[5]。數(shù)字出版的蓬勃發(fā)展為學(xué)術(shù)數(shù)據(jù)庫領(lǐng)域的發(fā)展提供有力支持的同時(shí),也對(duì)其資源服務(wù)的質(zhì)量和效率提出了更高要求。因此,將協(xié)同過濾推薦技術(shù)應(yīng)用于學(xué)術(shù)數(shù)據(jù)庫,創(chuàng)建智能化推薦系統(tǒng),對(duì)促進(jìn)學(xué)術(shù)數(shù)據(jù)庫個(gè)性化信息服務(wù)有著重要意義。

        (1) 挖掘用戶潛在需求。相比于其他的出版類型,學(xué)術(shù)出版領(lǐng)域中用戶群體特征和規(guī)模相對(duì)穩(wěn)定的特點(diǎn),有助于提高協(xié)同過濾推薦的性能。協(xié)同過濾推薦通過挖掘用戶的顯性信息(如注冊(cè)信息、評(píng)分信息等)和隱性信息(如點(diǎn)擊、收藏、頁面停留時(shí)間等系統(tǒng)交互行為信息),刻畫用戶的需求偏好,根據(jù)相似用戶的信息行為挖掘和引導(dǎo)目標(biāo)用戶的信息需求,以此發(fā)掘并適應(yīng)用戶的潛在需求,提高學(xué)術(shù)數(shù)據(jù)庫的信息服務(wù)質(zhì)量。

        (2)提高學(xué)術(shù)資源利用率。隨著細(xì)分學(xué)科和跨專業(yè)學(xué)科的增加,學(xué)術(shù)數(shù)據(jù)庫信息資源呈幾何式海量增長(zhǎng),這導(dǎo)致用戶受到過多不相關(guān)信息的干擾,難以抓取真正有用的信息。協(xié)同過濾推薦充分利用用戶-項(xiàng)目的協(xié)同驅(qū)動(dòng),通過相似性分析將用戶與待推薦項(xiàng)目相匹配,高效精準(zhǔn)地進(jìn)行個(gè)性化信息服務(wù),以此提高學(xué)術(shù)數(shù)據(jù)庫信息資源利用效率。

        (3)擴(kuò)展學(xué)術(shù)數(shù)據(jù)庫的知識(shí)服務(wù)功能。協(xié)同過濾推薦不僅可以為用戶提供需要的信息,推薦其需要但還未獲取的有用資源;還可以通過構(gòu)建用戶偏好模型,結(jié)合相似用戶信息行為的協(xié)同驅(qū)動(dòng),挖掘用戶的潛在需求,擴(kuò)展用戶獲取信息的范圍,使信息服務(wù)功能更加主動(dòng)化和自動(dòng)化,實(shí)現(xiàn)學(xué)術(shù)數(shù)據(jù)庫信息服務(wù)向知識(shí)服務(wù)的轉(zhuǎn)變。

        2.3 協(xié)同過濾研究現(xiàn)狀

        自1992年第一個(gè)推薦系統(tǒng) Tapestry [6]提出以來,協(xié)同過濾推薦技術(shù)受到業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。至今,該技術(shù)已經(jīng)從最初的郵件過濾[7],推廣到新聞、電影[8]、電子商務(wù)、電子政務(wù)等社會(huì)各行各業(yè)。同時(shí),學(xué)界的研究也從最初對(duì)協(xié)同過濾算法本身的完善,發(fā)展到當(dāng)前結(jié)合多領(lǐng)域知識(shí)解決數(shù)據(jù)稀疏性等問題的研究[9-14]。

        近年來,隨著機(jī)器學(xué)習(xí)、大數(shù)據(jù)和社會(huì)網(wǎng)絡(luò)的快速發(fā)展,學(xué)者們還通過結(jié)合機(jī)器學(xué)習(xí)技術(shù)等建立更精準(zhǔn)的用戶偏好模型、協(xié)同過濾系統(tǒng)的性能評(píng)價(jià)指標(biāo)研究、推薦結(jié)果解釋性研究等角度對(duì)協(xié)同過濾展開研究[15-16]。

        3 我國(guó)學(xué)術(shù)出版領(lǐng)域協(xié)同過濾研究現(xiàn)狀

        雖然目前協(xié)同過濾推薦技術(shù)已經(jīng)較成熟,但在我國(guó)學(xué)術(shù)出版領(lǐng)域的運(yùn)用尚處于實(shí)踐探索階段,缺乏系統(tǒng)研究。鑒于此,本文以中國(guó)最大的學(xué)術(shù)數(shù)據(jù)庫“中國(guó)知網(wǎng)”為對(duì)象,收集其中發(fā)表的2003年至2016年“圖書情報(bào)與數(shù)字圖書館”領(lǐng)域關(guān)于協(xié)同過濾推薦的82篇文章,并以這82篇文章為樣本,詳細(xì)調(diào)研我國(guó)學(xué)術(shù)出版關(guān)于協(xié)同過濾資源推薦的研究情況。結(jié)果表明,我國(guó)在該領(lǐng)域的研究仍比較薄弱。

        3.1 協(xié)同過濾研究重點(diǎn)

        在調(diào)研過程中,本文根據(jù)學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦領(lǐng)域不同的研究重點(diǎn),將82篇文獻(xiàn)分為以下幾類,如圖1所示:(1)推廣:介紹學(xué)術(shù)數(shù)據(jù)庫(學(xué)術(shù)出版)中協(xié)同過濾技術(shù)類文獻(xiàn)。(2)系統(tǒng)架構(gòu)研究:構(gòu)建以協(xié)同過濾推薦技術(shù)為核心的學(xué)術(shù)數(shù)據(jù)庫推薦系統(tǒng)。這類文獻(xiàn)主要是從系統(tǒng)架構(gòu)角度研究如何將協(xié)同過濾技術(shù)應(yīng)用于學(xué)術(shù)數(shù)據(jù)庫,往往不涉及具體的算法細(xì)節(jié)。(3)數(shù)據(jù)稀疏性問題研究:解決協(xié)同過濾推薦算法中存在的數(shù)據(jù)稀疏性問題。(4)可擴(kuò)展性問題研究:解決協(xié)同過濾推薦算法中存在的可擴(kuò)展性問題。(5)因子研究:為更精準(zhǔn)地描述學(xué)術(shù)出版領(lǐng)域的用戶偏好,對(duì)用戶偏好影響因子進(jìn)行研究。(6)其他:包括針對(duì)不同類型的協(xié)同過濾推薦技術(shù)進(jìn)行性能比較,協(xié)同過濾推薦方法性能評(píng)價(jià)指標(biāo)研究等。

        由圖1可知,2003年至2016年協(xié)同過濾推薦在學(xué)術(shù)數(shù)據(jù)庫領(lǐng)域的研究不斷增加,尤其是在2007年至2016年10年間,研究成果增加明顯。由圖1可以看出,除2004年,每年均有推廣性的研究成果,且呈上升趨勢(shì),說明將協(xié)同過濾推薦推廣至學(xué)術(shù)數(shù)據(jù)庫領(lǐng)域是一個(gè)研究熱點(diǎn)。但以推薦系統(tǒng)架構(gòu)為主題的文獻(xiàn)數(shù)目較少且分布稀疏,也表明協(xié)同過濾推薦在學(xué)術(shù)數(shù)據(jù)庫中的實(shí)際應(yīng)用還比較薄弱,推廣工作尚待加強(qiáng)。此外,圖1還表明另一個(gè)研究重點(diǎn)是對(duì)協(xié)同過濾推薦算法本身的完善,具體表現(xiàn)在近10年關(guān)于數(shù)據(jù)稀疏性問題、可擴(kuò)展性問題和因子選擇問題的研究有所增加,其中對(duì)數(shù)據(jù)稀疏性問題的研究占了較大比重。

        總體而言,目前學(xué)界在加強(qiáng)推廣學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾推薦技術(shù)的同時(shí),重點(diǎn)研究算法的完善,且主要集中于數(shù)據(jù)稀疏性問題和可擴(kuò)展性問題的研究。因此,下文將對(duì)這兩個(gè)研究重點(diǎn)分別進(jìn)行論述。

        3.2 數(shù)據(jù)稀疏性問題

        數(shù)據(jù)稀疏性問題是指協(xié)同過濾推薦算法中,用戶評(píng)分的項(xiàng)目數(shù)量過少造成用戶-項(xiàng)目評(píng)分矩陣的極度稀疏,導(dǎo)致相似度計(jì)算不準(zhǔn)確的問題。事實(shí)上,網(wǎng)站運(yùn)行過程中項(xiàng)目數(shù)量龐大且不斷增加,而用戶通常只對(duì)少量項(xiàng)目進(jìn)行評(píng)分,這導(dǎo)致用戶評(píng)分?jǐn)?shù)據(jù)稀疏,進(jìn)而影響協(xié)同過濾的推薦質(zhì)量。

        如圖2所示,本文將樣本文獻(xiàn)中解決數(shù)據(jù)稀疏性問題的方法總結(jié)為以下三種:(1)結(jié)合基于內(nèi)容的推薦,占總樣本的67.5%;(2)空值填補(bǔ),占總樣本的15.0%;(3)推薦結(jié)果融合,占總樣本的12.5%。

        3.2.1 結(jié)合基于內(nèi)容的推薦

        結(jié)合基于內(nèi)容的推薦方法[17]通過結(jié)合基于內(nèi)容的推薦來豐富用戶的偏好信息,在改善協(xié)同過濾推薦對(duì)用戶評(píng)分信息過度依賴問題的同時(shí),通過結(jié)合基于內(nèi)容的推薦對(duì)用戶偏好進(jìn)行更精準(zhǔn)的描述,以此緩解數(shù)據(jù)稀疏性問題。

        孔繁超[18]考慮用戶偏好隨時(shí)間變化的特性,在用戶-項(xiàng)目評(píng)分矩陣中引入時(shí)間維,并使用自組織映射技術(shù)對(duì)用戶信息進(jìn)行聚類處理,根據(jù)用戶的需求行為將其劃分為不同的簇,降低數(shù)據(jù)稀疏性對(duì)信息推薦造成的影響。邱均平、張聰[19]同樣考慮時(shí)間因素,使用借閱時(shí)間計(jì)算用戶的偏好值,并輔助使用用戶評(píng)分對(duì)該值進(jìn)行調(diào)整。周之誠(chéng)[20]通過運(yùn)用K-means算法,對(duì)資源類別意圖特征值相似的用戶進(jìn)行聚類,以此提高推薦的實(shí)時(shí)性,緩解數(shù)據(jù)稀疏性問題。徐偉芬[21]依據(jù)中圖法對(duì)用戶興趣進(jìn)行建模,并通過關(guān)聯(lián)規(guī)則算法挖掘信息資源各類別間的關(guān)聯(lián),然后通過基于模糊C均值的聚類算法對(duì)用戶進(jìn)行聚類,在得到用戶在各聚類中的隸屬度后計(jì)算用戶之間的相似度,從而得到目標(biāo)用戶的最近鄰居集。畢強(qiáng)、劉健[22]以關(guān)聯(lián)語義鏈為基礎(chǔ)建立數(shù)字文獻(xiàn)資源的關(guān)聯(lián)語義鏈網(wǎng)絡(luò), 計(jì)算數(shù)字文獻(xiàn)資源之間關(guān)聯(lián)的權(quán)重,然后將其引入皮爾森(Pearson)相關(guān)性公式中計(jì)算用戶相似度,以此預(yù)測(cè)評(píng)分并進(jìn)行推薦。馬麗等人[23]為了體現(xiàn)用戶的多興趣特點(diǎn),利用模糊聚類技術(shù)對(duì)用戶進(jìn)行聚類,在得到用戶在各聚類中的隸屬度和各聚類的聚類中心后,為目標(biāo)用戶尋找最近鄰居集。張付志等人[24]引入文本聚類技術(shù),結(jié)合圖書資源的特征對(duì)同類資源進(jìn)行聚類,使讀者評(píng)價(jià)過的資源集中到聚類生成的某一個(gè)或多個(gè)簇類文檔中,并在其中進(jìn)行相似度計(jì)算。

        3.2.2 空值填補(bǔ)

        空值填補(bǔ)方法利用預(yù)測(cè)方法來填補(bǔ)用戶-項(xiàng)目評(píng)分矩陣中的缺失項(xiàng),從而提高評(píng)分矩陣中的數(shù)據(jù)密度,緩解數(shù)據(jù)稀疏性問題。

        李衛(wèi)華等人[25]提出一種計(jì)算群體興趣偏向度的方法來預(yù)測(cè)用戶-項(xiàng)目評(píng)分矩陣中的空缺值。王代琳等人[26]通過計(jì)算用戶對(duì)項(xiàng)目評(píng)分之間的平均差異度來預(yù)測(cè)用戶對(duì)未評(píng)分項(xiàng)目的評(píng)分:通過計(jì)算兩個(gè)項(xiàng)目評(píng)分的平均比值得到兩個(gè)項(xiàng)目之間的平均差異度,并根據(jù)平均差異度來預(yù)測(cè)目標(biāo)用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分。張閃閃等人[27]通過建立自動(dòng)化評(píng)分規(guī)則來計(jì)算并填補(bǔ)評(píng)分矩陣中的缺失項(xiàng)。

        3.2.3 推薦結(jié)果融合

        推薦結(jié)果融合方法通過不同的方法計(jì)算用戶對(duì)項(xiàng)目的偏好,并將各計(jì)算結(jié)果融合以改善數(shù)據(jù)稀疏性問題。在本文的樣本集中,最常使用的推薦結(jié)果融合方法是將聚類算法和協(xié)同過濾算法相結(jié)合。

        劉飛飛[28]提出一種能夠同時(shí)考慮用戶和項(xiàng)目之間相似性的協(xié)同過濾方法,即利用雙聚類技術(shù)對(duì)行和列同時(shí)進(jìn)行聚類,同時(shí)完成用戶和項(xiàng)目的相似性分組。劉劍濤[29]通過計(jì)算相對(duì)點(diǎn)擊和評(píng)分差的海明距離得到每個(gè)用戶的候選鄰居集,結(jié)合多態(tài)相似度對(duì)鄰居集二次聚類,由最鄰近用戶預(yù)測(cè)當(dāng)前用戶的需求度,選擇前N條生成推薦列表。劉如娟[30]通過統(tǒng)計(jì)每個(gè)用戶最常用的標(biāo)簽,計(jì)算選中的標(biāo)簽與全部資源的相似性,然后以標(biāo)簽聚類作為橋梁,計(jì)算資源和用戶之間的相關(guān)度,并對(duì)結(jié)果進(jìn)行線形加權(quán),計(jì)算用戶對(duì)資源的興趣值,生成推薦列表。

        對(duì)比以上三種方法,首先,結(jié)合基于內(nèi)容的推薦方法通過引入內(nèi)容描述信息刻畫用戶偏好,緩解了數(shù)據(jù)稀疏性問題,但由于引入基于內(nèi)容的推薦方法,也存在受領(lǐng)域知識(shí)及非結(jié)構(gòu)化的內(nèi)容限制等缺陷。其次,空值填補(bǔ)方法利用用戶已有評(píng)分?jǐn)?shù)據(jù)填充評(píng)分缺失值,具有直觀、操作簡(jiǎn)單等優(yōu)點(diǎn),但空值填補(bǔ)本身是對(duì)評(píng)分缺失值的一種預(yù)測(cè),預(yù)測(cè)偏差會(huì)對(duì)最后的推薦精度產(chǎn)生影響。最后,推薦結(jié)果融合方法將不同方法計(jì)算出的用戶偏好進(jìn)行綜合,可以對(duì)高維稀疏的數(shù)據(jù)進(jìn)行更加充分的挖掘,產(chǎn)生更高的推薦精度。同時(shí),聚類、神經(jīng)網(wǎng)絡(luò)等離線機(jī)器學(xué)習(xí)方法的引入還能夠改善推薦的運(yùn)行效率和對(duì)海量數(shù)據(jù)的處理能力。但該方法也存在操作復(fù)雜、結(jié)果的可解釋性差以及需要考量不同技術(shù)間的融合機(jī)制等缺陷。

        3.3 可擴(kuò)展性問題

        為了更精準(zhǔn)地描述用戶偏好以提高推薦精度,協(xié)同過濾推薦中往往引入除評(píng)分以外的其他因子,加之實(shí)際運(yùn)用過程中用戶和項(xiàng)目的信息數(shù)量通??蛇_(dá)到上百萬,協(xié)同過濾算法的可擴(kuò)展性受到嚴(yán)峻挑戰(zhàn),這也是目前學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾資源推薦領(lǐng)域的一個(gè)研究重點(diǎn)。在如何解決可擴(kuò)展性這一問題方面,本文分析的82篇文獻(xiàn)樣本中多采用聚類的方法,如圖3所示,聚類方法占總樣本的69.2%。

        張付志等人[31]將K-means技術(shù)和分層技術(shù)相結(jié)合對(duì)圖書資源進(jìn)行聚類,縮小了近鄰搜索的范圍和需要預(yù)測(cè)的圖書資源數(shù)目。周之誠(chéng)[32]同樣通過運(yùn)用K-means算法對(duì)資源類別的意圖特征值相似用戶進(jìn)行聚類,提高推薦的實(shí)時(shí)性。張玉霞[33]利用改進(jìn)的粒子群優(yōu)化算法對(duì)文獻(xiàn)進(jìn)行聚類,使目標(biāo)文獻(xiàn)的大部分鄰居實(shí)際上可以在目標(biāo)文獻(xiàn)相似度最高的幾個(gè)聚類中找到。鄭麗姣[34]在進(jìn)行協(xié)同過濾推薦之前,首先使用聚類對(duì)數(shù)據(jù)集進(jìn)行降維處理。孫守義等人[35]利用模糊聚類技術(shù)對(duì)用戶進(jìn)行聚類,在得到用戶在各聚類中的隸屬度和各聚類的聚類中心后,為目標(biāo)用戶尋找最近鄰居集進(jìn)行推薦。

        除此以外,研究人員用于解決可擴(kuò)展性問題的方法還包括引入神經(jīng)網(wǎng)絡(luò)、矩陣壓縮、分類等。如周樸雄等人[36]采用反向傳播神經(jīng)網(wǎng)絡(luò)對(duì)情境屬性向量進(jìn)行處理,生成用戶在該情境下對(duì)閱讀項(xiàng)目的偏好程度。劉海鷗[37]使用MapReduce化的蟻群神經(jīng)網(wǎng)絡(luò)權(quán)值訓(xùn)練方法來訓(xùn)練數(shù)據(jù)集。羅琳等人[38]利用稀疏向量的表示方法來表示輸入矩陣中的每個(gè)資源,以壓縮稀疏矩陣存儲(chǔ)。

        4 總 結(jié)

        作為個(gè)性化服務(wù)的重要手段,協(xié)同過濾推薦技術(shù)在為用戶提供有效信息、節(jié)約搜索成本等方面發(fā)揮著重要作用。本文通過文獻(xiàn)樣本分類,發(fā)現(xiàn)目前該領(lǐng)域的研究重點(diǎn)集中于學(xué)術(shù)數(shù)據(jù)庫協(xié)同過濾推薦的推廣和對(duì)推薦算法本身的完善上,且后者主要針對(duì)數(shù)據(jù)稀疏性問題和可擴(kuò)展性問題的研究。通過研究趨勢(shì)分析和詳細(xì)論述,本文總結(jié)目前我國(guó)學(xué)術(shù)數(shù)據(jù)庫出版協(xié)同過濾資源推薦的研究情況和研究重點(diǎn),旨在厘清該領(lǐng)域的研究脈絡(luò),為后續(xù)研究提供參考。

        注 釋

        [1]Borchers A,Herlocker J,Konstan J,et al.Ganging up on Information Overload[J]. Computer,1998,31(4):

        106-108

        [2][6][7]Goldberg D,Nichols D,Oki B M,et al. Using Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70

        [3][9]Breese J, Hecherman D, Kadie C. Empirical analysis of predictive algorithms for collaborative filtering[C]. In: Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence (UAI98),1998,43-52

        [4]毛穎,周源遠(yuǎn),王繼成,等.信息過濾技術(shù)研究[J].計(jì)算機(jī)科學(xué),2003(8):10-12

        [5]《中國(guó)出版年鑒》雜志社有限公司.中國(guó)出版年鑒[M].北京:《中國(guó)出版年鑒》雜志社有限公司,2015:449-452

        [8]Resnick P, Iacovou N, Suchak M, Bergstrom P, Riedl J.GroupLens: An open architecture for collaborative filtering of netnews [C]. In: Proceedings of the ACM Conference on Computer Supported Cooperative Work.1994:175-186

        [10]鄧愛林,朱楊勇,施伯樂.基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過濾推薦算法[J].軟件學(xué)報(bào),2003(9):1621-1628

        [11]張鋒,常會(huì)友.使用BP神經(jīng)網(wǎng)絡(luò)緩解協(xié)同過濾推薦算法的稀疏性問題[J].計(jì)算機(jī)研究與發(fā)展,2006(4):667-672

        [12]吳湖,王永吉,王哲,等.兩階段聯(lián)合聚類協(xié)同過濾算法[J].軟件學(xué)報(bào),2010(5):1042-1054

        [13]吳顏,沈潔,顧天竺,等.協(xié)同過濾推薦系統(tǒng)中數(shù)據(jù)稀疏問題的解決[J].計(jì)算機(jī)應(yīng)用研究,2007(6):94-97

        [14][15][17]冷亞軍,陸青,梁昌勇.協(xié)同過濾推薦技術(shù)綜述[J].模式識(shí)別與人工智能,2014,27(8):720-734

        [16]馬宏偉,張光衛(wèi),李鵬.協(xié)同過濾推薦算法綜述[J].小型微型計(jì)算機(jī)系統(tǒng),2009(7):1282-1288

        [18]孔繁超.個(gè)性化信息服務(wù)中用戶偏好的動(dòng)態(tài)挖掘[J].情報(bào)理論與實(shí)踐,2009(6):111-113

        [19]邱均平,張聰.高校圖書館館藏資源協(xié)同推薦系統(tǒng)研究[J].圖書情報(bào)工作,2013(22):132-137

        [20][32]周之誠(chéng).用戶意圖聚類的數(shù)字資源推薦方法[J].情報(bào)理論與實(shí)踐,2011(6):116-119

        [21]徐偉芬.基于模糊聚類的數(shù)字圖書館個(gè)性化推薦系統(tǒng)方案設(shè)計(jì)[J].價(jià)值工程,2013(6):174-176

        [22]畢強(qiáng),劉健.數(shù)字文獻(xiàn)資源內(nèi)容服務(wù)推薦方法研究[J].現(xiàn)代圖書情報(bào)技術(shù),2015(12):21-27,105

        [23]馬麗.基于群體興趣偏向度的數(shù)字圖書館協(xié)同過濾技術(shù)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2007(10):19-22

        [24][31]張付志,姜志英.一種基于聚類技術(shù)的數(shù)字圖書館個(gè)性化推薦算法[J].計(jì)算機(jī)應(yīng)用與軟件,2008(7):84-85

        [25]李衛(wèi)華,盧雨民,梅紅.淺談數(shù)字圖書館個(gè)性化信息推薦系統(tǒng)[J].科技廣場(chǎng),2007(9):109-110

        [26]王代琳,劉亞秋,王真諦.基于平均差異度的數(shù)字圖書館個(gè)性化推薦算法研究[J].圖書情報(bào)工作,2009(11):119-122

        [27]張閃閃,黃鵬.高校圖書館圖書推薦系統(tǒng)中的稀疏性問題實(shí)證探析[J].大學(xué)圖書館學(xué)報(bào),2014(6):47-53

        [28]劉飛飛.基于多目標(biāo)優(yōu)化雙聚類的數(shù)字圖書館協(xié)同過濾推薦系統(tǒng)[J].圖書情報(bào)工作,2011(7):111-113

        [29]劉劍濤.個(gè)性化推薦系統(tǒng)中用戶多態(tài)聚類研究[J].現(xiàn)代圖書情報(bào)技術(shù),2012(2):18-22

        [30]劉如娟.基于標(biāo)簽聚類與用戶模型的個(gè)性化推薦方法研究[J].現(xiàn)代情報(bào),2016(6):74-78

        [33]張玉霞.改進(jìn)的個(gè)性化智能文獻(xiàn)推送方法在數(shù)字圖書館中的應(yīng)用研究[J].情報(bào)理論與實(shí)踐,2012(7):92-95

        [34]鄭麗姣.基于聚類的個(gè)性化圖書推薦技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2015(4):100-100

        [35]孫守義,王蔚.一種基于用戶聚類的協(xié)同過濾個(gè)性化圖書推薦系統(tǒng)[J].現(xiàn)代情報(bào),2007(11):139-142

        [36]周樸雄,張兵榮,趙龍文.基于BP神經(jīng)網(wǎng)絡(luò)的情境化信息推薦服務(wù)研究[J].情報(bào)科學(xué),2016(3):71-75

        [37]劉海鷗.云環(huán)境用戶情境感知的移動(dòng)服務(wù)QoS混合推薦[J].情報(bào)雜志,2016(4):183-189

        [38]羅琳,梁桂生,蔡軍.基于分眾分類法的圖書館書目推薦系統(tǒng)[J].現(xiàn)代圖書情報(bào)技術(shù),2014(4):14-19

        (收稿日期:2016-10-23)

        猜你喜歡
        協(xié)同過濾
        基于用戶評(píng)分和項(xiàng)目類偏好的協(xié)同過濾推薦算法
        基于用戶相似度加權(quán)的Slope One算法
        軟件(2016年4期)2017-01-20 09:44:28
        圖書推薦算法綜述
        改進(jìn)的協(xié)同過濾推薦算法
        基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
        基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
        基于協(xié)同過濾算法的個(gè)性化圖書推薦系統(tǒng)研究
        混合推薦算法在電影推薦中的研究與評(píng)述
        關(guān)于協(xié)同過濾推薦算法的研究文獻(xiàn)綜述
        商(2016年29期)2016-10-29 15:22:08
        基于混合信任模型的協(xié)同過濾推薦算法
        av免费在线播放一区二区| 又长又大又粗又硬3p免费视频 | 99精品欧美一区二区三区| 国产女人18毛片水真多| 久久国产精品岛国搬运工| 国产女主播在线免费看| 亚洲一区精品在线中文字幕| 成年免费a级毛片免费看| 女人扒开屁股爽桶30分钟| 免费人成在线观看播放国产| 日本护士一区二区三区高清热线| 国产丝袜美腿一区二区三区| 色偷偷久久久精品亚洲| 亚洲精品www久久久| 亚洲av无码一区二区三区网站| 九九久久精品大片| 中文字幕一区二区三区综合网| 一区二区三区人妻少妇| 性xxxx18免费观看视频| 国产精品美女久久久浪潮av| 色综合久久久久综合一本到桃花网| 亚洲免费精品一区二区| 无码专区一ⅴa亚洲v天堂 | 亚洲五月婷婷久久综合| 色婷婷精久久品蜜臀av蜜桃| 青青草小视频在线播放| 久久久久亚洲av成人无码| 好大好硬好爽免费视频| 国产成人综合久久三区北岛玲 | av免费在线免费观看| 亚洲av久久久噜噜噜噜| 欧美日韩不卡视频合集| 激情内射亚洲一区二区| 亚洲综合中文字幕日韩| 国产强被迫伦姧在线观看无码| 亚洲av片不卡无码久久| 高跟丝袜一区二区三区| 不卡视频在线观看网站| 国产精品国产三级国产专播| 亚洲色自偷自拍另类小说| 亚洲青涩在线不卡av|