孫常麗++孫達辰++郭冬梅++武麗影++金松跟
[摘要]文章概述了高校圖書館薦讀系統(tǒng)的發(fā)展現(xiàn)狀,對推薦系統(tǒng)中的核心技術——推薦算法進行了探討分析,同時進行了高校推薦系統(tǒng)地推薦模式的創(chuàng)新性設計,簡述了基于局部數(shù)據(jù)推薦模式的實現(xiàn)過程,對國內(nèi)圖書館提供推薦服務的未來做出了展望。
[關鍵詞]高校圖書館;推薦系統(tǒng);推薦技術;推薦算法;推薦服務
[DOI]1013939/jcnkizgsc201704221
高校圖書館擁有豐富的藏書資源,是知識和信息的集散地,但是在知識爆炸的時代,移動設備頻頻更新?lián)Q代,讀者閱讀行為已經(jīng)改變,如果圖書館不能推出新的面向讀者的服務方式,高校圖書館將無法很好發(fā)揮其資源的優(yōu)勢。在這種環(huán)境下,文章提出了在高校圖書館領域構建基于局部數(shù)據(jù)的圖書薦讀系統(tǒng)(推薦系統(tǒng)),既能很好地滿足廣大師生的信息需求,同時也能夠通過這種主動推薦的模式幫助更多師生節(jié)省查找圖書資料的時間,提高工作學習效率。
1推薦系統(tǒng)在國內(nèi)外的發(fā)展現(xiàn)狀
近年來,推薦系統(tǒng)在各個領域內(nèi)逐漸興起,并得到越來越廣泛的應用,1992年12月,美國施樂公司研究所開發(fā)了最早的推薦系統(tǒng)Tapestry;[1]1994年,GroupLens系統(tǒng)可以根據(jù)用戶的興趣推薦相關的網(wǎng)絡新聞的文章;之后又出現(xiàn)了Citeseer等應用于不同領域的推薦系統(tǒng);近年來,很多網(wǎng)站可以為消費者提供個性化推薦,其中,最著名的是亞馬遜電子商務網(wǎng)站,它采用的是條目對條目的協(xié)同推薦算法;目前,在圖書館領域應用推薦系統(tǒng)的比比皆是,除了各自采用不同的推薦方式之外,目的都是為讀者提供更快、更好的信息推送服務,其中斯坦福大學的Fab推薦系統(tǒng),它將基于內(nèi)容和協(xié)同過濾算法結合起來,采用混合推薦技術為特定用戶進行推薦;加州大學的Melvy推薦系統(tǒng),它采用了兩種生成推薦系統(tǒng)的方法,一種是利用圖書館的流通數(shù)據(jù)進行推薦,另一種是基于相似性的推薦;美國俄勒岡的SERF推薦系統(tǒng)是一種通過寫作過濾的新型搜索引擎;在國內(nèi),雖然也有高校圖書館推出了推薦系統(tǒng),但并不普遍,其中中國人民大學圖書館的推薦系統(tǒng)比較成型,它同樣采用了混合的推薦模式為讀者推送書目信息。
綜上所述,推薦系統(tǒng)在國際上已有成熟范例,而國內(nèi)圖書館領域仍屬于起步階段,需我們各大高校共同努力,實現(xiàn)圖書館領域的智能圖書推薦,并且可以為相似領域提供一定的參考思路。
2高校圖書推薦系統(tǒng)的個性化推薦模式探討
圖書推薦系統(tǒng)的主要推薦模式有三種:個性化推薦、智能化檢索和社會化推薦。[2]其中智能化推薦需要利用大數(shù)據(jù)和云計算技術構建一個強大的互動知識分享平臺,社會化推薦旨在解決用戶在網(wǎng)上書店的社交網(wǎng)絡需求,而對于高校圖書館而言,目前,僅僅實現(xiàn)了低級信息化,圖書數(shù)據(jù)的元數(shù)據(jù)不多,使得圖書的全文檢索功能受到限制,而且高校圖書館有其自身藏書特點,專業(yè)書籍占藏書比例相對要高,由于讀者水平及其專業(yè)各不相同,使得圖書館中大部分書籍成了擺設,無人問津,為了解決以上問題,本文嘗試采用個性化的推薦模式來構建高校圖書館領域的圖書推薦系統(tǒng)。[3]
目前,推薦系統(tǒng)在各行各業(yè)中應用廣泛,其核心算法已經(jīng)基本成熟,個性化推薦是將協(xié)同過濾推薦算法應用于高校圖書館領域,其基本思想是為一個用戶找到他真正感興趣的內(nèi)容的最好方法是首先找到與此用戶有相似喜好的其他用戶,然后將他們所喜好的內(nèi)容推薦給當前用戶,該思想類似于現(xiàn)實生活中的“口碑傳播”(word-of-mouth)。它是在用戶對于一些項目或新聞資訊的評分或可以表達用戶喜好的行為的基礎上,查找具有相同興趣愛好或行為的用戶,以此來為目標用戶推薦一些他們可能會感興趣的資料的技術。協(xié)同過濾推薦算法是目前較常用的推薦技術,它的計算所依賴的原始數(shù)據(jù)都是用戶數(shù)據(jù)評分矩陣,根據(jù)我們的經(jīng)驗,協(xié)同過濾算法可以基于相似用戶的歷史行為獲得更多“不知曉”的項目,它的優(yōu)點是不需要對物品或者用戶進行嚴格的建模,且不要求物品的描述是機器可以理解的,與領域無關的,而且它計算出來的推薦是開放的,可以共用他人的經(jīng)驗,很好地支持用戶發(fā)現(xiàn)潛在的興趣偏好,且發(fā)現(xiàn)速度更快;這種推薦方法隨著時間推移性能會提高,且其推薦個性化、自動化程度都很高,能處理復雜的非結構化對象;但是,這種方法存在稀疏性問題、可擴展問題和新用戶問題,其推薦效果取決于歷史數(shù)據(jù)集,且系統(tǒng)剛開始時推薦質(zhì)量較差。
這種方法不同于其他算法,在國內(nèi)應用不多。文章將采用個性化推薦模式,主要是根據(jù)《中圖法》對圖書館中的圖書類別按照分類號進行劃分,同時根據(jù)讀者的借閱習慣劃分出相似讀者群,并為讀者找到具有更為相似借閱習慣的近鄰讀者,對其進行圖書推薦服務,這種推薦模式可以為讀者提供相同及不同分類號的圖書推薦服務,同時還提供近鄰讀者推薦,一方面,對讀者推薦可能感興趣的作者及其作品,另一方面,對作者推薦相似讀者及其圖書興趣。其主要推薦過程為:①數(shù)據(jù)預處理:將得到的數(shù)據(jù)按照運算模式進行預處理;②數(shù)據(jù)處理:通過已經(jīng)設計好的個性化推薦體系將得到的預處理數(shù)據(jù)進行數(shù)據(jù)加工處理,得到備用數(shù)據(jù)集;③數(shù)據(jù)測試:將數(shù)據(jù)集代入個性化協(xié)同過濾模式中進行數(shù)據(jù)測試;④評分:進行計算并得出有意義的評分集合;⑤進行推薦:根據(jù)我們得到的評分集合來進行圖書推薦。[4]
3推薦方法的創(chuàng)新設計
在采用個性化推薦模式的基礎之上,文章創(chuàng)新性地提出了基于局部近鄰搜索的思想,即基于局部用戶數(shù)據(jù)(User-Based,CF)的協(xié)同過濾推薦算法來構建圖書推薦系統(tǒng),該算法是假設如果某些讀者同時喜歡某一專業(yè)或某一類別的圖書,那么他們對其他專業(yè)或類別的圖書的喜愛也比較相似,即評分相似。高校由于其按專業(yè)進行劃分的這種特點,在挑選圖書時,相同專業(yè)的讀者往往會挑選相同或相似類別的圖書,因此,我們在進行推薦方法設計時創(chuàng)新性地采用了讀者局部數(shù)據(jù),即采用相同專業(yè)的讀者借閱數(shù)據(jù)來進行圖書推薦服務,這種方法區(qū)別于以往的利用全校讀者的借閱數(shù)據(jù)來發(fā)掘讀者潛在興趣,提供推薦服務的模式。
這種基于創(chuàng)新圖書推薦方法的圖書推薦服務的實現(xiàn),需要我們根據(jù)讀者所屬專業(yè)的不同將圖書館中讀者借還數(shù)據(jù)進行分類,并計算相同專業(yè)不同讀者之間的借閱相似度,我們需要根據(jù)這種相似度的高低來找到目標讀者的K個最近鄰居,在這一過程中將采用最近鄰方法進行篩選。同時,我們將讀者借閱相似度作為權重得出預測評分,這需要計算最近鄰居對未評分項目的加權平均值,對得到的預測評分進行排序,將評分較高的項目作為目標進行推薦。這種方式的推薦結果推薦精度高、且具有推薦對象多樣化等優(yōu)點。
4結論
將推薦系統(tǒng)應用于圖書館領域,可以提高圖書館現(xiàn)有資源的利用率,節(jié)省讀者查找所需圖書資料的時間,為高校教學科研提供極大便利。目前,國內(nèi)很少有成熟的推薦系統(tǒng)應用在高校圖書館領域,由于構建推薦系統(tǒng)的算法多種多樣,各具優(yōu)勢,各大高校應該根據(jù)自己院校的特點進行選擇,適當創(chuàng)新,以促進推薦系統(tǒng)在未來高校圖書館中的發(fā)展應用。
參考文獻:
[1] Goldberg D,Nichols D,Okibm,et alUsing Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70
[2]張閃閃,黃鵬高校圖書館圖書推薦系統(tǒng)中的稀疏性問題實證探析[J].大學圖書館學報,2014(6):47-53
[3]姜志英基于數(shù)據(jù)挖掘的數(shù)字圖書館個性化推薦算法研究[D].秦皇島:燕山大學,2007
[4]楊玲圖書推薦服務系統(tǒng)構建與應用研究[D].廣州:華南理工大學,2014