聶珍 王華秋 周建
〔摘要〕本文分析了圖書館服務(wù)中個(gè)性化推薦提出的背景、研究意義和圖書館發(fā)展的狀況,闡述了圖書館個(gè)性化系統(tǒng)設(shè)計(jì)思想、框架結(jié)構(gòu)和各功能模塊的任務(wù)。詳細(xì)介紹了系統(tǒng)的實(shí)現(xiàn),以某圖書館數(shù)據(jù)為例,進(jìn)行聚類分析,獲得各簇的借閱模式,結(jié)合讀者信息,通過(guò)圖書喜好度計(jì)算,完成了圖書推薦的目標(biāo),并提供了可參考的建議。這一推薦服務(wù)系統(tǒng)的提出,提高了圖書館的使用率,提升了圖書館的服務(wù)水平,是網(wǎng)絡(luò)時(shí)代圖書館發(fā)展的新道路。
〔關(guān)鍵詞〕個(gè)性化推薦;圖書館服務(wù);系統(tǒng)設(shè)計(jì)
DOI:10.3969/j.issn.1008-0821.2013.09.019
〔中圖分類號(hào)〕G252.6;TP301.6〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2013)09-0095-04
圖書館個(gè)性化推薦則是指以讀者的個(gè)人背景、專業(yè)、習(xí)慣、愛好和提出的特別要求等為依據(jù),對(duì)每一個(gè)讀者提供個(gè)性化推薦服務(wù)[1]。讀者的個(gè)人信息是存儲(chǔ)在圖書館的數(shù)據(jù)庫(kù)里,借閱信息是存儲(chǔ)在讀者的借閱日志中,這就需要采用數(shù)據(jù)挖掘技術(shù)[2],在大量的隱藏信息中挖掘出讀者的喜好和借閱模式,便于進(jìn)行個(gè)性推薦。各個(gè)高校開始這方面的研究,并各自推出了推薦系統(tǒng),如中國(guó)人民大學(xué)、浙江大學(xué)及武漢大學(xué),這才開啟了國(guó)內(nèi)個(gè)性化推薦服務(wù)的研究[3]。
就理論發(fā)展而言,從多種角度和多種方向研究PRSL領(lǐng)域的文章很多,揭示了圖書館中發(fā)展個(gè)性化的推薦服務(wù)具有重要意義,預(yù)測(cè)了發(fā)展的良好態(tài)勢(shì)[4-5]。目前開展個(gè)性化的推薦服務(wù)的高校有中科院的文獻(xiàn)信息中心、浙江大學(xué)和中國(guó)人民大學(xué)等,甚至連清華大學(xué)網(wǎng)絡(luò)信息實(shí)驗(yàn)室的研究課題中都有個(gè)性化的信息檢索系統(tǒng),并發(fā)表了數(shù)篇基于該課題的論文[6]。
圖書館擁有大量圖書,是提供給讀者學(xué)習(xí)資料的重要場(chǎng)所。其服務(wù)對(duì)象各有特色,圖書館提供的服務(wù)應(yīng)該滿足不同讀者的需要,才能真正有效的利用資源。采用文獻(xiàn)[7]的和聲模糊聚類算法(Harmony Fuzzy Clustering,HFC)的推薦系統(tǒng)主要是為圖書館的管理提供幫助。系統(tǒng)主要是通過(guò)記錄讀者的借閱行為、采集各個(gè)讀者的借閱數(shù)據(jù),然后對(duì)采集的數(shù)據(jù)進(jìn)行預(yù)處理,存儲(chǔ)在數(shù)據(jù)表中。利用HFC算法分析數(shù)據(jù)集,得到隱含的各類圖書的借閱模式和規(guī)則。最后根據(jù)讀者的相關(guān)信息,預(yù)測(cè)讀者可能喜愛的圖書資料,通過(guò)各種形式向其推薦感興趣的圖書資料,以達(dá)到為讀者提供個(gè)性化的信息服務(wù)的目標(biāo)。
本文從設(shè)計(jì)思想、系統(tǒng)框架以及具體的實(shí)現(xiàn)來(lái)介紹系統(tǒng),為圖書館工作提供參考意見。
1個(gè)性化推薦系統(tǒng)的框架
根據(jù)個(gè)性化推薦系統(tǒng)的設(shè)計(jì)思想,完成系統(tǒng)的框架結(jié)構(gòu)設(shè)計(jì)。本節(jié)主要從系統(tǒng)的整體結(jié)構(gòu)、各個(gè)功能模塊的工作和個(gè)性化推薦的工作過(guò)程詳細(xì)的介紹了系統(tǒng)的框架結(jié)構(gòu)設(shè)計(jì)。
1.1整體結(jié)構(gòu)
已有的大多數(shù)圖書館個(gè)性化推薦系統(tǒng)中,多采用輸入讀者喜好關(guān)鍵字和傳統(tǒng)的聚類算法對(duì)讀者借閱日志進(jìn)行分析處理,效果較差。本文采用HFC算法來(lái)處理讀者借閱日志,不需要輸入讀者喜好關(guān)鍵字就能自動(dòng)的進(jìn)行個(gè)性化的推薦,在文獻(xiàn)[7]已經(jīng)詳細(xì)的驗(yàn)證了HFC算法較其他算法的高效性,在聚類中獲得了很好的效果。根據(jù)系統(tǒng)要完成的功能將系統(tǒng)結(jié)構(gòu)分為三層,一是界面層;二是個(gè)性化推薦層;三是數(shù)據(jù)庫(kù)層,如圖1所示。界面層是跟讀者面對(duì)面的可視化層,向讀者推薦個(gè)性化的圖書資料。個(gè)性化推薦層主要是進(jìn)行數(shù)據(jù)的采集和預(yù)處理,采用HFC算法處理數(shù)據(jù),得到圖書借閱的模式,推薦個(gè)性化的圖書資料。這一層的功能模塊由讀者借閱日志的采集、數(shù)據(jù)的預(yù)處理、聚類分析和推薦個(gè)性化的圖書資料4個(gè)部分組成?;緮?shù)據(jù)庫(kù)層主要是存儲(chǔ)讀者、圖書和借閱日志的數(shù)據(jù)信息。