侯燁 時(shí)圣宇
摘 要:高等院校內(nèi)部圖書館系統(tǒng)設(shè)計(jì)和應(yīng)用工作,在現(xiàn)代化科學(xué)技術(shù)和管理原則的共同作用下,已經(jīng)產(chǎn)生了十分明顯的發(fā)展效果。本文首先對(duì)高校圖書館,圖書推薦系統(tǒng)當(dāng)中,關(guān)聯(lián)規(guī)則的應(yīng)用進(jìn)行了簡(jiǎn)單概述,分析了數(shù)據(jù)倉(cāng)庫(kù)和聯(lián)機(jī)分析模塊的設(shè)計(jì)工作;隨后,在此基礎(chǔ)上,進(jìn)一步探究了高校圖書館中,關(guān)聯(lián)規(guī)則的優(yōu)化模式,旨在為關(guān)注這一領(lǐng)域的人士,提供一些可行性較高的參考意見。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則;高校圖書館;圖書推薦
隨著我國(guó)國(guó)民經(jīng)濟(jì)的發(fā)展,以及人民生活水平的提高,社會(huì)各界對(duì)于我國(guó)高等院校的圖書館管理模式,尤其是高校圖書館中,關(guān)聯(lián)規(guī)則的應(yīng)用方面越來越關(guān)注。圖書館的信息服務(wù)模式,是面向全體讀者的,在高等院校內(nèi)部的圖書館中,關(guān)聯(lián)規(guī)則的合理應(yīng)用,可以為讀者們推薦更加適合的圖書信息,幫助學(xué)生們根據(jù)自己的實(shí)際需求,靈活地挑選和借閱圖書,提高圖書的可讀性。
1 關(guān)聯(lián)規(guī)則在高校圖書館圖書推薦中的應(yīng)用
高校圖書館中,圖書借閱數(shù)據(jù)庫(kù)和聯(lián)機(jī)分析模塊的設(shè)計(jì)和管理,是關(guān)聯(lián)規(guī)則應(yīng)用最為廣泛的項(xiàng)目。
1.1 數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)
在進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)工作中,設(shè)計(jì)師要明確不同區(qū)域各自所具備的主題。將邏輯模型按照主題進(jìn)行分化和管理,之后,再利用關(guān)聯(lián)規(guī)則,將其進(jìn)行延伸,明確各個(gè)主題下,不同邏輯模型之間的關(guān)聯(lián)關(guān)系。比如,在實(shí)際的設(shè)計(jì)工作中,可以將粒度層次劃分方法,應(yīng)用到其中。粒度層次劃分方法,是數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)環(huán)節(jié)最為重要的內(nèi)容。首先對(duì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)量級(jí)進(jìn)行分析,將數(shù)據(jù)倉(cāng)庫(kù)的數(shù)量級(jí)應(yīng)用到不同的管理管理模塊,采用多種數(shù)據(jù)粒度策略。當(dāng)數(shù)據(jù)量較大時(shí),應(yīng)用雙重粒度;當(dāng)數(shù)據(jù)量較小時(shí),可以采取直接存儲(chǔ)細(xì)節(jié)的方式,并且定期進(jìn)行數(shù)據(jù)庫(kù)綜合測(cè)試,優(yōu)化數(shù)據(jù)粒度[1]。
1.2 聯(lián)機(jī)分析模塊
多維聯(lián)機(jī)分析數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)分析模塊是其最重要的功能。例如,我國(guó)某地區(qū)的高校圖書館,在進(jìn)行設(shè)計(jì)的過程中,應(yīng)用了Oracle10g和Oracle Warehouse Builder組織數(shù)據(jù)庫(kù),對(duì)模塊進(jìn)行了集中數(shù)據(jù)管理。在具體的操作環(huán)節(jié),工作人員分別建立了數(shù)據(jù)倉(cāng)庫(kù)的圖書維、讀者維和時(shí)間維等三個(gè)模塊。建立讀者多維數(shù)據(jù)庫(kù)和圖書多維數(shù)據(jù)庫(kù),通過時(shí)間軸,對(duì)讀者在不同時(shí)間段內(nèi)查詢、瀏覽和借閱的圖書信息進(jìn)行集中管理。在讀者共享的維度,可以按照讀者所在學(xué)院、專業(yè)、借閱組等方面的信息進(jìn)行分類,形成具有遞進(jìn)層次的數(shù)據(jù)信息,可以為聯(lián)機(jī)分析模塊的優(yōu)化設(shè)計(jì),提供更為準(zhǔn)確的信息數(shù)據(jù)支持。
2 高校圖書館中關(guān)聯(lián)規(guī)則的優(yōu)化研究
在對(duì)高校圖書館中,關(guān)聯(lián)規(guī)則的具體應(yīng)用模式進(jìn)行優(yōu)化研究的過程中,筆者以某地區(qū)高等院校內(nèi)部讀者在校期間的借閱數(shù)據(jù)作為主要的研究對(duì)象,開展了如下的研究工作:
2.1 研究流程
應(yīng)用關(guān)聯(lián)規(guī)則和時(shí)間軸分析方法,對(duì)不同讀者的閱讀數(shù)據(jù)進(jìn)行了分類管理。在這一過程中,將讀者所在學(xué)院和所學(xué)專業(yè)等變量信息考慮在內(nèi),以此得出讀者閱讀偏好和圖書類型的關(guān)聯(lián)關(guān)系。通過關(guān)聯(lián)規(guī)則分析的方法,重點(diǎn)掌握了以專業(yè)為單位的用戶群體,不同的閱讀需求、閱讀偏好與閱讀傾向等,將各項(xiàng)數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)當(dāng)中,為后續(xù)高校圖書館圖書推薦系統(tǒng)的個(gè)性化和私人化推薦,提供更為準(zhǔn)確的信息數(shù)據(jù)支持。在大數(shù)據(jù)和云計(jì)算等科學(xué)技術(shù)的配合下,關(guān)聯(lián)原則在高校圖書館中的應(yīng)用效果更為明顯,以行之有效的推薦方法,可以讓高校圖書館的圖書資源,發(fā)揮出最佳的應(yīng)用效果。將科學(xué)的圖書信息服務(wù),貫穿于用戶閱讀全過程。
在數(shù)據(jù)信息選取的過程中,筆者選取了抽樣調(diào)查的方法,將抽樣比例控制在30%。從圖書館的借閱管理系統(tǒng),對(duì)抽樣用戶從一年級(jí)到四年級(jí)期間,在圖書館中借閱的數(shù)據(jù)進(jìn)行了調(diào)取,共獲取了1200名用戶的27905條數(shù)據(jù)。抽樣的用戶專業(yè)覆蓋了管理、經(jīng)濟(jì)、法學(xué)、醫(yī)學(xué)、文學(xué)、理學(xué)和工學(xué)等多個(gè)學(xué)科的71個(gè)專業(yè)。在數(shù)據(jù)處理階段,根據(jù)用戶的學(xué)號(hào)、專業(yè)、借閱操作日期、中圖分類號(hào)和圖書名稱等信息,將各項(xiàng)數(shù)據(jù)進(jìn)行了集成處理。應(yīng)用Apriori算法,對(duì)圖書借閱活動(dòng)中的用戶維度、圖書維度和時(shí)間維度等內(nèi)容進(jìn)行了處理。運(yùn)用Apriori算法,找出全部數(shù)據(jù)當(dāng)中的頻繁項(xiàng)集,之后判斷最大頻繁項(xiàng)集中,沒有超過最小支持度的數(shù)據(jù),將其進(jìn)行剔除,得到的滿足條件的最小置信度,即為強(qiáng)關(guān)聯(lián)原則[2]。
2.2 研究結(jié)果
在筆者調(diào)查的1200名用戶的27905條數(shù)據(jù)中,用戶借閱的圖書類型共計(jì)22類,借閱密度為0.17。其中,最常借閱的圖書類型為B、H、I、K、T等五種類型。有155名用戶的借閱數(shù)據(jù)顯示,平時(shí)只借閱一種類型的圖書。并且,數(shù)據(jù)還顯示,用戶在一、二和四年級(jí)的學(xué)習(xí)中,借閱類型與自身專業(yè)匹配度較高。對(duì)此,在系統(tǒng)進(jìn)行優(yōu)化設(shè)計(jì)時(shí),可以根據(jù)用戶的專業(yè)類型以及在不同年級(jí)的發(fā)展水平,為用戶推薦更適合的專業(yè)書籍。此外,用戶除了專業(yè)書籍之外,其他興趣愛好方面的發(fā)展總體呈現(xiàn)出較低的水平。對(duì)此,高校圖書館系統(tǒng)可以適當(dāng)?shù)卦谕扑]項(xiàng)目中,增加用戶可能感興趣的課外閱讀材料,并根據(jù)用戶的點(diǎn)擊量,隨時(shí)進(jìn)行優(yōu)化調(diào)整。
3 總結(jié)
綜上所述,關(guān)聯(lián)規(guī)則在高校圖書館中,有著良好的應(yīng)用效果。相關(guān)領(lǐng)域的工作人員,可以在日常的組織和管理過程中,深入系統(tǒng)地分析出,高校圖書館圖書推薦服務(wù)中,關(guān)聯(lián)規(guī)則的操作模式。通過設(shè)計(jì)出合理的研究流程,可以提升研究所得結(jié)果的科學(xué)性和準(zhǔn)確性,從而可以為高校圖書館圖書推薦服務(wù),更好地應(yīng)用和發(fā)展關(guān)聯(lián)規(guī)則,更加便捷靈活地為讀者們服務(wù),提供了可行的途徑。
參考文獻(xiàn)
[1]王娜,岳俊英.基于關(guān)聯(lián)規(guī)則的高校圖書信息數(shù)據(jù)挖掘[J].信息系統(tǒng)工程,2014(02):153-154.
[2]趙琳. 數(shù)據(jù)挖掘技術(shù)及其在高校圖書管理系統(tǒng)中的應(yīng)用研究[D].中國(guó)海洋大學(xué),2011.