陳瑤
摘 要:大數(shù)據(jù)時(shí)代,如何從海量的資源中為用戶提供個(gè)性化信息服務(wù),是當(dāng)前高職院校圖書館遇到的困難之一。本文首先分析總結(jié)了目前高職院校圖書館個(gè)性化信息服務(wù)現(xiàn)狀,針對(duì)這些問(wèn)題,結(jié)合數(shù)據(jù)挖掘技術(shù),提出了優(yōu)化圖書館個(gè)性化信息服務(wù)的若干方式。
關(guān)鍵詞:圖書館,個(gè)性化,數(shù)據(jù)挖掘,信息服務(wù)
近年來(lái),國(guó)家對(duì)高職教育愈發(fā)重視,高職院校發(fā)展的同時(shí)其圖書館館藏資源也飛速增長(zhǎng),隨之也導(dǎo)致資源利用效率不高。信息資源豐富對(duì)圖書館來(lái)說(shuō)既是優(yōu)勢(shì),又是挑戰(zhàn)。如何有效利用海量的資源為用戶提供個(gè)性化信息服務(wù),是圖書館目前要解決的重要問(wèn)題。而數(shù)據(jù)挖掘技術(shù),就是最有效的科學(xué)方法,可幫助圖書館精準(zhǔn)開(kāi)展個(gè)性化信息服務(wù)。
1 高職圖書館個(gè)性化信息服務(wù)的現(xiàn)狀及原因
個(gè)性化信息服務(wù),重點(diǎn)在于個(gè)性化,是面對(duì)不同用戶的信息需求,根據(jù)用戶的個(gè)人特征,定制不同的服務(wù)方式,主動(dòng)為用戶提供不同的信息和服務(wù)內(nèi)容,實(shí)現(xiàn)服務(wù)內(nèi)容、方式、時(shí)空的個(gè)性化。用戶不用再毫無(wú)頭緒得面對(duì)海量信息,獲得的主要是其感興趣的信息。
然而,由于高職院校圖書館的管理理念落后、資源經(jīng)費(fèi)不足等種種原因,高職院校圖書館的個(gè)性化信息服務(wù)發(fā)展水平落后,未能及時(shí)跟上信息社會(huì)的變化。目前,大多數(shù)高職圖書館的個(gè)性化信息服務(wù)項(xiàng)目主要有資源(圖書)推薦、星級(jí)評(píng)價(jià)等基本形式。在資源(圖書)推薦服務(wù)模塊,大多數(shù)高職院校圖書館的圖書推薦僅僅停留在新書推薦、熱書推薦形式,是面向全員的統(tǒng)一推薦,并不是真正意義上的個(gè)性化推薦??偟膩?lái)說(shuō),目前高職院校圖書館的個(gè)性化信息服務(wù)內(nèi)容單一,讀者參與度也不高,無(wú)法充分發(fā)揮圖書館的功能職責(zé)。
究其成因,主要有以下幾點(diǎn):
1)被動(dòng)服務(wù),項(xiàng)目單一。目前,大多數(shù)高職圖書館的服務(wù)方式還是以管理為中心,主要提供基本的查找和借閱文獻(xiàn)的傳統(tǒng)服務(wù),服務(wù)項(xiàng)目單一。而本身高職院校師生主動(dòng)利用圖書館資源的意愿也并不強(qiáng)烈,參與度較低,這也降低了高職院校圖書館工作的積極性。長(zhǎng)此以往,高職圖書館在學(xué)校的地位和作用將會(huì)受到巨大的挑戰(zhàn)。
2)讀者反饋機(jī)制不健全。高職院校師生入館率低,圖書館也沒(méi)有積極走向師生,導(dǎo)致讀者和圖書館缺乏溝通交流,無(wú)法及時(shí)了解用戶的信息需求。
3)技術(shù)薄弱,人才短缺。當(dāng)前高職圖書館的人才隊(duì)伍質(zhì)量參差不齊,專業(yè)技術(shù)人才較少,在個(gè)性化信息服務(wù)研發(fā)工作中面臨各種技術(shù)難題。而完善的個(gè)性化信息服務(wù)系統(tǒng)也需要先進(jìn)的設(shè)備支撐,且系統(tǒng)維護(hù)和完善更是一項(xiàng)長(zhǎng)期的工程。一般的中小型高職圖書館很難獨(dú)立完成個(gè)性化信息服務(wù)系統(tǒng)的研發(fā)工作。
2 個(gè)性化信息服務(wù)的必要性
2.1 轉(zhuǎn)變信息服務(wù)方式,提高圖書館服務(wù)質(zhì)量
隨著信息技術(shù)的發(fā)展,各類資源的不斷增加,基本的咨詢和借閱服務(wù),已經(jīng)完全不能滿足圖書館用戶的信息需求。順應(yīng)時(shí)代的變化,圖書館開(kāi)展個(gè)性化信息服務(wù),是從簡(jiǎn)單的借閱服務(wù)完善到個(gè)性化的信息服務(wù),是從被動(dòng)服務(wù)方式向主動(dòng)服務(wù)轉(zhuǎn)變,提升了服務(wù)質(zhì)量,充分體現(xiàn)了“用戶至上”的服務(wù)理念,也大大提升了用戶體驗(yàn)。
2.2 發(fā)揮圖書館功能職責(zé),提升競(jìng)爭(zhēng)力
圖書館作為文獻(xiàn)、信息資源中心,肩負(fù)教育的職能,其實(shí)具有不可忽視的作用。為此,開(kāi)展個(gè)性化信息服務(wù),進(jìn)行閱讀推廣、信息推送等活動(dòng),可以更好地為師生提供信息資源服務(wù)。當(dāng)圖書館滿足了師生的信息需求,也就讓師生感受到了圖書館的功能作用,這也就增強(qiáng)了圖書館在校園的影響力。
3 數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘,就是從大量的、不完整的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中但又是潛在有用的信息和知識(shí)的過(guò)程。這是一門適應(yīng)信息社會(huì)從海量數(shù)據(jù)中提取信息的需要而產(chǎn)生的新學(xué)科,是統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)技術(shù)、人工智能、可視化技術(shù)等學(xué)科的交叉,所涉及的方法也很多。目前比較成熟且應(yīng)用廣泛主要有分類(Classification)、預(yù)測(cè)(Prediction)、關(guān)聯(lián)規(guī)則(association rules)、聚類(Clustering)等分析方法,每一類方法又涉及很多算法。
由于數(shù)據(jù)挖掘方法的科學(xué)高效,上述算法也被各方學(xué)者不斷改進(jìn)與優(yōu)化,廣泛運(yùn)用于實(shí)踐。在農(nóng)業(yè)、制造業(yè)、教育、體育競(jìng)技、生物科學(xué)等各學(xué)科各領(lǐng)域的決策支持活動(dòng)中,數(shù)據(jù)挖掘技術(shù)也都扮演著越來(lái)越重要的角色??茖W(xué)利用數(shù)據(jù)挖掘技術(shù),有助于圖書館開(kāi)展個(gè)性化信息服務(wù)。
4 利用數(shù)據(jù)挖掘技術(shù)優(yōu)化圖書館個(gè)性化服務(wù)的方式
4.1 用戶研究
圖書館以用戶為中心,研究用戶基本屬性和行為習(xí)慣,有利于圖書館全面了解用戶的需求,及時(shí)調(diào)整及時(shí)優(yōu)化,為用戶提供有需要的信息和服務(wù)。
利用數(shù)據(jù)挖掘的聚類算法,可以進(jìn)行用戶分類,了解群體特征。例如,通過(guò)入館數(shù)據(jù)和借閱數(shù)據(jù),分析活躍用戶的行為習(xí)慣,對(duì)非活躍用戶的行為習(xí)慣加以引導(dǎo),有利于提高圖書館整體的入館率和借閱率。此外,聚類分析結(jié)果中用戶的平均借閱天數(shù)、平均借閱冊(cè)數(shù)及其標(biāo)準(zhǔn)差,可以作為圖書館個(gè)性化調(diào)整最大借閱天數(shù)和最大借閱冊(cè)數(shù)的參考依據(jù)。當(dāng)前,多數(shù)高職圖書館的借書期限和借閱冊(cè)數(shù)都是最初開(kāi)館設(shè)定,后期也并未進(jìn)行實(shí)踐優(yōu)化,可能無(wú)法滿足部分用戶的借閱需求。通過(guò)適當(dāng)調(diào)整,盡可能地將圖書主動(dòng)提供給更多“適合的讀者”,提高圖書館各類圖書的流通率。
4.2 優(yōu)化館藏
利用語(yǔ)義分析和關(guān)鍵詞提取等方法,分析用戶的留言、建議等信息,了解用戶的需求,不斷優(yōu)化圖書服務(wù)。了解讀者薦購(gòu)需求,結(jié)合圖書館各類型圖書的借閱率統(tǒng)計(jì)結(jié)果,制定科學(xué)的圖書采購(gòu)計(jì)劃,減少盲目采購(gòu)行為,優(yōu)化圖書館館藏,提高圖書的利用率。
4.3 個(gè)性化圖書推薦
通過(guò)相關(guān)算法,依據(jù)讀者個(gè)人的特征以及圖書的特征,圖書館可以為每位讀者進(jìn)行個(gè)性化的圖書推薦,推薦讀者感興趣的圖書。目前,常用的推薦算法有基于內(nèi)容推薦、協(xié)同過(guò)濾推薦、關(guān)聯(lián)規(guī)則推薦、組合推薦等。不同的算法各有優(yōu)缺點(diǎn),針對(duì)不同領(lǐng)域和不同的數(shù)據(jù)源,選擇合適的算法是提高推薦效果的關(guān)鍵。針對(duì)高職圖書館的特點(diǎn),本文建議從用戶相關(guān)性和圖書相似性兩個(gè)角度來(lái)進(jìn)行推薦。
用戶相關(guān)性角度可以使用關(guān)聯(lián)規(guī)則來(lái)進(jìn)行挖掘,雖然關(guān)聯(lián)規(guī)則尋找的是物品之間的聯(lián)系,但它是依據(jù)大量用戶的歷史記錄挖掘出相關(guān)的規(guī)則,只有用戶之間具有相似的興趣愛(ài)好才會(huì)產(chǎn)生相同的事務(wù),因此它是用戶之間相似性的表現(xiàn)。
針對(duì)圖書之間的相似性,本文建議采用谷歌的開(kāi)源工具word2vec。它能夠?qū)⒃~表征為向量從而方便的計(jì)算詞與詞之間的相似度。對(duì)圖書館來(lái)說(shuō),圖書的書名信息可以做為word2vec的輸入數(shù)據(jù),經(jīng)過(guò)訓(xùn)練能夠得到對(duì)應(yīng)每本圖書的詞向量,向量之間的距離可作為圖書之間相似性的體現(xiàn),從而據(jù)此為讀者提供相似的圖書的推薦。
5 結(jié)語(yǔ)
在國(guó)家大力推進(jìn)職業(yè)教育現(xiàn)代化的新形勢(shì)下,高職院校的圖書館的服務(wù)也需要與時(shí)俱進(jìn),加快革新。特別是在大數(shù)據(jù)環(huán)境下圖書館應(yīng)該充分利用圖書館的文獻(xiàn)、信息資源,運(yùn)用現(xiàn)代信息技術(shù),主動(dòng)為圖書館用戶提供個(gè)性化信息服務(wù),滿足圖書館用戶的需求,貫徹圖書館“用戶至上”的服務(wù)理念。
參考文獻(xiàn)
[1]曹金梅.淺談高職院校圖書館的個(gè)性化信息服務(wù)[J].哈爾濱職業(yè)技術(shù)學(xué)院學(xué)報(bào),2012,(01):103-104.
[2]張宇惠.數(shù)據(jù)挖掘在電信數(shù)據(jù)分析中的應(yīng)用[J].信息通信,2017,01:279-280.
[3]邵曉紅.高職院校圖書館個(gè)性化信息服務(wù)的思考[J].鄂州大學(xué)學(xué)報(bào),2015,22(09):57-58+61.