巫紅霞
(鎮(zhèn)江高等專(zhuān)科學(xué)校 裝備制造學(xué)院,江蘇 鎮(zhèn)江 212003)
數(shù)據(jù)挖掘在高校圖書(shū)館藏書(shū)管理中的應(yīng)用
巫紅霞
(鎮(zhèn)江高等專(zhuān)科學(xué)校 裝備制造學(xué)院,江蘇 鎮(zhèn)江 212003)
利用數(shù)據(jù)挖掘技術(shù)分析圖書(shū)借閱數(shù)據(jù),可以科學(xué)地剔除舊圖書(shū),同時(shí)為最新的圖書(shū)在書(shū)架中預(yù)留空間,減少館藏圖書(shū)倒架次數(shù),合理布局館藏書(shū)架,優(yōu)化館藏資源和空間。
圖書(shū)館;數(shù)據(jù)挖掘;書(shū)架;藏書(shū)管理
高校圖書(shū)館依托豐富的館藏資源為廣大師生服務(wù)[1]。圖書(shū)館資源以紙質(zhì)圖書(shū)為主。紙質(zhì)圖書(shū)主要存放在館藏書(shū)架中。圖書(shū)館藏書(shū)品種和數(shù)量逐漸增加,與有限的館藏書(shū)架之間的矛盾日益凸顯。這就要求圖書(shū)管理人員能夠合理利用有限的館藏書(shū)架存放更具價(jià)值的圖書(shū),完成這項(xiàng)工作的關(guān)鍵是預(yù)測(cè)圖書(shū)的變化趨勢(shì),利用數(shù)據(jù)挖掘技術(shù)可以很好地解決這一問(wèn)題。
數(shù)據(jù)挖掘(Data Mining,DM)[2]最早出現(xiàn)于1989年,就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)庫(kù)中提取隱性信息并且加工成可理解的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘常用的方法有關(guān)聯(lián)規(guī)則、決策樹(shù)及統(tǒng)計(jì)分析等。數(shù)據(jù)挖掘的任務(wù)主要是能分類(lèi)、回歸、時(shí)間序列分析、預(yù)測(cè)、聚類(lèi)、匯總、關(guān)聯(lián)規(guī)則、序列發(fā)現(xiàn)等。
剔除舊圖書(shū)[3]一般指對(duì)破舊、過(guò)時(shí)的或者失去價(jià)值的圖書(shū)進(jìn)行清理。比如因年代久遠(yuǎn)變得陳舊或內(nèi)容滯后而失去參考價(jià)值的圖書(shū)、有新版或修訂版的圖書(shū)、殘缺破損不利于閱讀的圖書(shū)、復(fù)本過(guò)多[4]的圖書(shū)、在規(guī)定時(shí)間內(nèi)未流通的圖書(shū)、借閱率低的圖書(shū),都可以作為剔舊圖書(shū)而入藏舊書(shū)庫(kù)。
在實(shí)際工作中,對(duì)于殘缺破損的或有新版、修訂版的圖書(shū),剔除工作相對(duì)簡(jiǎn)單,復(fù)本過(guò)多的圖書(shū)和借閱率低的圖書(shū)的剔舊工作相對(duì)困難。利用數(shù)據(jù)挖掘技術(shù)可以科學(xué)地分析圖書(shū)的復(fù)本數(shù),統(tǒng)計(jì)圖書(shū)在一定周期內(nèi)的借閱次數(shù),從而得出借閱率。但單從借閱率低、復(fù)本數(shù)多等方面考慮剔除舊圖書(shū)是不科學(xué)的。有些優(yōu)秀的圖書(shū)往往會(huì)被反復(fù)續(xù)借,并長(zhǎng)期在某一特定用戶(hù)手中,其借閱次數(shù)不一定很多,但借閱時(shí)間很長(zhǎng)。這些圖書(shū)并不一定能在借閱次數(shù)上體現(xiàn)其優(yōu)勢(shì),因此,還需要統(tǒng)計(jì)圖書(shū)的平均借閱時(shí)間,并依此設(shè)定平均借閱閾值,去掉未達(dá)到閾值的圖書(shū),找到館藏中借閱時(shí)間較長(zhǎng)的圖書(shū)。
以鎮(zhèn)江高等專(zhuān)科學(xué)校圖書(shū)館為例,統(tǒng)計(jì)中文圖書(shū)的借閱率,并進(jìn)行分析。設(shè)定借閱時(shí)間為2013年1月至2014年6月,借閱率小于0.3。通過(guò)數(shù)據(jù)挖掘得到如圖1所示的統(tǒng)計(jì)結(jié)果。
在圖1中,我們可以看到,《晨讀十分鐘》復(fù)本數(shù)為12,借閱次數(shù)為2,借閱率低,可以適當(dāng)降低復(fù)本數(shù)。同樣,《語(yǔ)文學(xué)科知識(shí)與教學(xué)能力》復(fù)本數(shù)為6,借閱次數(shù)為1,借閱率也比較低,可以降低復(fù)本數(shù)。
圖書(shū)排架[5]就是將已經(jīng)加工整理的圖書(shū)按照某種標(biāo)準(zhǔn)和次序陳放在書(shū)架上的過(guò)程。鎮(zhèn)江高等專(zhuān)科學(xué)校圖書(shū)館是根據(jù)圖書(shū)分類(lèi)號(hào)來(lái)排架的,其優(yōu)點(diǎn)是, 讀者能夠比較方便準(zhǔn)確地找到所需要的圖書(shū),并在查找自己所要的圖書(shū)的同時(shí)關(guān)注相似的圖書(shū)。缺點(diǎn):1) 讀者需要準(zhǔn)確知道欲借圖書(shū)的索書(shū)號(hào)。2) 圖書(shū)館必須為各類(lèi)新進(jìn)圖書(shū)預(yù)留合理的書(shū)架空間,否則會(huì)導(dǎo)致圖書(shū)的重新整架甚至倒架,增加圖書(shū)管理人員的工作量。3) 讀者進(jìn)入圖書(shū)館借書(shū),很可能就在某類(lèi)自己感興趣的圖書(shū)中查閱,很少同時(shí)關(guān)注其他類(lèi)別的圖書(shū)。
圖1 圖書(shū)借閱率統(tǒng)計(jì)分析
因此,需要對(duì)圖書(shū)館系統(tǒng)中的數(shù)據(jù)進(jìn)行挖掘分析,了解各類(lèi)圖書(shū)的利用率[6]和更新指數(shù),統(tǒng)計(jì)各類(lèi)圖書(shū)借閱情況??梢愿鶕?jù)圖書(shū)的利用率合理排架,即將利用率高的圖書(shū)陳放在容易查找的書(shū)架上??梢愿鶕?jù)圖書(shū)的更新指數(shù)預(yù)留書(shū)架空間。可以根據(jù)某一時(shí)期圖書(shū)借閱次數(shù)排行榜找出最受歡迎的圖書(shū),開(kāi)設(shè)《好書(shū)介紹》欄目,甚至可以針對(duì)特定群體進(jìn)行好書(shū)介紹和推薦。設(shè)立專(zhuān)門(mén)的書(shū)架為圖書(shū)展讀處,最好設(shè)立在讀者進(jìn)入圖書(shū)館的必經(jīng)之地,吸引讀者注意。圖書(shū)館也可以主辦各類(lèi)讀書(shū)節(jié)活動(dòng)吸引讀者。
以鎮(zhèn)江高等專(zhuān)科學(xué)校圖書(shū)館為例,圖書(shū)利用率統(tǒng)計(jì)結(jié)果詳見(jiàn)圖2。從圖2可以看出,B類(lèi)(哲學(xué)類(lèi))、H類(lèi)(語(yǔ)言、文字類(lèi))、I類(lèi)(文學(xué)類(lèi))、K類(lèi)(歷史、地理類(lèi))、Q類(lèi)(生物科學(xué)類(lèi))等圖書(shū)的利用率高,可以將放置這幾類(lèi)圖書(shū)的書(shū)架放在容易查找、方便上架的地方。
圖2 圖書(shū)利用率分析
在圖3中,《哈佛家訓(xùn)大全集》《誰(shuí)還在背單詞,大學(xué)英語(yǔ)四級(jí)詞匯》《你好,舊時(shí)光(全3冊(cè))》《Q版漫畫(huà)技法從入門(mén)到精通》等借閱次數(shù)較多,可以將它們作為熱門(mén)圖書(shū)推薦放在最受歡迎圖書(shū)的書(shū)架上。
在圖4中,B類(lèi)(哲學(xué)類(lèi))、D類(lèi)(政治法律類(lèi))、F類(lèi)(經(jīng)濟(jì)類(lèi))、G類(lèi)(文化、科學(xué)、教育、體育類(lèi))、H類(lèi)(語(yǔ)言、文字類(lèi))、I類(lèi)(文學(xué)類(lèi))、J類(lèi)(藝術(shù)類(lèi))、K類(lèi)(歷史、地理類(lèi))、T類(lèi)(工業(yè)技術(shù)類(lèi))等圖書(shū)的更新指數(shù)較高,因此要增加這幾類(lèi)圖書(shū)的書(shū)架預(yù)留空間。
高校圖書(shū)館館藏圖書(shū)多且更新快。合理布局館藏書(shū)架是圖書(shū)館工作的重要部分。合理布局館藏書(shū)架、優(yōu)化館藏圖書(shū)不僅可以減少圖書(shū)館工作人員的勞動(dòng)量, 方便讀者借閱,而且可以提高圖書(shū)館的服務(wù)質(zhì)量和圖書(shū)的利用率。
圖3 圖書(shū)借閱次數(shù)排行榜
圖4 圖書(shū)更新指數(shù)分析
本文只是簡(jiǎn)單地介紹了數(shù)據(jù)挖掘技術(shù)在高校圖書(shū)館藏書(shū)管理工作中的應(yīng)用。隨著數(shù)據(jù)挖掘技術(shù)的不斷深入研究,其在圖書(shū)館工作中的應(yīng)用也會(huì)越來(lái)越廣,比如進(jìn)行圖書(shū)采購(gòu)、讀者個(gè)性化服務(wù)、領(lǐng)導(dǎo)的決策分析等。
[1] 方小蘇.圖書(shū)館館藏資源配置的效率分析[J].圖書(shū)情報(bào)工作,2005(7):91-93.
[2] 巫紅霞.基于數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的高校教學(xué)管理決策支持系統(tǒng)[D].南京:南京航空航天大學(xué),2009:5.
[3] 王忠,劉惠琴.談?wù)勷^藏中文圖書(shū)剔舊工作[J].圖書(shū)館論壇,1995(3):41-42.
[4] 梅國(guó)華.分類(lèi)排架研究綜述[J].圖書(shū)情報(bào)工作,2004(3):102-104.
[5] 劉新文.圖書(shū)館圖書(shū)復(fù)本量的定量分析[J].西南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2007(4):87-89.
[6] 胡振華,蔡新.基于解釋結(jié)構(gòu)模型的高校圖書(shū)館紙質(zhì)資源利用率影響因素分析[J].圖書(shū)情報(bào)工作,2010(4):46-50.
〔責(zé)任編輯: 盧 蕊〕
Applicationofdatamininginmanagementofuniversitylibrarycollections
WUHong-xia
(School of Equipment Manufacturing, Zhenjiang College, Zhenjiang 212300, China)
Using data mining techniques to analyze the data of library borrowing can help to remove the old literature in a scientific and rational way and reserve space for the latest literature on the bookshelf, reduce the number of book collections on the shelves and optimize the resources and space for collection with reasonable layout of library shelves.
library; data mining; bookshelf; library collection management
2014-09-28
巫紅霞(1977—),男,江蘇句容人,講師,碩士,主要從事計(jì)算機(jī)數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘研究。
G253.5
: C
:1008-8148(2015)02-0046-03