閻星宇
摘 要: 分析圖書(shū)館讀者借閱對(duì)提高圖書(shū)借閱率、統(tǒng)計(jì)圖書(shū)量具有重要意義。傳統(tǒng)圖書(shū)館讀者借閱系統(tǒng)主要通過(guò)以往讀者借閱信息對(duì)圖書(shū)借閱率、圖書(shū)量所需增減情況進(jìn)行分析,忽略了圖書(shū)庫(kù)存量對(duì)讀者借閱率的影響。為此,提出并設(shè)計(jì)基于數(shù)據(jù)挖掘的圖書(shū)館讀者借閱系統(tǒng)。在分析其整體結(jié)構(gòu)的基礎(chǔ)上,給出詳細(xì)的硬件設(shè)計(jì)過(guò)程,引入數(shù)據(jù)挖掘方法,實(shí)現(xiàn)對(duì)軟件部分的設(shè)計(jì)。實(shí)驗(yàn)結(jié)果表明,采用改進(jìn)圖書(shū)館讀者借閱系統(tǒng)可實(shí)現(xiàn)圖書(shū)的高速借閱,提高借閱率及借閱準(zhǔn)確度,具有一定的實(shí)用性。
關(guān)鍵詞: 數(shù)據(jù)挖掘; 圖書(shū)借閱率; 讀者借閱信息; 借閱系統(tǒng); 圖書(shū)庫(kù)存量; 系統(tǒng)設(shè)計(jì)
中圖分類(lèi)號(hào): TN919.25?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)12?0180?03
Abstract: Library reader borrowing analysis is of great significance in improving the borrowing rate of books and obtaining the quantity of books. The traditional library reader borrowing system mainly analyzes the increase and decrease demand of book quantity and book borrowing rate according to the past borrowing information of readers, which ignores the impact of book inventory on the reader borrowing rate. Therefore, a library reader borrowing system based on data mining is proposed and designed. On the basis of analyzing its overall structure, the detailed hardware design process is given, and the data mining method is introduced to realize the design of the software part. The experimental results show that the improved library reader borrowing system can achieve the high?speed borrowing of books, and improve the borrowing rate and borrowing accuracy, which has a certain practicability.
Keywords: data mining; book borrowing rate; reader borrowing information; borrowing system; book inventory; system
design
0 引 言
圖書(shū)館作為搜集、整理、收藏圖書(shū)資料供人閱覽、參考的機(jī)構(gòu),是知識(shí)文化傳播的重要陣地,也是圖書(shū)信息聚集和分散的主要場(chǎng)所。其資料繁多,內(nèi)含大量的信息數(shù)據(jù)。當(dāng)前,圖書(shū)館內(nèi)圖書(shū)數(shù)量的逐年遞增,在如此龐大的圖書(shū)規(guī)模中找到讀者感興趣的書(shū)籍非常困難。傳統(tǒng)圖書(shū)館讀者借閱系統(tǒng)存在借還流程長(zhǎng)、盤(pán)點(diǎn)和查找工作繁瑣、借閱和安全脫節(jié)、圖書(shū)管理員與讀者的滿(mǎn)意度低、條形碼技術(shù)缺陷等問(wèn)題,已經(jīng)不能滿(mǎn)足現(xiàn)有圖書(shū)管理的需求,且搜索功能的不強(qiáng)大,搜索結(jié)果眾多,讀者發(fā)現(xiàn)在自己感興趣的書(shū)籍十分困難[1]。在這種情況下,研究并設(shè)計(jì)一種能夠整合讀者行為數(shù)據(jù),讀者興趣愛(ài)好的新圖書(shū)館讀者借閱系統(tǒng),成為該領(lǐng)域亟待解決的問(wèn)題。對(duì)此,本文結(jié)合數(shù)據(jù)挖掘,根據(jù)讀者已有的歷史信息智能分析讀者的興趣愛(ài)好,運(yùn)用數(shù)據(jù)挖掘技術(shù)全面、準(zhǔn)確地給讀者推薦滿(mǎn)意的書(shū)籍,幫助讀者完成快速借閱圖書(shū)。
1 借閱系統(tǒng)整體結(jié)構(gòu)分析
本文設(shè)計(jì)的圖書(shū)館讀者借閱系統(tǒng)主要由圖書(shū)借還模塊、圖書(shū)管理模塊、讀者管理模塊、圖書(shū)盤(pán)點(diǎn)模塊和賬戶(hù)管理模塊組成,最終結(jié)果在顯示器顯示借閱結(jié)果。為了提高借閱系統(tǒng)的借閱率及圖書(shū)推薦準(zhǔn)確度[2],在其控制層添加數(shù)據(jù)挖掘的功能,通過(guò)實(shí)現(xiàn)對(duì)圖書(shū)數(shù)據(jù)進(jìn)行挖掘,縮短查找圖書(shū)所用時(shí)間,提高借閱率。其圖書(shū)館讀者借閱系統(tǒng)整體結(jié)構(gòu)如圖1所示。
由圖1可知,系統(tǒng)通過(guò)讀者輸入要求對(duì)其內(nèi)容在控制層進(jìn)行判斷,合理調(diào)度處理功能模塊。在模塊中進(jìn)行借書(shū)、還書(shū)、圖書(shū)管理、讀者管理、圖書(shū)盤(pán)點(diǎn)模塊及賬戶(hù)管理等功能[3]。而視圖層為讀者提供出錯(cuò)處理及借閱信息的顯示,出錯(cuò)處理負(fù)責(zé)處理出錯(cuò)信息,并將出錯(cuò)信息返回給讀者。整體圖書(shū)借閱系統(tǒng)啟動(dòng)并初始化以后進(jìn)入到主界面等待讀者的輸入,當(dāng)用戶(hù)輸入圖書(shū)信息時(shí),首先要確定讀者的身份[4],確認(rèn)完畢方可進(jìn)行下一步圖書(shū)借閱。每個(gè)子系統(tǒng)的界面都會(huì)為各種功能模塊提供使用方法,控制層在對(duì)讀者輸入的信息進(jìn)行判斷,調(diào)用相應(yīng)的模型處理輸入信息。
2 硬件部分設(shè)計(jì)
在硬件設(shè)計(jì)過(guò)程中,主要對(duì)借書(shū)模塊、讀者管理模塊、數(shù)據(jù)庫(kù)及控制層進(jìn)行設(shè)計(jì)分析,具體步驟如下:
1) 借書(shū)模塊主要通過(guò)讀者及管理員兩部分進(jìn)行使用。圖書(shū)管理員借閱是對(duì)讀者借閱圖書(shū)的記錄進(jìn)行管理,主要包括查詢(xún)超期的讀者、催促讀者還書(shū)等。通過(guò)不同列表的不同數(shù)據(jù),在超期記錄中向用戶(hù)發(fā)送催還信息,在預(yù)約記錄中向讀者發(fā)送預(yù)約信息,為了避免記錄過(guò)多,可在當(dāng)天或前兩天進(jìn)行記錄[5]。圖書(shū)管理員可以使用該模塊實(shí)現(xiàn)對(duì)書(shū)庫(kù)中圖書(shū)情況進(jìn)行查詢(xún),也可通過(guò)圖書(shū)借閱實(shí)現(xiàn)讀者對(duì)圖書(shū)的借閱及續(xù)借[6]。
2) 讀者管理主要目的是為管理人員提供讀者類(lèi)別、讀者信息、借書(shū)卡等日常維護(hù)管理。其中讀者類(lèi)別主要是對(duì)讀者信息進(jìn)行查詢(xún)、增加、修改及刪除等。讀者信息管理主要對(duì)讀者進(jìn)行查詢(xún)、增加、修改及注銷(xiāo)。借書(shū)卡管理主要是辦理借書(shū)卡或者對(duì)借書(shū)卡進(jìn)行掛失、注銷(xiāo)[7]。整體的讀者管理部分由讀者管理員進(jìn)行負(fù)責(zé),對(duì)讀者進(jìn)行管理時(shí),管理員身份需要驗(yàn)證,并在系統(tǒng)初始化部分對(duì)讀者信息進(jìn)行分類(lèi)及對(duì)讀者類(lèi)型進(jìn)行添加[8]。讀者類(lèi)型的添加也是挖掘讀者信息的前提條件,讀者管理員可以根據(jù)實(shí)際需求調(diào)整是否對(duì)新的讀者類(lèi)型進(jìn)行添加或?qū)σ延凶x者類(lèi)型進(jìn)行修改、刪除。
3) 數(shù)據(jù)庫(kù)設(shè)計(jì)。為了更好地與借書(shū)模塊結(jié)合,系統(tǒng)的用戶(hù)采用r_user表,及外擴(kuò)的sys_role,讀者角色關(guān)聯(lián)表sys_user_role,菜單表sys_menu[9],角色菜單關(guān)聯(lián)表sys_role_menu等輔助表。
4) 控制層設(shè)計(jì)。在控制層添加數(shù)據(jù)挖掘的功能形成數(shù)據(jù)倉(cāng)庫(kù),將挖掘的圖書(shū)相關(guān)數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中。而數(shù)據(jù)倉(cāng)庫(kù)主要是為管理決策模式的設(shè)置提供對(duì)應(yīng)支持信息,用于讀者數(shù)據(jù)處理的決策支持,主要處理方式以挖掘分析為主。其與數(shù)據(jù)庫(kù)的區(qū)別為數(shù)據(jù)庫(kù)直接與日常操作處理數(shù)據(jù)相關(guān),數(shù)據(jù)倉(cāng)庫(kù)主要是應(yīng)用于高層決策分析,主要來(lái)源于對(duì)數(shù)據(jù)庫(kù)的日常業(yè)務(wù)操作[10],主要為圖書(shū)借閱系統(tǒng)提供讀者決策支持的當(dāng)前及歷史數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)可有效地把操作數(shù)據(jù)集成在統(tǒng)一的環(huán)境中,為讀者提供決策型數(shù)據(jù),并對(duì)其余模塊進(jìn)行訪(fǎng)問(wèn)。圖書(shū)數(shù)據(jù)挖掘的引入可讓讀者更快、更方便地查詢(xún)所需圖書(shū)信息,縮短查詢(xún)圖書(shū)所用時(shí)間,提高借閱率。
3 軟件部分設(shè)計(jì)
在軟件設(shè)計(jì)部分,主要針對(duì)借書(shū)流程進(jìn)行分析,其實(shí)現(xiàn)流程如圖2所示。其中,查詢(xún)借書(shū)量是從讀者借閱數(shù)據(jù)庫(kù)里查找讀者借書(shū)量的信息,加入借書(shū)量為該圖書(shū)館賬戶(hù)借書(shū)量的最大值時(shí),則進(jìn)行報(bào)錯(cuò)提示,重新進(jìn)行其他書(shū)籍的借閱;反之,假如借書(shū)量未達(dá)到最大值,則從圖書(shū)數(shù)據(jù)庫(kù)中搜查該書(shū)是否有足夠的庫(kù)存,有則借閱成功,同時(shí)進(jìn)行圖書(shū)數(shù)據(jù)庫(kù)更新。由圖2可知,流程開(kāi)始后,首先通過(guò)用戶(hù)數(shù)據(jù)挖掘確定用戶(hù)信息,通過(guò)挖掘圖書(shū)數(shù)據(jù)確定圖書(shū)信息;其次檢驗(yàn)讀者身份;然后調(diào)用借書(shū)模塊功能完成對(duì)圖書(shū)庫(kù)出借信息的填寫(xiě)(此步驟顯示借書(shū)量是否已經(jīng)達(dá)到、圖書(shū)庫(kù)存是否為空,若均存在顯示報(bào)錯(cuò),退出借書(shū)流程,重新進(jìn)行借書(shū));最后將借書(shū)結(jié)果顯示在顯示器上,即圖書(shū)借閱成功(此步驟與借閱成功后對(duì)圖書(shū)庫(kù)信息的更新同步進(jìn)行)。
4 系統(tǒng)驗(yàn)證
為了驗(yàn)證改進(jìn)系統(tǒng)在圖書(shū)館讀者借閱圖書(shū)時(shí)的有效性,設(shè)置其開(kāi)發(fā)環(huán)境為eclipse 5.8, apache?tomcat 6, MySQL?9,后臺(tái)開(kāi)發(fā)框架為Spring Framework 6.0, Spring MVC 4.0, MyBatis 3.2+; 前臺(tái)開(kāi)放框架為Jquery 1.9, Twitter Bootstrap 2.3.1。采用傳統(tǒng)借閱系統(tǒng)與改進(jìn)借閱系統(tǒng)為對(duì)比,以圖書(shū)借閱耗時(shí)及圖書(shū)借閱準(zhǔn)確率為指標(biāo)進(jìn)行實(shí)驗(yàn)分析,結(jié)果如表1所示。
從表1可知,在圖數(shù)量一定的情況,采用傳統(tǒng)借閱系統(tǒng)時(shí),其借閱耗時(shí)隨著借閱圖數(shù)量的增加逐漸增大,最高時(shí)達(dá)到了350 s,最低時(shí)耗時(shí)為120 s;其圖書(shū)借閱準(zhǔn)確度也隨著圖書(shū)量的增加而增加,但其準(zhǔn)確度出現(xiàn)了忽高忽低的現(xiàn)象,不穩(wěn)定,最高時(shí)為90%,最低時(shí)為50%;相比傳統(tǒng)方法,采用改進(jìn)方法時(shí),其借閱耗時(shí)及準(zhǔn)確度均隨著圖書(shū)數(shù)量的增加而延長(zhǎng),但未出現(xiàn)忽高忽低的現(xiàn)象,穩(wěn)定性較好。耗時(shí)最高為61 s,最低為8 s,節(jié)約時(shí)間最高289 s,最低112 s,準(zhǔn)確度最高為99%,最低為89%,最多提高了39%,最少提高了9%,具有一定的實(shí)用性。
5 結(jié) 論
本文研究圍繞傳統(tǒng)借閱系統(tǒng)存在因借閱耗時(shí)長(zhǎng)導(dǎo)致的借閱率低、準(zhǔn)確性差的問(wèn)題,提出并設(shè)計(jì)了基于數(shù)據(jù)挖掘的圖書(shū)館讀者借閱系統(tǒng),得到結(jié)果如下:通過(guò)控制層構(gòu)造出讀者對(duì)圖書(shū)的借閱信息,并利用數(shù)據(jù)挖掘算法對(duì)讀者信息進(jìn)行挖掘,減少搜索空間,降低借閱耗時(shí);通過(guò)驗(yàn)證發(fā)現(xiàn),相比傳統(tǒng)借閱系統(tǒng),改進(jìn)系統(tǒng)的圖書(shū)借閱率及圖書(shū)借閱準(zhǔn)確率均有提高。
參考文獻(xiàn)
[1] 韓吉義.基于數(shù)據(jù)挖掘技術(shù)的高校圖書(shū)館檔案信息管理平臺(tái)的構(gòu)筑[J].山西檔案,2015(6):61?63.
HAN Jiyi. Data?mining technology based construction of archival information management platform for university libraries [J]. Shanxi archives, 2015(6): 61?63.
[2] 茹文,忻展紅.圖書(shū)館借閱數(shù)據(jù)分類(lèi)信息的關(guān)聯(lián)性研究[J].北京郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2016,18(1):14?19.
RU Wen, XIN Zhanhong. Associations between different classifications of library circulation data [J]. Journal of Beijing University of Posts and Telecommunications (Social sciences edition), 2016, 18(1): 14?19.
[3] 賴(lài)劍菲,江舟.基于WLAN的圖書(shū)館讀者行為采集分析平臺(tái)框架研究[J].圖書(shū)情報(bào)工作,2015(10):67?71.
LAI Jianfei, JIANG Zhou. Study on collection and analysis platform framework of library readers′ behaviors based on WLAN [J]. Library and information service, 2015(10): 67?71.