高躍峰
摘要:隨著我國教育事業(yè)的逐漸完善,圖書館作為人們獲取知識的一個重要途徑受到了各界人士的高度關(guān)注?;诖耍疚闹饕槍?shù)據(jù)挖掘技術(shù)在圖書館管理信息系統(tǒng)中的應(yīng)用流程、關(guān)聯(lián)規(guī)則挖掘、讀者服務(wù)和應(yīng)用效果進行分析,進一步明確數(shù)據(jù)挖掘技術(shù)的主要功能,更好地發(fā)揮出科學技術(shù)在教育事業(yè)中的應(yīng)用效果,希望為我國圖書館管理信息系統(tǒng)的完善提供參考依據(jù)。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);圖書館;讀者服務(wù)
前言:
近幾年來,我國正逐漸走向信息化的道路,數(shù)據(jù)挖掘技術(shù)作為一項專業(yè)化的信息處理技術(shù)備受關(guān)注。眾所周知,我國圖書館藏書量較大,并且每一天都隨著世界的變化而在不斷更新,需要處理的信息量也持續(xù)攀升?;诖?,在圖書館管理信息系統(tǒng)中充分利用數(shù)據(jù)挖掘技術(shù)是非常必要的,進一步改變傳統(tǒng)的手工加工管理時代,從而提高圖書館信息管理的整體水平。
一、數(shù)據(jù)挖掘技術(shù)的功能
數(shù)據(jù)挖據(jù)技術(shù)是一種新型的信息化處理技術(shù),其主要原理是對工作中產(chǎn)生的大量數(shù)據(jù)資料進行分析,并且在分析的過程中發(fā)現(xiàn)隱藏在數(shù)據(jù)中知識和規(guī)律,最大限度的發(fā)揮出數(shù)據(jù)的重要作用,為相關(guān)人員在工作的過程中節(jié)省大量的時間和精力,便于他們更加直接的獲取到自己想要的信息[1]。目前,科學家將數(shù)據(jù)挖掘技術(shù)按照其功能劃分為兩個方面。一方面進行預(yù)測性數(shù)據(jù)分析,在資料初步分析信息結(jié)論的基礎(chǔ)上,對其進行未來預(yù)測,主要包括分類型數(shù)據(jù)預(yù)測和統(tǒng)計回歸型預(yù)測兩個部分。另一方面進行描述性數(shù)據(jù)分析,主要是指對已經(jīng)收集到的資料信息進行系統(tǒng)化的描述,在與預(yù)測性數(shù)據(jù)分析相結(jié)合的基礎(chǔ)上,更好的進行海量數(shù)據(jù)的分類。
二、數(shù)據(jù)挖掘技術(shù)在圖書館管理信息系統(tǒng)中的應(yīng)用
(一)應(yīng)用流程
在實際的圖書館管理信息系統(tǒng)運行過程中,數(shù)據(jù)挖掘技術(shù)主要是通過“選擇挖掘工具—收集處理數(shù)據(jù)—數(shù)據(jù)庫挖掘—數(shù)據(jù)分析總結(jié)”這一流程步驟實現(xiàn)應(yīng)用的。具體來講:
在進行“選擇挖掘工具”的流程環(huán)節(jié)時,人們通常選擇“SQLServer2005”所謂數(shù)據(jù)挖掘的軟件工具。與傳統(tǒng)的數(shù)據(jù)挖掘工具相比,“SQLServer2005”整合了“T-SQL”事務(wù)處理模塊、“CLR”通用語言模塊、數(shù)據(jù)加密模塊、“SMTP”郵件模塊、“HTTP”終端模塊等多個功能模塊,具有極強的優(yōu)勢特點和應(yīng)用價值;其后,便可通過操作“SQLServer2005”軟件工具,實現(xiàn)基本數(shù)據(jù)的采集和處理。在這一過程當中,相關(guān)人員首先要從軟件服務(wù)其中找到相應(yīng)的信息表格,并對表格中存在的不對稱、不完善問題進行優(yōu)化補充。在達成表格信息的完善之后,便可啟動“SQLServer2005”工具,對表格做出進一步的技術(shù)處理,使表格信息更加便于分析和管理;再后,便可進行“數(shù)據(jù)庫挖掘”環(huán)節(jié)的相應(yīng)操作。對于這一環(huán)節(jié),相關(guān)人員一定要提起足夠的重視,嚴格按照軟件工具的技術(shù)步驟實施挖掘,以此保證數(shù)據(jù)挖掘的準確、高效[2];最后,即需要對挖掘出的信息進行分析處理。
(二)圖書關(guān)聯(lián)規(guī)則挖掘方面
1.數(shù)據(jù)準備及處理
圖書關(guān)聯(lián)規(guī)則挖掘前,應(yīng)做好數(shù)據(jù)準備,并對數(shù)據(jù)進行預(yù)處理。數(shù)據(jù)準備過程需要的數(shù)據(jù),包括書籍名稱、借閱次數(shù)等內(nèi)容。數(shù)據(jù)預(yù)處理方法,包括空值處理、噪聲處理、數(shù)據(jù)集成三種方法。以噪聲處理為例,影響數(shù)據(jù)挖掘結(jié)果的數(shù)據(jù),既“噪聲”。如未給予處理,隨借閱次數(shù)的增加,重復統(tǒng)計的現(xiàn)象較容易發(fā)生。為避免上述問題,應(yīng)根據(jù)讀者條碼的不同,完成預(yù)處理工作。
2.挖掘過程及結(jié)果
圖書關(guān)聯(lián)規(guī)則的挖掘過程如下:(1)生成事務(wù)集:圖書借閱過程中,借閱者的支持度,是決定挖掘效果的主要因素。為提高挖掘效率,應(yīng)首先將支持度低的紀錄刪除。選擇支持度較高的事務(wù),將其作為樣本,挖掘關(guān)聯(lián)規(guī)則。(2)最小支持度:最小支持度是決定挖掘效率的主要因素,因此,為提高數(shù)據(jù)處理效率,確定最小支持度指標是關(guān)鍵。(3)挖掘算法:可將Apriori算法,應(yīng)用到關(guān)聯(lián)規(guī)則的挖掘中,用以獲取關(guān)聯(lián)結(jié)果。當挖掘結(jié)果為10—20時,表明圖書較為活躍。當挖掘結(jié)果處于10以下時,則表明圖書活躍度較差。根據(jù)上述關(guān)聯(lián)結(jié)果的數(shù)據(jù),有關(guān)人員既能夠得到最終的圖書關(guān)聯(lián)規(guī)則挖掘結(jié)論。
(三)讀者服務(wù)方面
數(shù)據(jù)挖掘技術(shù)可以提升圖書館管理的水平,在信息系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)一個顯著的優(yōu)勢是提升了對讀者的服務(wù)效果。一般來說,現(xiàn)代圖書館的藏書規(guī)模往往在10萬甚至百萬冊以上,如此規(guī)模的圖書,依靠紙質(zhì)信息進行記錄和管理勢必存在困難,當讀者進入圖書館查找圖書時,也存在困擾。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以將所有圖書進行編號,以不同內(nèi)容為標準進行分類,在大類別下設(shè)置小類別,直到所有書籍實現(xiàn)編號的精細化。
(四)應(yīng)用效果
為了檢驗數(shù)據(jù)挖掘技術(shù)在圖書館管理信息系統(tǒng)中的應(yīng)用效果,可采用如下方法對系統(tǒng)進行檢驗:表單檢測:表單內(nèi)容是管理員、讀者使用圖書館管理信息系統(tǒng)的媒介,其測試內(nèi)容包含標題欄功能測試、TAB鍵測試系統(tǒng)是否需要設(shè)置ESC(全屏退出)、標題輸入功能以及列表間距是否合理等。系統(tǒng)鏈接測試則需要評估導航條、靜態(tài)信息鏈接的準確性、系統(tǒng)各頁面鏈接的準確性以及圖書鏈接的準確性等。數(shù)據(jù)庫測試需通過對單元、系統(tǒng)及集成狀況的測試,評估圖書館管理信息系統(tǒng)運行過程中是否會出現(xiàn)錯誤輸出或一致性錯誤。
經(jīng)過上述測試項目的多次重復測試后,基于數(shù)據(jù)挖掘技術(shù)的圖書館管理信息系統(tǒng)測試結(jié)果表明:該系統(tǒng)的功能均可正常運行,系統(tǒng)各頁面鏈接正常,系統(tǒng)登錄反應(yīng)、鏈接顯示反應(yīng)速度較快;讀者可通過對圖書館管理信息系統(tǒng)的便捷操作,掌握圖書館的圖書上架信息,而系統(tǒng)則可根據(jù)讀者的檢索記錄、借閱記錄自動為其推薦相應(yīng)類型圖書;管理員可利用該系統(tǒng)獲取讀者的閱讀需求,并制定適宜的圖書館資源管理方案。
結(jié)論:
綜上所述,與其他技術(shù)相比,數(shù)據(jù)挖掘技術(shù)的描述性數(shù)據(jù)分析功能、預(yù)測性數(shù)據(jù)分析功能為其在圖書館管理信息系統(tǒng)中的應(yīng)用奠定了良好的基礎(chǔ)。在圖書館管理信息系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù),可有效促進圖書館管理信息系統(tǒng)功能的強化,使其為圖書館管理工作帶來更多的便捷。而從讀者層面來講,該技術(shù)的引入可以提高讀者的滿意度,間接促進圖書資源價值的發(fā)揮。
參考文獻:
[1]張昕.數(shù)據(jù)挖掘技術(shù)在圖書館管理信息系統(tǒng)中的應(yīng)用[J].湖南城市學院學報(自然科學版),2016,25(05):63-64.
[2]徐德俊.數(shù)據(jù)挖掘技術(shù)在圖書館管理信息系統(tǒng)中的應(yīng)用[J].黑龍江史志,2015(05):266-268.