喬瑋
摘要:受信息技術影響,現(xiàn)代圖書館為了展現(xiàn)自身價值都積極引入了相關信息技術,使得圖書館朝信息化方向發(fā)展,這時信息技術就涉及圖書館的管理系統(tǒng)中,能夠幫助管理員做好管理工作,有利于圖書館運維。數(shù)據(jù)挖掘技術就是圖書館管理信息系統(tǒng)中的常用技術,與信息系統(tǒng)作用及管理工作質(zhì)量有密切關系,因此如何正確應用該項技術是現(xiàn)代圖書館需要思考的問題,本文也將展開研究,重點論述數(shù)據(jù)挖掘技術在圖書館管理信息系統(tǒng)中的運用方法。
關鍵詞:數(shù)據(jù)挖掘技術;圖書館;管理信息系統(tǒng)
目前,國內(nèi)圖書館基本都構建了管理信息系統(tǒng),但這些系統(tǒng)的功能性普遍比較淺薄,一般只能用于信息儲存、信息查找、信息展示等工作環(huán)節(jié),由此系統(tǒng)雖然有利于圖書館管理工作,實際效用水平卻相對薄弱。而針對這一現(xiàn)象,數(shù)據(jù)挖掘技術能夠彌補當前圖書館管理信息系統(tǒng)的短板,進一步簡化圖書館管理工作,還能對工作質(zhì)量做出更有力的保障,因此有必要對圖書館管理信息系統(tǒng)中數(shù)據(jù)挖掘技術的運用進行研究,此舉具有一定現(xiàn)實意義。
1 數(shù)據(jù)挖掘技術概念與管理作用
1.1技術概念
顧名思義,數(shù)據(jù)挖掘技術就是一種能夠不斷深入的挖掘大量數(shù)據(jù)的技術工具,該項技術在不斷發(fā)展中已經(jīng)趨向成熟,具有數(shù)據(jù)處理能力強、挖掘深度優(yōu)秀、性能全面等特點,因此可以投入實際應用。在基本作用上,該項技術面對種類繁多,且量級龐大的數(shù)據(jù),能夠在短時間內(nèi)提取所有數(shù)據(jù)的關鍵特征信息,這樣技術系統(tǒng)能對所有數(shù)據(jù)進行定義,隨后將任意數(shù)據(jù)進行組合,可得數(shù)據(jù)之間的關系,根據(jù)關系能對數(shù)據(jù)代表事項的發(fā)展趨勢進行判斷,而數(shù)據(jù)之間的關系是十分復雜的,屬于隱含信息,單純從數(shù)據(jù)表面上是無法看出的,這就是數(shù)據(jù)挖掘技術的挖掘作用體現(xiàn)。此外,人工自然也具備一定的數(shù)據(jù)挖掘能力,可以對數(shù)據(jù)關系進行分析,但人工必然存在能力上的限制,實際分析中如果數(shù)據(jù)量太大,首先無法保障分析效率,其次很有可能出現(xiàn)分析不全面、不準確等不良現(xiàn)象,因此有必要用數(shù)據(jù)挖掘技術來代替人工完成大量數(shù)據(jù)分析工作。
1.2管理作用
在圖書館管理工作基礎上,根據(jù)該項工作的當前要求,圖書館管理員除了要維系圖書館秩序以外,還要對圖書館用戶的各種需求來進行分析,而該項工作就比較困難,因為圖書館用戶的需求是不斷產(chǎn)生的,且種類繁多,還隨時會發(fā)生變化,同時很多用戶自己都不知道自己有什么需求,也不會主動向圖書館管理員提出,所以依靠管理員進行人工管理,只能做到維系圖書館秩序,難以分析用戶需求,這影響了現(xiàn)代圖書館的服務水平。但在數(shù)據(jù)挖掘技術上,首先該項技術會不斷搜集用戶在圖書館中的行為,并將這些行為以數(shù)據(jù)形式儲存,其次將對這些行為進行分析,通過分析可以從用戶綜合行為中得到用戶可能存在的需求,這樣就能提出準確的服務方向,有利于圖書館服務水平,另外技術的介入能在短時間內(nèi)完成工作,可以應對不斷產(chǎn)生、隨時變化的數(shù)據(jù),可見數(shù)據(jù)挖掘技術具有良好的管理作用,應用價值很高,值得推廣。
2 圖書館管理信息系統(tǒng)中數(shù)據(jù)挖掘技術的運用方法
圖書館管理信息系統(tǒng)是數(shù)據(jù)挖掘技術的運用基礎,但如何將該項技術融入系統(tǒng)中,并充分發(fā)揮技術作用就是一大難題,要解決難題就必須采用正確運用方法。為此,下文將提出技術在系統(tǒng)中的運用方法,以供參考。
2.1基本思路
數(shù)據(jù)挖掘技術在圖書館管理信息系統(tǒng)中運用的基本思路必須貼合管理需求,即現(xiàn)代圖書館管理工作希望了解用戶閱讀需求、購書需求、閱讀興趣、閱讀習慣等,以便于圖書館經(jīng)營與服務。因此技術運用方法必須滿足這些需求,做到這一點就說明技術運用方法有效。本文技術運用思路中技術運用方法大體可分為四個步驟,分別為挖掘工具選擇、數(shù)據(jù)采集與處理、數(shù)據(jù)挖掘、數(shù)據(jù)挖掘成果總結。
2.2運用方法
根據(jù)基本思路中技術運用方法的四個步驟,下文將展開相關分析。
(1)挖掘工具選擇
在數(shù)據(jù)挖掘技術的發(fā)展中出現(xiàn)了很多中挖掘工具,其中部分工具的性能、適用條件比較狹窄,不符合現(xiàn)代圖書館管理信息系統(tǒng)需求,因此必須慎重選擇數(shù)據(jù)挖掘工具,這樣才能對技術運用效果做出保障。根據(jù)普遍數(shù)據(jù)挖掘工具的優(yōu)劣、特點,本文主要選擇了SQL數(shù)據(jù)庫(SQL Server 2005)作為數(shù)據(jù)挖掘工具,該數(shù)據(jù)庫包含了大量數(shù)據(jù)挖掘方法,且相較于其他類似數(shù)據(jù)挖掘工具,SQL數(shù)據(jù)庫的優(yōu)勢非常明顯,具備獨特的數(shù)據(jù)處理方式,在運作中可以先保存海量數(shù)據(jù),同時提出關鍵詞來識別數(shù)據(jù),最后依靠挖掘邏輯來進行數(shù)據(jù)分析,這樣就能得到數(shù)據(jù)深層信息。可見SQL數(shù)據(jù)挖掘工具的應用不但簡便,還行之有效,建議在圖書館管理信息系統(tǒng)中推廣。
(2)數(shù)據(jù)采集與處理
SQL作為數(shù)據(jù)挖掘工具不可能憑空運作,因此必須在運作前需要進行數(shù)據(jù)采集與處理。具體方法可分為兩個步驟:①進入SQL服務器找到代表數(shù)據(jù)采集邏輯的表格,該表格在初始化階段包含的信息非常少,不滿足圖書館數(shù)據(jù)采集需求,因此必須進行完善,這里需要根據(jù)用戶閱讀需求、購書需求、閱讀興趣、閱讀習慣等相關數(shù)據(jù)特征來進行處理,由此得到完善的數(shù)據(jù)采集邏輯;②啟動SQL Server Management Shad io,這樣能根據(jù)系統(tǒng)提出對數(shù)據(jù)采集邏輯表格進行進一步處理,使表格更貼合管理工作流程。經(jīng)過以上兩個步驟,就可以通過圖書館管理信息系統(tǒng)來進行數(shù)據(jù)采集,采集所得數(shù)據(jù)會被全部導入SQL的數(shù)據(jù)儲存空間中接受挖掘分析。
(3)數(shù)據(jù)挖掘
要保障SQL能準確挖掘出管理員想要的信息,在挖掘之前應當先設定好挖掘邏輯。以用戶閱讀需求為例,管理員應當先在SQL內(nèi)設定數(shù)據(jù)分類項,即用戶閱讀需求為分類項總目,其下要根據(jù)用戶閱讀需求的特征進行細化分類,類如用戶翻閱記錄、用戶閱讀時長、用戶上次閱讀位置記錄等,這樣SQL就會根據(jù)分類項來進行數(shù)據(jù)挖掘,獲取相關信息后進行分析,這一步驟可以通過人工來完成,但如果條件允許,則建議引入智能邏輯來進行分析。此外,無論是人工分析還是技術分析,分析的基本流程是相同的,即根據(jù)相關分類項總目下細化分類的數(shù)據(jù)表現(xiàn),推測用戶當前可能存在什么需求,如在用于閱讀需求分類項總目下,通過用戶翻閱記錄可知用戶可能對哪些類型的圖書有興趣,這樣就可以向用戶推送相關類型的圖書,或者根據(jù)用戶閱讀時長,可知用戶最感興趣的是哪些類型的圖書,可集中推送。