汪濤
摘 要: 數(shù)據挖掘作為一種深層次的數(shù)據分析方法,此方法可以從大量數(shù)據中尋找出反應用戶特征的信息和規(guī)則,將中學圖書管理與數(shù)據挖掘相結合,尋找提取隱藏在大量的管理數(shù)據之中的有效數(shù)據,包括用戶數(shù)據的搜集、數(shù)據倉的建立,以及用戶特征的分析等主要內容。
關鍵詞:數(shù)據挖掘 中學 圖書管理系統(tǒng)
中圖分類號:TP315 文獻標識碼:A 文章編號:1003-9082(2016)12-0151-01
現(xiàn)今時代,隨著數(shù)據庫技術的成熟和數(shù)據引用的普及,人類積累的數(shù)據量正以指數(shù)級迅速增長。進入九十年代,隨著英特網的出現(xiàn)和高速發(fā)展,以及隨之到來的私有網以及內部網和外部網的產生運用,整個世界之間的距離被縮小,人們可以利用發(fā)達的網絡跨越時空的局限,在網絡上進行數(shù)據的交換。因此,曾經的局部數(shù)據庫不復存在,展現(xiàn)在人們面前的是龐大的的信息海洋,數(shù)據正如洪水一般向人們涌來。當數(shù)據量龐大到一定范圍時,如果沒有有效的方法,找尋提取有限數(shù)據的工作難度加大,人們面對著如海洋一般龐大的數(shù)據像大海撈針一樣徒勞無功。據有效估計,一個大型企業(yè)數(shù)據庫中只有約7.23%的數(shù)據得到應用。
隨著我國經濟的快速發(fā)展,在教育之中投入了更多的基礎建設資金,不少中學都擁有自己的圖書館,學生的學習方式更加多樣化,不僅僅是只用教科書,圖書館的建立擴大了學生的知識來源,大量的數(shù)據需要更加合適的管理才能將圖書館的功能發(fā)揮最大化。
數(shù)字圖書館概念的提出無疑是傳統(tǒng)圖書館管理的一次新進步、新改革,數(shù)字圖書館是在傳統(tǒng)圖書館的基礎上建立起來的,是現(xiàn)代圖書館進化階段的一大步。未來中學圖書館的發(fā)展重點將是在數(shù)字化管理信息的基礎上發(fā)展,穩(wěn)定高效的信息管理系統(tǒng)是圖書館發(fā)展的大前提大后方。
數(shù)據挖掘技術的應用將更好地幫助圖書館管理系統(tǒng)的運行。
一、數(shù)據挖掘的定義
數(shù)據挖掘是機器學習、人工智能以及數(shù)據庫三者有機結合所得的產物。21世紀是數(shù)字化的時代,信息大爆炸所帶來的科學數(shù)據的大量積累,因此數(shù)據庫被廣泛使用,人們在利用數(shù)據的過程中認識到海量的數(shù)據利用起來十分不方便、效率低下,并且從大量的數(shù)據之中找出有效數(shù)據的難度巨大。在這樣的困難的敦促之下,數(shù)據庫挖掘技術適時而生。
數(shù)據挖掘技術是從大量的、隨機的、有干擾的數(shù)據之中,尋找提取出隱藏在海量數(shù)據中對人們有用的或人們不自知但又存在潛在的利用價值的數(shù)據、知識、規(guī)則或者模型。數(shù)據挖掘是一門包含很多復雜知識的交叉學科,它不僅包括數(shù)理統(tǒng)計,模式識別、模糊數(shù)學這些有關數(shù)學的專業(yè)知識,還包括神經網絡、數(shù)據庫等相關的技術知識。
數(shù)據挖掘技術的內容主要有三個方面:數(shù)據、算法和技術以及建模能力。數(shù)據挖掘技術按照功能可分為兩大類:預測新模式以及描述性模式[1]。
數(shù)據挖掘的步驟內容龐大,簡單概括得到以下內容:
1.從海量的數(shù)據庫中獲得數(shù)據;
2.選擇適當?shù)奶卣鲗傩裕?/p>
3.挑選出合適的樣本策略;
4.排除數(shù)據中不正常的數(shù)據,同時補充不夠的部分;
5.用恰當?shù)慕稻S、變換的手段使數(shù)據挖掘的過程與數(shù)據模型相適配;
6.辨識出所得到的數(shù)據是否可視化或者是信息化;
這些步驟是從數(shù)據到知識的必經之路。每一步驟都可能是成功的關鍵或失敗的開始。在一般的定義中數(shù)據挖掘是知識獲取的一部分。
二、數(shù)據挖掘技術在圖書管理系統(tǒng)上的應用意義
關于數(shù)據挖掘技術在圖書管理系統(tǒng)上的應用,有以下幾個理論與方法: Kyle Banerjee 先生在1998年提出數(shù)據挖掘技術更適用于全文本動態(tài)變化的數(shù)據庫;Nicholson和Stanton在2002年的圖書館中數(shù)據挖掘的研究中提出了“書目挖掘(Bibliomining)”這一專業(yè)名詞,書目挖掘是指在圖書館的數(shù)據管理中,將數(shù)據挖掘、統(tǒng)計學原理、書目計量方式和報告工具這些技術有機的結合在一起,在行為信息與數(shù)據的基礎上獲取隱藏的模式。[2]
在中學的圖書館中大致有兩個方面的問題,第一,圖書館的管理中會有大量的不斷需要更新數(shù)據和之前需要保存的歷史數(shù)據,這些數(shù)據如何被高效的利用起來。另一個方面,許多中學為了一些關于圖書館的評測,只重視圖書館的藏書量,但忽略了這些圖書的分類結構與質量高低,這大大降低了圖書館數(shù)據的利用率,導致圖書館的藏書不能物盡其用,大量的書籍閑置。
因為以上所述的原因,筆者認為數(shù)據挖掘技術將能夠在中學圖書館管理系統(tǒng)之中有很大的研究價值及發(fā)展空間。
三、在中學圖書館管理系統(tǒng)中應用數(shù)據挖掘技術的重點
1.圖書館中大量的數(shù)據
大量的數(shù)據是數(shù)據挖掘技術的基礎,圖書館中的信息面對著不斷的更新,例如用戶的借還信息,圖書館每日人流量,借閱圖書名錄等,這些信息都可以作為數(shù)據挖掘的數(shù)據來源,每一日的新數(shù)據在第二天都將變成歷史數(shù)據,在不斷增加的歷史數(shù)據面前,傳統(tǒng)的數(shù)據庫只能起到數(shù)據管理的作用,而不能透過這些數(shù)據得到規(guī)律。
2.讀者的需求分析
一般的分析是以調查研究為基礎,但數(shù)據挖掘的分析與此不同,運用數(shù)據分析可以從海量的、不同類型的數(shù)據中挖掘出讀者身份,讀者閱讀習慣等具有特色的數(shù)據。
3.服務個性化
隨著各種書籍的種類、內容、出版社等日益增多,知識的載體也逐漸豐富,讀者的需求越來越難以把握,想要做到讀者滿意與資金的利用兩方平衡十分不易。應用數(shù)據挖掘技術可以更好地幫助這個問題的解決,利用大數(shù)據的挖掘分析出事物之間的聯(lián)系與規(guī)律,在大量的用戶數(shù)據中分析出他們讀書類型的傾向,以方便圖書館購書便利以及優(yōu)化圖書館藏書結構。用大數(shù)據挖掘實現(xiàn)個性化的服務。
四、在圖書館管理系統(tǒng)中應用數(shù)據挖掘技術還存在的問題
1.在大數(shù)據中數(shù)據挖掘的精度問題
在現(xiàn)今的數(shù)據挖掘中都是利用數(shù)據驅動來進行數(shù)據挖掘,這只能在數(shù)據內容上得出規(guī)律,這樣的數(shù)據準確性及精度遠遠不夠[3]。而且,數(shù)據挖掘并不是萬能的,它只是一個幫助更容易分析數(shù)據的一個工具,它能夠輔助圖書館工作人員更加深入的分析數(shù)據,但他不能辨識出數(shù)據的實際價值。
2.用戶的數(shù)據安全
現(xiàn)在是信息化的時代,個人的信息安全問題得到人們的重視。在構建數(shù)據庫、運用各種數(shù)據挖掘、分析工具的同時,要注意用戶隱私數(shù)據的處理。
3.數(shù)據挖掘技術與圖書館其他應用的融合問題
目前數(shù)據挖掘技術還不是十分完備,它正處于一個不斷發(fā)展的過程中,要是數(shù)據挖掘技術可以和更多的管理應用系統(tǒng)相融合,成為一種嵌入式技術,使各個技術都能發(fā)揮優(yōu)勢的一面,而不輕易出現(xiàn)互相沖突。
參考文獻
[1]周倩,《數(shù)據挖掘在圖書館用戶資源管理中的應用研究》[J],《圖書情報知識》2006(6)
[2]周倩,《構建圖書館現(xiàn)代化CRM系統(tǒng)》[J],《圖書情報工作》,2004(6)
[3]楊睿娜,《數(shù)據挖掘在高職院校圖書館管理中的應用》[J],《科技創(chuàng)新與應用》2012(3)