濰坊科技學(xué)院 武珍珍
時(shí)代在發(fā)展、社會(huì)在進(jìn)步,如今科技已經(jīng)融入到了人們?nèi)粘Ia(chǎn)生活中的方方面面,圖書館已經(jīng)不再是高校學(xué)生們獲取知識(shí)的唯一途徑。由于傳統(tǒng)圖書館尋找圖書困難、麻煩、服務(wù)不到位的原因,現(xiàn)如今很多高校學(xué)生不再愿意到圖書館搜集信息,圖書館面臨著廢置的局面。只有對(duì)圖書館進(jìn)行改革,與時(shí)俱進(jìn),將現(xiàn)代的數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校圖書館中,才能更好地使高校圖書館真正服務(wù)于學(xué)生,而不是成為一座無用建筑。
現(xiàn)如今,高校仍然是各項(xiàng)學(xué)術(shù)、科技項(xiàng)目的主要研發(fā)地,高校圖書館對(duì)這些科技與學(xué)術(shù)的研發(fā)起到了關(guān)鍵性的支撐作用,因此,應(yīng)該大力提高高校圖書館的服務(wù)水平,使其更好的為研發(fā)工作服務(wù)。當(dāng)前圖書館的所提供的服務(wù)越來越傾向于需求導(dǎo)向的服務(wù),也就是說通過識(shí)別用戶的需求來進(jìn)行服務(wù),這種服務(wù)可以在很大程度上滿足不同客戶的需求。
然而要實(shí)現(xiàn)這一服務(wù)方式單靠學(xué)校的工作人員來說難度很大,這一難度主要體現(xiàn)在數(shù)據(jù)方面,龐大的數(shù)據(jù)整理與分析要求高校投入大量的工作人員來完成工作,而這顯然是不可能實(shí)現(xiàn),人力與物力成本十分巨大。想要精準(zhǔn)的滿足所有用戶的需求就必須對(duì)所用用戶的需求、喜好、特征進(jìn)行細(xì)致的分析,將所有用戶根據(jù)特征、喜好、需求進(jìn)行分類,然后根據(jù)需要提供不同類型的定制服務(wù),補(bǔ)充圖書館缺失的紙質(zhì)版以及電子版資料,并對(duì)服務(wù)滿意程度以及需求符合程度數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。這一過程中涉及到了大量的數(shù)據(jù),是傳統(tǒng)圖書館所不能進(jìn)行的,因此,數(shù)據(jù)挖掘技術(shù)是高校圖書館所亟待需求的一項(xiàng)技術(shù)。
數(shù)據(jù)挖掘技術(shù)根據(jù)其功能和特征又可以被叫做數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn),它主要通過將歸納、邏輯分析、神經(jīng)網(wǎng)絡(luò)與模式識(shí)別等多種技術(shù)進(jìn)行結(jié)合,在用戶的使用的過程中根據(jù)其特征,在海量的數(shù)據(jù)庫中為用戶尋找相關(guān)、有價(jià)值的知識(shí),為用戶提供定制性的服務(wù)。由此可見,數(shù)據(jù)挖掘技術(shù)符合當(dāng)代高校圖書館改革的需要,是推動(dòng)圖書館發(fā)展的必然之選。
根據(jù)以往經(jīng)驗(yàn)來說,數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校圖書館服務(wù)中已經(jīng)十分可行。一方面來說,數(shù)據(jù)挖掘技術(shù)本身已經(jīng)十分成熟,他已經(jīng)被廣泛的應(yīng)用于通信、金融等多個(gè)服務(wù)領(lǐng)域,并且還被許多知名公司企業(yè)所應(yīng)用,在實(shí)際的應(yīng)用過程中并沒有出現(xiàn)什么失誤,而且也獲得了各個(gè)領(lǐng)域與企業(yè)的一致好評(píng)。另一方面來說,由于科技的發(fā)展、社會(huì)的進(jìn)步、工作過程中數(shù)據(jù)量的加大,大數(shù)據(jù)技術(shù)越來越被人們熟知,網(wǎng)絡(luò)上已經(jīng)出現(xiàn)了很多數(shù)據(jù)挖掘方面的軟件,越來越多的企業(yè)開始提供數(shù)據(jù)挖掘方面的技術(shù),這為高校圖書館應(yīng)用數(shù)據(jù)挖掘技術(shù)提供了技術(shù)支撐。由此可見,數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校圖書館服務(wù)中不存在大的阻礙。
(1)數(shù)據(jù)挖掘在文獻(xiàn)推薦方面的應(yīng)用
這一方面的應(yīng)用主要是指通過對(duì)用戶歷史借書數(shù)據(jù)分析,將其所借閱過的圖書進(jìn)行分類,根據(jù)其中的關(guān)聯(lián)性和特征劃分為不同種類,然后研究這些不同類型圖書之間的關(guān)聯(lián),從而建立起關(guān)聯(lián)規(guī)則,并且引入到數(shù)據(jù)庫中。也就是說,用戶在借閱一類圖書時(shí)很有可能會(huì)借閱另一類圖書。例如,一位同學(xué)在同時(shí)借閱了計(jì)算機(jī)類型的書籍以及金融方面的書籍,這一數(shù)據(jù)就會(huì)被記入數(shù)據(jù)庫進(jìn)行分析,當(dāng)數(shù)據(jù)庫通過分析建立起關(guān)聯(lián)規(guī)則時(shí),其他用戶在借閱計(jì)算機(jī)類型書籍時(shí),系統(tǒng)會(huì)自動(dòng)為其推薦金融方面的書籍。這主要是通過研究這些關(guān)聯(lián)規(guī)則的內(nèi)在置信度以及支持度來實(shí)現(xiàn)的。
(2)數(shù)據(jù)挖掘技術(shù)在文獻(xiàn)檢索方面的運(yùn)用
在傳統(tǒng)的圖書館中,一般都配備有文獻(xiàn)檢索的機(jī)器,用戶可以在進(jìn)入圖書館時(shí)利用該機(jī)器獲得一些所要尋找圖書的信息,例如,簡介、藏書位置等等。用戶可以通過該功能有針對(duì)性的去尋找所需要的圖書,避免浪費(fèi)時(shí)間,然而傳統(tǒng)的檢索服務(wù)卻不能提供個(gè)性化服務(wù)和具體的書籍信息。要想提供個(gè)性化的檢索服務(wù)首先需要搜集大量的用戶借閱、續(xù)借等數(shù)據(jù);然后,對(duì)搜集的數(shù)據(jù)進(jìn)行篩選,篩選出其中的有效信息,可以采用消除噪聲數(shù)據(jù)等等;其次,將篩選出的有效信息進(jìn)行組合,建立起一個(gè)具有結(jié)構(gòu)性的數(shù)據(jù)庫;再次,對(duì)已經(jīng)建立完成的結(jié)構(gòu)性數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)和分類處理;最后,在用戶檢索所需圖書時(shí)將所處理好的數(shù)據(jù)進(jìn)行可視化處理,為用戶提供個(gè)性化的檢索服務(wù)。
(3)在圖書管理方面的應(yīng)用
如果不對(duì)圖書進(jìn)行科學(xué)合理的管理,就會(huì)經(jīng)常倒換書架,增加工作人員的工作量,因此,必須加強(qiáng)這一方面的管理。要達(dá)成這一目的就必須采用回歸與時(shí)序分析方法對(duì)該圖書館歷史借閱圖書記錄進(jìn)行歸納分析,然后通過所得數(shù)據(jù)研究所有圖書被借閱的次數(shù)、周期,從而得出高頻借閱圖書數(shù)據(jù),為經(jīng)常借閱的書留出更多的藏書位置。并且對(duì)不常借閱以及不借閱書籍進(jìn)行下架處理。
(4)在信息搜集方面的應(yīng)用
當(dāng)今互聯(lián)技術(shù)以及高科技發(fā)達(dá),互聯(lián)網(wǎng)可以將圖書館所不具備的很多的信息進(jìn)行搜集。然而,互聯(lián)網(wǎng)也具備很多的缺點(diǎn),它里面所具有的信息過多過雜,需要經(jīng)過處理才能對(duì)信息加以利用。高校圖書館可以根據(jù)學(xué)校正在進(jìn)行的科研活動(dòng)進(jìn)行互聯(lián)網(wǎng)連接,對(duì)互聯(lián)網(wǎng)的海量信息進(jìn)行分類以及關(guān)聯(lián)處理,是用戶在搜集信息時(shí)可以找到更多的有效信息。
數(shù)據(jù)挖掘技術(shù)是一項(xiàng)新興技術(shù),也是一項(xiàng)發(fā)展已經(jīng)十分完備的技術(shù),它已經(jīng)在許多領(lǐng)域被廣泛的應(yīng)用,高校圖書館目前正在面臨著改革,數(shù)據(jù)挖掘技術(shù)是其改革的一條重要途徑,高校圖書館可以加緊對(duì)這一技術(shù)的研究,使其更好的高校圖書館發(fā)展服務(wù)。
[1]劉顯顯.基于數(shù)據(jù)挖掘的高校圖書館個(gè)性化信息推薦方法研究[D].遼寧大學(xué),2013.
[2]袁媛.數(shù)據(jù)挖掘在高校圖書館個(gè)性化服務(wù)中的應(yīng)用研究[D].廣州大學(xué),2011.