郭艾華++劉業(yè)亮
DOI:10.16661/j.cnki.1672-3791.2017.25.007
摘 要:本文將從數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應用的領域進行研究,從數(shù)據(jù)挖掘在國內(nèi)的數(shù)字圖書館、高校圖書館以及圖書館個性化服務等方面入手分析數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應用的現(xiàn)狀,總結其中存在的問題,并找出解決問題的方法,提高數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫的應用效率。
關鍵詞:數(shù)據(jù)挖掘 圖書館數(shù)據(jù)庫 應用研究
中圖分類號: G25.73 文獻標識碼:A 文章編號:1672-3791(2017)09(a)-0007-02
隨著數(shù)據(jù)挖掘?qū)W科的不斷發(fā)展,很多領域都引進了數(shù)據(jù)挖掘知識,解決人們對數(shù)據(jù)分析、處理、應用的難題。數(shù)據(jù)挖掘是一項綜合性很強的學科,不但涉及到了數(shù)據(jù)庫的技術,還有統(tǒng)計學、人工智能、檢索信息等領域,適用范圍十分廣泛,當今國內(nèi)的很多圖書館也關注到了數(shù)據(jù)挖掘,通過對數(shù)據(jù)挖掘在圖書館中的應用研究,提高數(shù)據(jù)挖掘應用效率。
1 數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應用研究存在的問題
1.1 理論研究不夠深入
雖然從20世紀90年代至今,都有國內(nèi)外的專家學者們對于圖書館數(shù)據(jù)挖掘相關理論的研究,但是這樣的研究還不夠深入和全面,沒有建立起系統(tǒng)的理論模型,這也是導致我國圖書館數(shù)據(jù)庫應用數(shù)據(jù)挖掘效率不高的原因之一。
1.2 圖書館數(shù)據(jù)庫應用研究不夠全面
數(shù)據(jù)挖掘是一門綜合性很強的學科,它集計算機、統(tǒng)計學、可視化以及人工智能等學科相關知識于一身,并且在很多領域包括金融、醫(yī)療、互聯(lián)網(wǎng)等都得到廣泛的應用。但是在國內(nèi)的圖書館中,由于對數(shù)據(jù)挖掘?qū)W科認識的不足,數(shù)據(jù)挖掘并不能充分地發(fā)揮其強大的作用,所以在圖書館數(shù)據(jù)庫應用數(shù)據(jù)挖掘過程中出現(xiàn)多種問題,如對圖書館數(shù)據(jù)挖掘應用研究不夠全面的問題。
1.3 研究項目和經(jīng)費支持少
數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應用研究存在的又一難題是對于數(shù)據(jù)挖掘在圖書館數(shù)據(jù)庫應用的研究項目和經(jīng)費支持少。國家對于研究項目的支持很少,從現(xiàn)有數(shù)據(jù)可以發(fā)現(xiàn)國家對于863計劃資助的研究項目只有1篇,這樣低的支持率造成了論文基金資助率低下的情況發(fā)生,僅僅只有3.47%的論文基金資助率,遠遠低于其他領域的資助水平。和其他研究領域相比,數(shù)據(jù)挖掘在圖書館數(shù)據(jù)庫應用的類型研究項目的支持經(jīng)費不高。但是圖書館的發(fā)展和管理的推進都需要大量的經(jīng)費作為后盾支持,特別是數(shù)據(jù)挖掘,此技術的研究和應用門檻高,研究人員需要有全面的知識,對計算機、統(tǒng)計學、數(shù)據(jù)庫等都精通,這樣的研究自然需要大筆的經(jīng)費支持。
1.4 研究成果與圖書館管理信息系統(tǒng)開發(fā)不緊密聯(lián)系
雖然目前我國的數(shù)字圖書館、高校圖書館以及公共圖書館個性化管理等都進行數(shù)據(jù)挖掘的相關研究,然而對于這些研究結果卻不能結合到具體的圖書館信息系統(tǒng)建設工作當中。世界上已經(jīng)開發(fā)出了具有數(shù)據(jù)挖掘功能的圖書館管理信息系統(tǒng),這些系統(tǒng)把數(shù)據(jù)挖掘的優(yōu)勢發(fā)揮出來,真正地應用到實際的圖書館發(fā)展中。但是相對于外國,我國的圖書館并不能研究開發(fā)出具有操作性強、易于實現(xiàn)并且能夠指導實際業(yè)務的成熟產(chǎn)品。造成這樣的情況發(fā)生很大一部分原因是研究成果與圖書館管理信息系統(tǒng)開發(fā)不緊密聯(lián)系,并且對于圖形圖像和用戶評論等非結構化的挖掘不夠深入。
2 加強圖書館數(shù)據(jù)挖掘應用的策略
通過加強圖書館數(shù)據(jù)挖掘應用,可以優(yōu)化圖書館的管理。圖書館數(shù)據(jù)挖掘的利用展現(xiàn)見圖1。
2.1 進行資源建設,館藏優(yōu)化
在圖書館信息資源的建設中,其文件的采訪是建設的關鍵,是否建設好文獻的采訪直接關系到文獻的資源共建、共享以及信息服務水準的提升。圖書館經(jīng)常是通過學科的需要及專業(yè)制定購買方案,同時還需要結合圖書館藏書學科專業(yè)分布情況和發(fā)展趨勢、現(xiàn)有的藏書量來制定購買計劃,但這樣的購買計劃并不能很好地進行優(yōu)化圖書館的藏書。所以最佳方法是通過數(shù)據(jù)挖掘的方法,客觀分析圖書館的現(xiàn)況,需求以及變化趨勢,再科學合理地進行資源建設,從而優(yōu)化館藏,根據(jù)圖書館數(shù)據(jù)挖掘的應用,有針對性地對藏書進行補充,不斷豐富館藏資源,優(yōu)化館藏的結構,進一步提高館藏的利用率。
2.2 利用數(shù)據(jù)挖掘提升服務質(zhì)量
圖書館可以利用數(shù)據(jù)挖掘來提升數(shù)據(jù)資源服務的質(zhì)量。通過信息服務的智能化,讓被動服務變成主動服務,改變傳統(tǒng)的服務方式,讓圖書館的服務質(zhì)量得到提升。通過OPAC的服務智能化,支持概念檢索、模糊檢索、聯(lián)想檢索等功能,利用數(shù)據(jù)挖掘中的文本挖掘技術讓檢索結果質(zhì)量提高。其次應用數(shù)據(jù)挖掘技術,在查詢咨詢中發(fā)揮優(yōu)勢,通過對網(wǎng)絡信息的挖掘以及網(wǎng)絡信息的序化、網(wǎng)絡信息的應用加強和優(yōu)化圖書館信息服務質(zhì)量。圖書館的服務質(zhì)量直接影響到了圖書館的運行效率,發(fā)展方向,所以要充分研究數(shù)據(jù)挖掘在圖書館中的應用,并發(fā)揮其優(yōu)勢,幫助圖書館優(yōu)化服務質(zhì)量,提高各方面的綜合能力。
2.3 挖掘?qū)W科動向,發(fā)現(xiàn)學科之間的隱性關聯(lián)
各個學科的動向直接影響到了圖書館的新書購買及藏書的相關工作,因此學科動向與學科隱性關聯(lián)是圖書館文獻使用規(guī)律挖掘的重要方面之一,利用數(shù)據(jù)挖掘中的文本聚類、文本分類以及關聯(lián)挖掘等功能強化圖書館的購買規(guī)劃,通過挖掘?qū)W科動向,發(fā)現(xiàn)學科之間的隱性關聯(lián),研究出在海量數(shù)據(jù)中存在的規(guī)則,而這些規(guī)則對于我們發(fā)現(xiàn)學科之間的隱性關聯(lián)很有幫助。有些學科之間的關聯(lián)并不容易發(fā)現(xiàn),需要通過內(nèi)在聯(lián)系、內(nèi)涵分析等才能發(fā)現(xiàn)其隱性關聯(lián)。挖掘出了學科之間的隱性關聯(lián),對于提高圖書館的藏書借閱和電子資源服務學科研究等工作的開展都有重大的意義。
3 數(shù)據(jù)挖掘研究熱點及趨勢
3.1 關聯(lián)挖掘
在以后的數(shù)據(jù)挖掘在國內(nèi)的圖書館數(shù)據(jù)庫應用領域研究中,其研究的熱點以及趨勢是學科之間的關聯(lián)挖掘。通過對讀者與書籍、書籍與書籍之間的隱性關聯(lián)的研究,可以為圖書館的藏書建設提供重要的指導意見。數(shù)據(jù)挖掘技術在圖書館中最常見的是館藏建設的優(yōu)化,館藏結構的優(yōu)化以及藏書布局等。通過關聯(lián)挖掘的研究,可以找出圖書館中的圖書與圖書之間的隱性聯(lián)系,或者讀者與文獻之間的聯(lián)系。比如讀者借閱了文獻A,一段時間后又借閱了文獻B,通過研究文獻A與文獻B之間的聯(lián)系,不斷優(yōu)化圖書館的藏書,使圖書館更好地服務于讀者。
3.2 讀者行為分析
圖書館中的讀者行為分析與挖掘?qū)τ趫D書館的發(fā)展有著重要的作用。通過讀者行為的分析,可以優(yōu)化館藏結構,提高讀者對圖書館的信息資源的利用率。比如圖書館挖掘在圖書館中的?;顒幼x者,對于讀者的身份和讀書習慣分析,對于文理科讀書群體的分析等,對這些讀者行為進行跟蹤與分析,通過分析和總結,發(fā)現(xiàn)圖書館存在的問題以及優(yōu)化館藏資源結構,并且尋找出相應的調(diào)整方案,從而優(yōu)化圖書管理和服務推送,讓更多的讀者喜歡圖書館,也讓圖書館的管理與發(fā)展更進一步。
3.3 個性化服務
每一個讀者的行為習慣都不同,閱讀的習慣也各不相同。如果圖書館能夠建立起個性化服務,并且對讀者對信息使用行為習慣的特定需求建立起完整的個性化服務體系,那么就能進一步提高圖書館的管理水平。而個性化服務也始終貫穿于數(shù)據(jù)挖掘在圖書館數(shù)據(jù)庫應用研究過程中。根據(jù)讀者的興趣、愛好、瀏覽模式等研究開發(fā)出適合不同讀者的個性化服務。比如閱讀推薦、個性化公告板、郵件訂閱等根據(jù)讀者的喜好推薦與之相符的書籍供讀者閱讀。
4 結語
當前數(shù)據(jù)挖掘技術在快速的發(fā)展當中,其在多個領域也得到廣泛的應用。數(shù)據(jù)挖掘技術為圖書館在海量信息資源中檢索有價值的信息從而為指導圖書館的工作提供了便利。優(yōu)化了圖書館的藏書結構,信息管理結構等,它是圖書館革新的重要手段。雖然目前國內(nèi)圖書館的數(shù)據(jù)挖掘應用還不夠完善,受到各種條件的制約,但是數(shù)據(jù)挖掘在圖書館中仍然有著廣闊的應用前景,有待我們進一步的挖掘和研究。
參考文獻
[1] 俞錦梅.數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應用領域研究綜述[J].圖書與情報,2015(2):137-141.
[2] 田瑞雪.國內(nèi)圖書館數(shù)據(jù)挖掘技術應用研究述評[J].科技信息,2014(1):167.
[3] 龐天丙.數(shù)據(jù)挖掘技術在圖書館系統(tǒng)中的研究現(xiàn)狀分析與研究[J].福建電腦,2012,28(2):72-74.endprint