趙志遠 孫劍華 汪方正
摘要:隨著計算機技術的不斷發(fā)展,當今社會已經(jīng)逐漸進入了大數(shù)據(jù)時代,在大數(shù)據(jù)時代中,數(shù)據(jù)挖掘技術也在各個領域使人們的生活更加方便。數(shù)據(jù)挖掘技術是基于大數(shù)據(jù)時代下的一種新型數(shù)據(jù)分析類技術,該技術可以針對不同的用戶提供數(shù)據(jù)分析得出的個性化服務,目前這項技術已經(jīng)被應用在了許多領域,文章分析了其在網(wǎng)購領域以及許多對用戶需求有要求的軟件之中得到的應用。
關鍵詞:數(shù)字圖書館;數(shù)據(jù)挖掘技術;大數(shù)據(jù);個性化服務
1 數(shù)據(jù)挖掘技術概念簡述
數(shù)據(jù)挖掘技術是大數(shù)據(jù)時代下的重要數(shù)據(jù)分析技術之一,又稱為數(shù)據(jù)處理技術,數(shù)據(jù)挖掘技術是從數(shù)據(jù)本身來考慮,通常數(shù)據(jù)挖掘需要有數(shù)據(jù)清理、數(shù)據(jù)變換、數(shù)據(jù)挖掘實施過程、模式評估和知識表示等8個步驟。數(shù)據(jù)挖掘的具體操作方法有8種,分別為:神經(jīng)網(wǎng)絡、遺傳算法、決策樹算法、粗集算法、覆蓋正例排斥反例方法、統(tǒng)計分析法、模糊集方法以及挖掘對象。一般數(shù)據(jù)挖掘技術在應用過程中的挖掘對象都是根據(jù)信息存儲格式,用于挖掘的對象有關系數(shù)據(jù)庫、面向對象數(shù)據(jù)庫、數(shù)據(jù)倉庫、文本數(shù)據(jù)源、多媒體數(shù)據(jù)庫、空間數(shù)據(jù)庫、時態(tài)數(shù)據(jù)庫、異質數(shù)據(jù)庫以及互聯(lián)網(wǎng)等。
數(shù)據(jù)挖掘技術簡單來講就是在數(shù)據(jù)庫中發(fā)現(xiàn)線索或者知識、進而對這些線索知識進行分析。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計算機科學有關,并通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)(依靠過去的經(jīng)驗法則)和模式識別等諸多方法來實現(xiàn)上述目標,而數(shù)據(jù)挖掘技術的研究目的就是出于人們的簡單需求,通過用戶使用各種軟件的需求量以及定向性來進行數(shù)據(jù)處理以及數(shù)據(jù)挖掘工作,進而更加方便的挖掘用戶的心理及用戶的需求信息,以便于進一步為用戶提供定向性個性化的服務[1]。目前,數(shù)據(jù)挖掘技術已經(jīng)被廣泛地應用到人們的生活之中,在零售業(yè)以及網(wǎng)購平臺中的有效應用也是數(shù)據(jù)挖掘技術的一個成功案例,因此,在研究數(shù)據(jù)挖掘技術在高校數(shù)字圖書館中的應用時,也可以對該技術的某些其他領域成功案例進行借鑒分析,進一步提高數(shù)據(jù)挖掘技術在數(shù)字圖書館技術中的有效應用。
2 數(shù)字圖書館以及其個性化服務中的大數(shù)據(jù)技術概況
數(shù)字圖書館是在新時期計算機技術的硬性下誕生的一種數(shù)字處理的網(wǎng)上圖書館。這種圖書館的形式與傳統(tǒng)的實體圖書館形式不同,可以更方便的使讀者得到想找的信息,也就是說是一種沒有圍墻的圖書館。這種虛擬的、數(shù)據(jù)的圖書館形式在目前的許多高校中得到了廣泛的應用。
2.1 數(shù)字圖書館
數(shù)字圖書館是一門全新的科學技術,也是一項全新的社會事業(yè)。簡而言之,數(shù)字圖書館是一種擁有多種媒體內(nèi)容的數(shù)字化信息資源,能夠為用戶提供方便、快捷、高水平的信息化服務機制[2]。
數(shù)字圖書館不是圖書館實體:它對應于各種公共信息管理與傳播的現(xiàn)實社會活動,表現(xiàn)為種種新型信息資源組織和信息傳播服務。它借鑒圖書館的資源組織模式、借助計算機網(wǎng)絡通信等高新技術,以普遍存取人類知識為目標,創(chuàng)造性地運用知識分類和精準檢索手段,有效地進行信息整序,使人們獲取信息消費不受空間限制,很大程度上也不受時間限制。另外,在高校數(shù)字圖書館之中也加入了許多個性化服務,這些個性化服務本身就利用了數(shù)據(jù)挖掘技術以及大數(shù)據(jù)技術的理念,這些理念的加入也使得數(shù)字圖書館的便利程度加大,在很大程度上解決了學生的讀書、找書等問題。
2.2 個性化推薦服務
在一個高校之中,圖書館是重要的學校建筑物之一,因為許多學生為了學習、復習或者提高個人修養(yǎng)都要去圖書館進行讀書或查找資料。然而數(shù)字圖書館的形式在豐富了學生的讀書范圍同時,也方便了學生查找文獻。在數(shù)字圖書館中有一項個性化服務為個性化推薦,個性化推薦的主要目的是為學生提供精準的書目推薦,這也是大數(shù)據(jù)技術中的重要項目之一。
許多學生在進行學習研究時通常需要找尋特定的文獻或者書籍,但在圖書館當中,書籍之多、文獻之廣常常使學生捉襟見肘。數(shù)字圖書館中的個性化推薦就解決了學生的這一問題。數(shù)字圖書館在對學生進行推薦書目時,數(shù)據(jù)挖掘技術就會對學生的圖書搜索方向以及圖書瀏覽方向進行專業(yè)的測算分析,進而為學生推薦出符合學生需求的書籍名目,以便于學生參考,這種技術就類似于對學生需求書目的預測,其技術核心是對學生的檢索以及學生過去使用數(shù)字圖書館的瀏覽記錄以及需求方向進行的測算[3]。
2.3 個性化推送
個性化推送也是數(shù)字圖書館中的一項個性化服務內(nèi)容,其含義是通過大數(shù)據(jù)技術手段向學生推送他們所需求或者所喜愛的內(nèi)容,進而對學生的需求方向進行分析推送。個性化推送服務有助于學生在進行研究時查找類似文獻時使用,由于學生在進行研究或者論文寫作時經(jīng)常出現(xiàn)不知道該查找那些具體文獻的情況,因此,在使用數(shù)字圖書館時,圖書館會為學生提供個性化推送,進而提高了學生查找文獻的效率,還可能為學生帶來許多意外的收獲,在一定程度上擴大了學生的閱讀范圍,給學生提供了方便,在一定程度上減少了查找書籍的時間。
2.4 個性化檢索服務
個性化檢索服務是數(shù)字圖書館中的重要個性化服務之一,其主要內(nèi)容有兩方面,一是精準檢索,二是模糊檢索。個性化檢索與傳統(tǒng)的圖書檢索功能不一樣,在傳統(tǒng)的檢索功能中,學生進行圖書檢索只會搜索出題目名稱完全一樣或者近乎一樣的文獻,而在數(shù)字圖書館的個性化檢索中,學生搜索一本書籍的名稱可能會出現(xiàn)許多內(nèi)容相似但名稱不相似的書籍[4]。
3 數(shù)據(jù)挖掘技術在高校數(shù)字圖書館個性化服務中的應用方向
在大數(shù)據(jù)時代下,數(shù)字圖書館要進行更為深入的發(fā)展,數(shù)據(jù)挖掘技術要想在數(shù)字圖書館的個性化服務中得到更為有效的應用,就要明確新時期的應用方向。本文從個性化推薦以及個性化檢索和推送3個方面具體地對高校數(shù)字圖書館個性化服務的應用方向進行了分析。
3.1 數(shù)據(jù)挖掘技術在個性化推薦中的應用
數(shù)據(jù)挖掘技術的主要應用方向就是在個性化推薦服務之中,數(shù)據(jù)挖掘技術可應用在個性化推薦之中可以使學生更好的得到所推薦的書目,在大數(shù)據(jù)的環(huán)境下,數(shù)字圖書館的研發(fā)人員可以通過數(shù)據(jù)挖掘技術中的具體算法進行更為深入的研究與發(fā)掘,進而提高個性化推薦的精準度,使數(shù)據(jù)挖掘技術更有效地應用在數(shù)字圖書館個性化服務之中。
3.1.1 文獻關聯(lián)算法的應用
在具體的數(shù)據(jù)挖掘算法應用過程中,研發(fā)者可以參考數(shù)據(jù)挖掘技術在網(wǎng)絡零售行業(yè)內(nèi)的成功案例,通過對學生搜索或者使用的文獻之間的關聯(lián)性進行其文獻關聯(lián)算法的應用,并結合學生在最近階段的瀏覽歷史以及查閱的文獻內(nèi)容類別進行文獻關聯(lián),進而提高個性化推薦的精準度[5]。
3.1.2 用戶評分分析算法的應用
一般每個學生在查閱文獻或者尋找書籍時,其大體尋找的文獻書籍相似度較高。在進行推薦時對學生進行更為精準的優(yōu)化推薦,就需要在這些相似文獻中進行用戶評分分析測算,即通過學生對相似文獻的打分情況以及閱讀時間進行測算分析,進而為學生提供同類別文獻內(nèi)的最優(yōu)選項。
3.1.3 自動過濾算法的應用
在個性化推薦服務中,不僅需要通過測算進行文獻書籍的推薦,而且還需要通過過濾算法進行文獻的過濾工作,通過對學生的需求測算,從學生的歷史瀏覽以及用戶評分等方面為學生過濾掉其不喜歡的內(nèi)容,這樣可以提高學生的文獻查找精度,并且為學生帶來更好的文獻查詢體驗?,F(xiàn)階段,數(shù)據(jù)挖掘技術的過濾算法有3種,協(xié)同過濾推薦、基于物品的協(xié)同過濾推薦、基于模型的協(xié)同過濾推薦。
3.1.4 混合推薦算法的應用
最后,數(shù)據(jù)挖掘技術在個性化服務中還有一個研究方向就是混合推薦算法的應用?;旌贤扑]算法是數(shù)據(jù)挖掘技術中推薦技術內(nèi)的多種推薦結果合并的算法,這種算法的優(yōu)點在于可以為學生提供一個全方位的推薦書目,避免了學生出現(xiàn)對文獻需求過度的現(xiàn)象。
3.2 數(shù)據(jù)挖掘在個性化檢索和推送中的應用
數(shù)據(jù)挖掘技術在個性化檢索、推送中的應用深度明顯要低于在個性化推薦中的應用。在具體的個性化推送以及檢索中的應用可以在其檢索引擎中進行應用,通過對檢索引擎內(nèi)的各種鏈接數(shù)據(jù)以及用戶搜索關鍵字詞的分析測算進行檢索優(yōu)化[6]。在推送中可以借鑒個性化推薦中的測算方法進行推送,進而提高推送質量,過濾掉質量較差的推送內(nèi)容,避免出現(xiàn)推送內(nèi)容單一的情況。
4 結語
在當今社會的高速發(fā)展過程中,大數(shù)據(jù)時代已經(jīng)來臨,數(shù)據(jù)挖掘技術也得到了更為深入廣泛的應用,本文從多方面對數(shù)據(jù)挖掘技術在數(shù)字圖書館個性化服務中的應用,進行了簡要的分析和討論,數(shù)據(jù)挖掘技術的深入應用及優(yōu)化有利于高校師生對數(shù)字圖書館的滿意程度,進而提高高校師生的文獻查找體驗。因此,數(shù)據(jù)挖掘技術在高校數(shù)字圖書館個性化服務中的應用優(yōu)化不僅有利于大數(shù)據(jù)技術的優(yōu)化,更有利于我國高校教育事業(yè)的發(fā)展。
[參考文獻]
[1]郅秀麗.基于信息素質教育視閾下的民族地區(qū)高校圖書館個性化服務提升策略——以寧夏大學圖書館為例[J].圖書館理論與實踐,2015(12):78-81.
[2]葉春蕾,馮路,冷伏海.數(shù)字圖書館個性化服務中用戶弱信息需求模型研究[J].圖書情報工作,2012(15):25-30.
[3]何勝,熊太純,周冰,等.高校圖書館大數(shù)據(jù)服務現(xiàn)實困境與應用模式分析[J].圖書情報工作,2015(22):50-55.
[4]李艷,呂鵬,李瓏.基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書館個性化服務研究[J].圖書情報知識,2016(2):60-68.
[5]柳益君,何勝,熊太純,等.大數(shù)據(jù)挖掘視角下的圖書館智慧服務——模型、技術和服務[J].現(xiàn)代情報,2017(11):81-86.
[6]莊經(jīng)緯.基于社會網(wǎng)絡分析方法和數(shù)據(jù)挖掘方法的網(wǎng)絡論壇定量分析[D].重慶:重慶大學,2010.