江波
摘?要:隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,信息數(shù)據(jù)的挖掘水平得到快速提高。為了提高數(shù)字圖書館電子資源推薦服務(wù)的水平,有效避免“數(shù)據(jù)孤島”,文章從基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)模型的構(gòu)建策略及構(gòu)建方案著手,分析了數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館電子資源推薦服務(wù)中的作用,為數(shù)字圖書館提高用戶的信息采用率提供了參考。
中圖分類號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2018)12-0059-03
關(guān)鍵詞:用戶行為;數(shù)據(jù)挖掘;數(shù)字圖書館;電子資源推薦服務(wù)
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,圖書信息資源的電子化進(jìn)程也得到快速推進(jìn),數(shù)字圖書館的電子資源推薦服務(wù)是信息資源電子化推進(jìn)過(guò)程中的一個(gè)重要環(huán)節(jié),應(yīng)該引起圖書館界的重視。為了滿足用戶的實(shí)際需求,數(shù)字圖書館在開展電子資源推薦服務(wù)前,應(yīng)了解用戶的個(gè)性化特征和使用習(xí)慣。從這個(gè)角度看,用戶行為特征的提取能力決定數(shù)字圖書館電子資源推薦服務(wù)的水平。隨著科技的發(fā)展,數(shù)據(jù)挖掘技術(shù)水平得到快速提高,在應(yīng)用領(lǐng)域也得到迅速推廣,數(shù)字圖書館采用數(shù)據(jù)挖掘技術(shù)對(duì)用戶的行為特征進(jìn)行提取,可避免“知識(shí)迷航”“信息過(guò)載”等情況的發(fā)生。
1?用戶行為的類型
互聯(lián)網(wǎng)技術(shù)的發(fā)展不僅給圖書館帶來(lái)了大量的信息資源,在很大程度上還拓寬了用戶獲取信息資源的渠道,改變了用戶獲取信息的習(xí)慣和方式。為了幫助人們從互聯(lián)網(wǎng)海量的信息資源中獲取他們所需的信息,數(shù)字圖書館在提高信息資源檢索能力的同時(shí),也應(yīng)不斷提高對(duì)用戶行為特征的挖掘能力。用戶行為指圖書館用戶為了解決自身在日常生產(chǎn)生活中遇到的問(wèn)題,或者為了達(dá)到某種目的,對(duì)一定時(shí)期的相關(guān)事件數(shù)據(jù)進(jìn)行查詢、檢索和信息加工等。圖書館只有掌握用戶的這些行為特征,才能整理和分析用戶的使用特點(diǎn)及信息需求,才能充分發(fā)揮自身優(yōu)勢(shì)為用戶提供更貼合實(shí)際的服務(wù)。常見的用戶行為主要有兩種:一是用戶在圖書館內(nèi)的直接使用行為,即用戶進(jìn)入圖書館,在不同區(qū)域進(jìn)行信息資源的查閱和咨詢行為。二是用戶通過(guò)圖書館網(wǎng)站進(jìn)行的檢索行為,即用戶帶著問(wèn)題在圖書館網(wǎng)站進(jìn)行檢索、瀏覽、交流互動(dòng)及下載資源信息等行為。
2?數(shù)字圖書館挖掘用戶行為數(shù)據(jù)的必要性
隨著圖書館數(shù)字化進(jìn)程的不斷推進(jìn),數(shù)字圖書館擁有的數(shù)據(jù)量呈幾何倍數(shù)增長(zhǎng),這些數(shù)據(jù)極大地豐富了館藏資源,給用戶的信息獲取帶來(lái)了便利。數(shù)字圖書館的數(shù)據(jù)資源主要包括館藏書刊資源信息、電子期刊資源信息、視頻音頻信息、用戶借閱信息,以及用戶的留言信息、分享信息和相關(guān)的硬件設(shè)備信息等,這些數(shù)據(jù)是數(shù)字圖書館正常運(yùn)轉(zhuǎn)的基礎(chǔ)。但是,受技術(shù)水平和經(jīng)費(fèi)的限制,部分?jǐn)?shù)字圖書館還不能很好地利用先進(jìn)技術(shù)對(duì)館藏?cái)?shù)據(jù)進(jìn)行合理優(yōu)化和融合。在這種情況下,大量數(shù)據(jù)不能進(jìn)行有效連接與貫通,不能得到有效利用,形成了“數(shù)據(jù)孤島”。然而,這些冗余、孤立存在的數(shù)據(jù)往往含有大量有價(jià)值的信息,如果這些信息不能被及時(shí)發(fā)現(xiàn)和有效利用,就會(huì)造成資源浪費(fèi),同時(shí)也削弱了數(shù)字圖書館的服務(wù)能力。
針對(duì)上述情況,數(shù)字圖書館應(yīng)重視館藏?cái)?shù)據(jù)的冗余問(wèn)題,尤其是用戶行為數(shù)據(jù)的冗余、孤立等問(wèn)題,并采取有效手段進(jìn)行解決。一方面,數(shù)字圖書館可以采取有效的管理手段,對(duì)館藏?cái)?shù)據(jù)進(jìn)行分類管理,避免出現(xiàn)疊加或盲區(qū)等現(xiàn)象,方便用戶快速獲取數(shù)據(jù);另一方面,數(shù)字圖書館可以采用先進(jìn)的技術(shù),如數(shù)據(jù)挖掘技術(shù),對(duì)館藏?cái)?shù)據(jù)進(jìn)行挖掘和整理。隨著數(shù)據(jù)挖掘技術(shù)的逐漸成熟,該技術(shù)的數(shù)據(jù)特征挖掘效果良好,可以幫助使用單位實(shí)現(xiàn)數(shù)據(jù)的有效利用。因此,數(shù)字圖書館應(yīng)引入數(shù)據(jù)挖掘技術(shù)對(duì)用戶行為數(shù)據(jù)進(jìn)行挖掘,及時(shí)分析用戶的行為特征,掌握用戶的使用習(xí)慣,為個(gè)性化推薦服務(wù)打下基礎(chǔ)。
3?基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)模型構(gòu)建
數(shù)字圖書館通過(guò)對(duì)用戶行為數(shù)據(jù)進(jìn)行挖掘的方式,掌握用戶的行為習(xí)慣和行為特征,提高服務(wù)水平。筆者結(jié)合數(shù)字圖書館的資源情況,構(gòu)建了基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)模型。
3.1?電子資源推薦服務(wù)模型的構(gòu)建策略
電子資源推薦服務(wù)在數(shù)字圖書館各種功能中占主要地位,它是數(shù)字圖書館與用戶聯(lián)系的中間紐帶,可以完整展現(xiàn)數(shù)字圖書館的服務(wù)能力和水平。電子資源推薦服務(wù)主要有交互性、人性化、即時(shí)性等特征。即時(shí)性和交互性特征的作用是通過(guò)大量數(shù)據(jù)即時(shí)鏈接、即時(shí)交互,解決用戶在海量數(shù)據(jù)包圍中可能出現(xiàn)的“知識(shí)信息迷航”問(wèn)題;個(gè)性化特征的作用是在用戶被動(dòng)接受無(wú)用數(shù)據(jù)時(shí),幫助用戶過(guò)濾掉主觀上不需要的信息,解決“知識(shí)信息過(guò)載”的問(wèn)題。具體的構(gòu)建策略如圖1所示。
3.1.1?利用關(guān)聯(lián)技術(shù)應(yīng)對(duì)“知識(shí)信息迷航”的問(wèn)題。關(guān)聯(lián)技術(shù)是一個(gè)統(tǒng)稱,包括本體、云平臺(tái)等,具有規(guī)范化、可共享等特點(diǎn)。在本體、云平臺(tái)的基礎(chǔ)上,關(guān)聯(lián)技術(shù)可以對(duì)多種類型的知識(shí)庫(kù)(包括異構(gòu)知識(shí)庫(kù))進(jìn)行有機(jī)連接,各類知識(shí)庫(kù)通過(guò)關(guān)聯(lián)技術(shù)進(jìn)行連接,最終形成龐大的數(shù)據(jù)集群庫(kù)。一方面,用戶可以通過(guò)數(shù)據(jù)集群庫(kù)對(duì)相關(guān)的信息資源進(jìn)行精確匹配查詢,提高檢索數(shù)據(jù)的準(zhǔn)確率和查全率;另一方面,各類信息數(shù)據(jù)管理平臺(tái)通過(guò)該數(shù)據(jù)集群庫(kù)縮小數(shù)據(jù)資源的檢索范圍,提高用戶檢索數(shù)據(jù)資源的效率,進(jìn)而解決“知識(shí)信息迷航”的問(wèn)題。
3.1.2?利用關(guān)聯(lián)技術(shù)應(yīng)對(duì)“知識(shí)信息過(guò)載”的問(wèn)題。數(shù)字圖書館在提供電子資源推薦服務(wù)的過(guò)程中,“知識(shí)信息過(guò)載”的問(wèn)題尤為凸顯。數(shù)字圖書館如果沒(méi)有掌握用戶的行為特征,就會(huì)向用戶推薦過(guò)多不需要的信息,給用戶帶來(lái)一定的困擾。數(shù)字圖書館通過(guò)關(guān)聯(lián)技術(shù),可以將用戶的行為數(shù)據(jù)進(jìn)行有機(jī)連接,挖掘用戶的行為特征,對(duì)用戶進(jìn)行有效推薦,提高用戶的滿意度。
3.2?電子資源推薦服務(wù)模型的構(gòu)建方案
基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)方案主要由用戶行為特征數(shù)據(jù)本體庫(kù)、用戶需求與喜好挖掘本體庫(kù)和館藏資源信息庫(kù)三部分構(gòu)成,具體的構(gòu)建方案如圖2所示。
3.2.1?用戶行為特征數(shù)據(jù)本體庫(kù)的構(gòu)建方案。數(shù)字圖書館可利用本體技術(shù),對(duì)獲取的用戶行為特征信息進(jìn)行再處理,提取與用戶行為特征數(shù)據(jù)庫(kù)相關(guān)的字段。同時(shí),數(shù)字圖書館也應(yīng)分析整理館藏資源信息庫(kù)的信息,提取與用戶行為特征相關(guān)聯(lián)的服務(wù)日志信息等內(nèi)容,進(jìn)而構(gòu)建用戶行為特征數(shù)據(jù)本體庫(kù)。該本體庫(kù)構(gòu)建的一個(gè)難點(diǎn)是用戶實(shí)際需求與館藏資源的匹配問(wèn)題,在整個(gè)本體庫(kù)構(gòu)建的過(guò)程中應(yīng)引起數(shù)字圖書館的重視。
3.2.2?用戶需求與喜好挖掘本體庫(kù)的構(gòu)建方案。數(shù)字圖書館積累了大量用戶需求及喜好的信息,如何利用這些信息提高電子資源推薦服務(wù)的效率是其亟須解決的問(wèn)題。在構(gòu)建用戶需求與喜好挖掘本體庫(kù)的過(guò)程中,數(shù)字圖書館要詳細(xì)統(tǒng)計(jì)和分析用戶的行為日志,對(duì)用戶的顯性需求和隱性需求進(jìn)行分類,用特定的本體術(shù)語(yǔ)進(jìn)行描述,方便相關(guān)功能模塊的調(diào)用。
3.2.3?電子資源推薦服務(wù)流程設(shè)計(jì)。當(dāng)用戶登錄數(shù)字圖書館后,系統(tǒng)會(huì)根據(jù)用戶的登錄信息,在用戶行為特征數(shù)據(jù)本體庫(kù)和用戶需求與喜好挖掘本體庫(kù)中進(jìn)行檢索,將用戶的需求與館藏資源進(jìn)行信息匹配,得出用戶可能需要的圖書、期刊、專利等方面的信息,并以小窗口的形式向用戶進(jìn)行推送。當(dāng)用戶在操作界面檢索需要的信息時(shí),系統(tǒng)會(huì)將用戶輸入的檢索信息與用戶的特征數(shù)據(jù)信息進(jìn)行融合,找出關(guān)聯(lián)信息,并在館藏資源信息庫(kù)中進(jìn)行檢索?;谟脩粜袨閿?shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)是一個(gè)實(shí)時(shí)的過(guò)程,主要通過(guò)系統(tǒng)后臺(tái)運(yùn)行,避免影響用戶的實(shí)際操作,同時(shí)又能向用戶推送符合其要求的信息。
4?基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)的優(yōu)勢(shì)分析
4.1?推薦服務(wù)更加精準(zhǔn)
基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館從用戶的實(shí)際需求出發(fā),對(duì)用戶行為特征進(jìn)行挖掘,并對(duì)獲取的用戶行為特征信息進(jìn)行詳細(xì)比對(duì)和關(guān)聯(lián)分析,找出其中的隱性信息,更好地掌握用戶的行為習(xí)慣、需求和喜好等內(nèi)容,進(jìn)而為用戶提供精準(zhǔn)的電子資源推薦服務(wù)。數(shù)字圖書館利用數(shù)據(jù)挖掘技術(shù)不僅提高了電子資源推薦服務(wù)的準(zhǔn)確性,還滿足了用戶的個(gè)性化信息需求,提高了用戶的信息采用率。
4.2?用戶使用更加便捷
基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)的操作系統(tǒng)是自動(dòng)運(yùn)行的,系統(tǒng)后臺(tái)能自動(dòng)根據(jù)用戶的登錄信息獲取用戶的行為特征信息,并與館藏資源數(shù)據(jù)庫(kù)中的資源進(jìn)行比對(duì),找出用戶可能需要的資源信息并進(jìn)行推薦。在推薦信息時(shí),數(shù)字圖書館通過(guò)小窗口顯示的方式,避免對(duì)用戶的操作界面產(chǎn)生影響,進(jìn)而提高用戶的檢索效率。因此,用戶在輸入檢索信息關(guān)鍵詞時(shí),可以快速瀏覽系統(tǒng)的推薦信息,如果推薦信息包括用戶需要查找的信息,用戶就不需要再重新查找。
4.3?數(shù)字圖書館管理更加高效
基于用戶行為數(shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)主要是通過(guò)運(yùn)行計(jì)算機(jī)程序?qū)崿F(xiàn)的,不需要專門人員負(fù)責(zé)實(shí)施。該推薦服務(wù)主要是通過(guò)增設(shè)系統(tǒng)模塊實(shí)現(xiàn)的,也就是說(shuō)在系統(tǒng)升級(jí)過(guò)程中數(shù)字圖書館只要將模塊融入管理系統(tǒng),就不需要再派專門人員負(fù)責(zé)分析用戶行為,從而降低了經(jīng)費(fèi)開支,提高了管理效率。
5?結(jié)語(yǔ)
隨著科技的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)已經(jīng)滲透到各行各業(yè),并在多個(gè)領(lǐng)域發(fā)揮著積極的作用?;谟脩粜袨閿?shù)據(jù)挖掘的數(shù)字圖書館電子資源推薦服務(wù)提高了用戶的信息采用率,為數(shù)字圖書館電子資源推薦服務(wù)智能化發(fā)展打下了堅(jiān)實(shí)的基礎(chǔ)。
參考文獻(xiàn):
[1] 張宏.我國(guó)高校圖書館大數(shù)據(jù)研究現(xiàn)狀分析[J].圖書館工作與研究,2016(7):46-50.
[2] 王捷.大數(shù)據(jù)時(shí)代下圖書館開展信息服務(wù)的對(duì)策[J].現(xiàn)代情報(bào),2013(3):81-83.
[3] 張衛(wèi)群.圖書館用戶信息行為研究綜述[J].圖書館學(xué)研究,2006(8):87-90.
[4] 朱立紅.高校圖書館的數(shù)據(jù)挖掘技術(shù)應(yīng)用與用戶研究[J].圖書館雜志,2008(6):39-42.
[5] 應(yīng)璇,孫濟(jì)慶.面向大數(shù)據(jù)的用戶檢索行為研究[J].情報(bào)雜志,2014(2):140-143.
(編校:孫新梅)