楊睿
【摘要】本文介紹了數(shù)字化圖書(shū)館個(gè)性服務(wù)的概念、特點(diǎn)及主要模式,分析了數(shù)字化圖書(shū)館實(shí)現(xiàn)個(gè)性化服務(wù)的技術(shù)路徑,闡述了實(shí)現(xiàn)數(shù)字化圖書(shū)館個(gè)性服務(wù)的關(guān)鍵技術(shù)。
【關(guān)鍵詞】數(shù)字圖書(shū)館;個(gè)性化服務(wù);關(guān)鍵技術(shù)
一、數(shù)字圖書(shū)館個(gè)性化服務(wù)及其系統(tǒng)概述
服務(wù)的宗旨是滿足用戶的需要,用戶的需要是多樣性的,有顯性的,有隱性的,有共性的,有個(gè)性的,個(gè)性化的服務(wù)就是以用戶的需求為中心,面對(duì)需求不同的用戶提供不同的服務(wù),除了要為用戶提供共性的規(guī)范化服務(wù)外還要為有特殊需求的用戶提供個(gè)性化的服務(wù),力求站在用戶的角度思考問(wèn)題,在用戶提出自己的訴求之前,為用戶提供符合用戶興趣和行為習(xí)慣的服務(wù),使用戶真正成為服務(wù)的主人。
對(duì)于數(shù)字圖書(shū)館來(lái)說(shuō)個(gè)性化服務(wù)是指充分利用現(xiàn)代網(wǎng)絡(luò)技術(shù)對(duì)用戶以往的信息檢索和信息查詢方式認(rèn)真研究的基礎(chǔ)上,為用戶提供個(gè)性化的信息咨詢、信息檢索等綜合性信息服務(wù)機(jī)制,從而實(shí)現(xiàn)對(duì)用戶的主動(dòng)的信息服務(wù)。數(shù)字圖書(shū)館的個(gè)性化服務(wù)包含以下幾點(diǎn):1、服務(wù)的靈活性,指針對(duì)興趣愛(ài)好不同、專業(yè)不同的用戶,提供靈活而有針對(duì)性的服務(wù);2、服務(wù)的特殊性,指針對(duì)用戶的興趣愛(ài)好提供特殊的服務(wù);3、服務(wù)的多樣性,為用戶提供更多的選擇,以讓用戶可以挑選適合于自己的服務(wù)項(xiàng)目,數(shù)字圖書(shū)館應(yīng)把用戶需要在用戶提出之前為他想到并準(zhǔn)備好。
二、數(shù)字圖書(shū)館實(shí)現(xiàn)個(gè)性化服務(wù)的技術(shù)路徑
數(shù)字圖書(shū)館個(gè)性化的實(shí)現(xiàn)首先需要了解用戶的興趣及需要,這樣才能有針對(duì)性的為用戶服務(wù);其次將了解到的信息以合適的方式推薦給用戶,再次綜合考慮系統(tǒng)的體系結(jié)構(gòu),有效的組織資源。圖書(shū)館個(gè)性化服務(wù)的技術(shù)路徑可由以下幾方面著手:
1、數(shù)字圖書(shū)館用戶描述文件
身處大數(shù)據(jù)時(shí)代,面對(duì)客戶需求的日益多樣性,數(shù)字圖書(shū)館要以龐大的數(shù)據(jù)為支持,為每一個(gè)用戶建立一個(gè)用戶描述文件,不同的學(xué)者基于不同的研究視角對(duì)用戶描述性文件進(jìn)行了多角度、多層次的研究,由于研究角度的不同,對(duì)描述性文件的概念和內(nèi)涵有著不同的表達(dá),目前學(xué)術(shù)界尚無(wú)一個(gè)統(tǒng)一的標(biāo)準(zhǔn),如W3C通過(guò)是否含有PICS和APPLE1.0來(lái)作為是否符合用戶描述文件的標(biāo)準(zhǔn),PICS是Plugin Inventory and Control System的縮寫(xiě),中文翻譯為插件庫(kù)存和控制系統(tǒng),該系統(tǒng)最初的應(yīng)用是父母和教師為了控制學(xué)生的瀏覽能力而提供的過(guò)濾規(guī)則定義語(yǔ)言,而APPLE1.0是指用戶感興趣的過(guò)濾規(guī)則,如果系統(tǒng)中同時(shí)含有PICS和APPLE1.0,則可判定該系統(tǒng)能夠執(zhí)行用戶描述。當(dāng)用戶第一次使用數(shù)字圖書(shū)館個(gè)性哈服務(wù)系統(tǒng)的時(shí)候,大部分的用戶會(huì)愿意向Web站點(diǎn)提供個(gè)人的信息,只有少部分用戶具有很強(qiáng)的保密意識(shí),不愿意向Web站點(diǎn)透露個(gè)人信息,對(duì)于顯性的用戶,系統(tǒng)要求用戶注冊(cè)基本信息及感興趣的內(nèi)容,為用戶建立檔案,收集個(gè)人定制的信息并對(duì)用戶的行為記錄進(jìn)行分析,以了解用戶的喜好,對(duì)于不愿意透露基本信息的用戶,系統(tǒng)會(huì)根據(jù)用戶的瀏覽記錄來(lái)分析用戶的需要,從而尋找用戶的興趣點(diǎn),這樣可以根據(jù)用戶的喜好為用戶提供定制的資源列表。提供用戶收錄和選取的各種數(shù)字資源的訪問(wèn)入口;系統(tǒng)定期檢測(cè)這些鏈接資源,保證這些鏈接的有效性,以供讀者存儲(chǔ)個(gè)人檢索到的數(shù)據(jù),保存檢索歷史和檢索結(jié)果等。
2、數(shù)字圖書(shū)館資源描述文件
應(yīng)用領(lǐng)域不同個(gè)性化服務(wù)系統(tǒng)所處理的資源是不同的,目前,數(shù)字圖書(shū)館個(gè)性化服務(wù)系統(tǒng)所處理的資源都屬于文本范疇,向用戶發(fā)布的系統(tǒng)通知,幫助讀者及時(shí)掌握相關(guān)信息,協(xié)助發(fā)布庫(kù)的更新等信息。讀者的個(gè)人網(wǎng)頁(yè)上發(fā)布通知;讀者的個(gè)人需求能通過(guò)給出的渠道通知給系統(tǒng),用戶根據(jù)自己的研究興趣通過(guò)向特定用戶或用戶群體推送用戶所關(guān)注的專題資源,滿足讀者除了在線資源查詢閱覽以外,還希望系統(tǒng)能夠根據(jù)讀者自身的要求對(duì)目標(biāo)信息進(jìn)行監(jiān)測(cè),生成專題資源的需求。資源描述文件一般有兩種分類方法,一種是基于內(nèi)容的方法,一種是基于分類的方法,基于內(nèi)容的資源描述文件最常見(jiàn)的使用方法是加權(quán)關(guān)鍵詞矢量,這種方法彌補(bǔ)了基于關(guān)鍵詞檢索的局限性,檢索的內(nèi)容更加的廣泛,能夠以最少的詞搜索出信息量最多的內(nèi)容,基于方法的資源描述文件事先將資源的類別進(jìn)行分類,這樣用戶檢索時(shí)可以獲取同類的資源信息。
3、數(shù)字圖書(shū)館個(gè)性化推薦
隨著經(jīng)濟(jì)的發(fā)展、社會(huì)的進(jìn)步、社會(huì)總體文化水平的提高,人們的信息需求不斷擴(kuò)展提高,個(gè)性化需求陡增,而伴隨信息的暴增,傳統(tǒng)的大眾化服務(wù)模式已經(jīng)不再適應(yīng)這種個(gè)性化需求,人們往往就被淹沒(méi)在信息的汪洋中,無(wú)法得到一對(duì)一有效的信息服務(wù)。為此要根據(jù)圖書(shū)館現(xiàn)有的數(shù)字資源狀況,提供更方便快捷的資源統(tǒng)一檢索平臺(tái),實(shí)現(xiàn)各種數(shù)字資源的整合和統(tǒng)一跨庫(kù)搜索,并能夠?qū)?shù)字資源進(jìn)行深層次整合,從而全方位提升圖書(shū)館平臺(tái)系統(tǒng)的信息檢索及信息服務(wù)能力。
4、數(shù)字圖書(shū)館個(gè)性化服務(wù)體系結(jié)構(gòu)
數(shù)字圖書(shū)館個(gè)性化服務(wù)體系結(jié)構(gòu)一般采用的是B∕S體系結(jié)構(gòu),整個(gè)系統(tǒng)分為個(gè)性化資源推薦、統(tǒng)一資源檢索和實(shí)時(shí)資源系統(tǒng)模塊,其中個(gè)性資源推薦模塊又分為用戶興趣建模和個(gè)性化推薦兩部分,統(tǒng)一資源檢索模塊包括資源整合與統(tǒng)一檢索兩個(gè)處理模塊,傳統(tǒng)的參考咨詢服務(wù)只具有文獻(xiàn)檢索和解答用戶疑難的功能,隨著數(shù)字化信息的發(fā)展,這種簡(jiǎn)單的咨詢服務(wù)已然無(wú)法滿足用戶的需要,個(gè)性化系統(tǒng)中的參考咨詢服務(wù)除了上述的功能外,又增加了文獻(xiàn)傳遞與館際互借、知識(shí)講座和定題服務(wù)的功能,構(gòu)建了圖書(shū)館與讀者間的橋梁,實(shí)現(xiàn)了零距離溝通過(guò)。數(shù)字圖書(shū)館建設(shè)包括資源建設(shè)、資源整合、信息服務(wù)三大內(nèi)容,其建設(shè)的中心任務(wù)是如何又快又準(zhǔn)地向用戶提供所需要的信息,實(shí)現(xiàn)信息集成的方法是多種多樣的,由于系統(tǒng)建設(shè)是要圍繞如何方便用戶展開(kāi),以描述數(shù)字資源的元數(shù)據(jù)為管理對(duì)象,因此采取元數(shù)據(jù)的集成方式,即根據(jù)資源元數(shù)據(jù)標(biāo)準(zhǔn)建立統(tǒng)一的數(shù)據(jù)倉(cāng)庫(kù),以信息服務(wù)為中心,建立豐富的用戶興趣模型,根據(jù)這個(gè)模型進(jìn)行具體資源的推薦。采用建立本地?cái)?shù)據(jù)(倉(cāng))庫(kù)的方法進(jìn)行整合,改善系統(tǒng)服務(wù),使用戶能夠在最大時(shí)間內(nèi)得到所需的信息。實(shí)現(xiàn)個(gè)性化推薦和統(tǒng)一信息檢索無(wú)縫的結(jié)合,統(tǒng)一檢索是為了克服多信息源的問(wèn)題而提出來(lái)的,為用戶提供統(tǒng)一的檢索界面,主要解決用戶的易用性問(wèn)題。因此,它對(duì)資源的利用是被動(dòng)的。而個(gè)性化信息推薦是主動(dòng)的行為,需要對(duì)資源元數(shù)據(jù)的把握。這是兩種矛盾的要求,在同一個(gè)系統(tǒng)中同時(shí)融合這兩種功能有很大的困難,可通過(guò)劃分用戶興趣空間,并以該空間中的最小單元作為信息檢索的最基本單位,實(shí)現(xiàn)了二種功能的融合。
三、數(shù)字圖書(shū)館個(gè)性化服務(wù)關(guān)鍵技術(shù)分析
1、推送技術(shù)
服務(wù)器推送技術(shù)英文為ServerPushing,是隨著Ajax的興起而發(fā)展起來(lái)的新技術(shù),要服務(wù)器能實(shí)時(shí)地將更新的信息傳送到客戶端,而無(wú)須客戶端發(fā)出請(qǐng)求。網(wǎng)上信息的推送主要通過(guò)四種方式來(lái)完成:頻道式推送、郵件式推送、網(wǎng)頁(yè)式推送以及專用式推送。推送技術(shù)具有有及時(shí)性,應(yīng)用面廣,對(duì)用戶沒(méi)有技術(shù)上的要求的優(yōu)點(diǎn),該技術(shù)減少了用戶網(wǎng)上搜索的盲目性,允許服務(wù)器通知移動(dòng)應(yīng)用程序直接與服務(wù)器進(jìn)行通信,其工作流程為:首先是建立用戶需求管理數(shù)據(jù)庫(kù),其次是建立信息庫(kù),將Web上搜集到的信息進(jìn)行分析和整理,最后是信息推送,以個(gè)性化的信息在適當(dāng)?shù)臅r(shí)機(jī)以適當(dāng)?shù)姆绞酵扑统鋈ァ?/p>
2、智能代理技術(shù)
智能代理的英文為Neugent,是Neural(智能)和Agent(代理)兩個(gè)單詞拼合而成,它是人工智能研究的產(chǎn)物,使計(jì)算機(jī)應(yīng)用趨向人性化、個(gè)性化,由體系結(jié)構(gòu)和程序兩部分構(gòu)成,程序是智能代理技術(shù)的核心部分,一般由用戶界面模塊、學(xué)習(xí)模塊、任務(wù)技術(shù)模塊以及中央控制模塊組成,通過(guò)接受全局狀態(tài)、任務(wù)和時(shí)序等信息,指揮相應(yīng)的模塊工作,最早應(yīng)用于商業(yè)領(lǐng)域。智能代理根據(jù)人類思維的不同層次可分為反應(yīng)式智能代理、慎思式智能代理、跟蹤式智能代理及復(fù)合式智能代理。數(shù)字圖書(shū)館中應(yīng)用智能代理技術(shù)可以實(shí)現(xiàn)以下方面的功能:第一,信息導(dǎo)航,用戶上網(wǎng)查找信息時(shí),智能代理技術(shù)將及時(shí)記錄用戶查找的信息,并根據(jù)這些信息,分析用戶當(dāng)前感興趣的事情,同時(shí)將相關(guān)的信息以頁(yè)面鏈接的方式呈現(xiàn)給用戶,這樣用戶只需點(diǎn)擊這些網(wǎng)頁(yè)就可進(jìn)入該頁(yè)面;第二,智能檢索,當(dāng)用戶不斷尋找同類別的資源時(shí),顯示用戶有著這方面的需求,智能代理能夠?qū)π畔⑦M(jìn)行跟新,以便用戶能夠獲取最新的信息;第三信息庫(kù)管理,智能代理能夠保存用戶曾經(jīng)搜索過(guò)的信息,對(duì)用戶的信息進(jìn)行建檔,便于管理用戶。
3、智能搜索引擎技術(shù)
智能搜索引擎技術(shù)是指一款能夠在用戶瀏覽網(wǎng)頁(yè)過(guò)程中推送對(duì)于用戶有幫助、或者感興趣內(nèi)容的推薦系統(tǒng),具有以下功能可通過(guò)主動(dòng)方式采集網(wǎng)頁(yè)資源、商業(yè)數(shù)據(jù)庫(kù)、文件系統(tǒng)、以及散布在各處的郵件、圖片等非結(jié)構(gòu)化數(shù)據(jù),涵蓋非結(jié)構(gòu)化信息與結(jié)構(gòu)化信息,提供準(zhǔn)確的搜索服務(wù);搜索圖書(shū)館防火墻內(nèi)網(wǎng)中的Web服務(wù)器、數(shù)據(jù)庫(kù)、本地磁盤(pán)或文件服務(wù)器中的文件、IMAP電子郵件、文件管理系統(tǒng)、應(yīng)用程序等多種異構(gòu)信息系統(tǒng)數(shù)據(jù)源中專用、公用或共享的內(nèi)容;涵蓋多種索引策略、智能檢索輔助、內(nèi)容相關(guān)度排序等功能,實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的聯(lián)合檢索,搭配分布式集群架構(gòu),使搜索速度和準(zhǔn)確性共達(dá)最優(yōu),突破了傳統(tǒng)的“搜索框+關(guān)鍵詞”的傳統(tǒng)模式,實(shí)現(xiàn)了搜索技術(shù)與瀏覽器的結(jié)合,如當(dāng)用戶查找某一作者的著作時(shí),將會(huì)自動(dòng)推薦該作者的其他作品和相關(guān)的知識(shí)。
4、動(dòng)態(tài)網(wǎng)頁(yè)生成技術(shù)
動(dòng)態(tài)網(wǎng)頁(yè)生成技術(shù)可這樣描述,即用戶在使用的過(guò)程中不必使用靜態(tài)的HTML文件,只需要發(fā)送一個(gè)HTML請(qǐng)求到一個(gè)可執(zhí)行的應(yīng)用程序中,服務(wù)器將對(duì)這個(gè)請(qǐng)求做出反映,并求處理結(jié)果返回客戶端,實(shí)現(xiàn)服務(wù)器和用戶之間的互動(dòng)。動(dòng)態(tài)生成HTML靜態(tài)頁(yè)面,以減少服務(wù)器CPU的負(fù)載,提高用戶訪問(wèn)的速度。JSP和ASP都是面向Web服務(wù)器的技術(shù),當(dāng)用戶第一次請(qǐng)求JSP頁(yè)面或者ASP頁(yè)面時(shí),引擎將文件中的以HTML文本形式存在的靜態(tài)數(shù)據(jù)和以Java腳本存在的動(dòng)態(tài)數(shù)據(jù)全部轉(zhuǎn)換成Java代碼,之后再將java文件編譯成Servlet類文件,根據(jù)用戶的請(qǐng)求生成HTML格式的響應(yīng)頁(yè)面。目前在開(kāi)發(fā)動(dòng)態(tài)網(wǎng)頁(yè)方面,國(guó)內(nèi)數(shù)字圖書(shū)館大多采用ASP技術(shù),使用技術(shù)的數(shù)字圖書(shū)館很少。ASP技術(shù)和JSP相比可以發(fā)現(xiàn),JSP的安全性能以及穩(wěn)定性都要超過(guò)ASP技術(shù),因此JSP的應(yīng)用前景更為廣闊。
四、結(jié)語(yǔ)
個(gè)性化服務(wù)技術(shù)的應(yīng)用滿足了不同背景、不同目的的查詢需要,突破了傳統(tǒng)信息檢索通用化的限制,給信息技術(shù)領(lǐng)域帶來(lái)了一場(chǎng)革命,為數(shù)字圖書(shū)館的信息服務(wù)開(kāi)辟了廣闊的空間。目前數(shù)字化圖書(shū)館個(gè)性化服務(wù)技術(shù)尚處于起步階段,還有很多問(wèn)題亟待解決,以使個(gè)性化服務(wù)更加完善,更好的為用戶服務(wù)。
【參考文獻(xiàn)】
[1] 王 哲. 數(shù)據(jù)挖掘技術(shù)在高校圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用研究[D]. 重慶大學(xué), 2012.
[2] 徐杰飛. 數(shù)字圖書(shū)館個(gè)性化服務(wù)研究綜述[J]. 情報(bào)探索, 2010,07:116-118.
[3] 房 敏. 高校數(shù)字圖書(shū)館個(gè)性化服務(wù)綜述[J]. 科技創(chuàng)新導(dǎo)報(bào), 2010,33:219-220.
[4] 仇蓉蓉. 基于Jetspeed的數(shù)字圖書(shū)館個(gè)性化服務(wù)網(wǎng)格門(mén)戶構(gòu)建研究[D]. 湖北工業(yè)大學(xué), 2014.