亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶需求分析的數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)研究

        2014-01-13 08:01:41張為江天津圖書館天津300201
        圖書館理論與實踐 2014年9期
        關(guān)鍵詞:數(shù)據(jù)庫數(shù)字圖書館

        ●張為江(天津圖書館,天津300201)

        基于用戶需求分析的數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)研究

        ●張為江(天津圖書館,天津300201)

        知識發(fā)現(xiàn);用戶需求;數(shù)字圖書館

        知識發(fā)現(xiàn)系統(tǒng)是數(shù)字圖書館個性化信息服務(wù)的實現(xiàn)手段之一,本文以用戶需求為中心,從知識服務(wù)平臺、用戶知識行為分析平臺、知識發(fā)現(xiàn)平臺、數(shù)字圖書館資源等方面對數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)進行了論述。

        在數(shù)字圖書館服務(wù)中,如何提高資源系統(tǒng)的利用率以及如何進行更加人性化的主動知識服務(wù)一直是信息行業(yè)研究的重點課題,許多信息服務(wù)機構(gòu)推出了從研究資源或知識本身的邏輯關(guān)系出發(fā),進一步結(jié)合用戶的部分檢索需求構(gòu)建的主動服務(wù)的知識發(fā)現(xiàn)系統(tǒng),雖然在一定程度上解決了用戶在浩如煙海的信息資源中獲取信息困難的問題,卻沒有從根本上從用戶需求的角度出發(fā),深入研究和分析用戶的使用習(xí)慣、知識取向,從而無法真正完全保證用戶獲取到信息的準(zhǔn)確性,更談不上在對用戶的知識內(nèi)涵進行分析的基礎(chǔ)上開展個性化的主動知識服務(wù),用戶仍然在大量信息超載的情況下面臨選擇困難。[1]因此,在信息爆炸的時代,研究基于用戶需求分析的新一代數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng),幫助用戶擺脫信息超載困境是數(shù)字圖書館知識服務(wù)的必然選擇。

        1 知識發(fā)現(xiàn)概述

        1.1 概念

        知識發(fā)現(xiàn)(KnowledgeDiscoveruom Database,Kdd)是確定數(shù)據(jù)中有效的、新穎的、有潛在應(yīng)用價值的、基本可理解的模式的高級處理過程。知識發(fā)現(xiàn)對大量的數(shù)據(jù)進行處理、分析和挖掘,尋找各類數(shù)據(jù)間潛在的關(guān)聯(lián)和規(guī)律,把用戶對數(shù)據(jù)的利用從簡單的檢索查詢提升到幫助用戶發(fā)現(xiàn)潛藏在數(shù)據(jù)背后的信息與知識。[2]尤其重要的是,知識發(fā)現(xiàn)通過數(shù)據(jù)關(guān)聯(lián),幫助用戶在數(shù)據(jù)海洋中發(fā)現(xiàn)了無法找到的和無法知道的知識。

        1.2 知識發(fā)現(xiàn)的功能

        (1)概念描述就是對某類對象的內(nèi)涵進行描述,明確概括出對象的特征,可分為特征性描述和區(qū)別性描述。特征性描述要求指出描述對象的共同特征;區(qū)別性描述要求指出不同類對象之間的區(qū)別。(2)關(guān)聯(lián)分析指發(fā)現(xiàn)數(shù)據(jù)間的相關(guān)程度,從某一數(shù)據(jù)推斷出另一數(shù)據(jù),發(fā)現(xiàn)其重復(fù)出現(xiàn)的知識模式。(3)聚類分析是依據(jù)物以類聚的原則,將本身沒有類別的數(shù)據(jù)聚合成不同的類,由此導(dǎo)出規(guī)律和典型模式。聚類的目的是使屬于同一類的數(shù)據(jù)盡量相似,不同類的數(shù)據(jù)差別盡可能大。(4)自動預(yù)測趨勢與行為就是對數(shù)據(jù)進行掃描,尋找潛在的預(yù)測信息,發(fā)現(xiàn)其隱藏的模式,以便對未知數(shù)據(jù)進行歸類。(5)偏差檢測就是對數(shù)據(jù)庫中一些帶有偏差的異常記錄進行描述,如:分類中的反常實例,不滿足規(guī)則的特例等。

        1.3 知識發(fā)現(xiàn)的過程

        知識發(fā)現(xiàn)過程雖然有多種描述,但只是在組織和表達方式上有所不同,在內(nèi)容上并沒有本質(zhì)區(qū)別,主要包括以下步驟:(1)確定知識發(fā)現(xiàn)的挖掘?qū)ο?、目?biāo)和任務(wù);(2)搜集、提取數(shù)據(jù),建立關(guān)鍵性指標(biāo)數(shù)據(jù)庫;(3)根據(jù)知識發(fā)現(xiàn)任務(wù),對數(shù)據(jù)進行合法性檢查與清理,去除掉與知識發(fā)現(xiàn)無關(guān)的數(shù)據(jù);(4)根據(jù)知識發(fā)現(xiàn)的目標(biāo)和任務(wù)選擇數(shù)據(jù)挖掘的算法;(5)將知識發(fā)現(xiàn)的結(jié)果用可視化的形式表示,并讓專家和用戶進行評價。以上步驟需要經(jīng)過多次反復(fù)和修改,以便最終形成高效可用的知識發(fā)現(xiàn)結(jié)果。

        2 知識發(fā)現(xiàn)系統(tǒng)發(fā)展現(xiàn)狀

        知識發(fā)現(xiàn)系統(tǒng)是數(shù)字圖書館個性化信息服務(wù)的實現(xiàn)手段之一,雖然國內(nèi)外有很多類似的知識發(fā)現(xiàn)服務(wù)系統(tǒng),但這些系統(tǒng)大多是以資源為核心研究對象。例如:Series Solution公司的“資源發(fā)現(xiàn)系統(tǒng)Summon”和超星公司的“學(xué)術(shù)發(fā)現(xiàn)系統(tǒng)”,就是以文獻資源為基礎(chǔ),進行數(shù)據(jù)處理和分析展現(xiàn)給讀者。文獻資源雖然是揭示各信息資源關(guān)聯(lián)關(guān)系的立體知識體系,卻忽略了對用戶需求行為的深度分析。

        除了以資源為研究對象的系統(tǒng)外,也有以用戶為中心設(shè)計的知識發(fā)現(xiàn)服務(wù)系統(tǒng),但這類系統(tǒng)對用戶的分析要么局限于用戶最初注冊時的自我需求定制,要么局限于一些簡單的統(tǒng)計數(shù)據(jù)。例如:登錄次數(shù)、下載頁數(shù)、瀏覽次數(shù)等,這類分析遠遠不能精確地、動態(tài)地分析出用戶的知識結(jié)構(gòu)和使用習(xí)慣,從而影響到知識發(fā)現(xiàn)系統(tǒng)提供信息的準(zhǔn)確性。

        基于用戶需求分析的數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)則是采用追蹤用戶對各個數(shù)據(jù)庫的使用過程的方式,記錄用戶使用數(shù)據(jù)庫的關(guān)鍵信息和閱讀軌跡,以用戶使用數(shù)字圖書館的行為軌跡作為主要研究對象,通過挖掘各類數(shù)據(jù)庫與用戶行為之間的立體關(guān)系,分析和歸納用戶自身的特點,如不同的知識背景、知識取向和使用習(xí)慣等,據(jù)此建立以用戶需求為關(guān)聯(lián)的知識體系,從而發(fā)現(xiàn)用戶獲取知識的規(guī)律,以便用最有效的方式為用戶提供系統(tǒng)發(fā)現(xiàn)的知識信息。[3]

        由此可以得出,數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)以獨特的視角將用戶行為分析和知識發(fā)現(xiàn)兩個并行的研究方向有機地結(jié)合起來,統(tǒng)一到主動的知識服務(wù)上面來,是完全根據(jù)用戶的需求對數(shù)字圖書館的資源進行揭示、組織和聚類,主動知識發(fā)現(xiàn)的服務(wù)平臺。

        3 數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)的應(yīng)用意義

        3.1 有效提高數(shù)字圖書館資源利用率和用戶使用效果

        數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)通過全程記錄用戶利用數(shù)字圖書館的知識行為軌跡,如:檢索關(guān)鍵詞、關(guān)鍵詞出現(xiàn)頻率、用戶登錄頻率、檢索頻率、下載頁數(shù)、瀏覽時長等指標(biāo),建立用戶知識行為數(shù)據(jù)庫,運用分類、聚類、關(guān)聯(lián)分析等方法,研究出用戶的需求,如使用習(xí)慣、知識背景及知識取向,據(jù)此采用知識關(guān)聯(lián)對知識進行組織、管理。具體地講,就是在把知識A推送給用戶的同時,將與之相關(guān)的知識B推送給用戶,不僅有效地提高知識B的利用率,而且更重要的是讓用戶發(fā)現(xiàn)了所需要的知識B。這種以數(shù)據(jù)驅(qū)動的服務(wù)理念提供的知識無疑將有效地提高數(shù)字資源的利用率和用戶的滿意度。

        3.2 實現(xiàn)信息服務(wù)到知識服務(wù)的飛越

        數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)通過分析圖書館用戶的知識行為數(shù)據(jù)庫,發(fā)現(xiàn)其知識結(jié)構(gòu)和利用知識的規(guī)律,將此規(guī)律作為數(shù)字圖書館資源的智能化聚類和關(guān)聯(lián)的規(guī)則,利用知識發(fā)現(xiàn)技術(shù)在顯性和隱性的資源中對可用知識進行收集、選擇、關(guān)聯(lián)和升值,使知識發(fā)現(xiàn)系統(tǒng)提供的服務(wù)不僅僅是面向數(shù)據(jù)庫的簡單檢索、查詢和調(diào)用,而是實現(xiàn)個性化的主動的知識發(fā)現(xiàn)和推送。同時,通過大量分析用戶的知識行為數(shù)據(jù)庫,發(fā)現(xiàn)用戶共有的需求特性及其之間的相互關(guān)聯(lián)規(guī)則,進而還可利用已有的數(shù)據(jù)對用戶未來的活動進行預(yù)測,發(fā)現(xiàn)今后的閱讀趨勢,從而引領(lǐng)用戶獲得更有用的知識,以滿足用戶的實際和期望需要,實現(xiàn)從獲取信息到知識的飛躍。[2]

        3.3 進一步推動信息資源和數(shù)據(jù)庫的建設(shè)

        通過分析用戶利用數(shù)字圖書館的知識行為,發(fā)現(xiàn)用戶的知識行為規(guī)律,將此規(guī)律應(yīng)用于知識發(fā)現(xiàn)平臺,最終使用戶獲得隱藏于數(shù)據(jù)背后的具有新穎性的、潛在的、有價值的知識。整個過程既包括用戶知識行為的規(guī)律,又包括知識被發(fā)現(xiàn)的規(guī)律,這兩個規(guī)律完全以用戶為中心,聚焦用戶需求,相輔相成,不僅對今后數(shù)據(jù)庫的構(gòu)建提供理論支持,而且對數(shù)字圖書館的資源組織、建設(shè)具有很強的現(xiàn)實意義和指導(dǎo)意義,促使海量的數(shù)字圖書館信息轉(zhuǎn)變成能最大限度滿足用戶需求的資源。

        4 數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)框架設(shè)計

        數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)是以資源檢索為目標(biāo)的資源服務(wù)系統(tǒng)轉(zhuǎn)變?yōu)橥耆嫦蛴脩粜枨蟮?、主動發(fā)現(xiàn)和推送知識的系統(tǒng)。它主要由四部分構(gòu)成,即知識服務(wù)平臺、用戶知識行為分析平臺、知識發(fā)現(xiàn)平臺和數(shù)字圖書館資源。見圖。

        圖 數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)框架

        4.1 知識服務(wù)平臺

        知識服務(wù)平臺是數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)的入口,用戶通過它訪問數(shù)字圖書館資源以達到檢索、定制、獲取信息與知識的目的,同時通過廣泛深入采集用戶的瀏覽、檢索軌跡,生成用戶利用數(shù)字圖書館的知識行為數(shù)據(jù)庫。知識服務(wù)平臺集成了圖書館多種信息技術(shù)手段,如集成檢索、個性化推送、數(shù)字參考咨詢、知識交流等服務(wù),它更能體現(xiàn)用戶參與交互的特征,是圖書館提供知識服務(wù)的人機交互平臺。

        在數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)框架中,人機交互平臺是用戶與知識發(fā)現(xiàn)系統(tǒng)之間通信的接口,其設(shè)計占據(jù)非常重要的地位。以滿足用戶需求為基礎(chǔ)的交互是在充分考慮用戶的體驗及感受的前提下設(shè)計的,它嚴格以用戶為中心,不只關(guān)注形式和內(nèi)容,更多的是通過記錄用戶利用數(shù)字圖書館的過程,來準(zhǔn)確描述用戶需求,從而以最有效的方式向用戶推送知識信息。[4]對用戶而言,人機交互平臺必須是一個簡潔、易操作、且操作界面相對友好的平臺,并可將用戶的問題定義及知識發(fā)現(xiàn)結(jié)果以可視化的方式展示給用戶。

        4.2 用戶知識行為分析平臺

        用戶知識行為數(shù)據(jù)庫包括用戶個人信息庫和用戶知識行為記錄庫。用戶個人信息庫是指用戶的注冊信息和系統(tǒng)預(yù)設(shè)的用戶需求定制等數(shù)據(jù)。用戶知識行為記錄庫用于記錄大量用戶的檢索、閱讀的知識行為,這部分記錄利用數(shù)字圖書館日志、用戶cookie進行提取和收集。

        然而,并不是所有的用戶行為數(shù)據(jù)對知識發(fā)現(xiàn)都是有用的,用戶知識行為分析平臺主要負責(zé)分析用戶知識行為數(shù)據(jù)庫,通過統(tǒng)計學(xué)分析用戶知識行為指標(biāo),對大量用戶閱讀習(xí)慣進行聚類,然后根據(jù)聚類得到的各類指標(biāo)的相關(guān)性、邏輯性,對數(shù)據(jù)進行過濾,去除無效數(shù)據(jù),保留一些能夠體現(xiàn)用戶對資源感興趣的信息,從而發(fā)現(xiàn)用戶知識行為的內(nèi)在聯(lián)系和普遍規(guī)律,研究發(fā)現(xiàn)能夠表現(xiàn)用戶知識行為規(guī)律的關(guān)鍵功能指標(biāo),如檢索關(guān)鍵詞、加入收藏等,由此就可以推斷出該用戶在某一段時間的瀏覽偏好,并將用戶對數(shù)據(jù)庫需求的分析結(jié)果發(fā)送到知識發(fā)現(xiàn)平臺。

        在整個系統(tǒng)模型中,用戶可以對信息需求和推送的知識進行選擇和修改,這一過程將被記錄生成新的用戶知識行為數(shù)據(jù)庫,用戶知識行為分析平臺也將重新進行分析、定位用戶的現(xiàn)實與潛在需求,經(jīng)過如此反復(fù)地反饋、修改、再反饋、再修改,用戶知識行為規(guī)律將更加貼近用戶要求。用戶知識行為數(shù)據(jù)庫的建立要經(jīng)過必要的修整與調(diào)節(jié)過程,使數(shù)據(jù)庫趨于科學(xué)合理,同時只有經(jīng)過比較長時間數(shù)據(jù)積累的用戶知識行為數(shù)據(jù)庫才能真實反映用戶的知識背景、知識取向和使用習(xí)慣等,對其進行采集、處理是知識發(fā)現(xiàn)的基礎(chǔ)。

        4.3 知識發(fā)現(xiàn)平臺

        知識發(fā)現(xiàn)平臺是數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)的核心,以各類結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)為底層,利用數(shù)據(jù)倉儲、數(shù)據(jù)挖掘和搜索引擎等技術(shù)手段,全面揭示數(shù)字圖書館中各種文獻之間的內(nèi)在關(guān)系。眾所周知,各類數(shù)據(jù)不是孤立的,數(shù)據(jù)間存在著千絲萬縷的聯(lián)系,這些聯(lián)系就是知識關(guān)聯(lián)的基礎(chǔ),知識關(guān)聯(lián)就是在海量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)項之間的關(guān)系。通過知識關(guān)聯(lián),用戶可以獲得更多信息,直到發(fā)現(xiàn)用戶真正需要的知識,知識關(guān)聯(lián)是知識發(fā)現(xiàn)和知識創(chuàng)造的起點。

        知識發(fā)現(xiàn)的結(jié)果不僅取決于知識結(jié)點之間的邏輯關(guān)系,取決于知識之間的有機關(guān)聯(lián),更取決于用戶對知識的需求和利用規(guī)律。知識發(fā)現(xiàn)平臺依據(jù)用戶知識行為的分析結(jié)果,建立以用戶需求為關(guān)聯(lián)的知識體系,并深入挖掘大量數(shù)據(jù)資源背后的信息,以便發(fā)現(xiàn)用戶需要的、有效的知識。知識發(fā)現(xiàn)是數(shù)字圖書館服務(wù)的更高層次,是主動信息服務(wù)的基礎(chǔ)。

        4.4 數(shù)字圖書館資源

        數(shù)字圖書館資源是知識發(fā)現(xiàn)系統(tǒng)最基礎(chǔ)的設(shè)施,位于整個系統(tǒng)的最底層,主要包括圖書館各種不同類型、不同地域的數(shù)字資源和未挖掘的知識,它們是為用戶提供信息服務(wù)和知識發(fā)現(xiàn)的基礎(chǔ)。

        [1]曹樹金.基于用戶需求的圖書館用戶滿意實證研究[J].中國圖書館學(xué)報,2013(5):60-72.

        [2]劉建濤.?dāng)?shù)字圖書館用戶行為研究[D].武漢:武漢理工大學(xué),2007.

        [3]彭春紅.基于用戶體驗價值的高校圖書館服務(wù)創(chuàng)新[J].情報探索,2011(9):108-110.

        [4]景衛(wèi)紅.?dāng)?shù)字圖書館個性化信息服務(wù)研究[J].圖書情報工作,2010(S1):160-161,183.

        G250.76;G252.0

        A

        1005-8214(2014)09-0083-03

        張為江(1969-),女,情報學(xué)碩士,天津圖書館副研究館員,發(fā)表論文數(shù)篇。

        2014-06-26[責(zé)任編輯]王崗

        本文系2014年度文化部科技創(chuàng)新項目(項目編號:2014k jcxxm05)的研究成果之一。

        猜你喜歡
        數(shù)據(jù)庫數(shù)字圖書館
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        答數(shù)字
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        飛躍圖書館
        數(shù)字看G20
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        去圖書館
        成雙成對
        久久精品国产久精国产果冻传媒| 手机在线看片在线日韩av| 日本三区在线观看视频| 色窝窝亚洲av网在线观看| 国产va在线观看免费| 亚洲AⅤ无码片一区二区三区| 国产一品二品三品精品久久| 亚洲一区二区三区中文字幕网| 国产av旡码专区亚洲av苍井空| 国产黄页网站在线观看免费视频| 国产粉嫩嫩00在线正在播放| 天堂免费av在线播放| 色视频线观看在线网站| 中文字幕无码无码专区| 亚洲乱色视频在线观看| 成人影院在线观看视频免费| 香港三级日本三级a视频| 中文无码成人免费视频在线观看| 久久久精品人妻一区二区三区日本 | 人妻无码一区二区三区四区| 91精品日本久久久久久牛牛| 久久成人精品国产免费网站| 日本顶级metart裸体全部| 亚洲av无码1区2区久久| 亚洲乱在线播放| 蜜桃精品视频一二三区| 国产免费一区二区三区免费视频| 免费一级特黄欧美大片久久网| 国产不卡一区二区三区视频| 日本人视频国产一区二区三区| 性欧美videofree高清精品| 亚洲国产精品久久久天堂不卡海量 | 丰满人妻av无码一区二区三区| 巨乳av夹蜜桃站台蜜桃机成人| 国产午夜精品久久精品 | 好屌草这里只有精品| 亚洲一区二区三区精品网| 中文字幕亚洲高清视频| 少妇高潮惨叫久久久久久电影| 另类专区欧美在线亚洲免费| 精品人妻日韩中文字幕|