亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的數(shù)字圖書館個性化服務

        2009-03-02 09:33:14
        新媒體研究 2009年2期
        關鍵詞:數(shù)據(jù)挖掘

        駱 穎

        [摘要]隨著網(wǎng)絡用戶群的日益增長,更多的用戶期望能得到具有針對性的、個性化的信息服務和用戶支持。數(shù)據(jù)挖掘技術因其在海量信息資源中的智能表現(xiàn),為數(shù)字圖書館的個性化服務建設提供不可或缺的技術支撐。

        [關鍵詞]數(shù)據(jù)挖掘 數(shù)字圖書館 個性化服務

        中圖分類號:TP2文獻標識碼:A文章編號:1671-7597(2009)0120058-01

        一、數(shù)字圖書館個性化服務的含義

        近10年來,隨著“數(shù)字化生存”方式逐漸為人們所接受,數(shù)字圖書館信息量大、占用空間少、更新速度快、不受時空限制等特點而越來越受到人們的關注。人們在享受著數(shù)字圖書館所帶來便捷的同時,也深受其龐大而形式多樣的信息資源困擾,因為它具有較強的目標導向性,同樣的信息對于不同的個體表現(xiàn)出不同的價值。對單個用戶來說,不可能對數(shù)字圖書館的所有信息資源都需要,而同樣的信息也不一定會滿足所有的用戶。個性化服務是解決用戶“眾口難調(diào)”問題的關鍵,它是適應用戶多樣化需求的重要手段,也是圖書館應對信息資源多樣化的一個重要措施。

        數(shù)字圖書館個性化服務是基于信息用戶的信息使用行為、習慣、偏好、特點及用戶特定的需求,向用戶提供滿足其個性化需求的信息內(nèi)容和系統(tǒng)功能的一種服務。首先,它應該是一種能夠滿足數(shù)字圖書館用戶的個體信息需求的服務,即根據(jù)用戶提出的明確要求提供信息服務,或通過對用戶個性使用習慣的分析而主動地向用戶提供其可能需要的信息服務;其次,應該是一種培養(yǎng)個性、引導需求的服務,這樣可以幫助個體培養(yǎng)個性、發(fā)現(xiàn)個性、引導需求,促進社會的多樣性和多元化發(fā)展。數(shù)據(jù)挖掘是近年新興的計算技術與方法,它在科學發(fā)現(xiàn)、商業(yè)零售以及信用管理、醫(yī)學等領域已得到廣泛應用,并顯示出巨大的威力。最近幾年,數(shù)據(jù)挖掘技術開始應用于數(shù)字圖書館領域,使數(shù)字圖書館的功能有了較大的變化和發(fā)展。

        二、數(shù)據(jù)挖掘及相關技術

        數(shù)據(jù)挖掘也稱知識發(fā)現(xiàn),是從數(shù)據(jù)庫中獲取人們感興趣的知識,這些知識是隱含的、潛在的。與傳統(tǒng)的決策支持不同,它從大型數(shù)據(jù)庫、數(shù)據(jù)倉庫和浩瀚的網(wǎng)絡信息空間中發(fā)現(xiàn)并提取隱藏在其中的信息,幫助信息工作人員尋找數(shù)據(jù)間潛在的關聯(lián),發(fā)現(xiàn)被忽略的要素,而這些信息對預測趨勢和決策行為是十分有用的。數(shù)據(jù)挖掘根據(jù)其主要研究對象的數(shù)據(jù)結(jié)構形式的不同,一般粗分為數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘、文本數(shù)據(jù)挖掘3類。

        數(shù)據(jù)挖掘是面向數(shù)值數(shù)據(jù)的數(shù)據(jù)挖掘,對象是傳統(tǒng)的數(shù)據(jù)庫或數(shù)據(jù)倉庫。而Web數(shù)據(jù)挖掘是指針對包括Web頁面內(nèi)容、頁面之間的結(jié)構、用戶訪問信息、商務交易信息等在內(nèi)的各種Web數(shù)據(jù),應用數(shù)據(jù)挖掘方法及技術以發(fā)現(xiàn)有用的知識來幫助人們從萬維網(wǎng)中提取知識,改進站點設計,開展電子商務或改進服務。文本數(shù)據(jù)挖掘是指當數(shù)據(jù)挖掘的對象完全由文本類型組成時,結(jié)合使用數(shù)據(jù)挖掘算法與信息檢索算法對巨量文本信息進行自動化信息處理與分析的過程。

        三、數(shù)據(jù)挖掘在數(shù)字圖書館中的應用

        (一)個性化服務。數(shù)字圖書館的個性化服務在整個數(shù)字圖書館系統(tǒng)中是很關鍵的部分,應由被動服務轉(zhuǎn)向主動,由單純的信息呈現(xiàn)轉(zhuǎn)向信息生成。主要表現(xiàn)為兩個層次:第一層為按用戶要求進行信息訂制。第二層則是數(shù)字圖書館挖掘用戶興趣模式,主動提供服務,使數(shù)字圖書館成為一個智能型、主動性的信息提供商。

        (二)提高信息獲取速度。數(shù)字圖書館中的信息量是龐大的,在堆積如山的數(shù)據(jù)中包含著許多待提取的有用知識。用戶關心自己的需要是不是能夠被滿足更勝于關心數(shù)據(jù)圖書館中總的信息量。要想為用戶提供更快、更有效的服務,就必須有一套很好的搜索機制。數(shù)據(jù)挖掘技術為數(shù)字化圖書館提供了先進的信息檢索工具,在數(shù)字圖書館的檢索中采用數(shù)據(jù)挖掘的相關理論和方法,設計的系統(tǒng)將有更大的智能性。

        (三)拓展服務形式。數(shù)據(jù)挖掘可實現(xiàn)信息服務質(zhì)量的提升和業(yè)務的拓展。數(shù)字圖書館借助現(xiàn)代信息技術,不僅在于服務媒體和時空的轉(zhuǎn)變,更重要的能夠借助數(shù)據(jù)挖掘技術,完善其服務結(jié)構和提升服務水平。其中有信息檢索服務、定題與查新服務、信息分析服務。

        四、構建數(shù)字圖書館個性化服務系統(tǒng)

        利用數(shù)據(jù)挖掘技術構建數(shù)字圖書館個性化服務系統(tǒng)的前提和基礎是擁有大量、真實的數(shù)據(jù)積累,沒有數(shù)據(jù)積累,數(shù)據(jù)挖掘?qū)o用武之地,需要各方人員共同參與,通力合作。

        (一)提取原始信息和收集用戶特征。用戶通過瀏覽器訪問數(shù)字圖書館時,系統(tǒng)可以記錄下來的用戶訪問數(shù)據(jù)有兩類:用戶信息和用戶行為特征。用戶信息包括用戶的姓名、性別、年齡、職業(yè)、愛好、教育程度以及用戶訪問IP地址等;利用Web日志記錄可獲得用戶的行為特征,準確把握用戶的行為特征和偏好,是提供更精確、更符合用戶需求的信息服務的首要條件。

        (二)數(shù)據(jù)預處理和數(shù)據(jù)轉(zhuǎn)換。對收集到的數(shù)據(jù)進行加工處理和組織重構,如檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性、去除噪聲或刪除無效數(shù)據(jù)、填補丟失的域、去除空白數(shù)據(jù)域、考慮時間順序和數(shù)據(jù)變化;找到數(shù)據(jù)的特征,用維變換或轉(zhuǎn)換方法減少有效變量的數(shù)目,找到數(shù)據(jù)的不變式,構建相關主題的數(shù)據(jù)倉庫,為下一步的數(shù)據(jù)挖掘過程提供基礎平臺,做好前期準備。

        (三)確定數(shù)據(jù)挖掘目標。數(shù)據(jù)挖掘的目標應結(jié)合實際情況,細化、清晰。如,根據(jù)用戶興趣的不斷變化,利用數(shù)據(jù)挖掘技術發(fā)現(xiàn)用戶的最新需要,或者根據(jù)用戶的興趣度,推薦相關專題信息,并提供個性化界面等。

        (四)數(shù)據(jù)挖掘。根據(jù)挖掘目標和數(shù)據(jù)特點選擇相應的算法,在凈化和轉(zhuǎn)換過的數(shù)據(jù)集上進行數(shù)據(jù)挖掘。選擇某個特定數(shù)據(jù)挖掘算法用于搜索數(shù)據(jù)中的模式,進行數(shù)據(jù)挖掘、搜索或產(chǎn)生一個特定的感興趣的模式或一個特定的數(shù)據(jù)集,在此基礎上進行分析與評估,檢驗數(shù)據(jù)挖掘所得到的知識模式。

        (五)結(jié)果分析和知識的運用。對數(shù)據(jù)挖掘的結(jié)果進行解釋和評價,用預先、可信的知識檢查解決數(shù)據(jù)模式中可能的矛盾,以改善數(shù)據(jù)倉庫,轉(zhuǎn)化為能最終被用戶理解的知識,將分析得到的知識加載到實際運行系統(tǒng)中。數(shù)據(jù)挖掘的過程是一個反復進行的過程,需要對挖掘結(jié)果進行不斷的實踐應用、測試、修改、比對,直達到用戶滿意。

        五、結(jié)語

        數(shù)字圖書館個性化服務改變了圖書情報機構以往“我提供什么用戶就接受什么”的運作方式,開創(chuàng)了“用戶需要什么我就提供什么”的發(fā)展思路。個性化服務將成為未來數(shù)字圖書館技術發(fā)展的主要趨勢。隨著網(wǎng)絡用戶群的日益增長,更多的用戶期望能得到具有針對性的、個性化的信息服務和用戶支持。數(shù)據(jù)挖掘技術因其在海量信息資源中的智能表現(xiàn),能為數(shù)字圖書館的個性化服務建設提供不可或缺的技術支撐。盡管數(shù)據(jù)挖掘作為一門前沿技術,自身還在不斷發(fā)展完善,還面臨著許多問題,但隨著研究的深入,數(shù)據(jù)挖掘技術必將對數(shù)字圖書館的建設產(chǎn)生積極的影響。

        參考文獻:

        [1]張志英,關于數(shù)字圖書館建設的思考[J].黑龍江科技信息,2008.(3).

        [2]劉曉芳,淺談數(shù)字圖書館的建設[J].中國科技信息,2008.(1).

        [3]李琳琳,數(shù)據(jù)倉庫與數(shù)據(jù)挖掘在圖書館決策管理中的應用[J].科技情報開發(fā)與經(jīng)濟,2008.(1).

        [4]何茵,數(shù)字圖書館用戶信息需求特點與信息服務[J].中華醫(yī)學圖書情報雜志,2008.(1).

        猜你喜歡
        數(shù)據(jù)挖掘
        基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡流量異常識別方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        數(shù)據(jù)挖掘技術在打擊倒賣OBU逃費中的應用淺析
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        數(shù)據(jù)挖掘在高校圖書館中的應用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術實現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實踐
        亚洲国产成人精品无码区在线秒播| 麻豆AⅤ无码不卡| 久久久久国色av∨免费看| 精品国产网红福利在线观看| 国产伦码精品一区二区| 色青青女同性恋视频日本熟女 | 亚洲少妇一区二区三区老| 欧美性色欧美a在线播放| 久久亚洲精品11p| av无码av在线a∨天堂app| 日韩精品免费观看在线| 久久精品国产久精国产爱| 国产97在线 | 免费| 人妻人妻少妇在线系列| 伊人婷婷综合缴情亚洲五月| 妺妺跟我一起洗澡没忍住| 久久久精品2019免费观看 | 丰满五十六十老熟女hd | 色小姐在线视频中文字幕| 亚洲av综合色区无码专区桃色| 国产自偷自偷免费一区| 2021国产最新无码视频| 久久一区二区视频在线观看| 国产又大又硬又粗| 最新亚洲人成无码网站| 国产自产21区激情综合一区| 在线精品首页中文字幕亚洲| 无人视频在线观看免费播放影院| 无码日韩人妻AV一区免费| 亚洲第一页在线免费观看| 色又黄又爽18禁免费网站现观看| 一本无码人妻在中文字幕免费| 91精品综合久久久久m3u8| 国产一区二区三区青青草| 18禁无遮拦无码国产在线播放| 国产污污视频| 少妇深夜吞精一区二区| 日韩人妻ol丝袜av一二区| 日韩无码无播放器视频| 亚洲成人激情在线影院| 国产精品沙发午睡系列|