亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數據挖掘技術在圖書館中的應用及用戶研究

        2014-12-31 00:00:00鄒晶晶易燦
        計算機光盤軟件與應用 2014年16期

        摘 要:數據挖掘技術作為一種新信息處理技術,在諸多領域得到了普遍關注,本文以數據挖掘技術在圖書館中的實際應用為例,研究數據挖掘技術在圖書館信息采集、信息服務方面的重要作用,并研究了用戶對數據挖掘技術的使用技巧。

        關鍵詞:數據挖掘;圖書館;用戶;應用研究

        中圖分類號:TP311.13

        數據挖掘技術出現與上世紀九十年代中期,涉及了數據庫、神經網絡、模糊數學、模式識別等多方面知識。該技術實際上就是從大型數據庫中對人們感興趣的知識進行提取,而這種知識一般是隱含的、潛在的有用信息。數據挖掘對于優(yōu)化館藏,提高信息獲取速度起著重要作用。

        1 數據挖掘在圖書館中的應用研究

        數據挖掘技術在圖書館中的應用是實現圖書館管理現代化的重要表現之一,為圖書館館藏的優(yōu)化提供了重要方式,同時也有效的加快了信息獲取的速度,那么數據挖掘技術究竟是如何實現其功能的,我們首先要認識數據挖掘的常用技術。

        1.1 數據挖掘的常用技術

        結合數據挖掘技術的應用實際,本文主要介紹以下三種常用的數據挖掘技術:一是自動預測趨勢和行為技術。數據挖掘技術改變了傳統(tǒng)的單純依靠手工進行問題分析的局面,實現了自動數據處理,通過對大型數據庫中多種數據的自動篩選與分析,進行信息預測性,并快速的根據已知數據得出預測結果。二是關聯分析技術。數據關聯指的是兩個或多個變量的取值之間存在的特殊規(guī)律,它是數據庫中可被發(fā)現的重要知識,其目的在于尋找數據庫中重要的關聯網。關聯包括三種形式,即簡單關聯、時序關聯、因果關聯。三是聚類技術。在數據挖掘過程中,我們可以將數據庫中的記錄分解為多個不同的子集,這就是聚類。這一技術使人們對客觀現實的認識逐漸加深,同時也是進行概念描述和偏差分析的前提。

        1.2 數據挖掘技術在數字化圖書館中的具體應用

        數據挖掘技術在圖書館的數字資源管理中發(fā)揮著重要作用,并對提升圖書館服務質量具有重要影響,文章主要從數據挖掘技術對優(yōu)化館藏結構與提升信息獲取速度兩方面進行分析。

        首先,優(yōu)化館藏的結構。由于受到圖書館文獻購置費用的限制,如何合理的分配各學科文獻的購置成為圖書館管理中的一個難題,而數據挖掘技術恰好解決了工作人員的這一難題。還要通過數據挖掘技術采集互聯網上無序的、非結構的數據,并對其進行相應的分類,實現元數據向結構化數據的轉換,對讀者的興趣、閱讀傾向進行分析,從而實現文獻采購策略的動態(tài)調整,以優(yōu)化圖書館的信息資源。其次,提升了信息獲取速度。為了能夠讓用戶在最短的時間內獲取更多的有用信息,工作人員需要先對用戶每次閱讀文獻做一個專題集合,并將其看成是一個事物,這樣將每一位用戶的全部瀏覽過程記錄為一個事務庫,然后再對事務庫做出下面的幾項操作:首先,通過運用關聯規(guī)則挖掘算法分析求得訪問頻率超過給定閾值的專題集,然后再通過分類算法將瀏覽模式相似的用戶在同一服務器中組織起來,網絡代理則會依據規(guī)則預先連接其關聯頁,進而有效的提升了系統(tǒng)響應速度。最后,通過運用WEB挖掘實現用戶訪問序列模式,依據預測先將用戶可能會閱讀的網頁進行傳輸。

        2 數據挖掘技術的用戶研究

        當前圖書館信息供需矛盾表現的比較明顯,如何通過有效措施實現將適當的知識傳遞給適當的人的目標,是當前圖書館管理面臨的重要問題,筆者對此表示需要加強用戶教育,加強用戶使用數據挖掘技術的能力,增強其在信息化時代合理利用與快速獲取信息的能力。

        2.1 WEB挖掘技術

        該技術是指以大量的WEB文檔與WEB活動為依據,從中選擇感興趣的、潛在的有用模式及潛在信息等,從其研究對象上劃分,可以將其分為三類,即WEB結構挖掘、WEB內容挖掘、WEB使用模式挖掘。其中WEB結構挖掘的目的是尋找頁面的結構和WEB結構,并以此為基礎執(zhí)行對頁面的分類或者是聚類操作,并分析出權威頁面,它實際上就是WEB連接關系與組織結構中進行知識的推導。WEB結構挖掘使用的方法一般有Hub/authority與Page-rank兩種,WEB中存在著大量、異質的信息資源。但是,從局部來分析,在不同的WEB服務器上都有一個具有結構化水平較高的記錄集,也就是WEB訪問日志,WEB服務器會記錄每一次用戶獲取資源的請求;WEB內容挖掘是實現WEB文檔集合內容分類、聚類、關聯分析等的重要渠道,并能夠進行趨勢預測;WEB使用模式挖掘是通過挖掘WEB日志記錄的方式發(fā)現用戶對WEB頁面進行訪問的模式,它在三種技術中的關注度是最高的。WEB服務器一般會保存訪問過WEB頁面的全部WEB日志,我們將其稱之為WEB log,在WEB log中記錄了訪問日期、IP、服務器響應狀態(tài)、所請求URL資源等多方面內容,它為WEB訪問提供了大量的信息。

        2.2 數據挖掘流程設計方法

        本文所介紹的數據挖掘流程設計方法為SEMMA法(如圖1所示),該方法已經得到了廣泛的認可與普遍應用,更加適合于圖書館各類相關的數據挖掘設計。

        首先進行數據取樣。在具體實施數據挖掘的過程中,第一步就是對大量數據進行篩選,并選擇出一個與搜索問題相關的樣板數據子集,通過這一程序可以有效的降低數據處理數量,提升數據處理效率,同時還可以使數據的規(guī)律性表現的更為明顯。其次是進行數據探索,以樣本數據集為搜索依據,從中分析其規(guī)律與趨勢,并利用聚類分析技術對不同類別進行相應的劃分。第三步是進行數據調整,前兩步主要是明確了數據的狀態(tài)與趨勢,此時需要明確與量化解決問題的要求,并以問題要求為標準,對數據做增加或刪除處理,根據對重新認識的整個數據挖掘過程再生成一個新變量,從而使狀態(tài)更體現其有效性。第四步是進行模型化,這是實現數據挖掘的最關鍵環(huán)節(jié),通過上述三步操作已經基本明確了問題所在,并對數據結構及內容進行了相應的調節(jié),此時需要利用人工神經網絡、決策樹等方法建立模型。

        3 結束語

        綜上所述,數據挖掘技術作為信息處理領域中出現的一種新技術,正在社會生活的各個方面發(fā)揮著作用,得到了社會各界的普遍關注。本研究基于此,以數據挖掘技術在圖書館中的實際應用為例,望能夠為數據挖掘技術在圖書館管理及其他多個領域的應用提供借鑒。

        參考文獻:

        [1]Han J.FreeSpan:Frequent parttern-projected sequential pattern mining[J].In Proc.2000 Int.Conf.Knowledge Discovery and Data Mining.Boston,2000:355-359.

        [2]袁春花.Web.數據挖掘技術在數字圖書館中的應用研究[J].軟件導刊,2013(01).

        [3]柯俊帆,石常海.數據挖掘技術研究與應用[A].市場踐行標準化——第十一屆中國標準化論壇論文集[C],2014.

        作者簡介:鄒晶晶(1981-),女,湖南長沙人,講師,研究方向:Web應用開發(fā)、數據挖掘;易燦(1979-),男,湖南湘陰人,講師,研究方向:移動應用軟件開發(fā)。

        作者單位:湖南大眾傳媒學院,長沙 410100

        中文字幕人妻久久久中出| 91爱爱视频| 日本一区二区三区中文字幕视频| 亚洲av手机在线一区| 精品精品久久宅男的天堂| 欧美裸体xxxx极品少妇| 综合精品欧美日韩国产在线| 国产精品久久夜伦鲁鲁| 国产欧美日韩不卡一区二区三区| 少妇高潮太爽了免费网站| 午夜福利一区在线观看中文字幕| 亚洲一卡2卡3卡4卡5卡精品| 欧美三级免费网站| 国产精品99久久精品女同| 黄片视频免费观看蜜桃| 午夜福利啪啪片| 欧美在线a| 一级二级三一片内射视频| 97丨九色丨国产人妻熟女| 中国老妇女毛茸茸bbwbabes| 日本一区二区三区中文字幕最新| 久久久黄色大片免费看| 精品人妻av区乱码| 天堂√最新版中文在线天堂| 人妻精品一区二区免费| 中文字幕亚洲综合久久综合| 狠狠综合久久av一区二区| 91精品国产91久久久无码95 | 日韩在线 | 中文| 秋霞午夜无码鲁丝片午夜精品| 亚洲欧美日韩高清一区二区三区| 亚洲肥婆一区二区三区| 蜜臀av色欲a片无码精品一区| 成人片黄网站色大片免费观看app 亚洲av无码专区亚洲av | 粉嫩极品国产在线观看| 日本91一区二区不卡| 最新国产毛2卡3卡4卡| av人摸人人人澡人人超碰小说| 日本一区二区三区专区| 国产一区二区三区久久悠悠色av| 免费看黄色电影|