亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高校圖書(shū)館搜索引擎中Web使用記錄挖掘研究

        2013-03-29 02:11:22趙靜
        現(xiàn)代電子技術(shù) 2013年2期
        關(guān)鍵詞:路徑分析搜索引擎高校圖書(shū)館

        趙靜

        摘 要:針對(duì)高校的信息資源檢索的命中率低問(wèn)題提出了運(yùn)用Web使用記錄挖掘的高校圖書(shū)館搜索引擎。通過(guò)采用Web使用記錄挖掘技術(shù)和Clementine對(duì)高校圖書(shū)館網(wǎng)站的Web訪問(wèn)日志記錄進(jìn)行挖掘。在Web使用記錄挖掘流程中,提出一個(gè)基于用戶IP、登陸時(shí)間、網(wǎng)站的拓?fù)鋱D、引用網(wǎng)頁(yè)和Agent來(lái)識(shí)別出單個(gè)用戶的新算法,獲得有效提高識(shí)別用戶的實(shí)驗(yàn)結(jié)果。最后用路徑分析來(lái)挖掘模式,優(yōu)化網(wǎng)站結(jié)構(gòu),從而提高高校圖書(shū)館搜索引擎的命中率。

        關(guān)鍵詞:Web使用記錄挖掘; 搜索引擎; 路徑分析; 高校圖書(shū)館; 用戶識(shí)別

        中圖分類號(hào):TN911?34 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004?373X(2013)02?0001?05

        0 引 言

        高校圖書(shū)館使用數(shù)字技術(shù)進(jìn)行信息資源的組織和管理,能夠存儲(chǔ)海量的信息。高校圖書(shū)館的搜索引擎部分地解決了資源發(fā)現(xiàn)的問(wèn)題,但是它可能會(huì)返回給用戶成千上萬(wàn)檢索到的網(wǎng)頁(yè),而其中很大一部分與用戶的要求無(wú)關(guān),用戶不能快速、準(zhǔn)確地得到所需的有價(jià)值的信息。因此,運(yùn)用Web使用記錄挖掘的高校圖書(shū)館搜索引擎隨之產(chǎn)生。運(yùn)用Web使用記錄挖掘的高校圖書(shū)館搜索引擎是專門(mén)針對(duì)高校的信息資源進(jìn)行檢索的搜索引擎,是實(shí)現(xiàn)高校教學(xué)資源共享提高搜索命中率必不可少的工具,所以高校圖書(shū)館搜索引擎中Web使用記錄挖掘的應(yīng)用研究具有非常重要的科學(xué)意義和應(yīng)用價(jià)值。

        Web使用記錄挖掘[1]是從用戶“訪問(wèn)痕跡”中獲取有價(jià)值的信息,是對(duì)Web上日志數(shù)據(jù)及相關(guān)數(shù)據(jù)的挖掘。Web使用記錄挖掘技術(shù)和工具可分為2大類:訪問(wèn)模式的追蹤和個(gè)性化的使用記錄的追蹤。一般的訪問(wèn)模式追蹤通過(guò)分析使用記錄來(lái)了解用戶的訪問(wèn)模式和傾向,以改進(jìn)站點(diǎn)的組織結(jié)構(gòu);個(gè)性化的使用記錄追蹤則傾向于分析個(gè)別用戶的偏好,其目的是根據(jù)不同用戶的訪問(wèn)模式,為用戶提供定制的服務(wù)。其目的是預(yù)測(cè)用戶網(wǎng)上的行為,比較網(wǎng)站的實(shí)際使用與期望的差別,根據(jù)用戶的興趣調(diào)整網(wǎng)站結(jié)構(gòu)。通過(guò)Web使用記錄挖掘技術(shù)對(duì)高校圖書(shū)館網(wǎng)站的Web訪問(wèn)日志記錄進(jìn)行挖掘,挖掘出用戶訪問(wèn)模式、頻繁訪問(wèn)路徑等信息,從而優(yōu)化站點(diǎn)結(jié)構(gòu)、獲取和分析用戶需求信息、為用戶提供高校圖書(shū)館搜索引擎系統(tǒng)服務(wù)以及為圖書(shū)館管理層提供決策支持。

        1 高校圖書(shū)館搜索引擎中Web使用記錄挖掘 流程分析

        在高校圖書(shū)館系統(tǒng)中,運(yùn)用Web使用記錄挖掘的Web訪問(wèn)日志數(shù)據(jù)為核心分析高校圖書(shū)館搜索引擎系統(tǒng)。高校圖書(shū)館的日志文件采用SQL Server數(shù)據(jù)庫(kù)來(lái)完成相應(yīng)的挖掘操作,又用Clementine挖掘工具作以補(bǔ)充。

        Clementine挖掘工具[2]是ISL公司開(kāi)發(fā)的數(shù)據(jù)挖掘工具平臺(tái)。Clementine結(jié)合Web使用記錄挖掘技術(shù)可以快速建立預(yù)測(cè)性模型,進(jìn)而應(yīng)用到高校搜索引擎系統(tǒng)中,幫助高校圖書(shū)館改進(jìn)圖書(shū)館搜索引擎系統(tǒng)的結(jié)構(gòu),為讀者提供個(gè)性化服務(wù)。

        整個(gè)高校圖書(shū)館搜索引擎系統(tǒng)提出了一套適合Web使用記錄挖掘的流程圖,根據(jù)這個(gè)流程圖,進(jìn)行數(shù)據(jù)收集,數(shù)據(jù)準(zhǔn)備,建立用戶興趣模型,模式挖掘等操作。如圖1高校圖書(shū)館搜索引擎中Web使用記錄挖掘的流程圖所示。

        圖1 高校圖書(shū)館搜索引擎中Web使用記錄挖掘的流程圖

        1.1 數(shù)據(jù)收集

        用戶瀏覽信息被Web服務(wù)器自動(dòng)收集并保存在訪問(wèn)日志、引用日志和代理日志中?;诟咝D書(shū)館網(wǎng)站自身特點(diǎn),主要研究Web訪問(wèn)日志。根據(jù)高校圖書(shū)館的Web服務(wù)器訪問(wèn)日志,通過(guò)訪問(wèn)路徑C:/WINDOWS/System32/LogFiles 收集需要的信息。Web訪問(wèn)日志記錄用戶訪問(wèn)信息。下面是一段收集的Web服務(wù)器訪問(wèn)日志:

        #Software: Microsoft Internet Information Services 6.0

        #Version: 1.0

        #Date: 2012?05?21 07:06:45

        #Fields: date time s?sitename s?ip cs?method cs?uri?stem cs?uri?query s?port cs?username c?ip cs(User?Agent) sc?status sc?substatus sc?win32?status

        2012?05?21 07:06:45 W3SVC894523 192.168.16.86 GET /index.htm ? 80 ?192.168.16.80Mozilla/4.0+(compatible;

        +MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+GTB6.6;

        +.NET+CLR+2.0.50727;+360SE) 200 0 0

        上述日志的數(shù)據(jù)包含的主要項(xiàng)的含義如下:

        (1)date time:時(shí)間戳。

        (2)s?sitename: 系統(tǒng)服務(wù)。

        (3)s?ip: 被訪問(wèn)服務(wù)器的IP地址。

        (4)cs?method: 客戶訪問(wèn)的方式,有GET和POST。

        (5)cs?uri?stem: 請(qǐng)求文檔的URL,即所訪問(wèn)的頁(yè)面。

        (6)cs?uri?query: URL查詢,用戶預(yù)進(jìn)行的查詢。

        (7)s?port: 被訪問(wèn)服務(wù)器的端口。

        (8)cs?username: 用戶ID,是在被訪問(wèn)頁(yè)面需要進(jìn)行用戶注冊(cè)時(shí)才有的。

        (9)c?ip: 客戶主機(jī)的IP地址。

        (10)cs(User?Agent): 表示客戶機(jī)的瀏覽器類型、版本即所運(yùn)行的操作系統(tǒng)。

        (11)sc?status: 返回碼。200代表成功,404代表找不到所請(qǐng)求的頁(yè)面。

        猜你喜歡
        路徑分析搜索引擎高校圖書(shū)館
        多球訓(xùn)練在高校乒乓球教學(xué)中的路徑分析
        人間(2016年31期)2016-12-17 22:04:45
        我國(guó)供給側(cè)結(jié)構(gòu)性改革路徑選擇
        淺談中國(guó)民間舞蹈的文化傳承
        戲劇之家(2016年22期)2016-11-30 17:08:12
        高校圖書(shū)館閱讀推廣案例分析
        科技視界(2016年21期)2016-10-17 19:32:37
        微信公眾平臺(tái)在高校圖書(shū)館信息服務(wù)中的應(yīng)用研究
        科技視界(2016年21期)2016-10-17 19:25:20
        高校圖書(shū)館閱讀推廣實(shí)踐探討
        科技視界(2016年20期)2016-09-29 13:17:57
        高校圖書(shū)館電子資源的宣傳與推廣
        科技視界(2016年20期)2016-09-29 11:22:45
        供給側(cè)改革概述及其促進(jìn)經(jīng)濟(jì)增長(zhǎng)的路徑分析
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
        久久精品伊人久久精品伊人| 亚洲精品国产精品国自产观看| 99久久久久国产| 久青青草视频手机在线免费观看| 亚洲禁区一区二区三区天美| 久爱www人成免费网站| 少妇寂寞难耐被黑人中出| 亚洲精品成人av一区二区| 国产av精品一区二区三区视频| 草草影院发布页| 精品无码一区在线观看| 国产成人亚洲精品77| 91人妻人人做人人爽九色| 丰满少妇被猛烈进入高清播放 | 日韩精品乱码中文字幕| 丁香美女社区| 亚洲欧美偷拍视频| 亚洲av国产大片在线观看| 蜜桃免费一区二区三区| 热久久国产欧美一区二区精品| 国际无码精品| 少妇极品熟妇人妻高清| 日韩中文字幕在线观看一区| 国产真实乱对白精彩久久老熟妇女 | 亚洲精品久久激情国产片| 精品人妻系列无码人妻免费视频| 西西人体大胆视频无码| 国产中文字幕亚洲精品| 欧美日韩国产精品自在自线| 97性视频| 少妇一级内射精品免费| 极品少妇xxxx精品少妇偷拍| 欧美性猛交内射兽交老熟妇| 一区二区三区国产高潮| 亚洲国产精品婷婷久久| 亚洲 自拍 另类小说综合图区| 国产一区二区激情对白在线| 视频一区二区免费在线观看| 久久午夜福利无码1000合集| 人人妻人人玩人人澡人人爽| 蜜桃av噜噜一区二区三区香|