亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺談基于Web挖掘的個性化搜索引擎技術(shù)

        2018-11-26 09:34:40謝海艇
        關(guān)鍵詞:個性化服務(wù)搜索引擎

        謝海艇

        摘要:本文針對搜索引擎存在的問題,簡要介紹了Web挖掘的相關(guān)技術(shù),并構(gòu)建了用戶個性化數(shù)據(jù)庫,設(shè)計出基于Web挖掘的個性化搜索引擎模型,使檢索結(jié)果更加符合用戶的實際需要。

        關(guān)鍵詞:Web挖掘;搜索引擎;個性化服務(wù)

        搜索引擎的基本概念出現(xiàn)于20世紀(jì)70年代,并于20世紀(jì)90年代中期得到快速的發(fā)展。隨著Web信息的迅速增加,搜索引擎市場出現(xiàn)了前所未有的繁榮景象,搜索引擎正向著智能化、個性化等適應(yīng)不同用戶需求的方向發(fā)展。目前,搜索引擎仍然存在很多的局限性,主要表現(xiàn)在以下幾個方面:查詢精度不高且不能根據(jù)用戶興趣返回信息、資料檢索與用戶的交互不夠、查詢結(jié)果排序不合理、不能處理多種格式的文件等。

        Web挖掘[1]是指從異構(gòu)的分布式互聯(lián)網(wǎng)數(shù)據(jù)中收集信息,利用計算機網(wǎng)絡(luò)技術(shù)和人工智能技術(shù),不斷地發(fā)現(xiàn)有用的數(shù)據(jù)模型和隱含知識。根據(jù)挖掘?qū)ο蟮牟煌琖eb挖掘可分為Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘以及Web日志記錄挖掘。

        Web內(nèi)容挖掘是基于Internet中各種網(wǎng)站的數(shù)據(jù)內(nèi)容,以獲得有效的知識驅(qū)動模型,并自動檢索網(wǎng)絡(luò)資源,提高網(wǎng)絡(luò)數(shù)據(jù)的使用。

        Web結(jié)構(gòu)挖掘是研究Web文檔的鏈接結(jié)構(gòu),找到鏈接中隱含的可用模式。其中兩個最著名的算法是PageRank算法和HITS算法。

        Web日志記錄挖掘也稱為Web日志挖掘,以Web服務(wù)器訪問日志為主要數(shù)據(jù),分析用戶的瀏覽行為與頁面之間的結(jié)構(gòu)類型,改進站點結(jié)構(gòu),為用戶提供個性化服務(wù)。

        用戶個性化數(shù)據(jù)庫以用戶的多維信息為基礎(chǔ),不斷深入挖掘用戶的瀏覽行為,并根據(jù)頁面權(quán)重、時間間隔、下載信息等因素不斷更新數(shù)據(jù)庫,幫助用戶查找真實需求的資源信息[2]。用戶個性化數(shù)據(jù)庫包括信息收集與信息更新。

        1.收集用戶訪問信息

        如何獲取有關(guān)用戶的個性化信息是用戶個性化數(shù)據(jù)庫需要解決的首要問題。用戶個性化數(shù)據(jù)庫的數(shù)據(jù)信息主要來自于用戶提交的信息以及分析用戶的訪問日志。用戶在訪問互聯(lián)網(wǎng)的過程中,提交的查詢關(guān)鍵詞、停留網(wǎng)頁時間、下載狀態(tài)等信息會在Web服務(wù)器上留下記錄,并形成用戶訪問日志。用戶個性化數(shù)據(jù)庫通過不斷分析用戶訪問日志,挖掘用戶的潛在個性化信息。

        2.更新用戶個性化信息

        用戶的個性化需求不是一成不變的,大多數(shù)用戶的個人特征數(shù)據(jù)會隨著時間推移而變化。其主要表現(xiàn)形式有兩方面,一為興趣領(lǐng)域的變化,二為興趣程度的變化。用戶興趣的變化將不可避免地影響用戶個性化數(shù)據(jù)庫的內(nèi)容,這就要求用戶個性化數(shù)據(jù)庫具有自主學(xué)習(xí)的能力,并根據(jù)用戶的興趣變化不斷更新數(shù)據(jù)庫中的相關(guān)特征項。

        本文采用改變權(quán)重的方法更新用戶的個性化特征項,公式如下:

        NewWeight= OldWeight+i×t

        i為用戶訪問網(wǎng)站的參數(shù)。針對不同用戶的訪問行為進行定義,如用戶對訪問內(nèi)容進行下載、對網(wǎng)頁進行全文瀏覽、對部分網(wǎng)頁內(nèi)容進行瀏覽、未對網(wǎng)頁進行瀏覽等。不同的訪問行為反應(yīng)了用戶對信息的滿意程度,依次為i確定不同的數(shù)值。

        t是時間參數(shù)。用戶通常會長時間瀏覽他們感興趣的頁面,否則瀏覽時間將會變短。

        個性化服務(wù)的目標(biāo)是反映用戶之間的差異,尊重用戶的個性特征并向用戶提供各種信息服務(wù)[3]?;赪eb挖掘的個性化搜索引擎模型主要為用戶提供個性化的信息檢索服務(wù),便于用戶查閱使用。

        本系統(tǒng)主要包括個性化數(shù)據(jù)庫、檢索系統(tǒng)、后臺管理系統(tǒng)。

        個性化數(shù)據(jù)庫主要表示用戶的興趣趨勢,通過不斷挖掘用戶訪問日志,自動更新用戶的個性化特征項。

        檢索系統(tǒng)主要基于用戶查詢關(guān)鍵詞,在檢索信息的同時計算相應(yīng)頁面的權(quán)重,以此為依據(jù)進行排序,并把檢索結(jié)果反饋給用戶。

        后臺管理系統(tǒng)主要加強子系統(tǒng)之間的通信連接,維持系統(tǒng)的穩(wěn)定運行。

        隨著互聯(lián)網(wǎng)信息的急劇增加,搜索引擎技術(shù)在信息檢索中發(fā)揮的作用越來越大。相信隨著科學(xué)技術(shù)的進步,網(wǎng)絡(luò)信息檢索技術(shù)的發(fā)展也會越來越快。

        參考文獻:

        [1] 張彥波.Web挖掘研究微探[J].北京電力高等??茖W(xué)校學(xué)報(自然科學(xué)版),2010(27):145.

        [2] 馮是聰,單松巍,張志剛等.基于Web挖掘的個性化技術(shù)研究[J].計算機工程與設(shè)計,2004(1):4-5.

        [3] 王術(shù),付關(guān)友,朱征宇.面向個性化服務(wù)的網(wǎng)頁特征描述[J].計算機工程與設(shè)計,2005(3):651-653.

        猜你喜歡
        個性化服務(wù)搜索引擎
        淺析移動時代的圖書館發(fā)展策略
        青年時代(2016年30期)2017-01-20 02:26:57
        互聯(lián)網(wǎng)思維下數(shù)字圖書館個性化服務(wù)建設(shè)研究
        需求理論在高校圖書館就業(yè)服務(wù)中的應(yīng)用研究
        山西自駕游發(fā)展的問題與對策研究
        商(2016年25期)2016-07-29 09:05:27
        新形勢下飯店服務(wù)業(yè)發(fā)展存在的問題及對策建議
        中國市場(2016年22期)2016-07-07 04:54:28
        大數(shù)據(jù)對高校圖書館個性化服務(wù)的影響
        科技視界(2016年10期)2016-04-26 10:14:33
        網(wǎng)絡(luò)搜索引擎亟待規(guī)范
        Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
        基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
        廣告主與搜索引擎的雙向博弈分析
        玩弄丰满奶水的女邻居| 日韩激情av不卡在线| 亚洲一区二区国产一区| 国产精品成人免费视频一区| 国产嫖妓一区二区三区无码| 国产剧情无码中文字幕在线观看不卡视频 | 漂亮人妻洗澡被公强 日日躁| 无码人妻精品一区二区在线视频 | 亚洲女av中文字幕一区二区| 午夜免费福利小电影| 久久久久亚洲精品天堂| 久久精品成人亚洲另类欧美| 大陆少妇一区二区三区| 欧洲熟妇色| 精品推荐国产精品店| 99久久国语露脸国产精品| 深夜一区二区三区视频在线观看 | 精品欧洲av无码一区二区| 91精品国产福利尤物免费| 亚洲中文字幕国产剧情| 国产freesexvideos中国麻豆| 精品人妻一区二区三区四区| 欧美亚洲另类自拍偷在线拍| 中国亚洲av第一精品| 东京热无码av一区二区| 久久精品国产夜色| 亚洲精品在线观看一区二区| 国产一级内射视频在线观看| 国产成人午夜精华液| 欧美久久中文字幕| 精品中文字幕在线不卡| 国产精品久久久久9999小说| 久久永久免费视频| 精品国产夫妻自拍av| 少妇被又大又粗又爽毛片久久黑人 | 日本av一区二区播放| 亚洲最近中文字幕在线| 国产在视频线精品视频| 天啦噜国产精品亚洲精品| 日本不卡视频一区二区三区| 少妇厨房愉情理伦bd在线观看|