亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        搜索引擎及網絡數(shù)據(jù)挖掘相關技術研究

        2014-12-31 00:00:00楊丹丹
        數(shù)字化用戶 2014年11期

        【摘 要】數(shù)據(jù)挖掘技術就是從大量模糊、隨機、不完全、有噪聲信息中提出有用信息的一個過程,從而為用戶提供出更加針對性的信息支持。本文主要分析搜索引擎及網絡數(shù)據(jù)挖掘相關技術的融合應用。

        【關鍵詞】搜索引擎 網絡數(shù)據(jù)挖掘相關技術 研究

        在社會的發(fā)展之下,網絡已經成為人們生活與生產中必不可少的工具,但是網絡中充斥的大量繁雜信息也在一定程度上影響著人們的信息獲取速度,網絡信息檢索在檢準率與檢全率方面依然難以滿足人們的需求,而將網絡數(shù)據(jù)挖掘技術應用在其中即可很好的解決這一問題。

        1 數(shù)據(jù)挖掘技術簡介

        數(shù)據(jù)挖掘技術就是從大量模糊、隨機、不完全、有噪聲信息中提出有用信息的一個過程,與數(shù)據(jù)挖掘技術相關的技術還有數(shù)據(jù)分析技術、數(shù)據(jù)融合技術、知識發(fā)現(xiàn)技術等等,在技術水平的發(fā)展下,統(tǒng)計學方法、決策樹、關聯(lián)分析等一些新型數(shù)據(jù)挖掘技術也相繼出現(xiàn)。與數(shù)據(jù)挖掘不同,信息檢索實質上是一種信息發(fā)現(xiàn)任務,也是知識發(fā)展過程中的重要環(huán)節(jié),信息檢索能夠幫助人們了解各項靜態(tài)信息,但是難以分析到數(shù)據(jù)間的關系及其未來發(fā)展趨勢。而應用數(shù)據(jù)挖掘技術則可以有效提升系統(tǒng)檢索能力,預測出未來的走勢,因此,將數(shù)據(jù)挖掘技術應用在搜索引擎中也是大勢所趨。

        2 搜索引擎與網絡數(shù)據(jù)挖掘

        網絡數(shù)據(jù)挖掘是一種將數(shù)據(jù)挖掘技術與網絡融合的一種新模式,網絡數(shù)據(jù)挖掘也能夠稱之為Web挖掘,網絡數(shù)據(jù)的頁面復雜、數(shù)據(jù)內容繁雜,文章也具有不規(guī)則性,將數(shù)據(jù)挖掘技術應用在數(shù)據(jù)挖掘中可以有效的解決上述問題,根據(jù)處理對象,網絡數(shù)據(jù)挖掘任務有三種類型,即網絡內容挖掘、網絡使用挖掘與網絡結構挖掘。

        2.1 網絡內容的挖掘

        網絡內容挖掘就是從網絡數(shù)據(jù)、網絡內容與網絡文檔中挖掘信息,很多網絡信息是能夠在網絡中過去的,但是依然有很大一部分數(shù)據(jù)難以采用該種方法獲取,如使用PHP、JSP與ASP的動態(tài)網頁,拒絕訪問的網站,商業(yè)數(shù)據(jù)庫中的數(shù)據(jù)。這些內容都能夠使用網絡內容挖掘法來獲取,這可以使用兩個方法:網絡頁面內容挖掘法與搜索結果再挖掘法。

        2.2 網絡結構挖掘法

        網絡結構挖掘法強調挖掘網頁中的鏈接結構,并從中推導相關的知識,這種挖掘法與引文分析有著密切的關系,網絡中的鏈接信息能夠為數(shù)據(jù)挖掘提供全面的支持,為了獲取到理想的效果,可以來分析網頁鏈接與鏈接數(shù)量,并建立起鏈接結構模式。其常用的算法有Propriteary算法、Google算法、HITS算法與PageRank算法四種。

        2.3 網絡使用挖掘法

        網絡使用挖掘法就是通過日志發(fā)現(xiàn)來訪問頁面的一種模式,與網絡內容挖掘模式和網絡結構挖掘模式不同,網絡使用挖掘法的挖掘對象非是網絡與用戶交互中的二手數(shù)據(jù),這些數(shù)據(jù)大多來自Cookies或者Web服務器中的信息、系統(tǒng)交互信息與訪問記錄。

        3 數(shù)據(jù)挖掘技術在網絡信息檢索中的應用作用

        目前,人們已經進入了一個信息爆炸時代,雖然眾多搜索引擎網絡可以滿足人們對于信息檢索的基本需求,但是還是有很多地方不到位,目前,網絡挖掘技術已經開始在網絡領域中得到了應用,也取得了一定的成效。實踐顯示,將數(shù)據(jù)挖掘技術應用在網絡信息檢索中能夠取得如下的效用:

        3.1 提升標引準確性

        標引能夠準確選擇出文獻的檢索標示,網絡信息范圍廣、復雜性高、數(shù)量多,使用人工標引很難取得理想的檢索效果,因此,必須要使用自動標引。將網絡數(shù)據(jù)挖掘技術應用在其中能夠深刻的揭示出相關信息的聯(lián)系,幫助用戶在文檔中進行標注,提升信息攝取的準確性。而以此為基礎來應用加權算法則能夠得出具體的信息關聯(lián),對于提升檢索效果有著十分積極的效用。

        3.2 可以對檢索結果進行分類

        在網絡世界中,各個網站之間的轉載情況嚴重,用戶在使用搜索引擎時必然會檢索出大量的重復信息,這不僅會降低檢索效率,也會浪費資源。將數(shù)據(jù)挖掘技術應用在檢索工作中就能夠挖掘出網頁中的語義內容,有效提升檢索效率。此外,數(shù)據(jù)挖掘技術也可以有效提升檢索質量,該種方法是建立在層次法與劃分法基礎上,如果檢索文檔相似性大,即可進行聚類處理,將處理后的信息用層次化方式提供給用戶,用戶可以根據(jù)自己的需要自行選擇,這就有效減少了瀏覽數(shù)量。

        3.3 能夠提升自動摘要質量

        自動摘要即利用網絡來分析文章結構、主題語句的方式,自動摘要可以有效幫助用戶來加工與整合信息,與自動摘要相比,人工編制摘要會浪費大量的時間,將網絡數(shù)據(jù)挖掘技術應用在搜索引擎中能夠提升自動摘要的質量,該種技術是通過文檔內容來總結文本信息,能夠將Web中的重要內容總結起來,并提取出摘要。這對于優(yōu)化網絡信息資源的處理質量有著十分積極的意義。

        4 結語

        總而言之,將數(shù)據(jù)網絡挖掘技術應用在搜索引擎中已經成為了一個大勢所趨,采用該種技術可以有效提升標引、自動分類、自動摘要以及自動聚類的準確性,可以根據(jù)用戶的具體需求來建立模型,從而為用戶提供出更加針對性的信息支持。其中,最為常用的技術就是自由分類法,自由分類法能夠將難以用傳統(tǒng)方式細化的信息歸入熟悉類目中,并在排序檢索與信息組織上很好的彌補與了傳統(tǒng)搜索方法的缺陷,但是,該種方法也存在一些局限性,多應用在小范圍網絡中,相信在不久的將來,網絡數(shù)據(jù)挖掘技術定可以在搜索引擎中得到更加廣泛的使用。

        參考文獻:

        [1]狄浩林. 面向精確營銷基于數(shù)據(jù)挖掘的3G用戶行為模型及實證研究[D]. 北京郵電大學 2012

        [2]喬智勇,劉志鏡. Web數(shù)據(jù)挖掘系統(tǒng)的設計及實現(xiàn)研究[J]. 計算機工程與設計. 2002(07)

        [3]韓立新,黃麗雯,惲爽,謝立,陳道蓄. 基于Agent的面向Internet的信息檢索系統(tǒng)的設計和實現(xiàn)[J]. 情報學報. 2002(03)

        伊人精品成人久久综合97| 91av精品视频| 97久久久久国产精品嫩草影院 | 无码乱人伦一区二区亚洲一 | 少妇性饥渴bbbbb搡bbbb| 久久精品中文字幕第23页| 日韩女优中文字幕在线| 国产精品国产自产自拍高清av| 天天综合天天爱天天做| 国产精品无码一区二区在线看| 免费男人下部进女人下部视频| 亚洲av无码精品色午夜| AV无码一区二区三区国产| 国产一区二区一级黄色片| 午夜福利理论片在线观看播放| 国产精品天堂avav在线| 国产女精品视频网站免费| 国产精品无码mv在线观看| 日韩av免费一区二区| 久久天天躁狠狠躁夜夜avapp| 精品无码国产自产野外拍在线| 福利一区二区三区视频午夜观看| 涩涩国产在线不卡无码| 国产一区二区免费在线视频| 疯狂的欧美乱大交| 亚洲欧美国产日韩天堂在线视| 精品一区二区三区影片| 中文字幕亚洲精品专区| 精品国产性色无码av网站| 麻豆第一区MV免费观看网站| 亚洲一区二区三区乱码在线| 国产精品国产三级国产密月| 国产sm调教视频在线观看| 中文无码成人免费视频在线观看| 国产激情一区二区三区成人免费| 久久夜色精品国产亚洲av老牛| 日本最新视频一区二区| 国内成+人 亚洲+欧美+综合在线| 中文字幕无码不卡免费视频| 久久水蜜桃亚洲av无码精品麻豆| 亚洲素人日韩av中文字幕|