亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘及其在網(wǎng)絡(luò)信息檢索中的運用

        2016-11-27 16:02:12魏巍巍
        決策與信息 2016年35期
        關(guān)鍵詞:信息檢索數(shù)據(jù)挖掘結(jié)構(gòu)

        馮 雷 魏巍巍

        北京信息職業(yè)技術(shù)學(xué)院 100018

        數(shù)據(jù)挖掘及其在網(wǎng)絡(luò)信息檢索中的運用

        馮 雷 魏巍巍

        北京信息職業(yè)技術(shù)學(xué)院 100018

        網(wǎng)絡(luò)信息檢索對于幫助人們迅速獲取有效信息,提升知識儲備具有非常重要的意義。數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)信息檢索中的應(yīng)用將能夠有效提升檢索效率。這項技術(shù)的應(yīng)用將能夠使得網(wǎng)絡(luò)信息檢索變得更加精準(zhǔn)、更加個性化和智能化。本文將重點探討數(shù)據(jù)挖掘在網(wǎng)絡(luò)信息檢索中的運用情況。

        數(shù)據(jù)挖掘;網(wǎng)絡(luò)信息;結(jié)構(gòu)挖掘

        在互聯(lián)網(wǎng)技術(shù)快速發(fā)展的背景下,人們看到的信息也是海量增長。在海量信息海洋中如何快速有效獲取自身有用信息是人們高效率工作的關(guān)鍵。為了能夠達(dá)到這一目的就需要提升網(wǎng)絡(luò)信息檢索水平,通過利用數(shù)據(jù)挖掘技術(shù)從而達(dá)到快速獲取有用信息的目的。

        一、數(shù)據(jù)挖掘

        所謂數(shù)據(jù)挖掘?qū)嶋H上就是要從大量數(shù)據(jù)中利用專門算法來搜索隱藏其中的特定信息的過程。在互聯(lián)網(wǎng)時代數(shù)據(jù)挖掘技術(shù)在實際工作中所發(fā)揮的影響越來越大,加強(qiáng)對這門技術(shù)的研究已經(jīng)成為當(dāng)務(wù)之急。通過數(shù)據(jù)挖掘就是要把那些沒有加工的數(shù)據(jù)轉(zhuǎn)變成有用信息。在網(wǎng)絡(luò)信息檢索過程中利用數(shù)據(jù)挖掘技術(shù)間將能夠進(jìn)一步增強(qiáng)信息檢索能力。不僅如此還能夠?qū)崿F(xiàn)對數(shù)據(jù)未來走勢的科學(xué)預(yù)測。應(yīng)該看到數(shù)據(jù)挖掘是一種比信息檢索層次更高的技術(shù)。信息時代數(shù)據(jù)挖掘技術(shù)所發(fā)揮的影響將會越來越大。

        二、網(wǎng)絡(luò)信息特點

        當(dāng)前互聯(lián)網(wǎng)已經(jīng)成為人們?nèi)粘I钪胁豢苫蛉钡囊徊糠郑曰ヂ?lián)網(wǎng)依靠,各種信息實現(xiàn)了快速傳播。網(wǎng)絡(luò)信息資源變得異常豐富,在互聯(lián)網(wǎng)上人們將能夠獲取各種信息。當(dāng)前的網(wǎng)絡(luò)信息已經(jīng)成為知識和信息的集合,已經(jīng)成為當(dāng)前一種非常寶貴的財富。同傳統(tǒng)信息相比,網(wǎng)絡(luò)信息有其自身特點,深入分析就會發(fā)現(xiàn)其具有以下特點:

        (一)數(shù)量龐大、種類繁多以及傳播范圍廣?;ヂ?lián)網(wǎng)上的信息是非常龐大的,從種類上來看也能夠分為多種類別。圖文、文本、數(shù)據(jù)、視頻、圖像以及音頻是典型的信息傳播載體。從信息內(nèi)容上來看不僅有健康信息,同時也是有虛假和有害信息的。有害和虛假信息將會對人們產(chǎn)生很大危害。因此就需要采取措施來對這些信息進(jìn)行有效甄別。網(wǎng)絡(luò)信息分類的一個很重要的功能就是要防止這些信息流傳。

        (二)管理困難。從當(dāng)前實際情況來看網(wǎng)絡(luò)信息資源更新快、傳播范圍廣、影響更大。再這樣的背景下要想實現(xiàn)對網(wǎng)絡(luò)信息的有效管理就顯得非常難。網(wǎng)絡(luò)信息本身是自由發(fā)布的,從信息來源上來看也是非常廣泛的,信息源的差異性就會對信息質(zhì)量產(chǎn)生直接影響,信息質(zhì)量難以得到保證是網(wǎng)絡(luò)信息的典型特征。對此在今后工作中必須要引起認(rèn)識。

        (三)管理機(jī)制多樣。從當(dāng)前對網(wǎng)絡(luò)信息的管理來看,目前還沒有統(tǒng)一的管理機(jī)制,因此這就會使得網(wǎng)絡(luò)信息安全會缺乏一定保障。不少大型網(wǎng)絡(luò)公司雖然設(shè)計了一些管理制度,但是從實際情況來看仍然存在著管理機(jī)制多樣化的問題。這樣在實際管理過程中就會變得困難。

        三、數(shù)據(jù)挖掘技術(shù)的運用

        數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)信息檢索中的應(yīng)用已經(jīng)成為今后發(fā)展的必然趨勢,在實際應(yīng)用過程中所發(fā)揮的影響將會變得越來越大。對于其具體應(yīng)用情況,本文認(rèn)為主要是表現(xiàn)在以下幾個方面:

        (一)結(jié)構(gòu)挖掘。結(jié)構(gòu)挖掘是數(shù)據(jù)挖掘在網(wǎng)絡(luò)信息檢索中的典型應(yīng)用,結(jié)構(gòu)挖掘?qū)嶋H上就是要挖掘Web潛在鏈結(jié)構(gòu)模式,之后通過Web組織結(jié)構(gòu)和鏈接關(guān)系將能夠提供豐富的信息,這些信息大多是關(guān)于Web內(nèi)容相關(guān)質(zhì)量、結(jié)構(gòu)方面的信息。通過結(jié)構(gòu)挖掘?qū)⒛軌虬l(fā)揮非常重要的作用。

        結(jié)構(gòu)挖掘本身可以分為網(wǎng)絡(luò)引用挖掘和網(wǎng)絡(luò)結(jié)構(gòu)挖掘這兩種形式。引用挖掘?qū)嶋H上就是要對各個Web站點之間的鏈接關(guān)系來進(jìn)行分析,通過對這一關(guān)系的分析將能夠使得人們了解哪些網(wǎng)頁被連接次數(shù)最多,這樣就能夠分析出哪些網(wǎng)頁是比較重要的。結(jié)構(gòu)挖掘?qū)嶋H上就是要對網(wǎng)站結(jié)構(gòu)進(jìn)行科學(xué)分析。

        (二)內(nèi)容挖掘。所謂內(nèi)容挖掘?qū)嶋H上就是要從網(wǎng)絡(luò)內(nèi)容、數(shù)據(jù)、文檔中來發(fā)現(xiàn)有用信息。從實際情況來看Web資源分布范圍是非常廣泛且類型多樣的。在實際工作中為了能夠準(zhǔn)確獲取信息就需要網(wǎng)絡(luò)頁面內(nèi)容挖掘和搜索結(jié)果再挖掘。對于頁面內(nèi)容通常是要采用文本挖掘的方式,利用文本挖掘來直接挖掘Web文檔內(nèi)容或者關(guān)鍵信息,之后還要通過間接形式來對文檔內(nèi)容進(jìn)行摘要或者解釋。對于搜索結(jié)果的挖掘?qū)嶋H上就是要利用其他信息檢索工具來對檢索結(jié)果進(jìn)行再次挖掘。有些系統(tǒng)就是通過對搜索引擎查詢結(jié)果的分析從而來提煉出更加合適的結(jié)果。URL、內(nèi)容類型、超文本鏈接等都是可以進(jìn)行專門提煉的。在提煉之后則是要對其分類并且文檔可視化從而顯示出來。

        (三)使用挖掘。通過網(wǎng)絡(luò)信息用法挖掘,可以充分的了解用戶的網(wǎng)絡(luò)數(shù)據(jù)實際意義。網(wǎng)絡(luò)信息內(nèi)容挖掘和網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘主要是針對原始數(shù)據(jù)的,而網(wǎng)絡(luò)信息用法挖掘主要是針對用戶和網(wǎng)絡(luò)交互的過程中產(chǎn)生的數(shù)據(jù)。這些數(shù)據(jù)類型包括很多:用戶對網(wǎng)絡(luò)服務(wù)器的訪問記錄、瀏覽器日志記錄、用戶的個人信息、用戶額交易信息等等。運用網(wǎng)絡(luò)信息用法挖掘技術(shù)能夠有效的從服務(wù)器以及瀏覽器端的日志記錄中發(fā)現(xiàn)隱藏在網(wǎng)絡(luò)數(shù)據(jù)中的一些無法通過索引獲取的模式信息,還可以了解用戶對網(wǎng)絡(luò)系統(tǒng)的訪問模式以及在網(wǎng)絡(luò)上所進(jìn)行的行為模式,從而對其作出預(yù)測性分析。

        數(shù)據(jù)挖掘在網(wǎng)絡(luò)信息檢索中的應(yīng)用是時代發(fā)展的必然趨勢,在今后工作中為了能夠滿足實際需要就應(yīng)該加強(qiáng)對數(shù)據(jù)挖掘技術(shù)的研究,通過對此研究從而來了解今后發(fā)展趨勢。

        [1]李村合.網(wǎng)絡(luò)信息挖掘技術(shù)及其應(yīng)用研究[J].情報科學(xué),2008.

        [2]葉云,萬明明.網(wǎng)絡(luò)信息挖掘技術(shù)探討[J].廣西大學(xué)學(xué)報,2007.

        [3]黃曉斌.網(wǎng)絡(luò)信息挖掘[M].北京:電子工業(yè)出版社,2005.1.

        馮雷(1978-),女,北京人,北京信息職業(yè)技術(shù)學(xué)院軟件與信息工程學(xué)院,教師,工程碩士,從事計算機(jī)信息管理專業(yè),市場調(diào)查等方向研究。

        魏巍巍(1980-),女,北京人,北京信息職業(yè)技術(shù)學(xué)院軟件與信息工程學(xué)院,教師,工程碩士,從事計算機(jī)信息管理專業(yè),空間信息技術(shù)等方向研究。

        猜你喜歡
        信息檢索數(shù)據(jù)挖掘結(jié)構(gòu)
        《形而上學(xué)》△卷的結(jié)構(gòu)和位置
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        論結(jié)構(gòu)
        中華詩詞(2019年7期)2019-11-25 01:43:04
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        論《日出》的結(jié)構(gòu)
        醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        創(chuàng)新治理結(jié)構(gòu)促進(jìn)中小企業(yè)持續(xù)成長
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計與實施
        河南科技(2014年11期)2014-02-27 14:10:19
        亚洲一区av无码少妇电影| 国产黑色丝袜在线看片| 粗大的内捧猛烈进出看视频| 亚洲av综合av国产av| 国产在线一区二区三区av| 91桃色在线播放国产| 伊人中文字幕亚洲精品乱码| 亚洲国产另类精品| 精品乱子伦一区二区三区 | 丰满熟女人妻一区二区三区| 99久久国产精品网站| 狠狠色噜噜狠狠狠狠7777米奇 | 国产视频嗯啊啊啊| 亚洲成av人片极品少妇| 成人无码av一区二区| 黄色成人网站免费无码av| a√无码在线观看| 日本中文字幕精品久久| 99久久精品免费观看国产| 色狠狠色狠狠综合一区| 日韩少妇人妻一区二区| 亚洲一二三区免费视频| 激性欧美激情在线| 内射欧美老妇wbb| 亚洲日韩乱码中文无码蜜桃臀 | 日韩内射美女片在线观看网站| 国产无遮挡裸体免费视频| 亚洲综合伦理| 中文字幕亚洲一二三区| 久久天天躁狠狠躁夜夜avapp| 波多野结衣有码| 日韩一二三四区免费观看 | 免费黄色影片| 在线高清精品第一区二区三区| 色婷婷精品国产一区二区三区| 亚洲夫妻性生活免费视频| 天堂8中文在线最新版在线| 亚洲AⅤ樱花无码| 精品视频一区二区三区日本| 国内精品视频在线播放不卡| 精品少妇大屁股白浆无码|