亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        web網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)與實(shí)現(xiàn)分析

        2013-12-31 00:00:00劉珊珊

        摘 要:隨著科學(xué)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)中包含的信息越來越多,人們可以隨心所欲的在互聯(lián)網(wǎng)上尋找自己需要的學(xué)習(xí)或者技術(shù)資料,但同時(shí),由于互聯(lián)網(wǎng)上所包含的內(nèi)容特別的多,涉及的方面也特別的廣泛,當(dāng)我們?cè)谒阉饕嬷休斎胛覀兯栊畔⒌年P(guān)鍵詞時(shí),會(huì)有很多的超鏈接供我們選擇,如何在眾多的詞條中找到我們所需要的關(guān)鍵信息,已經(jīng)成為了靈活應(yīng)用互聯(lián)網(wǎng)進(jìn)行學(xué)習(xí)和工作的一個(gè)重要難題。本文結(jié)合自己多年的工作經(jīng)驗(yàn),著重對(duì)web網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)與實(shí)現(xiàn)進(jìn)行簡(jiǎn)要分析。

        關(guān)鍵詞:web網(wǎng)絡(luò)數(shù)據(jù);挖掘技術(shù);實(shí)現(xiàn)

        中圖分類號(hào):TP393.09

        時(shí)間就是金錢,效率就是生命。在當(dāng)今這個(gè)競(jìng)爭(zhēng)日趨激烈的社會(huì)中,誰能快速有效的找到并掌握信息誰就能夠在激烈的環(huán)境中占據(jù)強(qiáng)大優(yōu)勢(shì)。互聯(lián)網(wǎng)作為一個(gè)我們?nèi)魏螣岖@取知識(shí)和有效信息的重要工具,在我們?nèi)粘5纳詈凸ぷ髦芯哂蟹浅V匾淖饔?。我們?cè)谌粘5纳詈凸ぷ髦?,利用互?lián)網(wǎng)挖掘?qū)ξ覀冇行У臄?shù)據(jù)的時(shí)候,必須掌握一定的技術(shù)和技巧,這樣我們既可以得到我們所需要的資料和信息,又能在激烈的競(jìng)爭(zhēng)環(huán)境中占得先機(jī)。

        1 網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介

        當(dāng)今社會(huì)是一個(gè)網(wǎng)絡(luò)蔓延的社會(huì),我們的日常生活和工作學(xué)習(xí)都離不開網(wǎng)絡(luò)的大力支持,在網(wǎng)上我們可以找到我們所需的相關(guān)信息,網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)是一門在網(wǎng)上快速的提取我們所需的有效信息的一種技術(shù)手段,通過網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)我們可以節(jié)約我們獲取信息的時(shí)間,提高我們的日常工作效率。對(duì)于我們的日常生活來講,利用網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)在網(wǎng)上獲取我們所需的有效信息,可以為我們節(jié)約非常多的生活時(shí)間,讓我們有更多的時(shí)間和精力去處理個(gè)人生活問題,有效的幫助提高我們的生活質(zhì)量。在工作中,我們利用網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)可以為我們節(jié)約大量的時(shí)間,有效的提高我們的工作效率,對(duì)于一些特殊的行業(yè)來說,獲取信息的準(zhǔn)確與否會(huì)直接影響企業(yè)的未來發(fā)展甚至是命運(yùn),對(duì)于這些行業(yè)來講,他們必須保證自己在第一時(shí)間獲取信息,提前進(jìn)行準(zhǔn)備或者直接下手,為以后面對(duì)激烈的行業(yè)競(jìng)爭(zhēng)打下堅(jiān)實(shí)的基礎(chǔ)。

        Web數(shù)據(jù)挖掘技術(shù)是一項(xiàng)非常綜合性的技術(shù),我們可以把它認(rèn)為是一項(xiàng)計(jì)算機(jī)技術(shù),也可以把它理解為一項(xiàng)數(shù)據(jù)處理技術(shù),之所以這樣是因?yàn)檫@項(xiàng)技術(shù)在應(yīng)用的過程中,既要有一定的計(jì)算機(jī)應(yīng)用技術(shù)作為基礎(chǔ),又要熟練掌握一些相關(guān)的數(shù)據(jù)處理技術(shù)。在web數(shù)據(jù)挖掘技術(shù)應(yīng)用的過程中,人們需要對(duì)一些挖掘算法進(jìn)行反反復(fù)復(fù)的利用,建立一定的數(shù)據(jù)模型,最終按照建立的數(shù)據(jù)模型在網(wǎng)絡(luò)上準(zhǔn)確獲取我們所需要的有效信息。Web數(shù)據(jù)挖掘技術(shù)是一項(xiàng)在互聯(lián)網(wǎng)中獲取自己需要的有效信息的一種技術(shù)手段,我們可以從數(shù)學(xué)的角度來理解這項(xiàng)技術(shù),我們把我們現(xiàn)在掌握的有效信息作為一個(gè)信息集合P,把我們想要得到的有效信息作為另一個(gè)集合C,這樣我們就得到一個(gè)映射:P--C,而從P-C的這個(gè)過程就需要我們利用web挖掘技術(shù)進(jìn)行信息的挖掘和篩選。Web數(shù)據(jù)挖掘技術(shù)從本質(zhì)上講是一門數(shù)據(jù)獲取技術(shù),是由我們?cè)谌粘I詈凸ぷ髦械臄?shù)據(jù)挖掘技術(shù)發(fā)展而來的,以前我們?cè)讷@取數(shù)據(jù)進(jìn)行有效數(shù)據(jù)挖掘的時(shí)候是建立在紙質(zhì)的文件上的,而web數(shù)據(jù)挖掘技術(shù)是建立在網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)技術(shù)的基礎(chǔ)之上,是計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)高度發(fā)展形成的一個(gè)產(chǎn)物。我們?cè)诶脀eb數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)挖掘時(shí),首先要對(duì)現(xiàn)有的信息進(jìn)行總結(jié)歸納,得出其中所蘊(yùn)含的關(guān)鍵信息,然后利用數(shù)據(jù)挖掘這種技術(shù)手段對(duì)我們所需信息進(jìn)行深度挖掘的一個(gè)過程。利用web數(shù)據(jù)挖掘技術(shù)可以很好的解決我們?nèi)粘9ぷ髦兴枰母鞣N數(shù)據(jù)問題,幫助我們提高工作效率。

        2 web數(shù)據(jù)挖掘技術(shù)的基本原理

        我們把要得到的有效數(shù)據(jù)看做是一個(gè)集合,把我們目前掌握的已知數(shù)據(jù)也看作是一個(gè)集合,WEB數(shù)據(jù)挖掘技術(shù)的作用就是將這兩個(gè)信息有機(jī)的聯(lián)系在一起,我們首先在WEB網(wǎng)站中輸入我們所需信息的關(guān)鍵詞,首次輸入的時(shí)候力求做到全方位輸入,也就是說我們輸入的關(guān)鍵詞要盡可能的囊括我們所需信息的各個(gè)方面,如果在搜索后我們發(fā)現(xiàn),在WEB網(wǎng)站中沒有與我們所需信息完全吻合的數(shù)據(jù)信息,我們就將我們所要得到的信息進(jìn)行簡(jiǎn)化,所謂簡(jiǎn)化不是一味的刪除關(guān)鍵詞,而是對(duì)各個(gè)關(guān)鍵詞進(jìn)行逐字分析,弄懂其包含的意義,然后結(jié)合我們實(shí)際的工作需要,將關(guān)鍵詞進(jìn)行有效的排序,排在前面的將作為我們首先要輸入的關(guān)鍵詞,直至出現(xiàn)與我們所需信息一致的信息為止,對(duì)于我們?cè)谑状蔚乃阉鬟^程中沒有體現(xiàn)出來的關(guān)鍵詞,我們要進(jìn)行單獨(dú)的處理,然后將他們有機(jī)的融合在一起即可。在數(shù)據(jù)挖掘完成后,我們還需要進(jìn)行數(shù)據(jù)整理,將得到的信息進(jìn)行有機(jī)的整理也是數(shù)據(jù)挖掘技術(shù)的一個(gè)重要組成部分,根據(jù)我們工作的性質(zhì)和目的,結(jié)合我們的實(shí)際工作過程,將我們挖掘到的信息整理成我們所需的那種形式表達(dá)出來,這就是整個(gè)WEB數(shù)據(jù)挖掘技術(shù)的過程。

        3 web數(shù)據(jù)挖掘的分類

        每個(gè)概念每項(xiàng)技術(shù)都有其歸屬,網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)也有不同的分類標(biāo)準(zhǔn),按照挖掘?qū)ο筮M(jìn)行分類我們可以將web數(shù)據(jù)挖掘分為web內(nèi)容的挖掘、web結(jié)構(gòu)的挖掘、wab使用記錄的挖掘三類,下面對(duì)這三類web數(shù)據(jù)挖掘技術(shù)進(jìn)行簡(jiǎn)要介紹。

        3.1 web數(shù)據(jù)內(nèi)容挖掘

        Web數(shù)據(jù)內(nèi)容挖掘我們從其字面意思上就可以對(duì)這種挖掘有個(gè)大致的了解。所謂web數(shù)據(jù)內(nèi)容挖掘的針對(duì)對(duì)象就是對(duì)web網(wǎng)站中實(shí)際數(shù)據(jù)內(nèi)容進(jìn)行深度挖掘,我們可以進(jìn)行網(wǎng)頁信息的深度挖掘,也可以根據(jù)我們的需要進(jìn)行網(wǎng)頁數(shù)據(jù)格式的挖掘,從網(wǎng)頁信息的角度考慮,我們可以在網(wǎng)頁上實(shí)際的選擇我們真正需要的數(shù)據(jù)內(nèi)容,或者將幾個(gè)網(wǎng)頁的數(shù)據(jù)內(nèi)容進(jìn)行有機(jī)的結(jié)合;從網(wǎng)頁數(shù)據(jù)格式的角度考慮,我們可以挖掘我們需要的那種數(shù)據(jù)格式,網(wǎng)頁格式包括音頻、視頻、文本、圖片等等,以提高我們工作效率和工作質(zhì)量為原則,我們可以根據(jù)我們的實(shí)際需要選擇最理想的web數(shù)據(jù)挖掘內(nèi)容。

        3.2 web數(shù)據(jù)結(jié)構(gòu)挖掘

        Web結(jié)構(gòu)挖掘是另一種web數(shù)據(jù)挖掘的分類,所謂web結(jié)構(gòu)挖掘?qū)嶋H上是一種鏈接數(shù)據(jù)挖掘,我們可以利用鏈接分析來達(dá)到我們數(shù)據(jù)挖掘的目的,也就是說我們?cè)趙eb中輸入我們所需要的信息的關(guān)鍵詞,在網(wǎng)頁上就會(huì)自動(dòng)的彈出很多的鏈接供我們進(jìn)行自由選擇,我們根據(jù)我們的世界需要進(jìn)行鏈接的點(diǎn)擊和數(shù)據(jù)的獲取。我們對(duì)所得到的網(wǎng)頁進(jìn)行有效的分類通過分類來達(dá)到網(wǎng)頁之間數(shù)據(jù)對(duì)比和相似度分析的目的。在我們的日常工作中利用web結(jié)構(gòu)挖掘進(jìn)行工作的地方有很多。例如無論我們是大學(xué)畢業(yè)還是在評(píng)職稱的過程中,發(fā)表論文都是我們每個(gè)人的必經(jīng)之路,我們所寫的論文在發(fā)表之前都要進(jìn)行論文檢測(cè),以達(dá)到檢測(cè)相似度的目的,這個(gè)論文檢測(cè)就是對(duì)web數(shù)據(jù)結(jié)構(gòu)挖掘的一個(gè)很好的利用。

        3.3 web使用記錄挖掘

        Web使用記錄挖掘是除了web數(shù)據(jù)內(nèi)容挖掘和web數(shù)據(jù)結(jié)構(gòu)挖掘以外的另一種非常重要的數(shù)據(jù)挖掘形式。Web數(shù)據(jù)內(nèi)容挖掘和web數(shù)據(jù)結(jié)構(gòu)挖掘都是對(duì)web網(wǎng)頁進(jìn)行挖掘的一個(gè)形式,web使用記錄挖掘與他們不同,web使用記錄挖掘是建立在web數(shù)據(jù)內(nèi)容挖掘和web數(shù)據(jù)結(jié)構(gòu)挖掘基礎(chǔ)上的一種挖掘形式,是用戶與網(wǎng)路服務(wù)器在進(jìn)行交互的過程中形成的一種數(shù)據(jù)挖掘形式,web使用記錄挖掘的對(duì)象包括很多,它包括計(jì)算機(jī)注冊(cè)的信息、服務(wù)器的登錄次數(shù)和日志等等。Web使用記錄挖掘從本質(zhì)上講是對(duì)wab數(shù)據(jù)內(nèi)容挖掘和web數(shù)據(jù)結(jié)構(gòu)挖掘的二次挖掘,是對(duì)它們所蘊(yùn)含的數(shù)據(jù)的又一次過濾,幫助我們過去更加有效的數(shù)據(jù)信息。

        Web數(shù)據(jù)內(nèi)容挖掘、web數(shù)據(jù)結(jié)構(gòu)挖掘、web使用記錄挖掘是我們?cè)谌粘5臄?shù)據(jù)挖掘中經(jīng)常用到的三種挖掘形式,在它們之間也有一定的聯(lián)系,他們?nèi)呦噍o相成,我們可以根據(jù)自己的實(shí)際工作需要選擇合適的方法進(jìn)行數(shù)據(jù)挖掘,也可以綜合利用三種挖掘形式進(jìn)行數(shù)據(jù)挖掘。

        4 web數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)

        在我們的互聯(lián)網(wǎng)上蘊(yùn)藏著大量的信息供我們選擇,在互聯(lián)網(wǎng)上找到真正適合我們的有效信息目前已經(jīng)成為了一個(gè)難題,通過網(wǎng)絡(luò)開發(fā)人員的不斷努力,目前XML是我們解決這個(gè)問題的一個(gè)重要的技術(shù)。XML可以將不同位置、不同結(jié)構(gòu)形式、不同內(nèi)容的數(shù)據(jù)有機(jī)的結(jié)合在一起,幫助我們進(jìn)行web數(shù)據(jù)挖掘的實(shí)現(xiàn)。Web數(shù)據(jù)難以整理主要是有web數(shù)據(jù)的特點(diǎn)造成的,其中異構(gòu)數(shù)據(jù)庫環(huán)境、半結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)、是web數(shù)據(jù)兩個(gè)最重要的特點(diǎn),web數(shù)據(jù)的這兩個(gè)特點(diǎn),導(dǎo)致在不同位置、不同結(jié)構(gòu)的數(shù)據(jù)很難有機(jī)的集合在一起,而XML很好的為我們解決了這一點(diǎn),XML形象的被我們稱作是數(shù)據(jù)的中介機(jī)構(gòu),它的出現(xiàn)可以有機(jī)的將不同形式、不同格式的數(shù)據(jù)內(nèi)容建立一一對(duì)應(yīng)的關(guān)系,幫助我們把不同的數(shù)據(jù)有機(jī)的柔和在一起,供我們方便使用。隨著web數(shù)據(jù)挖掘的應(yīng)用日趨廣泛,這種XML技術(shù)被逐漸完善,通過軟件開發(fā)人員的不斷努力,目前,XML技術(shù)已經(jīng)具有操作簡(jiǎn)單、高效率、通用率高等諸多優(yōu)點(diǎn),而且,XML還實(shí)現(xiàn)了國(guó)際化,我們可以在世界網(wǎng)絡(luò)范圍內(nèi)進(jìn)行web數(shù)據(jù)的挖掘,擴(kuò)大了我們的知識(shí)范圍,為方便我們?nèi)粘9ぷ?,提高我們獲取有效信息的效率做出了巨大的貢獻(xiàn)。下面對(duì)web數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)步驟進(jìn)行簡(jiǎn)要描述:第一,用戶輸入已知的樣本,作為獲取數(shù)據(jù)的已知條件;第二,根據(jù)數(shù)據(jù)內(nèi)容,歸納數(shù)據(jù)特征,并利用一定的數(shù)據(jù)統(tǒng)計(jì)方法準(zhǔn)確的計(jì)算他們的權(quán)值。第三,獲取大量的網(wǎng)絡(luò)信息,也就是在搜索引擎中輸入我們要查找信息的關(guān)鍵詞,在網(wǎng)頁中顯示出很多的信息供我們選擇,這些信息包含不同的數(shù)據(jù)特點(diǎn),數(shù)據(jù)格式;最后,利用事先計(jì)算好的數(shù)據(jù)特征,對(duì)現(xiàn)在獲取的大量信息進(jìn)行匹配,并要求計(jì)算機(jī)將最吻合的信息反饋給用戶。這就是web數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)過程。

        5 結(jié)語

        Web數(shù)據(jù)挖掘技術(shù)是目前數(shù)據(jù)處理行業(yè)的一個(gè)重要的技術(shù),我國(guó)任何行業(yè)的發(fā)展與進(jìn)步都需要大量的數(shù)據(jù),我們?cè)谌粘I詈凸ぷ髦幸捕夹枰獜膚eb中獲取大量的有價(jià)值數(shù)據(jù),web數(shù)據(jù)挖掘技術(shù)可以有效的幫助我們進(jìn)行數(shù)據(jù)獲取,在為我們節(jié)約時(shí)間的同時(shí)獲取大量有價(jià)值的數(shù)據(jù)供我們?nèi)粘I詈凸ぷ魉?。Web數(shù)據(jù)挖掘技術(shù)是一項(xiàng)由計(jì)算機(jī)技術(shù)和數(shù)據(jù)挖掘技術(shù)共同組成的復(fù)雜技術(shù),這項(xiàng)技術(shù)的出現(xiàn)和不斷完善,對(duì)我們的日常生活起到了非常重要的作用,為提高我們的生活質(zhì)量和工作效率做出了巨大的貢獻(xiàn)。

        參考文獻(xiàn):

        [1]高燕,胡景濤.web數(shù)據(jù)挖掘原理、方法及應(yīng)用[J].現(xiàn)代圖書情報(bào)技術(shù),2012(03):51-53.

        [2]王玉珍.web數(shù)據(jù)挖掘分析與探索[J].計(jì)算機(jī)發(fā)展與應(yīng)用,2009(6):73-76.

        [3]范亞芹,劉穎.web數(shù)據(jù)挖掘的原理與實(shí)現(xiàn)技術(shù)[J].吉林大學(xué)學(xué)報(bào),2006(8):370-373.

        [4]高月,梁本亮.淺談網(wǎng)絡(luò)信息挖掘[J].通信電源技術(shù),2005(2):30-33.

        作者簡(jiǎn)介:劉珊珊(1982.06-),女,河北唐山人,計(jì)算機(jī)技術(shù)碩士,講師,從事計(jì)算機(jī)相關(guān)問題研究。

        作者單位:甘肅中醫(yī)學(xué)院信息工程學(xué)院,蘭州 730000

        四虎影视免费观看高清视频 | 中文字幕亚洲乱码熟女1区2区| 国产麻豆久久av入口| 永久黄网站色视频免费看| 精品国产v无码大片在线观看| 亚洲av无码一区二区三区天堂古代| 国产无套护士在线观看| 亚洲欧美日韩精品高清| 久久精品蜜桃美女av| 深夜爽爽动态图无遮无挡| 亚洲日韩v无码中文字幕| 亚洲精品中文字幕不卡在线| 亚洲发给我的在线视频| 国产精品无码一区二区三区在| 老子影院午夜精品无码| 日韩一区二区不卡av| 久久久亚洲成年中文字幕| 久久久久亚洲av成人网人人软件| 亚洲av无码一区二区三区性色| 亚洲色婷婷综合开心网 | 国产精品沙发午睡系列| 国产成人av片在线观看| 人妻人人澡人人添人人爽人人玩| 亚洲综合色区无码专区| 求网址日韩精品在线你懂的| 亚洲 欧美 偷自乱 图片| 亚洲aⅴ天堂av天堂无码麻豆| 亚洲三级香港三级久久| 国产中文字幕一区二区视频| 久久伊人精品一区二区三区| 国产美女遭强高潮网站| 一片内射视频在线观看| 久久久国产精品123| 久久夜色精品国产噜噜麻豆| 亚洲熟女av超清一区二区三区| 久久久亚洲av午夜精品| 熟女少妇内射日韩亚洲| 99ri国产在线观看| 亚洲一区二区视频免费看| 久久久亚洲欧洲日产国码aⅴ| 亚洲自偷自偷偷色无码中文|