于桂賓
(承德石油高等??茖W(xué)校管理工程系,河北 承德 067000)
數(shù)據(jù)挖掘技術(shù)是伴隨著近些年來人們的需要而誕生并發(fā)展起來的。這些數(shù)據(jù)也漸漸的開始隨著網(wǎng)絡(luò)的出現(xiàn)而上傳到網(wǎng)絡(luò)上,所以人們也開始在WEB上獲取所需要的信息。而WEB有時(shí)無形的、動(dòng)態(tài)的、頁面也相當(dāng)?shù)膹?fù)雜,因此人們從中找到有利的信息也變得尤為的困難。根據(jù)之前數(shù)據(jù)挖掘技術(shù)的出現(xiàn),也開始出現(xiàn)了WEB挖掘技術(shù),這是人們最理想的工具,可以在WEB上快速、有效的找到所要的主要信息。
數(shù)據(jù)挖掘技術(shù)是為方便人們在大量的數(shù)據(jù)中快速、正確的找到自己想要的信息而應(yīng)運(yùn)而生的技術(shù)。數(shù)據(jù)庫中的信息也可以通過數(shù)據(jù)挖掘技術(shù)進(jìn)行獲取。首先要確定挖掘的目的,其次在大量的數(shù)據(jù)庫中選擇所需數(shù)據(jù),并對數(shù)據(jù)進(jìn)行預(yù)處理和再加工,檢查數(shù)據(jù)的完整性,接下來要進(jìn)行數(shù)據(jù)挖掘的結(jié)果分析和轉(zhuǎn)化,轉(zhuǎn)化為可以被理解的信息,最后再將信息集齊上傳到系統(tǒng)中,供用戶采用[1-2]。數(shù)據(jù)挖掘系統(tǒng)在計(jì)算機(jī)計(jì)算和數(shù)據(jù)特征的支持下增強(qiáng)了系統(tǒng)的檢索的能力。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)與發(fā)展為人們更加準(zhǔn)確與快速的獲取信息帶來了福音。
數(shù)據(jù)挖掘技術(shù)應(yīng)用在WEB上,被稱為WEB挖掘技術(shù)。由于現(xiàn)代網(wǎng)絡(luò)發(fā)展迅速,WEB所涉及的服務(wù)也越來越廣泛,因此所含的信息量也就更大。而WEB挖掘技術(shù)也正是基于這個(gè)龐大的網(wǎng)絡(luò)上的數(shù)據(jù)挖掘技術(shù)[3-5]。
圖1是WEB挖掘技術(shù)的分類結(jié)構(gòu)圖。
由于網(wǎng)絡(luò)上資源量的不斷增大,所以數(shù)據(jù)挖掘技術(shù)開始應(yīng)用在WEB上。由于WEB涉及廣泛,而且具有龐大的數(shù)據(jù)庫系統(tǒng),數(shù)據(jù)量也在與日俱增,所以對于檢索到正確的信息,就需要數(shù)據(jù)挖掘技術(shù),WEB具有異構(gòu)性、動(dòng)態(tài)性,并具有半結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu),因此對于應(yīng)用于WEB上的數(shù)據(jù)挖掘技術(shù)也不能夠照舊全部應(yīng)用在WEB上,而是要根據(jù)WEB的特點(diǎn),根據(jù)檢索的內(nèi)容的不同做相應(yīng)的變通。
現(xiàn)在的很多商務(wù)活動(dòng)都應(yīng)用到現(xiàn)代的電子科技,被人們稱為電子商務(wù)。有著自己的一套完整的經(jīng)營與管理系統(tǒng)。而基于WEB的數(shù)據(jù)挖掘技術(shù)可以通過挖掘訪客的信息,并對其進(jìn)行分類和處理,這樣就能夠?yàn)轭櫩吞峁└玫?、有針對性的營銷計(jì)劃,為客戶量身定做,滿足客戶的要求,為銷售商提供了便利,帶來了更大的利潤。WEB數(shù)據(jù)挖掘除了能夠?qū)τ袨g覽記錄的客戶進(jìn)行挖掘外,還可以為銷售商找到那些未來潛在的客戶,并且能夠通過對以分類的顧客和潛在顧客的特征的對比來判斷是否真的有保留的價(jià)值。我們還可以通過WEB挖掘技術(shù)了解顧客在網(wǎng)絡(luò)上的行為方式,更加準(zhǔn)確的了解顧客的要求與感興趣的事物??梢哉f,WEB挖掘技術(shù)在電子商務(wù)上的應(yīng)用不僅可以使客戶更加的滿意,而且還可以使銷售商更加的了解顧客的需求并獲取更大的利潤見圖2。
由于網(wǎng)絡(luò)的發(fā)展,WEB已經(jīng)是一個(gè)重用的東西了,所以為了滿足各類用戶的需求,加上現(xiàn)在的商業(yè)性網(wǎng)站越來越多,我們就需要了解各類用戶的瀏覽習(xí)慣,就要WEB數(shù)據(jù)挖掘技術(shù)的支持。通過對每個(gè)用戶瀏覽的不同來調(diào)整自己來適應(yīng)大多數(shù)人們的需求。個(gè)性化服務(wù)就是通過WEB數(shù)據(jù)挖掘技術(shù)所獲得的信息與用戶需求來給他們制定用戶所需的瀏覽服務(wù)與網(wǎng)頁。并通過推薦連接等多種形式呈現(xiàn)給用戶。圖3是挖掘技術(shù)應(yīng)用在個(gè)性化服務(wù)中。
通過WEB數(shù)據(jù)挖掘技術(shù),我們可以對網(wǎng)頁上面的一些相關(guān)內(nèi)容進(jìn)行挖掘和采集。并且通過對用戶的提問方式等的歷史記錄的采集并對其進(jìn)行分析預(yù)處理,并對這些提出的問題進(jìn)行擴(kuò)展或挖掘更好的回答,通過WEB數(shù)據(jù)挖掘技術(shù)中的相關(guān)算法對關(guān)鍵詞進(jìn)行加強(qiáng),提高用戶們的檢索效率,同時(shí)也提高了引擎的準(zhǔn)確度。WEB數(shù)據(jù)挖掘技術(shù)對搜索引擎的發(fā)展與進(jìn)步,起到了強(qiáng)大的作用。
數(shù)據(jù)挖掘技術(shù)的出現(xiàn)給人們的生活與信息的獲取帶來了很多的便利。同時(shí)數(shù)據(jù)挖掘技術(shù)的出現(xiàn)也是時(shí)代發(fā)展的必然的歷程。而在數(shù)據(jù)挖掘技術(shù)的不斷地發(fā)展過程中,現(xiàn)代科學(xué)信息技術(shù)也在不斷的發(fā)展過程中。而網(wǎng)絡(luò)也正在被大多數(shù)人所接受和使用中。而WEB中也隨著信息量的不斷增大而導(dǎo)致數(shù)據(jù)庫的增大和混亂,所以人們就將數(shù)據(jù)挖掘技術(shù)應(yīng)用到了WEB上,這樣人們就能夠通過數(shù)據(jù)挖掘技術(shù)在WEB上更好的獲取自己想要的信息。同樣基于WEB的數(shù)據(jù)挖掘技術(shù)應(yīng)用的也很廣泛。商家可以根據(jù)這些技術(shù)來為客戶設(shè)計(jì)合理的、滿足需求的服務(wù)。基于WEB的數(shù)據(jù)挖掘機(jī)技術(shù)給人們和銷售者都同樣的帶來了很多的方便,但是有利也有弊,WEB數(shù)據(jù)挖掘技術(shù)還有很多需要改進(jìn)和加強(qiáng)的地方,隨著社會(huì)科技的發(fā)展,WEB數(shù)據(jù)挖掘技術(shù)還有這更大進(jìn)步的空間。本文主要介紹了WEB數(shù)據(jù)挖掘技術(shù)的概念、特點(diǎn)、并對其及其應(yīng)用進(jìn)行探究。
[1]康曉東.基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術(shù)[M].機(jī)械工業(yè)出版社,2004.
[2]朱越強(qiáng).Web日志挖掘在網(wǎng)站優(yōu)化中的研究與應(yīng)用[D].大連:大連海事大學(xué),2007.
[3]韓家煒,孟小峰,王靜,等.Web挖掘研究[J].計(jì)算機(jī)研究與發(fā)展,2001,27(4):15-18.
[4]王實(shí),高文,李錦濤.Web 數(shù)據(jù)挖掘[J].計(jì)算機(jī)科學(xué),2000,27(4):15 -16.
[5]王學(xué)軍,劉學(xué)軍,王龍,等.數(shù)據(jù)挖掘聚類算法在斜井抽油扶正器設(shè)計(jì)中的應(yīng)用[J].承德石油高等??茖W(xué)校學(xué)報(bào),2013,15(2):20-23.