楊繼武 河北旅游職業(yè)學(xué)院
Web數(shù)據(jù)挖掘能夠有效的為用戶提供各種網(wǎng)絡(luò)信息,并且?guī)椭脩糇钭羁斓臅r(shí)間內(nèi)尋找到自己所需要的知識(shí),但是在Web數(shù)據(jù)挖掘發(fā)展的過(guò)程中卻并沒(méi)有能夠及及時(shí)解決之時(shí)發(fā)現(xiàn)的問(wèn)題,也沒(méi)有深入的分析外部信息資源中所隱藏的知識(shí),為此人們對(duì)于Web數(shù)據(jù)挖掘的要求也不斷增多,而通過(guò)利用云計(jì)算技術(shù)實(shí)現(xiàn)了分布式信息的獲取,提高Web數(shù)據(jù)挖掘的效果,保證知識(shí)技術(shù)的存取,有效提高Web數(shù)據(jù)挖掘的質(zhì)量。
云計(jì)算作為互聯(lián)網(wǎng)計(jì)算的一種,能夠?qū)Y源軟件信息進(jìn)行共享,并且可以根據(jù)不同的方式為計(jì)算機(jī)和設(shè)備提供信息咨詢,云計(jì)算技術(shù)可以在web瀏覽器在線應(yīng)用服務(wù)程序中進(jìn)行廣泛的應(yīng)用,而且云計(jì)算技術(shù)還包括各種各樣的產(chǎn)品,極大的提高數(shù)據(jù)處理的質(zhì)量和水平[1]。云計(jì)算作為信息時(shí)代的一種新興產(chǎn)物主要就是指在信息爆炸時(shí)代所產(chǎn)生的海量數(shù)據(jù),云計(jì)算技術(shù),能夠從各種海量數(shù)據(jù)中快速的針對(duì)數(shù)據(jù)信息進(jìn)行收集與整理,從中發(fā)現(xiàn)具有價(jià)值的信息,通過(guò)云計(jì)算技術(shù),能夠針對(duì)數(shù)據(jù)信息進(jìn)行深入挖掘,保證信息的利用效率,而且在云計(jì)算信息處理的過(guò)程中,也能夠保證生命周期得到全面的發(fā)展在云計(jì)算技術(shù)信息處理時(shí),包括數(shù)據(jù)采集,數(shù)據(jù)存儲(chǔ),數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)可視化與及數(shù)據(jù)安全管理等內(nèi)容,通過(guò)這些環(huán)節(jié)能夠保證云計(jì)算信息的整體質(zhì)量和處理水平。
虛擬化作為云計(jì)算的重要基礎(chǔ)技術(shù),能夠保證物理資源的統(tǒng)一轉(zhuǎn)換成為數(shù)字信息利用虛擬化技術(shù)金能夠提高資源利用的質(zhì)量也可以根據(jù)用戶不同的業(yè)務(wù)需求來(lái)快速的對(duì)資源進(jìn)行部署,同時(shí)虛擬化技術(shù)還可以有效擴(kuò)大硬件的存儲(chǔ)容量,保證資源軟件優(yōu)化配置,利用虛擬化技術(shù)還可以使得單CPU模擬多CPU共同運(yùn)算,還能夠在同一個(gè)平臺(tái)運(yùn)行不同的操作系統(tǒng),提高計(jì)算機(jī)整體的運(yùn)行效率,在未來(lái)虛擬化技術(shù)快速發(fā)展的過(guò)程中,通過(guò)多元化的服務(wù)器存儲(chǔ)和網(wǎng)絡(luò),可以有效的將傳統(tǒng)的基礎(chǔ)設(shè)施與網(wǎng)絡(luò)資源進(jìn)行緊密連接,并且成為大型的計(jì)算體系為用戶提供更加優(yōu)質(zhì)的數(shù)據(jù)信息服務(wù)[2]。
云計(jì)算的編程模型必須要關(guān)注后臺(tái)的保障性功能,尤其是在具體的執(zhí)行過(guò)程中,要保證數(shù)據(jù)存儲(chǔ)的合理進(jìn)度,提高云計(jì)算資源利用的水平,也能夠滿足用戶實(shí)際的需求,云計(jì)算采用的編程通常會(huì)以樹(shù)狀圖的形式進(jìn)行構(gòu)建,保證各種任務(wù)能夠快速準(zhǔn)確的完成[3]。首先,云計(jì)算作為一種數(shù)據(jù)信息的服務(wù)和使用模式能夠針對(duì)各種資源信息和應(yīng)用按照實(shí)際需求來(lái)提供服務(wù),通過(guò)云計(jì)算能夠?yàn)樾畔⒓夹g(shù)的快速發(fā)展,提供充足的技術(shù)保障,并且成為國(guó)家大力推廣的新型技術(shù)之一,IDC模式作為數(shù)據(jù)應(yīng)用的主要平臺(tái),必須要在云計(jì)算的基礎(chǔ)上進(jìn)行發(fā)展,但是由于云計(jì)算的架構(gòu)與傳統(tǒng)的架構(gòu)存在明顯的區(qū)別,所以對(duì)于IDC的建設(shè)也存在比較明顯的區(qū)別。通過(guò)將模塊化,按照IDC主動(dòng)進(jìn)行劃分,能夠保證每一個(gè)電芯模塊和機(jī)架的整體數(shù)量進(jìn)行統(tǒng)籌設(shè)計(jì),并且將配電柜、UPS、制冷機(jī)等共同組成一個(gè)模塊化的IDC,保證資源利用效率實(shí)現(xiàn)最大化,同時(shí)通過(guò)這樣的標(biāo)準(zhǔn)化定制,也能夠根據(jù)實(shí)際的業(yè)務(wù)需求來(lái)進(jìn)行制定,由于新型IDC模塊建設(shè)具有高靈活性,而且也能夠進(jìn)行模塊化、標(biāo)準(zhǔn)化、定制化的設(shè)計(jì),還可以通過(guò)將電源空調(diào)機(jī)柜等全部的設(shè)備,完全按照標(biāo)準(zhǔn)化的組件進(jìn)行設(shè)計(jì),保障了整個(gè)IDC設(shè)備裝配的模式化發(fā)展。
Web數(shù)據(jù)挖掘能夠利用Web、W數(shù)據(jù)挖掘、計(jì)算機(jī)語(yǔ)言以及信息學(xué)等多個(gè)學(xué)科共同組成。Web數(shù)據(jù)挖掘通過(guò)與外部進(jìn)行有機(jī)統(tǒng)一,可以顯示出綜合性的特征,并且對(duì)Web數(shù)據(jù)挖掘的對(duì)象進(jìn)行全面的分析,在Web數(shù)據(jù)挖掘的過(guò)程中又能夠?qū)Ω鞣N內(nèi)容和結(jié)構(gòu)進(jìn)行全面的判斷。通過(guò)多種方法能夠有效提取數(shù)據(jù)信息獲取的效果和質(zhì)量,促進(jìn)Web數(shù)據(jù)挖掘?qū)ο蟮木劢筟4]。
隨著云計(jì)算被廣泛的應(yīng)用于網(wǎng)絡(luò)安全、網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳輸?shù)确矫嫱ㄟ^(guò)與Web數(shù)據(jù)挖掘進(jìn)行有機(jī)結(jié)合也能夠擴(kuò)展云計(jì)算的應(yīng)用效果,尤其是在基礎(chǔ)建設(shè)的過(guò)程中,能夠保證Web數(shù)據(jù)挖掘與處理評(píng)估結(jié)果等多種工作共同發(fā)展。
在利用Web數(shù)據(jù)挖掘的過(guò)程中,通過(guò)對(duì)于用戶訪問(wèn)數(shù)據(jù)以及機(jī)器人訪問(wèn)數(shù)據(jù)進(jìn)行分析,能夠快速的對(duì)大規(guī)模的數(shù)據(jù)進(jìn)行過(guò)濾和處理,將有用的信息進(jìn)行整合,而且還能夠?qū)⑾鄬?duì)的數(shù)據(jù)信息轉(zhuǎn)化為xml文件,并且將文件存儲(chǔ)在分布式的文件體系之中,通過(guò)利用數(shù)據(jù)編程的方式可以對(duì)各種數(shù)據(jù)信息集中在數(shù)據(jù)庫(kù)之中,并且可以將所有的操作系統(tǒng)流程進(jìn)行簡(jiǎn)化,滿足數(shù)據(jù)連續(xù)傳播的效果,由于系統(tǒng)自身并不能夠進(jìn)行保存和掃描,而且數(shù)據(jù)的算法也非常的簡(jiǎn)單,所以可以有效的提高系統(tǒng)運(yùn)行的質(zhì)量[5]。
在數(shù)據(jù)存儲(chǔ)的過(guò)程中,通過(guò)云計(jì)算技術(shù)不僅能夠提高數(shù)據(jù)存儲(chǔ)的效率,而且還可以對(duì)數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)失效的問(wèn)題進(jìn)行分析,加強(qiáng)數(shù)據(jù)遷移以及數(shù)據(jù)存儲(chǔ)的整體內(nèi)容,在云計(jì)算數(shù)據(jù)存儲(chǔ)的過(guò)程中,通過(guò)開(kāi)源系統(tǒng)可以幫助數(shù)據(jù)的整合,加強(qiáng)數(shù)據(jù)存儲(chǔ)與計(jì)算遷移的工作效率最終實(shí)現(xiàn)商業(yè)化的發(fā)展[6]。
結(jié)論:本文對(duì)云計(jì)算的Web數(shù)據(jù)挖掘進(jìn)行深入的分析和研究,能夠明確云計(jì)算環(huán)境下Web數(shù)據(jù)挖掘的處理,并且提高數(shù)據(jù)研究的整體質(zhì)量和水平。