王永
【摘要】數(shù)據(jù)挖掘技術(shù)作為現(xiàn)代科技領(lǐng)域當(dāng)中的一部分,該技術(shù)已經(jīng)完成從一個隨機的大量數(shù)據(jù)包中提取有效是數(shù)據(jù)信息的技術(shù)過渡到挖掘數(shù)據(jù)信息潛在價值的過程。在云計算技術(shù)等核心技術(shù)的支撐下,數(shù)據(jù)挖掘平臺的架構(gòu)更為穩(wěn)固,且能夠在融合了統(tǒng)計學(xué)、模式識別等方面科技元素的基層上,更好地執(zhí)行高經(jīng)濟(jì)性的還來那個數(shù)據(jù)處理任務(wù)。本文就針對基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)及其相關(guān)的虛擬化技術(shù)、云計算技術(shù)以及并行云計算技術(shù)等諸多關(guān)鍵技術(shù)進(jìn)行深入剖析。
【關(guān)鍵詞】云計算 數(shù)據(jù)挖掘 平臺架構(gòu) 關(guān)鍵技術(shù)
隨著信息時代的快速發(fā)展,云計算和數(shù)據(jù)挖掘等相關(guān)技術(shù)已然滲入在人們的生活與工作中,支撐著諸如電子商務(wù)、商業(yè)金融以及科研項目開發(fā)等方面的運作。從以往的技術(shù)實踐成果來看,將云計算應(yīng)用到數(shù)據(jù)挖掘平臺的框架之中,能夠解決針對海量數(shù)據(jù)的技術(shù)處理問題。
一、基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)分析
l、淺析云計算技術(shù)與數(shù)據(jù)挖掘技術(shù)。簡單來說,“云計算”是一種基于互聯(lián)網(wǎng)平臺管理的新型網(wǎng)絡(luò)化服務(wù)模式,能夠?qū)崿F(xiàn)信息資源的儲存以及資源的共享等目標(biāo)。數(shù)據(jù)挖掘技術(shù),則是為了挖掘海量數(shù)據(jù)信息當(dāng)中含有某些具備潛在價值的數(shù)據(jù)信息而研發(fā)出來的,該技術(shù)具有明顯的關(guān)聯(lián)特性、聚類屬性等等技術(shù)特征,在人工智能項目方面的應(yīng)用較多。
2、剖析基于云計算技術(shù)的數(shù)據(jù)挖掘平臺的架構(gòu)?;谠朴嬎慵夹g(shù)的數(shù)據(jù)挖掘平臺的基本框架主要有四項內(nèi)容,其核心是圍繞著數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)查詢處理、數(shù)據(jù)存儲與數(shù)據(jù)操控這一主線來搭建的?;谠朴嬎慵夹g(shù)的數(shù)據(jù)額挖掘平臺是在云計算技術(shù)平臺、數(shù)據(jù)挖掘能力層、數(shù)據(jù)挖掘服務(wù)層這三個層面的運作之下完成數(shù)據(jù)挖掘任務(wù)的。其中,數(shù)據(jù)挖掘能力層是整個架構(gòu)的核心層,它主要為平臺提供算法并行處理、調(diào)度服務(wù)等,并支持第三方數(shù)據(jù)的融入。另外,數(shù)據(jù)挖掘云服務(wù)層是最直接對外部提供服務(wù)的技術(shù)層面,無論是搜索引擎還是自動調(diào)用云服務(wù)等技術(shù)操作,都需要該層面技術(shù)的支持。實際上,每一個層面的功能都對整個平臺的高效率運作提供支持,從而令整個平臺架構(gòu)更為穩(wěn)定。
從實際情況來看,鑒于云計算技術(shù)與數(shù)據(jù)挖掘平臺的整合應(yīng)用具備一定的可行性,該類型的技術(shù)搭建模式,已經(jīng)為更多的實體領(lǐng)域提供了高效能的技術(shù)服務(wù)。
一、支撐數(shù)據(jù)挖掘平臺架構(gòu)的關(guān)鍵技術(shù)分析
l、數(shù)據(jù)挖掘平臺架構(gòu)的設(shè)立需要云計算技術(shù)的支撐
在目前的技術(shù)水平以及在社會各領(lǐng)域應(yīng)用需求的推動之下,云計算技術(shù)成為了數(shù)據(jù)挖掘平臺架構(gòu)中最核心的技術(shù)手段之一,而且,其中涵蓋了分布式存儲技術(shù)、并行云計算技術(shù)以及虛擬化技術(shù)等等,這些技術(shù)共同為構(gòu)建數(shù)據(jù)挖掘平臺系統(tǒng)提供高水準(zhǔn)的技術(shù)支撐,輔以完成海量動態(tài)標(biāo)準(zhǔn)下的高效率數(shù)據(jù)挖掘服務(wù)。
1、分布式存儲技術(shù)。從數(shù)據(jù)挖掘平臺的理想化搭建方案來看,利用高性能的先進(jìn)軟件能夠彌補傳統(tǒng)硬件的不足之處,尤其是能夠保證存儲數(shù)據(jù)信息的穩(wěn)定性與經(jīng)濟(jì)性。實質(zhì)上,采用分布式存儲技術(shù)就能夠?qū)崿F(xiàn)這一目標(biāo),該技術(shù)是云計算技術(shù)實施數(shù)據(jù)處理的關(guān)鍵技術(shù),以其成熟的技術(shù)形態(tài)以及穩(wěn)定的海量數(shù)據(jù)挖掘支持性能,為整個數(shù)據(jù)挖掘平臺架構(gòu)框架的搭建提供強有力的技術(shù)支撐。
2、并行云計算技術(shù)。相對于分布式存儲技術(shù)而言,并行云計算技術(shù)的應(yīng)用成熟度不夠高,但其對于整個數(shù)據(jù)挖掘平臺的運行效率而言至關(guān)重要。在并行云計算技術(shù)的支持下,挖掘計算任務(wù)處理過程當(dāng)中的任務(wù)并行操作、任務(wù)調(diào)度以及任務(wù)容錯等方面的技術(shù)處理,將依托并行云計算技術(shù)來完成。該技術(shù)為數(shù)據(jù)挖掘平臺系統(tǒng)的穩(wěn)定、高效運作注入了活力。
3、虛擬化技術(shù)。對于數(shù)據(jù)挖掘項目的運行而言,云計算技術(shù)的實現(xiàn)依靠的是虛擬化技術(shù)與整個資源環(huán)境的融合,并將海量的虛擬數(shù)據(jù)資源進(jìn)行統(tǒng)籌管理.再從中挖掘出有價值的數(shù)據(jù)信息。事實上,云計算技術(shù)與虛擬化技術(shù)是一個組合,二者對于云計算環(huán)境下的數(shù)據(jù)挖掘與有效信息數(shù)據(jù)整理等方面都十分關(guān)鍵,相當(dāng)于整套基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)當(dāng)中的“稱重梁”。
此外,支持基于云計算的數(shù)據(jù)挖掘平臺系統(tǒng)運作的關(guān)鍵技術(shù)還有很多,諸如數(shù)據(jù)匯集調(diào)度中心、服務(wù)調(diào)度與管理技術(shù)等等,同時,社會各產(chǎn)業(yè)領(lǐng)域中對數(shù)據(jù)挖掘平臺效能的實際需求也越來越嚴(yán)格,這就助推了更高級技術(shù)的不斷涌現(xiàn),將數(shù)據(jù)挖掘平臺搭建得更加完美。
結(jié)束語:總而言之,在新時期的氛圍中,云計算技術(shù)集合了網(wǎng)絡(luò)技術(shù)以及軟件技術(shù)等多個門類的技術(shù),在云計算的支撐下,搭建起符合當(dāng)前時代應(yīng)用需求的數(shù)據(jù)挖掘平臺,該平臺的運作對于現(xiàn)代商業(yè)發(fā)展與電子科研領(lǐng)域拓展有著積極的意義。從理論研究以及實踐操作成果來看,基于云計算的數(shù)據(jù)挖掘平臺的設(shè)立將會服務(wù)“大數(shù)據(jù)”時代中更廣泛的領(lǐng)域之中,支持不同系統(tǒng)的數(shù)據(jù)挖掘、分析處理等方面的技術(shù)處理,同時,維系整個系統(tǒng)環(huán)境的平穩(wěn)運行。