任海燕
摘 要 云計算在當前的計算機技術(shù)發(fā)展中是熱度很高的話題,對于它的具體定義描述,到目前還沒有一個較為權(quán)威統(tǒng)一的標準。從它的結(jié)構(gòu)構(gòu)成來講,它是一種新興的共享基礎架構(gòu)和方法,它的開展基礎是公開的標準和服務,圍繞互聯(lián)網(wǎng)為中心來提供相關(guān)服務,它在當前社會的大多數(shù)領域都有了廣泛的應用和體現(xiàn),涉及到諸多的領域,需要在具體應用時進行綜合全面的把握,基于此,本文就在分析云計算開放環(huán)境和系統(tǒng)的關(guān)鍵研發(fā)基礎上,對云計算模式下的數(shù)據(jù)挖掘平臺原型建立進行了分析,闡述了平臺在實際應用中的擴展性和通用性,可以給相關(guān)領域的研究學者提供參考作用。
【關(guān)鍵詞】云計算 數(shù)據(jù)挖掘 應用 有效性
隨著社會發(fā)展的不斷進步,對于數(shù)據(jù)挖掘系統(tǒng)的建立和研發(fā)工作也取得了一定的成效,雖然國內(nèi)外研究學者已經(jīng)研發(fā)出了多種形式的數(shù)據(jù)挖掘系統(tǒng),但是都或多或少的存在著一些缺陷和不足,像價格成本高、復雜繁瑣等。在新形勢下,隨著云計算模式的出現(xiàn),它為大量數(shù)據(jù)的分析提供了一種快捷低價的應對方案,使數(shù)據(jù)挖掘平臺的建立有了可行性的趨勢,云計算從實質(zhì)上來說,它是一種在計算機網(wǎng)絡結(jié)構(gòu)下的超級計算模式,具有存儲能力強、計算能力可彈性明顯等的特點,可以有效的實現(xiàn)大量數(shù)據(jù)挖掘的工作。
1 云計算的綜述
云計算的實質(zhì)是一種計算服務,它是由計算資源和軟件以及其他各種信息資源共同構(gòu)成的,它可以在網(wǎng)絡技術(shù)的支持下,脫離空間的限制,使用計算機或者是其他相關(guān)設備等來進行終端的訪問。云計算中的“云”是一個并行和分布式的系統(tǒng),它的構(gòu)成是由互相牽連的虛擬計算機實現(xiàn)的,可以實現(xiàn)被動的部署,最后作為一個或多個統(tǒng)一計算資源來體現(xiàn),它的服務形式是基于服務運營商和用戶兩者之間進行協(xié)商的服務等級協(xié)議,并在這個協(xié)議下提供服務。此外,從另一層面來說,它還是一個彈性空間很大的資源執(zhí)行環(huán)境,關(guān)系到諸多的利益方,并對其提供可以進行計量的服務,筆者所講的云屬于是基礎平臺,可以以多種形式在不同的資源上進行執(zhí)行。
2 數(shù)據(jù)挖掘技術(shù)
當前形勢下數(shù)據(jù)挖掘技術(shù)已經(jīng)得到了實際應用,主要涉及到關(guān)聯(lián)規(guī)則、分類、聚類以及預測和序列模式。
2.1 關(guān)聯(lián)規(guī)則
它分為兩個類型,一是Apriori算法;二是頻繁模式增長算法。那么任何一種模式的發(fā)現(xiàn)都是在同一個交易數(shù)據(jù)庫中的特定項目和其他項目之間的關(guān)系基礎上。
2.2 分類
它是一種利用數(shù)學方法來完成的技術(shù),包括線性規(guī)劃、神經(jīng)網(wǎng)絡等。在進行分類的過程中在軟件作用下可以掌握數(shù)據(jù)項分組的方法。
2.3 聚類
聚類技術(shù)也對類和類中的對象進行了闡述,在這種技術(shù)下,相同類型的數(shù)據(jù)可以規(guī)劃到一起,并有明確的標注,便于查找應用。
2.4 預測
預測主要用于發(fā)現(xiàn)自變量之間及其和因變量之間的關(guān)系,那么實際案例中,可以把銷售額作為自變量,利潤為因變量,進而預測到未來的銷售利潤。
2.5 序列模式
它是一種在事件發(fā)生的時間順序上相關(guān)的數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)的模式主要用于各種不同數(shù)據(jù)之間關(guān)系的深層化分析研究。例如2010年,Kawuu W.Lin等所提出的多任務頻繁模式挖掘的策略。
3 云計算環(huán)境下的數(shù)據(jù)挖掘優(yōu)勢分析
在云計算環(huán)境下來進行數(shù)據(jù)的挖掘工作,這在當前形勢發(fā)展下是具有重要作用的,這與云計算環(huán)境的特性是由很大關(guān)系的,那么在云計算環(huán)境下來分析數(shù)據(jù)挖掘工作的優(yōu)勢就可以從下三方面來闡述:
(1)一般來說,數(shù)據(jù)挖掘是大量的,規(guī)模較大,需要從大量的數(shù)據(jù)中挖掘出理解的知識,這在互聯(lián)網(wǎng)數(shù)據(jù)不斷增長的形勢下,對于其的挖掘任務遠遠超出了搜索任務,有很大的復雜性,這就導致了在進行挖掘的過程中,要具備良好的開發(fā)環(huán)境和應用環(huán)境,那么這種挖掘要求就需要充分的應用到云計算環(huán)境。
(2)在云計算環(huán)境下,可以順利的實現(xiàn)低成本分布式并行計算環(huán)境,基于此,就可以大大降低企業(yè)的數(shù)據(jù)處理成本,而且也擺脫了對高性能機器的依賴性。
(3)在云計算環(huán)境下,進行數(shù)據(jù)開挖活動時十分的便利,對底層有屏蔽作用。而且在并行化條件下,云計算還可以在原有設備的利用基礎上進一步的提高對大規(guī)模數(shù)據(jù)的處理能力和速度,這樣不僅確保了容錯性,而且還起到了增加結(jié)點的作用。
4 云計算環(huán)境下數(shù)據(jù)挖掘平臺的分析
4.1 賬戶管理子系統(tǒng)
賬戶管理的子系統(tǒng)一般是針對于管理用戶對與平臺相關(guān)的服務狀況,進行的一個賬戶收支明細的詳細記載,這個系統(tǒng)是平臺的基礎所在。從它的構(gòu)成結(jié)構(gòu)來看,它主要涉及到四個方面的功能,即支出的明細、收入的明細、賬戶余額以及歷史記錄。這四個方面是相互作用,相互聯(lián)系的,其中每一部分的作用是有區(qū)別的,支出明細主要是對用戶所使用的平臺中的付費服務和設施的明細賬目進行詳細合理的記錄;收入的明細主要涉及到它的兩項主要來源,一是用戶在這個系統(tǒng)下提供平臺的數(shù)據(jù)資源,二是以挖掘算法子系統(tǒng)提供給平臺的先進算法的報酬明細;而賬戶的余額主要是支出和收入之間的差額;最后的歷史記錄是指對用戶登錄平臺之后的所有操作行為進行記載,這樣可以給后期的撤銷操作提供條件。
4.2 數(shù)據(jù)管理的子系統(tǒng)
這個系統(tǒng)是針對于用戶的數(shù)據(jù)資源管理來說的,涉及到用戶自己的數(shù)據(jù)、采購的數(shù)據(jù)以及賣出的數(shù)據(jù)。這個子系統(tǒng)是在云計算的DaaS服務模式基礎上出現(xiàn)的,對于用戶來說,可以在這個系統(tǒng)的作用下,通過平臺來獲得自己所需要的數(shù)據(jù)資源,并且也可以把自己所擁有數(shù)據(jù)提供給平臺,需要注意的是,這個提供是有償性的。它的功能作用主要包含三個方面,我的數(shù)據(jù)、采購數(shù)據(jù)、賣出數(shù)據(jù)。這三個數(shù)據(jù)各有各自的優(yōu)勢,我的數(shù)據(jù),它較為清晰的表示了用戶存放在平臺上的全部數(shù)據(jù)名城;采購數(shù)據(jù),它從平臺采購數(shù)據(jù),然后在系統(tǒng)的作用下對這些數(shù)據(jù)所進行存放的數(shù)據(jù)庫名城按照列表的形式顯示給用戶;賣出數(shù)據(jù),它是用戶所賣出的平臺數(shù)據(jù)的詳細記錄列表進行的顯示。
4.3 挖掘算法管理子系統(tǒng)
這種系統(tǒng)主要是針對于管理數(shù)據(jù)挖掘子系統(tǒng)所需要的算法和模型來說的,并且還可以協(xié)助完成數(shù)據(jù)挖掘子系統(tǒng)中的自定義功能的算法獲取作用。從這種系統(tǒng)的結(jié)構(gòu)構(gòu)成來說,它包含有系統(tǒng)算法、算法歷史記錄以及自定義算法等的基本功能。這個功能之間是相互聯(lián)系的作用,各有各自的特點,系統(tǒng)算法,它可以較為清晰明確的列出平臺所擁有的挖掘算法和相關(guān)的介紹等;對于算法記錄來說,它可以對用戶所使用的全部算法進行合理的記錄;自定義算法主要是指用戶根據(jù)自身需求所創(chuàng)作出的算法,也可以是經(jīng)過改進創(chuàng)新的算法。
4.4 服務器群
服務群的存在主要是對用戶提供高效的平臺訪問、數(shù)據(jù)操作等的一系列服務。這種服務群所采用的虛擬技術(shù)以及具體的分布式技術(shù)會把平臺所擁有的本地或者是異地服務器資源進行高效的利用,進而提供高質(zhì)量的服務。在這個平臺的作用下,它可以把服務器直接的租用給客戶,也可以是客戶把自己所具有的閑置服務器已虛擬化等的技術(shù)來租用給平臺,這樣可以確保資源的高效配置,通常情況下,這個服務器群涉及到數(shù)據(jù)庫服務器、數(shù)據(jù)挖掘服務器以及賬戶管理服務器等方面。
5 總結(jié)
現(xiàn)代科學技術(shù)的發(fā)展,使得云計算得到了顯著的普及和應用。云計算自身具有獨特的優(yōu)勢特點,它在大量數(shù)據(jù)挖掘方面具有明顯的優(yōu)勢,而且隨著它的應用領域不斷延伸,人們在加大對其應用的同時,也給云計算環(huán)境下的數(shù)據(jù)開挖提供了很大的便利,而且國家也加大了這方面的政策支持力度,又為云計算環(huán)境下的數(shù)據(jù)開挖實效性注入新的活力。
參考文獻
[1]石杰.云計算環(huán)境下的數(shù)據(jù)挖掘應用[J].微型機與應用,2015,34(05):13-15.
[2]黃章樹,劉晴晴.基于云計算服務模式的數(shù)據(jù)挖掘應用平臺的構(gòu)建[J].電信科學,2012,(01):53-57.
[3]鄧蕾蕾,于航.基于云計算的數(shù)據(jù)挖掘研究及展望[J].計算機與現(xiàn)代化,2012,(05):93-95.
[4]周晏,桑書娟.淺談基于云計算的數(shù)據(jù)挖掘技術(shù)[J].電腦知識與技術(shù),2010,6(34):9681-9683.
[5]蔡興旺,段夢博.云計算及其在數(shù)據(jù)挖掘上的應用研究[J].電腦知識與技術(shù),2010,6(22):6272-6274.
[6]肖云鵬,劉宴兵.云計算關(guān)鍵技術(shù)與應用展望[J].數(shù)字通信,2010,(03):29-31+36.
作者單位
湖南勞動人事職業(yè)學院 湖南省長沙市 410126