董楠楠+牟有靜+文楠
摘 要
隨著計(jì)算機(jī)技術(shù)的開發(fā)與普及,云計(jì)算時(shí)代正式來臨,基于云計(jì)算的大批量的數(shù)據(jù)挖掘,也自然成為了解決傳統(tǒng)集中式數(shù)據(jù)挖掘無法適應(yīng)大量數(shù)據(jù)不斷增長這一問題的主要方法。故文章將主要對云計(jì)算含義進(jìn)行探討,對云計(jì)算特點(diǎn)進(jìn)行分析,并且深入討論數(shù)據(jù)挖掘技術(shù)優(yōu)勢,以供參考。
【關(guān)鍵詞】云計(jì)算 數(shù)據(jù)挖掘技術(shù) 技術(shù)改革
數(shù)據(jù)挖掘主要是指從復(fù)雜的、大量的、模糊的、隨機(jī)的數(shù)據(jù)當(dāng)中進(jìn)行探索與篩選,并集中識別出清晰的、有效的、新穎的、有實(shí)質(zhì)作用的數(shù)據(jù)的過程。基于網(wǎng)絡(luò)平臺上大批量且持續(xù)增長的數(shù)據(jù)進(jìn)行查找與篩選,最然有了更多資源作為基礎(chǔ),但同時(shí)也大幅度提升了數(shù)據(jù)挖掘的難度,故文中將主要針對基于云計(jì)算的數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,提供改革意見。
1 云計(jì)算的具體含義分析
云計(jì)算技術(shù)具有先進(jìn)的科學(xué)理念,借助于當(dāng)前網(wǎng)絡(luò)中復(fù)雜的計(jì)算機(jī)處理程序,把大程序拆分成多個(gè)小程序,并且利用錯(cuò)綜復(fù)雜的服務(wù)器網(wǎng)絡(luò)進(jìn)行細(xì)化搜索和計(jì)算,在成功發(fā)掘和搜索之后,需要把相應(yīng)的處理結(jié)果回饋給相關(guān)的用戶。利用這種先進(jìn)的技術(shù),使用這種服務(wù)的用戶可以在短時(shí)間內(nèi)有效的處理大量的信息內(nèi)容,并且完成相應(yīng)的網(wǎng)絡(luò)工作。當(dāng)前的網(wǎng)絡(luò)平臺中,云計(jì)算技術(shù)比較常見,比如網(wǎng)絡(luò)信箱以及搜尋引擎等等。相關(guān)的使用者需要使用加密信息和帳號,進(jìn)而方便的獲得針對性的信息內(nèi)容。在將來的科技發(fā)展中,通過使用手機(jī)和GPS等設(shè)備可以利用云計(jì)算技術(shù)來拓展種類繁多的服務(wù)形式。在當(dāng)前云計(jì)算技術(shù)發(fā)展的流程中,云計(jì)算可以完成更為復(fù)雜和先進(jìn)的工作,可以擺脫資料分析和搜尋的限制,進(jìn)而完成DNA結(jié)構(gòu)分析,完成對于基因圖譜的定序等較為復(fù)雜的任務(wù)內(nèi)容。當(dāng)前大規(guī)模的分布式計(jì)算技術(shù)已經(jīng)相對成熟,這就是云計(jì)算概念的發(fā)源。只要在有網(wǎng)絡(luò)的地區(qū),我們已經(jīng)完全可以拋棄U盤等移動設(shè)備,只需要登入網(wǎng)絡(luò)大數(shù)據(jù)平臺,便可以快捷獲取數(shù)據(jù)并分享數(shù)據(jù),這樣的數(shù)據(jù)共享與存儲模式顯然是更加便利的,但同時(shí)也有很大的風(fēng)險(xiǎn)需要去規(guī)避,那便是安全隱患,只有不斷開發(fā)并升級網(wǎng)絡(luò)安保技術(shù),才能確保云計(jì)算技術(shù)的優(yōu)勢進(jìn)一步發(fā)揮出來。
2 云計(jì)算的特點(diǎn)分析
2.1 超大規(guī)模的特點(diǎn)
“云”這一概念本指無局限的領(lǐng)域,說明著這項(xiàng)技術(shù)的數(shù)據(jù)存儲與互傳空間具有很大的規(guī)模。當(dāng)前國際知名的Google公司,為運(yùn)行其云計(jì)算平臺,已經(jīng)先后開啟了100多萬臺的服務(wù)器,除此以外,亞馬遜、微軟、IBM、雅虎等大型互聯(lián)網(wǎng)企業(yè)所建立的云平臺,均擁有幾十萬臺的服務(wù)器。這些服務(wù)器能夠進(jìn)一步提升網(wǎng)絡(luò)平臺數(shù)據(jù)運(yùn)算、存儲及交互的效率。
2.2 虛擬化的特點(diǎn)
借助云計(jì)算技術(shù),網(wǎng)絡(luò)用戶能在任意的位置、使用各類終端獲取應(yīng)用服務(wù)。在網(wǎng)絡(luò)平臺上所請求的資源均來自云平臺,并不是固定有形的實(shí)體。無論是儲存、搜索或是互傳,都在不存在實(shí)體的云平臺中運(yùn)行,但除去技術(shù)人員以外,實(shí)際上網(wǎng)絡(luò)用戶在應(yīng)用過程中并不需要詳細(xì)了解運(yùn)行的具體位置。只需要一臺電腦或是一部手機(jī),就可以借助網(wǎng)絡(luò)服務(wù)來獲取所需要的信息,甚至完成數(shù)據(jù)的秒速上傳與下載。
2.3 高可靠性的特點(diǎn)
云平臺普遍使用數(shù)據(jù)多副本容錯(cuò)及計(jì)算節(jié)點(diǎn)同構(gòu)可互換等措施來確保數(shù)據(jù)上傳、下載、存儲及互傳等服務(wù)的可靠性,部分類型的平臺上,數(shù)據(jù)即便丟失也有可能找回的渠道,比起使用計(jì)算機(jī)自帶硬盤,使用網(wǎng)絡(luò)云計(jì)算平臺更為可靠。
2.4 通用性的特點(diǎn)
云計(jì)算技術(shù)的應(yīng)用,并不具備很強(qiáng)的針對性,只要是在網(wǎng)絡(luò)平臺上建設(shè)平臺,且具備了充足的服務(wù)器,便可完成,在云計(jì)算技術(shù)的支撐下,技術(shù)人員能夠構(gòu)造出千變?nèi)f化的應(yīng)用,同一個(gè)云平臺可以同時(shí)支撐不同設(shè)備的應(yīng)用運(yùn)行。
2.5 可擴(kuò)展性的特點(diǎn)
云平臺的規(guī)模普遍是可以動態(tài)伸縮的,進(jìn)而滿足不同類型企業(yè)及個(gè)人用戶的需求,用戶能夠根據(jù)自身的需求去定制所需空間的大小、功能等等,是十分人性化的,這樣的特點(diǎn)能夠使平臺應(yīng)用更具針對性。
2.6 按需服務(wù)
云平臺是龐大的資源池,但用戶所要存儲、調(diào)用或是傳輸?shù)臄?shù)據(jù)是有限的,所以在云平臺提供了充足空間的前提下,用戶可以按需購入,這樣能夠避免對網(wǎng)絡(luò)空間的過度占用,云平臺也可以作為資源,如同水、電及天然氣等資源那樣計(jì)費(fèi)是十分科學(xué)的。
2.7 建設(shè)成本低
由于云平臺有著特殊的容錯(cuò)措施,因此可以采用很多的節(jié)點(diǎn)去構(gòu)成一個(gè)無縫的數(shù)據(jù)網(wǎng),云平臺的自動化集中式管理,使得許多的企業(yè)都無需負(fù)擔(dān)日益高昂的數(shù)據(jù)中心建設(shè)與管理成本。這不僅有助于平臺規(guī)模的拓展,而且企業(yè)建設(shè)云平臺的成本低廉,用戶便也可以以低廉的價(jià)格獲取自身專屬云空間及服務(wù),只要能夠確保環(huán)境安全,必然會成為未來的大勢所趨。
3 基于云計(jì)算的數(shù)據(jù)挖掘的優(yōu)勢
鑒于數(shù)據(jù)挖掘處理工作過程中所涉及的數(shù)據(jù)是大批量并且不斷增長的,因此為完成信息的上傳、下載、存儲及互傳,網(wǎng)絡(luò)用戶必須要從大批量的數(shù)據(jù)當(dāng)中進(jìn)行挖掘篩選,最終在無法預(yù)計(jì)的巨大數(shù)據(jù)群中篩選出符合自身需求的數(shù)據(jù)信息。同時(shí),因?yàn)榛ヂ?lián)網(wǎng)中的數(shù)據(jù)增長速度極為驚人,所以需要利用更為復(fù)雜的方法來發(fā)掘數(shù)據(jù),在實(shí)際的發(fā)掘中,需要構(gòu)建完善的開發(fā)環(huán)境和應(yīng)用環(huán)境,同時(shí)需要持續(xù)的優(yōu)化發(fā)掘思路和手段。利用這種方式,可以完善當(dāng)前基于云計(jì)算平臺的數(shù)據(jù)挖掘環(huán)境。與此同時(shí),利用云計(jì)算技術(shù),可以構(gòu)建發(fā)揮云計(jì)算功能的分布式計(jì)算環(huán)境,企業(yè)通過應(yīng)用這方面的技術(shù)可以降低自己的運(yùn)營成本,同時(shí)可以提升網(wǎng)絡(luò)應(yīng)用的效率,可以快速的處理網(wǎng)絡(luò)平臺中的關(guān)鍵數(shù)據(jù),這樣顯著提升了容錯(cuò)率,并且擴(kuò)充了結(jié)點(diǎn)。
4 結(jié)語
綜上所述,本文探討了云計(jì)算的概念和相關(guān)的理論,分析了當(dāng)前云計(jì)算應(yīng)用的特征以及今后的發(fā)展方向、主要發(fā)展趨勢等等。一方面,分析了云計(jì)算技術(shù)在數(shù)據(jù)發(fā)掘和研究方面的巨大優(yōu)勢,一方面看到了云計(jì)算技術(shù)在數(shù)據(jù)發(fā)掘方面的能力和碰到的嚴(yán)峻挑戰(zhàn),對此,需要給出相對合理的解決思路和建議,并且落實(shí)相應(yīng)的改革措施。最近幾年來,世界范圍內(nèi)各個(gè)國家都開始關(guān)于云計(jì)算技術(shù),在不遠(yuǎn)的將來,云計(jì)算技術(shù)可以再一次突破技術(shù)的平靜,進(jìn)而在數(shù)據(jù)發(fā)掘方面實(shí)現(xiàn)新的飛躍,這是不可否認(rèn)的必然趨勢,需要得到所有網(wǎng)絡(luò)技術(shù)人員的重視。
參考文獻(xiàn)
[1]尹雪婷,程強(qiáng),許惠惠.基于云計(jì)算的數(shù)據(jù)挖掘技術(shù)[J].信息與電腦(理論版),2015(21):60+63.
[2]朱江.基于云計(jì)算的數(shù)據(jù)挖掘平臺架構(gòu)及其關(guān)鍵技術(shù)研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2014,17(21):111+113.
[3]宋秋銀.基于云計(jì)算的數(shù)據(jù)挖掘技術(shù)研究[J].電腦編程技巧與維護(hù),2013(08):87-88+91.
作者單位
遼寧大學(xué) 遼寧省沈陽市 110035endprint