文世敏
【摘 要】隨著信息技術的快速發(fā)展,大數據技術已經融入人們生活的方方面面,當下社會迎來了大數據時代。數據挖掘技術是大數據時代人類普遍使用的一項技術,也是現如今一項值得重點研究的課題。因為通過對大數據的深入分析對比,人們可以更加深入地了解數據背后所隱藏的奧秘。文章通過對大數據時代、數據挖掘技術的簡要介紹和概括,詳細論述大數據時代下數據挖掘技術的應用。
【關鍵詞】大數據時代;數據;數據挖掘技術;應用
【中圖分類號】P311.13 【文獻標識碼】A 【文章編號】1674-0688(2018)06-0109-02
1 大數據概述
大數據顧名思義就是根據大量數據的集合,而“大”不僅僅是數量大,而且還有容量大、類型多、存儲速度快、應用價值高等含義。大數據這一概念提出于2008年,此后,人們對大數據的了解越來越多,大數據也越來越融入人們的生活,在一定程度上改變著人們的生活。到目前為止,其對金融業(yè)、零售業(yè)、農業(yè)等各個領域都產生了極大的影響,人類社會步入大數據時代。
1.1 大數據的特點
(1)Variety,大數據種類繁多,既包括結構化數據,又包括網絡日志、錄音文件、視頻文件、圖形文件、地理位置信息文件等。
(2)Volume,通過各種各樣的設備產生大量數據,其產生的數據規(guī)模很龐大。
(3)Velocity,處理速度相當快速,對數據的實時處理有著較高的要求。
(4)Value,價值密度低。
1.2 大數據的意義
大數據的意義實際上就是為了挖掘出龐大的數據集合背后的價值。阿里巴巴通過大數據分析每個用戶使用淘寶的瀏覽記錄,追蹤用戶需求,并主動向用戶推薦相關商品。谷歌針對用戶檢索的詞條進行數據挖掘,基于其中45個檢索詞組合的一個數學模型可以高精度預測流感,其預測結果的正確性達到97%,也就是說,誤差率僅為3%。通過大數據,了解這些數據背后的價值,不僅可以總結出行業(yè)目前的發(fā)展狀況,還能夠對行業(yè)的未來發(fā)展做出預測,為之后的管理決策提供可靠的支持。
1.2.1 數據挖掘的內涵、過程和方法解析
“數據挖掘”和“數據挖掘技術”這兩個詞雖然之前在某些行業(yè)應用比較普遍,但是隨著大數據時代的到來,已經在我們生活周圍經常被提及,成為現今階段至關重要的一項關鍵技術。數據挖掘技術在不斷地影響、改變著數據信息在生活、生產等方面的作用。
(1)數據挖掘的概念。數據挖掘這個概念,雖然其誕生很早,但是到目前為止其仍屬于一個新興的事物。數據挖掘一開始主要應用于商業(yè)領域,后來逐漸發(fā)展到各個行業(yè)的生產、管理部門中。數據挖掘就是將各種各樣不規(guī)則且非常復雜的數據,通過一定的技術手段,從中找出相對比較隱秘、具備潛在價值等特點的信息,從而為行業(yè)的發(fā)展提供參照。
(2)數據挖掘的基本過程。數據挖掘有3個基本過程。第一個過程是數據準備。這是一個最基本但是非常重要的過程,只有首先把數據準備工作做好,才能保障之后要完成的數據挖掘工作是最有效的。數據準備也就是對原始數據進行相應的篩選、優(yōu)化、整理、轉換的過程。第二個過程是數據挖掘。作為最關鍵的一個過程,在進行數據挖掘時,首先需要準確了解數據挖掘所需要達到的最終目標,其次需要找到合適的分析方法,最后合理地進行數據挖掘,將其中有價值的數據充分使用。第三個過程是模式評價與分析。這一過程主要就是對結果進行相應的分析和解釋,轉化為人們能夠容易理解的結論,讓相應行業(yè)得以使用。
1.2.2 數據挖掘的基本分析方法
數據挖掘的核心是數據分析方法。需要從數據的分析方法開始,深入研究,才能發(fā)現這些數據背后所具有的意義和內涵。無論生活中的哪一種特殊數據,只要深入探究這些數據的內容,都會或多或少地發(fā)現這些數據的特殊規(guī)律和分布情況。因此,掌握數據分析方法相當重要。一般常見的數據分析方法有以下幾種。
(1)聚類分析方法。聚類分析方法就是將一些不具體的、模糊的、沒有指向的數據信息搜集在一起,然后按照分類進行整理、編輯,最后形成具有統(tǒng)一特征、具體表現的數據信息源,為之后的分析研究提供保障。
(2)關聯分析方法。事實上,不同的數據之間或多或少會有一些關聯性,而這些關聯性很難通過我們自身的力量去發(fā)現,這就需要人們依據關聯分析方法識別出數據信息之間的關聯性,制定出數據之間的關聯管理方案,從而達到完成對數據信息分辨的任務。這樣一個任務通常有著很強的目的性,因此,這個方法比較適合用于完成一些要求較高的、比較復雜的數據信息處理工作。
(3)特征性數據分析方法。當今時代是一個數據信息資源大爆發(fā)的時代,各種各樣的數據資源緊緊圍繞在我們身邊,很多情況下,面對大量的數據,需要根據特定的特征要求進行分類,來研究其表現出的規(guī)律,這種根據特定特征型數據進行的分析方法即為特征性數據分析方法。例如,醫(yī)院每天接診無數病人,通過對這些病歷信息的分析,可以知道不同年齡層患某種疾病的可能性,提前做好預防措施;通過復雜的大批量數據對人工神經網絡進行分析,實現對于計算機或人腦而言非常復雜的模式抽取及趨勢分析;可視化技術是數據挖掘中應用非常廣泛的一種輔助技術,它借助圖形、圖像、動畫等手段形象地指導操作、引導挖掘和表達結果等。
2 大數據時代下數據挖掘技術的應用
當前,數據挖掘技術已經融入大數據環(huán)境中,為企業(yè)創(chuàng)造出更多的經濟效益。因此,我國各大行業(yè)要想在競爭中占據有利的地位,發(fā)揮不可替代的作用,實現信息資源的合理應用,充分利用數據挖掘技術是必不可少的。下面簡要分析大數據時代下數據挖掘技術的具體應用。
2.1 市場營銷領域
市場營銷領域可以說是使用數據挖掘技術最早的一個領域。通過數據挖掘技術可以進一步分析掌握不同的顧客的消費習慣和消費特點,從而在一定程度熟練掌握顧客購買時的心理,激發(fā)顧客的購買欲望,從而達到提升銷售業(yè)績的目的。目前數據挖掘技術在市場營銷領域的應用,已經不能簡單解釋為超市購物,它已經逐步應用到保險、醫(yī)療和電子商務等行業(yè)中,為各個行業(yè)提供了潛在客戶群體,使他們能充分利用資源而不斷實現發(fā)展。
2.2 科學研究領域
在科學研究的過程中,科學家們往往需要通過分析各種各樣的數據,并從這些數據中找出一些能為研究做出參考的有用信息,掌握其中的規(guī)律,達到最終的研究目標。也就是說,數據挖掘技術是科學研究領域的一項很重要的輔助工具。因此,通過數據挖掘技術可以在一定的時間內找出數據間存在的規(guī)律,最終發(fā)現一系列的信息和結論。例如,利用數據挖掘技術對DNA進行詳細地分析研究,可以提高親子鑒定的準確率等。所以,數據挖掘技術在科學研究領域也是至關重要的。
2.3 制造業(yè)領域
在生產制造業(yè)領域中,隨著人們生活品質的提高,用戶對產品質量的要求也越來越高。制造商可以通過對各個產品的數據進行分析,進一步提升產品的質量和生產效率,從而降低生產商成本,提高用戶的滿意度。例如,分析造成產品缺陷的數據,就可以首先找出生產過程中能夠影響生產效率的各種因素,再通過數據挖掘技術進行分析,最終找出其原因,進一步提升產品的使用效率。
2.4 教育領域
如今,學校、家長不只是關心學生的學習成績,而且還關心學生的心理健康教育。數據挖掘技術在今天的教育領域中也起到了不可替代的作用。學校利用數據挖掘技術,可以充分掌握和分析學生們的心理特征,可以使學校老師針對不同心理健康的學生采用不同的方法進行知識的講解、內容的安排。也可以利用數據挖掘技術分析學生的學習成績,及時準確地了解到學生們的薄弱之處,有針對性地對薄弱之處進行講解和指導,從而有效提高教學效率,提升教學質量,使學生成績得以提升。
3 結語
數據挖掘技術在市場營銷、科學研究、制造業(yè)、教育、電信等領域中發(fā)揮著至關重要的作用,就其發(fā)展前景來看,隨著數據挖掘技術研究的不斷深化,該項技術將會被運用到更多的領域和行業(yè)中去??傊髷祿r代下,數據挖掘技術的發(fā)展和應用會越來越有意義。
參 考 文 獻
[1]孫澤.淺析大數據時代[J].中國民商,2018(1):244.
[2]Chen H,Deng Y.Enlightenment and Exploration of Big Data[J].Information Security & Communications Privacy,2013.
[3]田志民,梁品超,任艷紅,等.大數據時代下數據挖掘技術與應用[J].當代教育實踐與教學研究,2017(10):4.
[責任編輯:鐘聲賢]