令狐永芳
摘要:互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展以及和人類社會的不斷融合,使得互聯(lián)網(wǎng)技術(shù)已經(jīng)成為人類社會發(fā)展必不可少的關(guān)鍵因素之一。同時,其在逐漸發(fā)展的過程中演變成一個信息傳輸?shù)木C合體,網(wǎng)絡(luò)數(shù)據(jù)也呈現(xiàn)出一種爆炸式增長的趨勢,由此人們正式進(jìn)入了大數(shù)據(jù)時代。在這個時代背景下,人們通過使用數(shù)據(jù)挖掘技術(shù),在整合分析大量數(shù)據(jù)的基礎(chǔ)上實現(xiàn)從中發(fā)現(xiàn)其隱藏規(guī)律以及有價值的信息。本文從其概念剖析入手,在解析其基本數(shù)據(jù)分析方法的基礎(chǔ)上,就其在互聯(lián)網(wǎng)中的應(yīng)用進(jìn)行了詳細(xì)的分析,希望對今后數(shù)據(jù)挖掘技術(shù)的推廣使用帶來一定的幫助。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);概念;分析方式;互聯(lián)網(wǎng);應(yīng)用
1.何為數(shù)據(jù)挖掘技術(shù)
信息交互程度的提升以及網(wǎng)絡(luò)數(shù)據(jù)的實時分享,從某種意義上來說加速了人們的生活發(fā)展,人們在日常生活中可以時刻享受到大數(shù)據(jù)技術(shù)帶來的便利。同時在互聯(lián)網(wǎng)行業(yè)不斷發(fā)展的影響之下,互聯(lián)網(wǎng)平臺得以大規(guī)模發(fā)展,致使網(wǎng)絡(luò)數(shù)據(jù)得到了爆炸式的增長,出現(xiàn)了海量以及復(fù)雜性的特征。但是這些數(shù)據(jù)并非是全部具備使用價值的,其中包括了大量的噪聲數(shù)據(jù),導(dǎo)致實際的具備價值的數(shù)據(jù)所占比例相對較少,再加之?dāng)?shù)據(jù)內(nèi)容可能會存在缺失及分散的現(xiàn)象,繼而引發(fā)數(shù)據(jù)質(zhì)量不一致的問題。在這種情況下,我們就需要使用數(shù)據(jù)挖掘技術(shù)從這些數(shù)量龐大的且較為隨機(jī)雜亂的數(shù)據(jù)中,借助一定的算法將信息進(jìn)行提取,在發(fā)現(xiàn)其中具備價值以及規(guī)律信息的數(shù)據(jù)基礎(chǔ)上,將數(shù)據(jù)信息庫進(jìn)行重新組合。
所謂的數(shù)據(jù)挖掘并非是僅僅只有收據(jù)的收集,其中更是包括了從海量類型不同的數(shù)據(jù)中,將其中具備使用價值的信息予以挖掘,并合理使用這些數(shù)據(jù)做到社會治理數(shù)據(jù)改善以及數(shù)據(jù)系統(tǒng)使用率的提升。數(shù)據(jù)挖掘技術(shù)就是針對數(shù)量龐大數(shù)據(jù)進(jìn)行整合、分析以及分析之后,借助于機(jī)器學(xué)習(xí)方式、人工智能方式以及各種數(shù)據(jù)挖掘方式進(jìn)行數(shù)據(jù)的深度挖掘工作,在發(fā)現(xiàn)總結(jié)其中隱藏規(guī)律的基礎(chǔ)上,將之合理應(yīng)用的一種方式。
2.數(shù)據(jù)挖掘技術(shù)的基本分析方法解析
2.1聚類分析
這種數(shù)據(jù)分析方式主要就是將物理以及抽象對象的整合予以分類,與此同時針對那些完全相同或者是具備一定相似性的對象組成的分類開展更為深入的分析工作。其最終的目標(biāo)就是將這些數(shù)據(jù)進(jìn)行有效的分類,也就是在深入分析事物之間規(guī)律的基礎(chǔ)上,從而實現(xiàn)各個領(lǐng)域的智能化學(xué)習(xí)目標(biāo)。聚類分析這種方式其中又可以分為硬聚類和模糊聚類兩種方式,其中的硬聚類方式就是將分析的對象歸屬到相近程度最高的類別之中。而其中的模糊聚類方式在劃分對象的過程中以取值范圍作為依據(jù),同時還會出現(xiàn)同一個對象對應(yīng)的多個類別的現(xiàn)象。
2.2關(guān)聯(lián)分析
關(guān)聯(lián)分析從其本質(zhì)上來看和蝴蝶效應(yīng)較為相似,所謂的蝴蝶效應(yīng)就是指自然界中的任何一次微小變動都有很大的可能性帶來另一個事件的發(fā)生。同樣這也是關(guān)聯(lián)分析方式的規(guī)律所在,相同事物之間具備著不同程度的依賴以及關(guān)聯(lián)性,也正是因為事物之間的這一特點,就可以對事物之間的規(guī)律性予以有效的預(yù)測。
舉個例子,購物籃事件就是這種方式中最具有代表性的應(yīng)用。就是通過針對顧客購物籃的物品管理規(guī)律進(jìn)行相應(yīng)的分析,就可以做到初步掌握顧客自身的購買特點以及習(xí)慣,并以這些數(shù)據(jù)作為基礎(chǔ)將日?;臓I銷方案以及策略予以制定。通過使用這種方式就可以取得很好的營銷效果。
2.3分類與預(yù)測
分類就是針對那些不具備排序規(guī)律的標(biāo)號予以分類,預(yù)測則是針對連續(xù)值的函數(shù)模型開展相應(yīng)的預(yù)測工作。而其中的分類則是數(shù)據(jù)挖掘技術(shù)極為重要的基礎(chǔ)之一,借助分類可以將數(shù)據(jù)集合自身的特征予以明確的表示,從而將各個類別的屬性進(jìn)行相應(yīng)的劃分,其中較為常見的方式之一就是決策樹、遺傳算法等等。而預(yù)測就是將當(dāng)前已知的分類情況作為基礎(chǔ),并按照其中的發(fā)展規(guī)律將其未來的發(fā)展趨勢予以預(yù)測,當(dāng)前較常用的方式主要包括時間序列以及回歸分析等等。
3.數(shù)據(jù)挖掘技術(shù)在互聯(lián)網(wǎng)領(lǐng)域中應(yīng)用分析
3.1應(yīng)用于電子商務(wù)領(lǐng)域
互聯(lián)網(wǎng)技術(shù)的出現(xiàn)以及普及對于傳統(tǒng)的實體行業(yè)帶來了相應(yīng)的沖擊,由此網(wǎng)購逐漸深入人們的日常生活中,使得我國的營銷市場得到了極大的發(fā)展。數(shù)據(jù)挖掘技術(shù)應(yīng)用在電子商務(wù)領(lǐng)域中主要是負(fù)責(zé)挖掘消費者自身的喜好之上。通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用針對消費者的商品瀏覽以及購買記錄就可以從中挖掘出不同消費者在商品類型、價格上的偏好。當(dāng)前絕大多數(shù)的網(wǎng)購平臺都通過數(shù)據(jù)挖掘技術(shù),在深刻分析消費者自身購買喜好的基礎(chǔ)上,為企業(yè)制定營銷策略提供了精準(zhǔn)化的數(shù)據(jù)支撐,就可以達(dá)到電子商務(wù)平臺的運營投放上的優(yōu)化。
3.2應(yīng)用于金融領(lǐng)域
銀行業(yè)當(dāng)前已經(jīng)針對大數(shù)據(jù)在其經(jīng)營管理、客戶營銷以及產(chǎn)品優(yōu)化等工作中的重要作用有了一個全面清醒的認(rèn)知。銀行業(yè)中使用數(shù)據(jù)挖掘技術(shù)往往都是將其自身大數(shù)據(jù)的巨大價值予以挖掘,并以此作為其產(chǎn)品、服務(wù)以及管理工作方面的創(chuàng)新依據(jù)。而在金融投資方面則是通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用針對投資數(shù)據(jù)進(jìn)行分析,將隱藏在其中的規(guī)律予以發(fā)現(xiàn),并以此作為投資行為的數(shù)據(jù)導(dǎo)向,最終目標(biāo)就是降低投資風(fēng)險的降低。
3.3應(yīng)用于醫(yī)療領(lǐng)域
當(dāng)前醫(yī)療信息化程度的不斷提升,導(dǎo)致醫(yī)院在病人檔案、醫(yī)療器具等方面管理工作的現(xiàn)代化程度逐漸得以提升,通過數(shù)據(jù)挖掘技術(shù)的幫助可以很好發(fā)現(xiàn)存在于其中的問題,實現(xiàn)醫(yī)院管理質(zhì)量的不斷提升。
與此同時因為醫(yī)務(wù)工作人員自身的診斷方式也從之前的傳統(tǒng)依靠人員經(jīng)驗的診斷方式逐漸向著現(xiàn)代化診斷方式發(fā)展。通過數(shù)據(jù)挖掘技術(shù)的使用醫(yī)務(wù)人員就可以針對患者的過往病史、臨床癥狀表現(xiàn)以及相似程度較高患者的病史與數(shù)據(jù)庫中的各項信息進(jìn)行分析以及綜合研究,可以很有效的提升相應(yīng)的診斷正確率,有助于提升醫(yī)療服務(wù)質(zhì)量。
4.總結(jié)
當(dāng)前大數(shù)據(jù)時代的到來,社會中的數(shù)據(jù)信息呈現(xiàn)出一種爆炸式的增長態(tài)勢,為了更好的使用其中有價值的數(shù)據(jù),就需要借助于數(shù)據(jù)挖掘技術(shù)。通過數(shù)據(jù)挖掘技術(shù)中的聚類分析、分類預(yù)測以及關(guān)聯(lián)分析等方式就可以很好實現(xiàn)數(shù)據(jù)規(guī)律的發(fā)現(xiàn)以及利用,并且隨著技術(shù)的逐步發(fā)展在互聯(lián)網(wǎng)領(lǐng)域中的金融、醫(yī)療以及電子商務(wù)等領(lǐng)域中的應(yīng)用將會逐漸得以推廣。
參考文獻(xiàn)
[1]管祥甫,管子涵.計算機(jī)文本信息挖掘技術(shù)在網(wǎng)絡(luò)安全中的應(yīng)用[J/OL].電子技術(shù)與軟件工程,2019(21):184-185[2019-11-20].
[2]謝翠琴.淺析移動通信中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].電子世界,2019(20):192-193.