熊文君
摘 要:21世紀(jì)以計(jì)算機(jī)信息技術(shù)為代表的新科技革命不斷深入,社會(huì)經(jīng)濟(jì)的發(fā)展使得人類積累的數(shù)據(jù)逐漸龐大,海量信息內(nèi)后蘊(yùn)含無(wú)限的應(yīng)用價(jià)值。信息挖掘技術(shù)就是在海量信息中搜尋有價(jià)值、有用途的信息。Excel2010就是當(dāng)今一項(xiàng)簡(jiǎn)單實(shí)用、功能豐富、應(yīng)用廣泛的數(shù)據(jù)挖掘工具,本文詳細(xì)分析了Excel2010的功能,并從統(tǒng)計(jì)數(shù)據(jù)信息和支持多種算法兩個(gè)方面探究Excel2010的應(yīng)用。
關(guān)鍵詞:Excel2010;數(shù)據(jù)挖掘工具;功能與運(yùn)用
中圖分類號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:B 文章編號(hào):1002-7661(2014)24-005-01
數(shù)據(jù)挖掘是指從海量的數(shù)據(jù)中搜尋有價(jià)值、有趣模式的過(guò)程,試圖在隨機(jī)的、無(wú)規(guī)律的、大量的、模糊的數(shù)據(jù)中提取人們所不知道的但存在潛在利用價(jià)值的數(shù)據(jù)信息。數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的過(guò)程,能夠幫助人們快速整理、尋找目的信息,提高數(shù)據(jù)信息利用效率。Excel作為Micrsoft Office應(yīng)用辦公軟件中的常用組件,具有高效的計(jì)算功能和直管的圖表界面,是當(dāng)下最流行的辦公應(yīng)用軟件。而Excel2010則是一款功能強(qiáng)大、應(yīng)用廣泛的數(shù)據(jù)挖掘工具,本文將對(duì)其功能和應(yīng)用做詳細(xì)闡述。
一、Excel2010數(shù)據(jù)挖掘工具
Excel2010數(shù)據(jù)挖掘工具具有創(chuàng)建、測(cè)試、管理數(shù)據(jù)挖掘結(jié)構(gòu)和模型的功能,能夠?yàn)橛脩籼峁┛焖僦庇^的應(yīng)用界面,同時(shí)SQL中數(shù)據(jù)自定義功能不會(huì)喪失,并能夠?qū)Υ鎯?chǔ)在Excel表格中的數(shù)據(jù)進(jìn)行相關(guān)性分析和匯總,支持?jǐn)?shù)據(jù)建模、圖形展示結(jié)果的功能。使用Excel2010進(jìn)行數(shù)據(jù)挖掘時(shí),需要具備數(shù)據(jù)挖掘外接程序和Microsoft SQL兩種技術(shù)支持,本文所介紹的Excel2010是在windows2007版本下的Microsoft SQL2012和Office2012數(shù)據(jù)挖掘外接程序[1]。Excel2010由用戶界面、數(shù)據(jù)知識(shí)庫(kù)(評(píng)估模式和數(shù)據(jù)挖掘搜索引擎)、數(shù)據(jù)庫(kù)服務(wù)器以及數(shù)據(jù)清理、集成和選擇組成,整個(gè)數(shù)據(jù)挖掘系統(tǒng)均可以與互聯(lián)網(wǎng)和其他信息總庫(kù)相連接。Excel2010采用外接程序?qū)崿F(xiàn)數(shù)據(jù)挖掘功能,主要包括三個(gè)板塊:一是Excel表格工具,用戶可以通過(guò)簡(jiǎn)單的鼠標(biāo)和鍵盤操作,對(duì)表格中的數(shù)據(jù)進(jìn)行各種運(yùn)算和相關(guān)性分析;二是Visio數(shù)據(jù)挖掘模板。用戶可以通過(guò)Visio以圖形方式呈現(xiàn)數(shù)據(jù)結(jié)果,方便用戶更直觀簡(jiǎn)潔地理解。三是Excel2010數(shù)據(jù)挖掘客戶端,用戶可以通過(guò)Analysis Services 訪問(wèn)其他數(shù)據(jù)庫(kù)或互聯(lián)網(wǎng)數(shù)據(jù),從而擴(kuò)大信息搜索范圍。
二、Excel2010數(shù)據(jù)挖掘工具的功能應(yīng)用
1、數(shù)據(jù)準(zhǔn)備
Excel2010中具備瀏覽、查看、刪除、標(biāo)記、分類、整理等多種數(shù)據(jù)管理功能,方便用戶在進(jìn)行數(shù)據(jù)挖掘操作時(shí)做好數(shù)據(jù)準(zhǔn)備[2]。瀏覽數(shù)據(jù)和查看數(shù)據(jù)是Excel2010中最基本的功能,能夠明確判定單個(gè)行或列中數(shù)據(jù)的分布情況和數(shù)據(jù)性質(zhì)。清除或刪除數(shù)據(jù)是Excel2010一大主要功能之一,用戶可以通過(guò)標(biāo)記、修改或刪除沒(méi)有利用價(jià)值的數(shù)據(jù)以達(dá)到運(yùn)用目的。分類數(shù)據(jù)是Excel2010中常見(jiàn)的功能之一,通過(guò)各種分類方法將不相關(guān)的、無(wú)規(guī)律的數(shù)據(jù)繼續(xù)擰有規(guī)律、有計(jì)劃的排列組合,方便后期數(shù)據(jù)挖掘。
2、數(shù)據(jù)建模
數(shù)據(jù)建模是指根據(jù)Excel2010表格數(shù)據(jù)庫(kù)中數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析,預(yù)測(cè)數(shù)據(jù)趨勢(shì),方便后期查找和分類。數(shù)據(jù)建模是建立在Analysis Services 基礎(chǔ)之上的,數(shù)據(jù)分析或數(shù)據(jù)分類過(guò)程中能夠生成一個(gè)分類模型,系統(tǒng)根據(jù)模型中列和行的值來(lái)預(yù)測(cè)某一單位列中的值。預(yù)測(cè)模型,它通過(guò)提取數(shù)據(jù)模式中的關(guān)聯(lián)模式來(lái)預(yù)測(cè)連續(xù)的數(shù)字或日期。聚類分析模型,它能夠針對(duì)特征相同或相似的數(shù)據(jù)或行組進(jìn)行歸納。關(guān)聯(lián)模型能夠檢測(cè)多個(gè)事務(wù)中存在關(guān)聯(lián)性的數(shù)據(jù),比如學(xué)生信息系統(tǒng)模型中,將學(xué)生的姓名、班級(jí)、學(xué)號(hào)、成績(jī)等進(jìn)行關(guān)聯(lián)性分類。
3、檢測(cè)與評(píng)估模型
檢測(cè)和評(píng)估模型是指創(chuàng)建用于分析數(shù)據(jù)挖掘方案的圖表,以提升圖或散點(diǎn)圖的方式清楚直觀地將分析結(jié)果展示出來(lái),方面用戶評(píng)估模型的性能。比如公司企業(yè)的年度利潤(rùn)收益狀況圖表就是醫(yī)用走勢(shì)圖或柱狀圖展示出來(lái)的。
4、管理與連接
Excel2010數(shù)據(jù)挖掘客戶端,用戶可以通過(guò)Analysis Services 訪問(wèn)其他數(shù)據(jù)庫(kù)或互聯(lián)網(wǎng)數(shù)據(jù),從而擴(kuò)大信息搜索范圍。
5、統(tǒng)計(jì)數(shù)據(jù)信息
Excel2010最基本的功能就是數(shù)據(jù)挖掘,而數(shù)據(jù)挖掘是數(shù)據(jù)統(tǒng)計(jì)最典型的功能,能夠支持海量數(shù)據(jù)、多種性質(zhì)數(shù)據(jù)的統(tǒng)計(jì)分析操作,幫助人們獲取目的信息數(shù)據(jù)。
6、支持多種數(shù)據(jù)算法
Excel2010作為一種數(shù)據(jù)挖掘工具,它的數(shù)據(jù)模型功能是通過(guò)各種復(fù)雜的算法來(lái)實(shí)現(xiàn)的。以Microsoft SQL2012中的Office Excel2010為例,其中包括分類算法、回歸算法、分段算法、關(guān)聯(lián)算法、順序分析算法等等,這些算法為實(shí)現(xiàn)數(shù)據(jù)建模中的分類模型、聚類分析、邏輯回歸、統(tǒng)計(jì)學(xué)分析等等具有重要作用。
Excel2010作為一款永永快速直觀工作界面和高效創(chuàng)建管理數(shù)據(jù)的數(shù)據(jù)挖掘模型,能夠幫助人們從海量無(wú)規(guī)律的數(shù)據(jù)中提取有應(yīng)用價(jià)值的數(shù)據(jù),簡(jiǎn)化操作程序,提高工作效率。Excel2010數(shù)據(jù)挖掘工具主要具備數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)建模、檢測(cè)與模型評(píng)估、模型用途以及管理和連接五大方面的作用,在快速高效統(tǒng)計(jì)數(shù)據(jù)信息和支持多種數(shù)據(jù)算法方面應(yīng)用廣泛。
參考文獻(xiàn):
[1] 吳 丹.Excel2007數(shù)據(jù)挖掘工具的研究與應(yīng)用[J].數(shù)據(jù)庫(kù)與信息管理,2013,9(8):1736-1738.
[2] 徐軍偉.程國(guó)忠.Excel2010數(shù)據(jù)挖掘工具的應(yīng)用研究[J].電腦知識(shí)與技術(shù),2014,10(1):4-7.endprint