山東省菏澤市定陶區(qū)統(tǒng)計(jì)局 張麗麗
試析數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用
山東省菏澤市定陶區(qū)統(tǒng)計(jì)局 張麗麗
我國社會(huì)經(jīng)濟(jì)體制的變更推動(dòng)著我國社會(huì)經(jīng)濟(jì)的快速發(fā)展,2016年我國國民生產(chǎn)總值已達(dá)74萬億,同時(shí)在社會(huì)經(jīng)濟(jì)活動(dòng)當(dāng)中,因?yàn)椴煌愋徒?jīng)濟(jì)發(fā)展因素的影響,逐漸形成了一種比較復(fù)雜的經(jīng)濟(jì)關(guān)系體制,經(jīng)濟(jì)的快速發(fā)展已經(jīng)開始超過了人類大腦可以分析和理解的范圍。因此我們需要對(duì)當(dāng)代先進(jìn)的統(tǒng)計(jì)技術(shù)加以有效應(yīng)用,來對(duì)經(jīng)濟(jì)發(fā)展的趨勢進(jìn)行分析。在我國最近幾年的統(tǒng)計(jì)學(xué)發(fā)展過程中,數(shù)據(jù)挖掘技術(shù)慢慢發(fā)展成為了經(jīng)濟(jì)統(tǒng)計(jì)和分析的全新形式,在社會(huì)的統(tǒng)計(jì)活動(dòng)當(dāng)中得到廣泛應(yīng)用。
數(shù)據(jù)挖掘 經(jīng)濟(jì)統(tǒng)計(jì) 應(yīng)用分析
自我國改革開放之后,我國在社會(huì)經(jīng)濟(jì)的發(fā)展速度上不斷加快,我國在歷經(jīng)幾十年的經(jīng)濟(jì)發(fā)展建設(shè)活動(dòng)之后,已經(jīng)積累下了大量的經(jīng)濟(jì)發(fā)展數(shù)據(jù)。因?yàn)榻?jīng)濟(jì)數(shù)據(jù)本身都具備一定的發(fā)展性與信息量的龐大性,造成了對(duì)統(tǒng)計(jì)數(shù)據(jù)人員在對(duì)其中的數(shù)據(jù)信息進(jìn)行使用的過程中,只是單純地局限于對(duì)其中樹據(jù)數(shù)字信息的分析和使用,并且對(duì)數(shù)據(jù)信息中的重要統(tǒng)計(jì)資料不進(jìn)行更加深入的挖掘工作。對(duì)數(shù)據(jù)挖掘技術(shù)來講,它作為一種全新的統(tǒng)計(jì)方式,它的優(yōu)勢主要表現(xiàn)在對(duì)所有的信息數(shù)據(jù)實(shí)施橫向或者是縱向的開發(fā),在實(shí)際的研究范圍上都得到了相應(yīng)的延伸,并且可以通過對(duì)數(shù)據(jù)的挖掘,可以從基礎(chǔ)性的數(shù)據(jù)當(dāng)中獲得更多更有價(jià)值的數(shù)據(jù)信息,可以更好地為社會(huì)中的統(tǒng)計(jì)數(shù)據(jù)提出良好的需求。
數(shù)據(jù)挖掘技術(shù)主要是指通過比較深層次的開發(fā),從大量的數(shù)據(jù)當(dāng)中挖掘出比較有價(jià)值的信息,并且對(duì)所挖掘出來數(shù)據(jù)進(jìn)行分析和整理,有效地實(shí)現(xiàn)對(duì)比較復(fù)雜和混亂的數(shù)據(jù)進(jìn)行有效的整合。這其中我們所提到的大量數(shù)據(jù)具有比較強(qiáng)的模糊性、隨機(jī)性以及不完全性的特性,通過對(duì)數(shù)據(jù)挖掘技術(shù)可以將其變成比較有價(jià)值和新型的信息。數(shù)據(jù)挖掘不但是在經(jīng)濟(jì)信息中實(shí)現(xiàn)信息的變化,同時(shí)還是一種具有科學(xué)交換特性的數(shù)據(jù)技術(shù),其中重點(diǎn)涉及了學(xué)習(xí)、數(shù)據(jù)分析以及數(shù)據(jù)庫等方面的內(nèi)容,在統(tǒng)計(jì)行業(yè)當(dāng)中得到了非常廣泛的應(yīng)用。
在經(jīng)濟(jì)數(shù)據(jù)統(tǒng)計(jì)工作當(dāng)中,作為一種基礎(chǔ)性的數(shù)據(jù)處理形式,是實(shí)現(xiàn)經(jīng)濟(jì)數(shù)據(jù)實(shí)現(xiàn)預(yù)處理的主要方式,因?yàn)閿?shù)據(jù)挖掘技術(shù)本身就屬于一種為基礎(chǔ)性信息提供準(zhǔn)確分析的技術(shù),數(shù)據(jù)挖掘受到了基礎(chǔ)數(shù)據(jù)信息的限制性,它不可能用來代替經(jīng)濟(jì)數(shù)據(jù)中所具有的數(shù)據(jù)信息收集功能。因此作為數(shù)據(jù)挖掘系統(tǒng)中的基礎(chǔ)性的數(shù)據(jù)信息,都需要提前進(jìn)行預(yù)處理技術(shù),所處理的內(nèi)容主要包含了對(duì)這些方面數(shù)據(jù)的不準(zhǔn)確性、不真實(shí)性以及不同經(jīng)濟(jì)數(shù)據(jù)相互之間出現(xiàn)比較大的差異性[1]。
由于當(dāng)前我國在社會(huì)活動(dòng)中,對(duì)經(jīng)濟(jì)數(shù)據(jù)的統(tǒng)計(jì)內(nèi)容比較龐大,其中對(duì)眾多的經(jīng)濟(jì)數(shù)據(jù)的統(tǒng)計(jì)工作,并不是來源于在官方統(tǒng)計(jì)局當(dāng)中,而是從社會(huì)中的一些統(tǒng)計(jì)組織或者是一些社會(huì)經(jīng)濟(jì)個(gè)體當(dāng)中所提供的數(shù)據(jù),在對(duì)數(shù)據(jù)信息實(shí)施挖掘的過程中,其中這些經(jīng)濟(jì)數(shù)據(jù)主要來源于多方面的數(shù)據(jù)模式的集合,通過經(jīng)濟(jì)數(shù)據(jù)的集成化來實(shí)現(xiàn)對(duì)實(shí)體經(jīng)濟(jì)數(shù)據(jù)信息的識(shí)別工作。
數(shù)據(jù)轉(zhuǎn)換的方式,主要是指在對(duì)其中某種方式的數(shù)據(jù)變化形式,可以充分滿足數(shù)據(jù)要求變化的方式,轉(zhuǎn)換的方式主要分成數(shù)據(jù)的泛化和數(shù)據(jù)的準(zhǔn)確性。對(duì)于后者來講其中主要涵蓋了數(shù)據(jù)的最大規(guī)范化、最小規(guī)范化以及平均值的規(guī)范化,但是數(shù)據(jù)中的泛化主要是指對(duì)最高層次中的數(shù)據(jù)信息對(duì)低層次中的數(shù)據(jù)進(jìn)行替換,其中主要包含了對(duì)數(shù)據(jù)連續(xù)性的處理,但是因?yàn)檫@種方式對(duì)實(shí)現(xiàn)數(shù)據(jù)的連續(xù)性的處理比較困難,所以說,通常只選擇離散的方式,也就是對(duì)數(shù)據(jù)進(jìn)行區(qū)間形式的劃分[2]。
決策樹屬于一種預(yù)測性的模型,是對(duì)象價(jià)值和對(duì)象屬性相互之間形成的一種映射性的關(guān)系。其中每個(gè)葉片點(diǎn)對(duì)應(yīng)的從根部的節(jié)點(diǎn)到這個(gè)葉節(jié)點(diǎn)上,所經(jīng)歷的過程上所表現(xiàn)出的對(duì)象的數(shù)據(jù),同時(shí)還可以作為一種預(yù)測性分析。在經(jīng)過了這種環(huán)節(jié)之后就可以有效實(shí)現(xiàn)相關(guān)的管理決策人員對(duì)數(shù)據(jù)信息的使用。決策樹的方式首先需要建立決策樹:第一是通過對(duì)相關(guān)的數(shù)據(jù)信息進(jìn)行大體的分析,通過測試集成來實(shí)施模型測試工作,并且進(jìn)行簡單的處理工作,然后再建立起輸出模型[3];第二是通過建立起完成的決策樹系統(tǒng),來對(duì)數(shù)據(jù)信息實(shí)施簡單化的處理,這個(gè)過程有稱之為“遞歸”,在完成整個(gè)決策樹的建立之后,再對(duì)決策樹中的枝葉信息進(jìn)行修剪,以此來避免在之后的調(diào)試工作中一些不相關(guān)數(shù)據(jù),對(duì)決策樹產(chǎn)生的影響。
數(shù)據(jù)的回歸分析,主要指的是通過兩種或者多種變量相互之間產(chǎn)生的依賴性,通過數(shù)據(jù)之間形成的一種定量的關(guān)系形成一種的統(tǒng)計(jì)學(xué)的分析方式。通過對(duì)數(shù)據(jù)回歸的分析可以有效的建立起變量相互之間的回歸方程,通過相關(guān)的因素分析和判斷,對(duì)其中的變量和次變量之間的關(guān)系進(jìn)行分析,通過這種不同類型方式的實(shí)驗(yàn),實(shí)現(xiàn)測量誤差降到最低,通過回歸的數(shù)據(jù)分析方式,可以實(shí)現(xiàn)對(duì)社會(huì)市場的占有率、品牌的銷售量以及整體的經(jīng)濟(jì)發(fā)展趨勢等進(jìn)行有效的解釋,將其中的兩個(gè)或者兩個(gè)以上的數(shù)據(jù)關(guān)系,通過函數(shù)的關(guān)系進(jìn)行表達(dá),以此方便與更有效的解決問題[4]。
數(shù)據(jù)挖掘技術(shù)作為一種對(duì)數(shù)據(jù)信息進(jìn)行深層次加工的統(tǒng)計(jì)基礎(chǔ),它本身具備著比較明確的目的性,在實(shí)際的使用過程當(dāng)中,可以通過長時(shí)間的積累統(tǒng)計(jì)數(shù)據(jù),來對(duì)基礎(chǔ)性數(shù)據(jù)實(shí)施深層次的處理和加工。在實(shí)際的使用過程當(dāng)中,基于數(shù)據(jù)使用者的具體要求,從不同的分析角度上出發(fā)對(duì)數(shù)據(jù)在應(yīng)用過程中,對(duì)數(shù)據(jù)本身存在的數(shù)據(jù)信息實(shí)施統(tǒng)計(jì)和分類,將原本比較混亂的數(shù)據(jù)庫實(shí)施科學(xué)和系統(tǒng)的歸類整理,通過這種方式來保證數(shù)據(jù)信息管理的高效性和便利性。
對(duì)于數(shù)據(jù)挖掘技術(shù)來講,它屬于一種系統(tǒng)型的數(shù)據(jù)統(tǒng)計(jì)工具,并不屬于一種單一性的數(shù)據(jù)分析,可以有效地實(shí)現(xiàn)對(duì)使用者本身對(duì)各種不同類型的信息的需求性,伴隨當(dāng)前我國社會(huì)經(jīng)濟(jì)的快速發(fā)展,其中經(jīng)濟(jì)管理部門中需要對(duì)社會(huì)當(dāng)中大量的經(jīng)濟(jì)發(fā)展數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,并且數(shù)據(jù)信息所表現(xiàn)出的管理和處理的權(quán)限各不相同,這就需要經(jīng)濟(jì)管理部門需要針對(duì)不同需求的經(jīng)濟(jì)管理內(nèi)容進(jìn)行統(tǒng)計(jì)分析,將其中的數(shù)據(jù)轉(zhuǎn)換成不同的數(shù)據(jù)形式,并且可以依照信息的具體來源以及統(tǒng)計(jì)信息的計(jì)算形式對(duì)其可靠程度來進(jìn)行評(píng)估,保證數(shù)據(jù)統(tǒng)計(jì)信息的準(zhǔn)確性[5]。
在我國的經(jīng)濟(jì)管理部門當(dāng)中,對(duì)職權(quán)的管理工作上表現(xiàn)的比較分散,其中不同類型的經(jīng)濟(jì)管理部門中,對(duì)數(shù)據(jù)信息的需求量以及需求的類型也是不盡相同的。在很多地區(qū),很多的經(jīng)濟(jì)管理部門對(duì)其統(tǒng)計(jì)活動(dòng)的傳統(tǒng)實(shí)施方式,具有比較明顯的局限性,很難通過經(jīng)濟(jì)管理活動(dòng)來提供更加優(yōu)良的服務(wù),在實(shí)際的工作當(dāng)中經(jīng)常會(huì)出現(xiàn)一些重復(fù)性統(tǒng)計(jì)或者統(tǒng)計(jì)不完全的現(xiàn)象,嚴(yán)重影響到了經(jīng)濟(jì)數(shù)據(jù)分析的有效性,通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用,有效地避免了這方面的問題,只要充分地保證所得數(shù)據(jù)的準(zhǔn)確性,通過數(shù)據(jù)挖掘技術(shù)就可以對(duì)其實(shí)施有效地整合和處理,從而使數(shù)據(jù)資源變得更加豐富多樣。
本文通過對(duì)數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用分析,從中得出結(jié)論,在受到了不同類型經(jīng)濟(jì)發(fā)展因素的影響,經(jīng)濟(jì)的發(fā)展逐漸形成了一種比較復(fù)雜化的經(jīng)濟(jì)關(guān)系體制,經(jīng)濟(jì)的快速發(fā)展已經(jīng)開始超過了人類大腦可以分析和理解的范圍,我們就需要對(duì)當(dāng)代先進(jìn)的統(tǒng)計(jì)技術(shù)加以有效的應(yīng)用,來對(duì)經(jīng)濟(jì)發(fā)展的趨勢進(jìn)行分析,通過對(duì)數(shù)據(jù)挖掘技術(shù)的有效的應(yīng)用,有效實(shí)現(xiàn)了對(duì)比較復(fù)雜的經(jīng)濟(jì)數(shù)據(jù)的分析,對(duì)我國社會(huì)經(jīng)濟(jì)的發(fā)展起到了保障性的作用。
[1] 楊梅冰,梁思思.關(guān)于數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用[J].時(shí)代金融,2015(24).
[2] 董靜.試析數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用[J].商,2015(31).
[3] 柳楓.基于統(tǒng)計(jì)的數(shù)據(jù)挖掘技術(shù)在CRM系統(tǒng)中的應(yīng)用研究[D].大連理工大學(xué),2013.
[4] 楊杰,黃欣,呂永.數(shù)據(jù)挖掘技術(shù)在建模、優(yōu)化和故障診斷中的應(yīng)用[J].紅外與激光工程,2015(03).
[5] 楊振艦.可視化數(shù)據(jù)挖掘技術(shù)在城市地下空間GIS中的應(yīng)用研究[D].河北工業(yè)大學(xué),2014.
F222.3
A
2096-0298(2018)01(a)-013-02
張麗麗(1975-),女,漢族,山東省菏澤市人,本科,中級(jí)統(tǒng)計(jì)師,主要從事統(tǒng)計(jì)設(shè)計(jì)方面的研究。