張師瑋
摘 要:隨著社會的發(fā)展和科技的進(jìn)步,各行各業(yè)的統(tǒng)計(jì)需求都有所增長。在這一過程中,越來越多的先進(jìn)技術(shù)和統(tǒng)計(jì)學(xué)的傳統(tǒng)方法產(chǎn)生了融合,為我國經(jīng)濟(jì)決策提供了重大幫助。當(dāng)前,我國一些地區(qū)使用的傳統(tǒng)的統(tǒng)計(jì)方法已經(jīng)不能滿足新時(shí)代對于社會建設(shè)和經(jīng)濟(jì)發(fā)展的需要,在很大程度上影響了統(tǒng)計(jì)效率。而數(shù)據(jù)挖掘技術(shù)的應(yīng)用,就讓統(tǒng)計(jì)學(xué)的整體效率得到了大幅提升,同時(shí),也讓統(tǒng)計(jì)的科學(xué)性上升到了一個(gè)新的臺階。本文針對數(shù)據(jù)挖掘技術(shù)在統(tǒng)計(jì)學(xué)中的應(yīng)用展開討論,希望對相關(guān)人員有所幫助。
關(guān)鍵詞:數(shù)據(jù)挖掘;統(tǒng)計(jì)學(xué);應(yīng)用
引 言
信息時(shí)代的到來,為很多行業(yè)的生產(chǎn)效率都大幅提升。尤其在我國進(jìn)入信息時(shí)代之后,互聯(lián)網(wǎng)快速普及,現(xiàn)如今已經(jīng)成為人們?nèi)粘I钪斜夭豢缮俚囊徊糠?。在統(tǒng)計(jì)學(xué)中,信息技術(shù)的應(yīng)用也越來越普遍。數(shù)據(jù)挖掘技術(shù)就為統(tǒng)計(jì)工作效率的提升帶來了更多可能,互聯(lián)網(wǎng)的發(fā)展同時(shí)也為數(shù)據(jù)挖掘提供了更多的數(shù)據(jù)資源,也讓統(tǒng)計(jì)學(xué)中應(yīng)用數(shù)據(jù)挖掘技術(shù)取得了更好的效果。
1.數(shù)據(jù)挖掘技術(shù)簡述
網(wǎng)絡(luò)的快速發(fā)展,使得信息呈現(xiàn)爆炸式增長,尤其在網(wǎng)絡(luò)稱為人們生活的一部分之后,人們對網(wǎng)絡(luò)的依賴更加嚴(yán)重,雖然通過網(wǎng)絡(luò)獲得了巨大的便捷,但是不可否認(rèn)的是,產(chǎn)生的數(shù)據(jù)信息體量也大幅增長。這在一定程度上阻礙了人們獲取有價(jià)值的信息,鑒于這種現(xiàn)狀,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。它為人們篩選信息、挖掘有用信息提供了巨大的幫助,讓人們能夠在海量信息中,通過特定的篩選方法,獲得最有價(jià)值的信息,讓信息真正服務(wù)于生產(chǎn)和生活,做出更好的決策。
數(shù)據(jù)挖掘技術(shù)在實(shí)際應(yīng)用的過程中,也發(fā)生了一定程度的變化。它從最開始的數(shù)理統(tǒng)計(jì),到后來的人工智能分析,再到后來的機(jī)器學(xué)習(xí),這一整個(gè)過程中,數(shù)據(jù)挖掘技術(shù)的功能越來越強(qiáng)大、效率越來越高。而且,經(jīng)過多年的發(fā)展和實(shí)踐,數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域也越發(fā)廣泛,在很多行業(yè)中發(fā)揮著不可取代的作用,為我國經(jīng)濟(jì)發(fā)展提供源源不斷的力量。而且,數(shù)據(jù)挖掘和其他學(xué)科的融合也更加深入,尤其和統(tǒng)計(jì)學(xué)的融合,為統(tǒng)計(jì)工作的效率和準(zhǔn)確性提供了更強(qiáng)有力的保障。因?yàn)閭鹘y(tǒng)的統(tǒng)計(jì)方法沒有辦法針對目標(biāo)數(shù)據(jù)進(jìn)行深入挖掘,不能發(fā)現(xiàn)海量數(shù)據(jù)背后的有價(jià)值信息,這樣一來,統(tǒng)計(jì)工作的效果就沒法達(dá)到預(yù)期,影響了統(tǒng)計(jì)工作整體質(zhì)量的提升,更為決策的制定造成了不同程度的影響。而利用數(shù)據(jù)挖掘技術(shù)和統(tǒng)計(jì)學(xué)進(jìn)行融合,很多問題就迎刃而解了。它讓很多領(lǐng)域的海量數(shù)據(jù)處理成為可能,為統(tǒng)計(jì)學(xué)數(shù)據(jù)采集范圍得到了空前的提升,同時(shí)通過對有價(jià)值信息的挖掘,讓統(tǒng)計(jì)工作的針對性更強(qiáng)。
2.數(shù)據(jù)挖掘技術(shù)在統(tǒng)計(jì)學(xué)中的應(yīng)用
社會在發(fā)展的過程中,每時(shí)每刻都會產(chǎn)生大量的數(shù)據(jù)。人們利用現(xiàn)如今強(qiáng)大的計(jì)算機(jī)設(shè)備,能夠?qū)A繑?shù)據(jù)進(jìn)行處理,讓自身更加便捷地接觸到有價(jià)值信息。在統(tǒng)計(jì)學(xué)中,數(shù)據(jù)挖掘技術(shù)就發(fā)揮著重要的作用。因?yàn)閿?shù)據(jù)和字段之間的關(guān)系錯(cuò)綜復(fù)雜,有函數(shù)相關(guān)關(guān)系,有關(guān)鍵詞對應(yīng)關(guān)系,還有數(shù)據(jù)引申含義的關(guān)系,無論是哪一種關(guān)系,要想通過統(tǒng)計(jì)方法來獲得其準(zhǔn)確的規(guī)律,都要對數(shù)據(jù)進(jìn)行篩選。這時(shí)就需要根據(jù)統(tǒng)計(jì)學(xué)原理,對體量龐大的數(shù)據(jù)進(jìn)行有效分析,將其中有價(jià)值的信息提取出來,再對其應(yīng)用統(tǒng)計(jì)學(xué)方法。比較常見的是神經(jīng)網(wǎng)絡(luò)策略,它是通過計(jì)算機(jī)模擬人腦,來對數(shù)據(jù)進(jìn)行加工和處理的模式,對數(shù)據(jù)進(jìn)行分析和處理的效率非常高,而且針對不同類型的數(shù)據(jù),還能提供一套相對完善的處理機(jī)制,進(jìn)一步提高統(tǒng)計(jì)工作的準(zhǔn)確性。網(wǎng)絡(luò)上很多信息相對來說比較抽象,利用神經(jīng)網(wǎng)絡(luò),還能讓統(tǒng)計(jì)結(jié)果更加具象化、實(shí)用化,讓人們能夠更加方便地使用數(shù)據(jù)。這種處理方法的優(yōu)勢有很多,最明顯的一個(gè)是這種方式是粗集理論策略的具體應(yīng)用,而且容易操作,不需要給出額外的信息,這樣不僅節(jié)省了空間,還能夠提高數(shù)據(jù)信息的有效性。數(shù)據(jù)挖掘還能用來發(fā)現(xiàn)網(wǎng)絡(luò)中的安全隱患,尤其對于那些相對隱蔽的安全隱患來說,數(shù)據(jù)挖掘能夠發(fā)現(xiàn)潛在風(fēng)險(xiǎn),并由相關(guān)人員及時(shí)做出應(yīng)對。
3.數(shù)據(jù)挖掘技術(shù)在統(tǒng)計(jì)學(xué)中的體現(xiàn)
數(shù)據(jù)挖掘技術(shù)在統(tǒng)計(jì)學(xué)中的應(yīng)用雖然能夠帶來非常大的便利,提高統(tǒng)計(jì)工作的準(zhǔn)確性和效率,但是,要想讓數(shù)據(jù)挖掘技術(shù)充分發(fā)揮作用,就要做好準(zhǔn)備工作。具體來說,就是要將數(shù)據(jù)準(zhǔn)備好,或者在網(wǎng)絡(luò)上劃定一定的數(shù)據(jù)采集范圍,這樣才能進(jìn)行有效的挖掘,提高數(shù)據(jù)挖掘的效率,也更加方便對數(shù)據(jù)進(jìn)行簡化,為后續(xù)的數(shù)據(jù)處理工作打下基礎(chǔ)。接下來,在進(jìn)行數(shù)據(jù)挖掘的過程中,應(yīng)當(dāng)根據(jù)具體的需求,根據(jù)數(shù)據(jù)的不同類型,選擇合適的算法,因?yàn)橹挥兴惴ê蛿?shù)據(jù)的類型匹配時(shí),才能得到預(yù)期的結(jié)果?,F(xiàn)如今,人工智能技術(shù)越來越發(fā)達(dá),在進(jìn)行統(tǒng)計(jì)工作時(shí),利用人工智能對數(shù)據(jù)進(jìn)行初步的分析也是非常有效的一種方法,它能夠模擬人腦對數(shù)據(jù)進(jìn)行篩選,但是相較于人腦,人工智能的篩選速度更快,能夠更為高效地得出有價(jià)值的信息,供統(tǒng)計(jì)工作使用。利用人工智能得出的有價(jià)值信息還能讓后續(xù)的分析和評估工作更好地進(jìn)行,方便統(tǒng)計(jì)工作人員進(jìn)行總結(jié)。另外,機(jī)器學(xué)習(xí)也是一種在統(tǒng)計(jì)學(xué)的基礎(chǔ)上發(fā)展起來的技術(shù),它通過對大量的樣本進(jìn)行分析和總結(jié),發(fā)現(xiàn)其中的規(guī)律,并形成一套類人的判斷,進(jìn)而像人腦一樣對某一類事物形成一定的記憶。不過,這種技術(shù)的應(yīng)用前提是在要有數(shù)量充足的樣本,這樣,計(jì)算機(jī)才能通過統(tǒng)計(jì)學(xué)方法,發(fā)現(xiàn)樣本之間的相同和不同,進(jìn)而完成學(xué)習(xí)。在這一過程中,計(jì)算機(jī)需要更加深入地對樣本信息進(jìn)行分析,挖掘不同樣本信息中的有效內(nèi)容,并將這些內(nèi)容進(jìn)行集中處理,這樣才能完成學(xué)習(xí)。
結(jié)束語
數(shù)據(jù)挖掘在統(tǒng)計(jì)學(xué)中的應(yīng)用非常廣泛,尤其在我國進(jìn)入信息時(shí)代之后,數(shù)據(jù)挖掘技術(shù)更是對統(tǒng)計(jì)學(xué)產(chǎn)生了巨大影響。人工智能、機(jī)器學(xué)習(xí)等一系列先進(jìn)的技術(shù),都是在統(tǒng)計(jì)學(xué)的基礎(chǔ)上發(fā)展起來的。相關(guān)領(lǐng)域的技術(shù)人員應(yīng)當(dāng)積極應(yīng)用數(shù)據(jù)挖掘技術(shù)對傳統(tǒng)的統(tǒng)計(jì)學(xué)方法進(jìn)行優(yōu)化,為生產(chǎn)和生活創(chuàng)造更大的便利。本文簡單分析了數(shù)據(jù)挖掘技術(shù)在統(tǒng)計(jì)學(xué)中的應(yīng)用和體現(xiàn),希望對相關(guān)人員有所幫助。
參考文獻(xiàn)
[1] 馬江洪,張文修,徐宗本. 數(shù)據(jù)挖掘與數(shù)據(jù)庫知識發(fā)現(xiàn):統(tǒng)計(jì)學(xué)的觀點(diǎn)[J]. 工程數(shù)學(xué)學(xué)報(bào),2002(01):1-13.
[2] 安康,韓兆洲. 對統(tǒng)計(jì)學(xué)領(lǐng)域數(shù)據(jù)挖掘研究的反思[J]. 統(tǒng)計(jì)與決策,2010(10):4-7.
[3] 孫薇斌. 數(shù)據(jù)挖掘中統(tǒng)計(jì)方法的作用和問題點(diǎn)[J]. 數(shù)理統(tǒng)計(jì)與管理,2004(05):78-80+39.