鄧施明
摘 要:在信息化時代的背景下,信息數(shù)據(jù)在獲取和處理上面都產(chǎn)生了巨大的進步,這在一定程度上也推動了統(tǒng)計學的發(fā)展,并且促使統(tǒng)計學方法在各個領(lǐng)域范圍內(nèi)都有廣泛應用。通過探討統(tǒng)計學方法的發(fā)展趨勢以及統(tǒng)計學方法在大數(shù)據(jù)中的具體應用,對于未來的統(tǒng)計學研究發(fā)展方向具有重要意義。因此,本文也將圍繞統(tǒng)計學方法的發(fā)展歷程展開論述,并在此基礎(chǔ)上探討和研究統(tǒng)計學方法在大數(shù)據(jù)中的應用,希望通過本文分析,能為相關(guān)研究人員提供可供參考的價值。
關(guān)鍵詞:統(tǒng)計學方法;大數(shù)據(jù);發(fā)展及應用
前 言
統(tǒng)計實踐活動最初只是方便人們計數(shù)和描述,隨著經(jīng)濟的發(fā)展以及科學技術(shù)的進步,統(tǒng)計學方法也在不斷發(fā)展壯大,作用也不僅僅是用來計數(shù)和描述,涉及的范圍更加豐富多樣。并且,經(jīng)過相關(guān)專家的深入研究和分析討論,統(tǒng)計學方法也得以完善和改進,更好地發(fā)揮其本身的價值。由此可見,在當前大數(shù)據(jù)時代背景下,深入研究統(tǒng)計學的發(fā)展史以及實際應用,對于未來統(tǒng)計學的發(fā)展有著至關(guān)重要的作用。
一、統(tǒng)計學方法的發(fā)展概述
(一)概率論是統(tǒng)計學發(fā)展的基石
概率論是數(shù)學家通過解答賭博中的大量問題而誕生出來的一門學科,這門學科使得概率計算從最初的簡單計數(shù)進入到較為精細的階段。早期概率論與統(tǒng)計學的關(guān)系還沒有十分密切,隨著數(shù)學理論的完善,概率論才有了更為嚴謹?shù)臄?shù)學基礎(chǔ),加深了與統(tǒng)計學的交集。而大數(shù)定律的提出,為統(tǒng)計方法和理論提供了基礎(chǔ),隨后又提出了中心極限定理,這也是概率論研究的中心,這個定理是數(shù)理統(tǒng)計學中大樣本方法的基礎(chǔ)。之后誕生的隨機過程,將隨機變量從靜態(tài)轉(zhuǎn)到動態(tài),極大地拓寬了概率論的應用及研究范圍。
(二)數(shù)理統(tǒng)計是統(tǒng)計學與實踐結(jié)合的開始
數(shù)理統(tǒng)計也就是逆概率,是指用結(jié)果推原因,為了研究統(tǒng)計推斷問題,各個統(tǒng)計學專家由此產(chǎn)生了兩個體系,分別是頻率學派和貝葉斯學派。在某些特定情況下,貝葉斯學派的方法會比較方便,而在一些非參模型下,則是頻率學派的方法更為便捷,兩者是相互補充的關(guān)系。由此來看,數(shù)理統(tǒng)計是統(tǒng)計學與實踐結(jié)合的開始,是統(tǒng)計學發(fā)展歷程中非常重要的環(huán)節(jié),同時也為未來的統(tǒng)計學預測、控制等功能奠定了基礎(chǔ)。
(三)回歸分析的提出與發(fā)展
回歸分析是生物學家將理論與實踐相結(jié)合的成果,對于統(tǒng)計學的發(fā)展具有重要意義。高爾頓運用統(tǒng)計學方法研究遺傳學,并從中發(fā)現(xiàn)了非常重要的統(tǒng)計學方法與理論。這些理論對于實際生活都有非常大的促進作用,通過運用回歸分析,探索數(shù)據(jù)之間的相互關(guān)系,能對生產(chǎn)生活中的事物進行預測和判斷,促進相關(guān)工作的有效開展。由此可見,回歸分析的提出使得統(tǒng)計學的內(nèi)容和應用范圍更加廣泛。
(四)多元統(tǒng)計分析的提出與發(fā)展
多元統(tǒng)計分析的方法對于統(tǒng)計學的發(fā)展也具有重要作用,其主要應用在多個對象和多個指標的情況下。多元統(tǒng)計分析包含的內(nèi)容非常多,比如聚類分析、因子分析以及多元回歸分析等等。隨著科技的不斷進步,多元統(tǒng)計分析的方法也越來越受到重視,被廣泛地應用到各個學科和生產(chǎn)當中。并且,在信息化時代的背景下,多元統(tǒng)計分析還能與數(shù)據(jù)庫技術(shù)相結(jié)合,使得海量數(shù)據(jù)的處理效率大大提升。
二、統(tǒng)計學方法在大數(shù)據(jù)中的應用
(一)“大數(shù)定律”在大數(shù)據(jù)分析中的應用
隨著信息技術(shù)與互聯(lián)技術(shù)的普及,互聯(lián)網(wǎng)平臺的交易活動也越來越頻繁,這就使得海量的數(shù)據(jù)信息被生產(chǎn)出來。有調(diào)查發(fā)現(xiàn),就某個單一品種的商品而言,其每秒所產(chǎn)生的數(shù)據(jù)就有12個,按照這樣的速度下去,則1個小時就能產(chǎn)生43200個有效數(shù)據(jù)信息,如果沒有統(tǒng)計學思想的指導,僅僅依靠大數(shù)據(jù)分析,則會降低數(shù)據(jù)分析效果。而將“大數(shù)定律”的統(tǒng)計學方法運用到大數(shù)據(jù)分析當中,就能很好地提升工作效率,并且還可以避免不必要的資源浪費。比如,將該定律中的“收斂值”運用到大數(shù)據(jù)分析中,就能讓相關(guān)人員有一個明確的分析目標,排除一些干擾選項,使得分析人員用較短的時間就能分析出其中的規(guī)律,極大地提高了工作效率。此外,利用“大數(shù)定律”還可以實現(xiàn)事物未來發(fā)展狀況的預測。
(二)多元統(tǒng)計分析在大數(shù)據(jù)分析中的應用
多元統(tǒng)計分析方法在大數(shù)據(jù)中的應用主要包括兩方面:主成分分析和聚類。主成分分析方法是將多個指標轉(zhuǎn)為幾個綜合指標,這在大數(shù)據(jù)分析中通常被當作是一種降維方法。在大數(shù)據(jù)背景下,相關(guān)技術(shù)人員在海量數(shù)據(jù)的處理過程中,由于變量個數(shù)過多,會嚴重影響和干擾模型的運行效率,而運用主成分分析方法,能有效減少變量的個數(shù),并且還能避免數(shù)據(jù)信息的遺漏,得到更多的信息。這種方法適用于處理海量數(shù)據(jù)的情況,不僅能減輕工作量,將數(shù)據(jù)化繁為簡,并且還能減少模型的運算消耗。其次是聚類,這種方法正處于發(fā)展階段,其主要表現(xiàn)形式就是將一些沒有標記的變量進行分類,有不同的分類方法。在大數(shù)據(jù)分析中,運用聚類方法,能將大量未知標注的數(shù)據(jù)集進行分類處理,既能區(qū)分類別內(nèi)的數(shù)據(jù)信息,也能區(qū)別不同類別的數(shù)據(jù)信息,極大地提高了工作效率,對于數(shù)據(jù)的預處理發(fā)揮了至關(guān)重要的作用。
(三)概率論在大數(shù)據(jù)分析中的應用
在大數(shù)據(jù)時代,數(shù)據(jù)對于經(jīng)濟的作用是非常巨大的,尤其是對于經(jīng)濟數(shù)據(jù)的分析,能有效促進社會經(jīng)濟的發(fā)展。經(jīng)濟數(shù)據(jù)通常是以低密度形式存在的,在進行數(shù)據(jù)分析時難度較大,而運用概率論與數(shù)理統(tǒng)計的方法,能有效提升數(shù)據(jù)分析效率。比如,利用正態(tài)分布概率來分析經(jīng)濟數(shù)據(jù),能夠有效預測連續(xù)性隨機變量的概率,并對相關(guān)信息進行快速高效的分析,同時還能根據(jù)最終的分析結(jié)果掌握市場經(jīng)濟的發(fā)展狀況,幫助人們更快地了解市場經(jīng)濟規(guī)律,并且從中獲取的信息還能幫助后續(xù)的計劃進行合理的調(diào)整。
結(jié)束語
綜上所述,有數(shù)據(jù)的地方就會有統(tǒng)計學,隨著科學技術(shù)的發(fā)展,統(tǒng)計學與大數(shù)據(jù)的有效結(jié)合必然是順應時代發(fā)展的方向,不僅能促使統(tǒng)計學的應用范圍更加廣泛,同時也能產(chǎn)生新的大數(shù)據(jù)算法,促進大數(shù)據(jù)分析的進一步發(fā)展。因此,在當前時代背景下,應當積極鼓勵統(tǒng)計學方法的研究,并且促進統(tǒng)計學方法與大數(shù)據(jù)分析的有效結(jié)合。這樣才能促使統(tǒng)計學方法的進一步發(fā)展,為社會貢獻其最大的效用和潛力。
參考文獻
[1] 游士兵,徐小婷.統(tǒng)計學方法的發(fā)展及其在大數(shù)據(jù)中的應用[J].統(tǒng)計與決策,2020,36(04):31-35.
[2] 王路,王茜茜.大數(shù)據(jù)及互聯(lián)網(wǎng)時代統(tǒng)計學課程教學改革新思路及新方法[J].高教學刊,2019(10):130-132.
[3] 吳東武,王潤良.大數(shù)據(jù)背景下統(tǒng)計學教學方法研究[J].高教學刊,2017(15):76-78.