陳雪如 鄖陽中學
統(tǒng)計工作其實就是搜集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)和解釋數(shù)據(jù)的系統(tǒng)性過程,統(tǒng)計學離開數(shù)據(jù)就失去了研究的價值;同理,數(shù)據(jù)離開統(tǒng)計學就只是簡單的數(shù)字,失去價值。只有利用統(tǒng)計學的原理與方法對數(shù)據(jù)加以整理、分析,才能提高數(shù)據(jù)精確度、適用度,發(fā)揮數(shù)據(jù)的價值。但在大數(shù)據(jù)時代,統(tǒng)計學迎來機遇與挑戰(zhàn),必須加強分析和探究。
在大數(shù)據(jù)時代要用辯證的、發(fā)展的眼光看待統(tǒng)計學,在大數(shù)據(jù)思想框架下建立新的統(tǒng)計學科體系。大數(shù)據(jù)時代的總體統(tǒng)計思想與方法延伸統(tǒng)計學科體系,如統(tǒng)計學結(jié)合樣本統(tǒng)計與總體統(tǒng)計,樣本統(tǒng)計要求樣本正確代表總體,因而總體必須觀察同質(zhì)單位,這種理想情況在現(xiàn)實中很難達到,以大數(shù)據(jù)為基礎(chǔ)的總體統(tǒng)計正好彌補樣本統(tǒng)計的不足。
大數(shù)據(jù)時代代表傳統(tǒng)分析、核算單個計算機所存儲數(shù)據(jù)的統(tǒng)計方法,突破單個計算機數(shù)據(jù)限制,基于移動硬盤匯聚整理眾多計算機中存儲的數(shù)據(jù),形成新的數(shù)據(jù)流環(huán)境,實現(xiàn)對冗雜分散數(shù)據(jù)的集中分析與處理,提高數(shù)據(jù)統(tǒng)計效率。隨著數(shù)據(jù)類型的持續(xù)增多,適用的統(tǒng)計方法也越來越多,統(tǒng)計學在大數(shù)據(jù)技術(shù)的支持下逐漸走上分類、高效的數(shù)據(jù)分析處理道路[1]。
大數(shù)據(jù)時代促進各行各業(yè)的信息數(shù)據(jù)化變革與更新,影響人們學習、工作與生活的方方面面,報表與數(shù)據(jù)的網(wǎng)絡(luò)搜索查詢技術(shù)能提高人們采集數(shù)據(jù)、利用數(shù)據(jù)的效率,拓寬有效的統(tǒng)計數(shù)據(jù)獲取渠道,使人們享受極大的便利。預處理則體現(xiàn)出統(tǒng)計學隨機抽樣調(diào)查和沉淀處理冗雜非標準數(shù)據(jù),主要分為清洗、矯正和填補這三個階段,保證在存儲數(shù)據(jù)的過程中將無效數(shù)據(jù)篩選出來,同時增強統(tǒng)計數(shù)據(jù)庫的相互聯(lián)系,大大提高數(shù)據(jù)的傳遞與共享效率。
在觀念、成本等的傳統(tǒng)因素的影響下,統(tǒng)計學主要在行業(yè)統(tǒng)計、部門統(tǒng)計中發(fā)揮作用,服務(wù)于政策的制定、服務(wù)的完善。但統(tǒng)計學在大數(shù)據(jù)時代不僅有助于快速拓展統(tǒng)計領(lǐng)域,還在醫(yī)學、金融、計算機等學科發(fā)揮作用。如數(shù)據(jù)分析,數(shù)學和計算機一樣,都是統(tǒng)計分析工具,數(shù)學夯實統(tǒng)計學的理論基礎(chǔ),計算機使統(tǒng)計分析更便捷,復雜的數(shù)據(jù)處理問題得到解決,在豐富統(tǒng)計學發(fā)展內(nèi)涵的同時擴大統(tǒng)計學的作用范圍。
在過去,統(tǒng)計學大多停留在應用抽樣技術(shù)、建模和模式分析等層面,這樣的方式在大數(shù)據(jù)時代不再適用于統(tǒng)計需求,信息量龐大和數(shù)據(jù)的多元化發(fā)展導致統(tǒng)計方法被限制在范圍內(nèi)的數(shù)據(jù)掃描分析當中。與此同時,樣本統(tǒng)計依舊占據(jù)重要地位,在大數(shù)據(jù)時代難以提高統(tǒng)計數(shù)據(jù)的精確度。統(tǒng)計學主要是基于篩選的數(shù)據(jù)研究數(shù)量間以及數(shù)量特征的關(guān)系,考察樣本統(tǒng)計數(shù)據(jù)的價值決定著樣本的選取性、標準性,然而大數(shù)據(jù)增加確定樣本標準性和選取樣本的難度,統(tǒng)計學也因此迎來巨大挑戰(zhàn)。
在大數(shù)據(jù)時代,人們面對繁多的、冗雜的數(shù)據(jù),需要了解數(shù)據(jù)的表面意思,注重分析產(chǎn)生數(shù)據(jù)的原因和數(shù)據(jù)的特征,這就使傳統(tǒng)統(tǒng)計學遇到難題,必須創(chuàng)新原有統(tǒng)計方法,滿足人們的需求。龐大的數(shù)據(jù)量超乎人們想象,其分散性、多樣性的特征給選取數(shù)據(jù)造成巨大困難,在收集樣本數(shù)據(jù)時遇到選取范圍廣、難度系數(shù)高、標準界定不清等問題[2]。另外,隨著電子信息產(chǎn)生越來越多的數(shù)據(jù),網(wǎng)絡(luò)數(shù)據(jù)沒有可以遵循的規(guī)律,統(tǒng)計學的數(shù)據(jù)卻具備結(jié)構(gòu)性、邏輯性,在樣本選取中很容易丟失有價值的數(shù)據(jù),樣本存在偏頗,造成損失。
在大數(shù)據(jù)時代,數(shù)據(jù)信息是核心,統(tǒng)計學的發(fā)展要從中汲取動力,產(chǎn)生大量統(tǒng)計數(shù)據(jù)分析需求。傳統(tǒng)統(tǒng)計方法無法繼續(xù)適應大數(shù)據(jù)時代的數(shù)據(jù)特點,要求統(tǒng)計學要基于大數(shù)據(jù)的特點,從滿足及服務(wù)于各領(lǐng)域的需求出發(fā),推進數(shù)據(jù)分析理論和方法的創(chuàng)新發(fā)展。如在大數(shù)據(jù)時代要注意結(jié)合統(tǒng)計思維和信息技術(shù),因為統(tǒng)計技術(shù)對龐大的數(shù)據(jù)量特別是囊括諸多非結(jié)構(gòu)化數(shù)據(jù)而言是遠遠不夠的,首要問題就是計算,只有密切結(jié)合統(tǒng)計技術(shù)和信息技術(shù),才能提高計算效率,促進統(tǒng)計學和大數(shù)據(jù)的融合。
統(tǒng)計學是一門注重實踐操作的學科,在學習統(tǒng)計學的知識時必須夯實基礎(chǔ),掌握好基礎(chǔ)知識,更要形成良好思維,掌握的數(shù)據(jù)的收集、統(tǒng)計和整理方法、技巧,培養(yǎng)專業(yè)統(tǒng)計思維,以便在大數(shù)據(jù)時代正確分辨所需數(shù)據(jù),分析數(shù)據(jù)的關(guān)聯(lián)性及相關(guān)數(shù)據(jù)。總之,大數(shù)據(jù)時代穩(wěn)步推進統(tǒng)計學的改革和發(fā)展,人們面臨更高的要求,提高統(tǒng)計思維、整合統(tǒng)計學與先進的網(wǎng)絡(luò)信息技術(shù)、智能技術(shù)勢在必行,從容應對挑戰(zhàn),提高樣本選取與數(shù)據(jù)分析的精確度,抓住機遇大力發(fā)展統(tǒng)計學。