田曉玲
隨著大數(shù)據(jù)時代的全面到來,人們獲取信息的方式也發(fā)生了巨大改變,同時在獲取信息資源過程中,擁有了更多的途徑與渠道。這對于數(shù)據(jù)統(tǒng)計工作人員以及從事數(shù)據(jù)統(tǒng)計的學者來講就如同打開了一扇新的大門,同時面臨諸多的機遇和挑戰(zhàn)。
在信息技術高速發(fā)展背景下,當今社會已經(jīng)快步走入大數(shù)據(jù)時代,并基于大數(shù)據(jù)技術支持下,能夠更加全面整合分析相關信息,逐步形成了全新而又便利的數(shù)據(jù)分析方法,這在大數(shù)據(jù)和統(tǒng)計學之間架設起一條彼此互通的橋梁。大數(shù)據(jù)技術的普及應用給統(tǒng)計學帶來了巨大變革,并對統(tǒng)計學的發(fā)展與提升起到了很大的促進作用,使得統(tǒng)計學未來發(fā)展前景越加廣闊。但是與此同時也給統(tǒng)計學帶來了諸多挑戰(zhàn)。
一、大數(shù)據(jù)時代下統(tǒng)計學概念概述
教科書上對統(tǒng)計學給出了這樣的定義:有效搜集整理分析隨機性數(shù)據(jù),對考察問題給出推斷與預測,最終為行動提供數(shù)據(jù)支持。從根本上看,統(tǒng)計學是一門與數(shù)據(jù)有關的學科。如美國總統(tǒng)拜登在競選總統(tǒng)過程當中便是基于數(shù)據(jù)團隊支持下而取得成功的,而馬云在很早的時候就將大數(shù)據(jù)當作企業(yè)發(fā)展的重要戰(zhàn)略。步入大數(shù)據(jù)時代之后,在網(wǎng)絡技術支持下數(shù)據(jù)收集變得更加便利,傳統(tǒng)設備已經(jīng)無法容納海量增長的數(shù)據(jù)信息,必須及時進行設備更新,而運用大數(shù)據(jù)對相關數(shù)據(jù)展開全面分析,才能確保信息的有效傳遞,并為推動社會不斷發(fā)展提供有效支撐。在當前社會發(fā)展進程當中,統(tǒng)計的都是極為重要的內(nèi)容,如進行商品交換時,統(tǒng)計學發(fā)揮的作用更大,利用統(tǒng)計學還能及時掌握市場經(jīng)濟信息。進入大數(shù)據(jù)時代,統(tǒng)計工作開展過程中,不能僅僅停留在隨機抽樣調(diào)查層面,而應當打破這種傳統(tǒng)統(tǒng)計方式,運用大數(shù)據(jù)技術手段獲取更為豐富的信息,進而為推動社會發(fā)展提供全面詳實的數(shù)據(jù)參考。
二、大數(shù)據(jù)時代對于統(tǒng)計學產(chǎn)生的影響
(一) 樣本概念變得更為深化
我們知道統(tǒng)計學離不開樣本,樣本是統(tǒng)計學的重要組成部分,只有保證樣本的有效性,才能將相關情況準確體現(xiàn)出來,在大數(shù)據(jù)快速發(fā)展時代,樣本概念和傳統(tǒng)數(shù)據(jù)相比出現(xiàn)了很大不同,通常我們得到的諸多網(wǎng)絡數(shù)據(jù):一種為靜態(tài)網(wǎng)絡數(shù)據(jù),即直接在客戶端創(chuàng)建的數(shù)據(jù),不用進行提取便可應用,不用投入較多成本。另一種為動態(tài)數(shù)據(jù),伴隨時間的改變數(shù)據(jù)也出現(xiàn)相應的變化,樣本也不再僅僅停留于隨機抽取,選定之后便可直接進行分析。
(二)從類型方面看,呈擴大之勢
傳統(tǒng)數(shù)據(jù)主要為結(jié)構(gòu)化數(shù)據(jù),其標準比較固定,而隨著大數(shù)據(jù)技術的快速發(fā)展,數(shù)據(jù)結(jié)構(gòu)也出現(xiàn)了巨大改變,同時出現(xiàn)大量的異構(gòu)數(shù)據(jù)。與此同時,大數(shù)據(jù)技術也改變了過去的儲存方式,大數(shù)據(jù)可以直接將探測的信號容納進去,并運用網(wǎng)絡實現(xiàn)不同結(jié)構(gòu)數(shù)據(jù)的有效識別,并迅速儲存下來。
(三)收集概念得到擴展
過去統(tǒng)計工作開展過程當中,數(shù)據(jù)收集都是有目的的進行,效率不高,還需要投入較多的成本。而伴隨大數(shù)據(jù)技術的快速發(fā)展,在數(shù)據(jù)收集過程當中更加的步驟化,做好數(shù)據(jù)識別及處理工作,在此基礎上進行分析,從中探尋所需的數(shù)據(jù),并合理儲存。但是在海量信息面前,必須要對數(shù)據(jù)的分析與識別給予充分重視,最大程度提高數(shù)據(jù)精準性與安全性,有效降低成本投入。
(四)數(shù)據(jù)來源較傳統(tǒng)不同
統(tǒng)計數(shù)據(jù)收集過程當中,過去都是依照研究目的進行收集,知道數(shù)據(jù)源,這些數(shù)據(jù)核對比較簡單。進入大數(shù)據(jù)時代信息獲取更加便利,而且很多數(shù)據(jù)無數(shù)據(jù)源,難以對記錄身份進行識別,所以在數(shù)據(jù)收集過程中應當充分重視數(shù)據(jù)源登記。
(五)量化方式發(fā)生變化
對于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)來講,有著比較成熟的量化方式,通過對數(shù)據(jù)的收集與分析便能獲得結(jié)果,然而進入大數(shù)據(jù)時代,出現(xiàn)大量的異化結(jié)構(gòu)數(shù)據(jù)難以通過直接分析的形式獲得結(jié)果。目前很多專家學者都在對非機構(gòu)化數(shù)據(jù)的處理進行研究,進而推動統(tǒng)計學在大數(shù)據(jù)時代獲得更好發(fā)展。
(六)分析思維發(fā)生改變
從分析過程看,過去分析數(shù)據(jù)過程當中都是依照定性、定量以及最終定性的方式進行分析。但是大數(shù)據(jù)在進行統(tǒng)計分析時,只通過定量、定性便能獲取相應的結(jié)果。同時,傳統(tǒng)數(shù)據(jù)證實分析時都是按照假設證的方式進行分析,然而實踐發(fā)現(xiàn),這種分析方式時常會出現(xiàn)較大誤差。而在大數(shù)據(jù)技術快速發(fā)展背景下,我們的思維為發(fā)現(xiàn)—總結(jié),這是整合—發(fā)現(xiàn)最終定論的過程,在此過程中會有很多發(fā)現(xiàn)。
(七)統(tǒng)計軟件越來越多
過去在統(tǒng)計學開展過程當中主要應用SPSS、SAS、STATA等統(tǒng)計軟件,但隨著大數(shù)據(jù)的快速發(fā)展,主要是基于數(shù)據(jù)中心為前提,將大數(shù)據(jù)和軟件有效整合,極大地簡化了分析過程。通過以上分析不難發(fā)現(xiàn),在大數(shù)據(jù)技術的快速發(fā)展背景下,可以更加主動統(tǒng)計,使得統(tǒng)計學在原有基礎上獲得了巨大進步與發(fā)展。
三、大數(shù)據(jù)時代下統(tǒng)計學面臨的挑戰(zhàn)
統(tǒng)計學有著非常久遠的發(fā)展歷程,形成了較為成熟的理論基礎,在生產(chǎn)實踐當中發(fā)揮的作用也越來越大,統(tǒng)計學的快速發(fā)展也深刻地影響到經(jīng)濟社會的快速發(fā)展。但步入大數(shù)據(jù)時代之后,數(shù)據(jù)分布狀態(tài)呈現(xiàn)海量增長,并以分散式分布,這給統(tǒng)計學帶來了極為深刻的影響。首先大數(shù)據(jù)的“大”,數(shù)據(jù)信息現(xiàn)已突破了人們的想象。而大數(shù)據(jù)當中的“全”,可以使人們更加全面的認識大體量、多樣化的數(shù)據(jù),數(shù)據(jù)樣本和總體彼此間的關系也出現(xiàn)巨大改變。而且多樣化的數(shù)據(jù),也使得傳統(tǒng)數(shù)據(jù)統(tǒng)計主觀訴求出現(xiàn)巨大改變,之前人們進行統(tǒng)計分析過程當中,更多的關注“為什么?”但是大數(shù)據(jù)時代下的統(tǒng)計更加關注“是什么?”這種改變深刻影響到傳統(tǒng)統(tǒng)計學,推動大數(shù)據(jù)時代統(tǒng)計學的快速發(fā)展已經(jīng)成為重要發(fā)展方向,然而傳統(tǒng)和更新之間彼此仍存在某些不相容的問題,所以在變革過程當中,需要全面綜合考慮各個方面。
第一,通過分析樣本標準不能看出,大數(shù)據(jù)時代樣本獲取變得更加便利,伴隨網(wǎng)絡技術的快速推進,大樣本標準也有了很大的發(fā)展和提升。傳統(tǒng)統(tǒng)計學將界限定在30,大于30為大樣本,小于30為小樣本。進入大數(shù)據(jù)時代,這個界限就太低了,沒辦法清除干擾信息,這就會給分析結(jié)果造成影響。所以,在掌握數(shù)據(jù)來源的基礎上,還應當對樣本標準做出及時更新,舊的數(shù)量可以通過大樣本數(shù)量進行替代,進而滿足大數(shù)據(jù)時代的發(fā)展要求。
第二,在選取樣本及其形式方面,傳統(tǒng)的統(tǒng)計學數(shù)據(jù)結(jié)構(gòu)比較固定,傳統(tǒng)統(tǒng)計學固定結(jié)構(gòu)化數(shù)據(jù)內(nèi)藏著一定的統(tǒng)計規(guī)律,雖然可以從中了解到研究對象具有的數(shù)量關系,然而不是任何事物都存在相應的量化指標,有的指標雖然被量化,但是卻無法將研究對象清晰地解讀出來。在數(shù)據(jù)采集過程中,過去的統(tǒng)計數(shù)據(jù)庫難以處理這些數(shù)據(jù),但是基于大數(shù)據(jù)支持下構(gòu)建非結(jié)構(gòu)數(shù)據(jù)庫,轉(zhuǎn)化這些數(shù)據(jù),便可將多樣化的分析作用體現(xiàn)出來,這樣就在很大程度上降低了選取樣本的標準,進一步擴大統(tǒng)計范圍。
最后,在開發(fā)統(tǒng)計軟件過程當中也面臨著諸多挑戰(zhàn),隨著大數(shù)據(jù)技術的快速提升,在分析數(shù)據(jù)過程中,都是基于數(shù)據(jù)進行非關系分析,面對海量的數(shù)據(jù)處理,需要更為合理的快速分析技術。
四、大數(shù)據(jù)時代下統(tǒng)計學面臨的發(fā)展機遇
(一)提升了統(tǒng)計質(zhì)量
就統(tǒng)計質(zhì)量而言,主要體現(xiàn)在適用、準確以及時效和平衡等幾個方面,適用主要是確保統(tǒng)計信息與相關要求相符合,統(tǒng)計信息必須要能夠充分滿足客戶需求,而大數(shù)據(jù)技術手段合理應用可以更加有效地提升適用功能。同時,過去所說的時效性,主要體現(xiàn)在統(tǒng)計所用的時間長短上,運用更短的時間進行統(tǒng)計,確??蛻裟軌蚨虝r間內(nèi)獲取統(tǒng)計信息,而基于大數(shù)據(jù)支持下其時效性更強。準確主要體現(xiàn)在估值和真值是否存在差別,在相應范圍當中數(shù)據(jù)有一定的誤差存在可視作正常。大數(shù)據(jù)技術下數(shù)據(jù)獲取更加全面,同時也有效包容了誤差,使誤差有效減少,提供了數(shù)據(jù)的真實性。平衡及協(xié)調(diào),基于大數(shù)據(jù)支持下檢驗與核對數(shù)據(jù)信息,都需要滿足客戶不斷檢查,全面增強數(shù)據(jù)平衡性。
(二)降低了統(tǒng)計成本
基于數(shù)據(jù)收集層面進行分析,在大數(shù)據(jù)技術支持下,打破了過去通過問卷調(diào)查以及電話調(diào)查等形式進行統(tǒng)計的局面,可以快速利用互聯(lián)網(wǎng)完成數(shù)據(jù)統(tǒng)計,及時、迅速,提高了數(shù)據(jù)精準性,大大減少了成本投入。而且在利用數(shù)據(jù)方面,過去的統(tǒng)計數(shù)據(jù)過期之后,還需要進行行再次抽樣分析,并且信息公布存在很大局限性。大數(shù)據(jù)技術可以更加便捷地對于數(shù)據(jù)進行收集,并能反復利用這些數(shù)據(jù),大大降低了統(tǒng)計成本。
(三)統(tǒng)計學作用范圍的增大
過去在統(tǒng)計學開展過程當中,時常受觀念、成本等諸多因素影響,經(jīng)濟學的應用范圍也比較有限。而伴隨大數(shù)據(jù)時代的快速發(fā)展,數(shù)據(jù)也出現(xiàn)很大變化,可以快速地進行數(shù)據(jù)傳遞,為社會各行各業(yè)做出巨大貢獻,并在推動自身發(fā)展的基礎上,更好地服務社會大眾,推動國家建設。
(四)統(tǒng)計學科體系的延伸
將大數(shù)據(jù)應用于統(tǒng)計學當中,雖然也給統(tǒng)計工作帶來很大挑戰(zhàn),但其發(fā)展機遇也更加廣闊。目前,統(tǒng)計學當中引入的大數(shù)據(jù)技術,海量的數(shù)據(jù)深刻影響到統(tǒng)計樣本選取及確定標準。過去簡單的抽樣調(diào)查,很難適應當前時代發(fā)展要求,所以統(tǒng)計樣本也必須要向著總體統(tǒng)計方向邁進,實現(xiàn)樣本統(tǒng)計和總體統(tǒng)計齊頭并進,有效應對傳統(tǒng)統(tǒng)計工作存在的不足,增強統(tǒng)計工作整體成效。
五、大數(shù)據(jù)時代下統(tǒng)計學的應對策略
(一)培養(yǎng)復合型人才
傳統(tǒng)的數(shù)據(jù)統(tǒng)計方法較為簡單,對數(shù)據(jù)人員的綜合素質(zhì)要求不高,隨著大數(shù)據(jù)時代的到來,我國的統(tǒng)計工作變得日益復雜起來,各種類型的數(shù)據(jù)需要統(tǒng)計人員進行分析和整理,這在無形中增加了數(shù)據(jù)統(tǒng)計人員的工作量,為了適應新形勢下統(tǒng)計工作發(fā)展需求,我國的統(tǒng)計學領域必須重視人才的培養(yǎng)工作,建立一批復合型的人才隊伍,從而滿足大數(shù)據(jù)時代下統(tǒng)計學對統(tǒng)計人員的要求。當代的統(tǒng)計學人員不僅要具備良好的統(tǒng)計專業(yè)知識,還要擁有良好的統(tǒng)計能力以及軟件操作能力,所以相關單位必須要將提高統(tǒng)計學人員的綜合素質(zhì)放在首位,運用各種形式培養(yǎng)統(tǒng)計人員的操作能力,真正的培養(yǎng)一批復合型的統(tǒng)計學人才隊伍,促進數(shù)據(jù)統(tǒng)計行業(yè)的發(fā)展。
(二) 推動統(tǒng)計學和大數(shù)據(jù)的協(xié)同發(fā)展
伴隨大數(shù)據(jù)技術的日益推進,也深刻影響到人們傳統(tǒng)的生產(chǎn)生活方式以及工作方式,受大數(shù)據(jù)技術影響,統(tǒng)計學必須要做出相應的調(diào)整,在開展數(shù)據(jù)統(tǒng)計工作時,相關的技術人員在掌握數(shù)據(jù)統(tǒng)計知識的基礎上,應該有效地結(jié)合統(tǒng)計學和大數(shù)據(jù),通過大數(shù)據(jù)技術手段來對各種信息進行統(tǒng)計分析,并與統(tǒng)計方法有效結(jié)合,充分發(fā)揮大數(shù)據(jù)對統(tǒng)計學的促進作用,為統(tǒng)計學的健康發(fā)展提供助力。大數(shù)據(jù)技術在帶來巨大發(fā)展機遇的同時,也帶來了巨大的挑戰(zhàn),統(tǒng)計學領域的相關人員必須緊跟時代潮流發(fā)展趨勢,融入到大數(shù)據(jù)時代中,促進統(tǒng)計學的發(fā)展。
(三)注重統(tǒng)計學的多學科合作
在大數(shù)據(jù)技術高速發(fā)展背景下,無論哪個行業(yè),每天都會有海量的數(shù)據(jù)產(chǎn)生,單一的傳統(tǒng)學已經(jīng)不能滿足信息處理的要求,但是在數(shù)據(jù)統(tǒng)計中,統(tǒng)計人員過分依賴計算機等一些軟件制約了統(tǒng)計學的發(fā)展。所以,數(shù)據(jù)統(tǒng)計學人員不僅要掌握必備的統(tǒng)計學知識,還要積極學習數(shù)學知識以及計算機知識,發(fā)揮不同學科的優(yōu)勢,真正實現(xiàn)優(yōu)勢互補,促進統(tǒng)計學與數(shù)學、計算機學科的合作,使統(tǒng)計學工作能夠滿足當下社會和人們生活對統(tǒng)計數(shù)據(jù)的需求。統(tǒng)計學與數(shù)學、計算機學科的合作和融合已經(jīng)成為促進統(tǒng)計學發(fā)展的必由之路,相信在不久的將來,統(tǒng)計學在數(shù)學與計算機學科的推動下,將會朝著更加科學化和規(guī)范化的方向發(fā)展。
結(jié)語:
統(tǒng)計學當中數(shù)據(jù)是核心,也是統(tǒng)計學價值的重要體現(xiàn),傳統(tǒng)的數(shù)據(jù)意義在大數(shù)據(jù)時代出現(xiàn)了巨大改變,數(shù)據(jù)所蘊含的信息、傳播以及分布速度已經(jīng)打破了人們的想象,同時也轉(zhuǎn)變了數(shù)據(jù)具有的核心意義,因此更需要以大數(shù)據(jù)技術為支撐,推動統(tǒng)計學的快速發(fā)展。雖然統(tǒng)計學在大數(shù)據(jù)時代面臨諸多機遇和挑戰(zhàn),但為適應新時期的發(fā)展要求,應當緊跟時代發(fā)展形勢,及時做出轉(zhuǎn)變,對大數(shù)據(jù)時代特征進行充分研究,并將大數(shù)據(jù)技術引入傳統(tǒng)統(tǒng)計學,這樣才能為統(tǒng)計學的快速發(fā)展奠定堅實的基礎。