李偉
摘要:隨著多媒體技術的發(fā)展,網絡信息也漸漸豐富起來,大數(shù)據(jù)因其數(shù)據(jù)信息規(guī)模較大、結構復雜,受到各個國家廣泛的關注。并且大數(shù)據(jù)與統(tǒng)計工作之間存在多方面的聯(lián)系大數(shù)據(jù)時代的出現(xiàn)給統(tǒng)計新思維也提出很多要求。本文就大數(shù)據(jù)與統(tǒng)計新思維方式的進行分析,深入探討統(tǒng)計思維的變化及創(chuàng)新大數(shù)據(jù)的收集方式,以期提升大數(shù)據(jù)分析數(shù)據(jù)的效率。
關鍵詞:大數(shù)據(jù) 統(tǒng)計新數(shù)據(jù) 分析
隨著信息時代的發(fā)展,大數(shù)據(jù)發(fā)展的速度變得越來越快,漸漸改變著公眾通過統(tǒng)計知識去探索世界的方法。在以往的統(tǒng)計學分析中,所使用的數(shù)據(jù)一般都是樣本數(shù)據(jù),即現(xiàn)在的大數(shù)據(jù)。大數(shù)據(jù)的數(shù)據(jù)規(guī)模非常廣泛,數(shù)據(jù)的類型非常多,并且更新的速度較快。大數(shù)據(jù)與樣本數(shù)據(jù)相比,其數(shù)據(jù)量較廣,因此,有利于研究人員從多方面統(tǒng)計及分析數(shù)據(jù)。在統(tǒng)計學分析中,研究者所研究的對象沒有更改,但數(shù)據(jù)的來源卻有了相應的變化,比以往的更加完善,相關的統(tǒng)計思維方式也有很大的變化。
一、統(tǒng)計思維的變化
(一)認識數(shù)據(jù)思維
首先,從數(shù)據(jù)來源方面看,以往的樣本數(shù)據(jù)是根據(jù)某種方式來進行收集,但大數(shù)據(jù)主要是來源于網絡,數(shù)據(jù)庫內的信息可被記錄下來,不帶有目的性。因此,對于大數(shù)據(jù)的來源難以追溯。其次,大部分的樣本數(shù)據(jù)的類型都屬于結構型,而大數(shù)據(jù)的類型屬于半結構、非結構及異構型。最后,以往的樣本數(shù)據(jù)可依靠相關的理論基礎,對一些結構型的數(shù)據(jù)實施量化處理,但大數(shù)據(jù)的數(shù)據(jù)類型較為復雜,量化的方式也需要有所更改。
(二)收集數(shù)據(jù)的思維要變化
收集與統(tǒng)計數(shù)據(jù)的思維是確定數(shù)據(jù)統(tǒng)計分析的目的,之后再根據(jù)所需的數(shù)據(jù)進行收集,因此,要仔細分析相應的調查方案,嚴格按照規(guī)定來執(zhí)行各個流程。
(三)分析數(shù)據(jù)的思維
第一,以往的統(tǒng)計思維分析,主要是根據(jù)“定性--定量--再定性”的過程進行,定性的目的是為了確定進行定量分析的方向,根據(jù)相關經驗來判斷,這在數(shù)據(jù)缺失及運算受限的情況之下顯得非常重要。目前主要是依靠數(shù)據(jù)的分析來做判斷,因此,主要要找到定量回應,這對于儲存能力、分析技術的速度不斷提升的今天,探測定量回應的工作,主要是在定量回應當中來尋找真實及重要的數(shù)量管理,進而得出可作為數(shù)據(jù)判斷或者是決策的結論。
第二,以往的統(tǒng)計思維實證分析,要先按照數(shù)據(jù)研究的目的,做出相應的假設,然后再通過收集和分析數(shù)據(jù),驗證該項假設是否成立,分析的思路主要是按照“假設--驗證”的過程來進行,但是這種形式的驗證經常會受到假設條件的限制,造成很多指標選擇不當或者是缺失數(shù)據(jù),最后沒能得出結論。第三,以往的統(tǒng)計思維推斷分析,根據(jù)分布理論,以一定概率作為保障,按照樣本數(shù)據(jù)的特征來推斷出總體的特征,邏輯關系為“分布理論--概率保證--總體推斷”,而推斷評判的標準和樣本沒有關系,但是推斷結果正確與否直接取決定于基本樣本的好壞。
二、積極應對大數(shù)據(jù)
(一)改變對不確定性的認識
統(tǒng)計學出現(xiàn)的目的主要是研究與認識事物發(fā)生的不確定性,因為不管是自然還是社會的經濟現(xiàn)象,隨時都會由于個體間的差異而造成不確定性,想要研究與分析不確定性,就要先收集大量的數(shù)據(jù)信息,在只可以實行抽樣檢測的情況之下,不確定性主要表現(xiàn)在獲取樣本、推斷總體以及建設模型等方面。對大數(shù)據(jù)依然存在相應的個體差異,而區(qū)別就只在于其包含了所有的個體,并不是隨機獲取的樣本。
(二)融合統(tǒng)計技術與云計算技術
盡管當前收集與分析數(shù)據(jù)信息的統(tǒng)計技術已逐漸成熟,但在面對規(guī)模較大的大數(shù)據(jù),也存在一定的困難,這對數(shù)據(jù)信息的計算能力來說是一個挑戰(zhàn)。因此,需要充分使用現(xiàn)代化的信息技術,并借助相應的云計算技術,把其與統(tǒng)計技術相互融合,來處理相關的數(shù)據(jù)。并且大數(shù)據(jù)的數(shù)據(jù)量較大,形式復雜多樣,必須要現(xiàn)從數(shù)據(jù)本身切入,并結合大數(shù)據(jù)的相關特點,仔細查看數(shù)據(jù)的變化情況,不斷創(chuàng)新大數(shù)據(jù)的梳理及分類的方法,只有不斷創(chuàng)新技術才可以適應當前大數(shù)據(jù)對技術的需求。
(三)創(chuàng)新樣本采樣的方式
對于小數(shù)據(jù)時代而言,主要是按照研究的目的進行數(shù)據(jù)采樣,屬于收集數(shù)據(jù)的一種方式。雖然數(shù)據(jù)樣本在總體樣本中只占據(jù)較小的部分,但按照采樣的科學理論,科學的進行采樣可保證數(shù)據(jù)信息的可靠性。系統(tǒng)采樣的信息量有一定的限制,難以滿足信息化社會發(fā)展的需求,但從目前的成本與效率方面來考慮,以往的數(shù)據(jù)采樣調查方式依然被廣泛應用。
(四)因果關系和相關關系
因果關系通常都來源于經驗,但隨著大數(shù)據(jù)時代的到來,就直接推翻了這一論斷。在大數(shù)據(jù)時代環(huán)境之下,并不需要了解其發(fā)展的原因,它的主要核心是建立在相關關系之上,進而可以科學地預測未來事物的發(fā)展方向。但分析事物發(fā)生的因果關系,一直都是人們探索未知世界的一個使命。即在大數(shù)據(jù)時代下,人們只是了解事物發(fā)展的因果關系遠遠不夠,還應充分了解事物間存在的相關關系,只有知道因果關系,才可以有效地使用相關關系,進而協(xié)助研究人員作出科學的決策。
三、結束語
總而言之,隨著大數(shù)據(jù)時代的發(fā)展,對各個領域的發(fā)展都帶來了很大的影響在大數(shù)據(jù)特征的影響之下,統(tǒng)計學分析也漸漸轉變了單一的思維,而是以一種全新的態(tài)度來分析大數(shù)據(jù)所帶來的便利,使用新思維來認識、分析及處理大數(shù)據(jù)中出現(xiàn)的問題,并不斷轉變大數(shù)據(jù)統(tǒng)計學的分析方式,充分利用大數(shù)據(jù)的優(yōu)勢,進而為決策人員提供一些有效及可靠的決策選擇。
參考文獻:
[1]柴世琿.試論大數(shù)據(jù)統(tǒng)計的新思維[J].中國高新技術企業(yè),2015,15
[2]喬紅.現(xiàn)代統(tǒng)計中新思維、新方法的應用[J].現(xiàn)代商業(yè),2015,36
[3]劉軍華.大數(shù)據(jù)視野下統(tǒng)計數(shù)據(jù)質量演變的信息回歸、分布與趨勢[J].統(tǒng)計與信息論壇,2015,149