李士猛 步倩
摘 要:大數(shù)據(jù)時(shí)代的來臨,海量般的數(shù)據(jù)從簡(jiǎn)單的處理對(duì)象開始轉(zhuǎn)變?yōu)橐环N基礎(chǔ)性資源,如何更好有效地管理和充分挖掘利用大數(shù)據(jù),對(duì)我國統(tǒng)計(jì)提出極大的挑戰(zhàn)。本文重點(diǎn)闡述大數(shù)據(jù)對(duì)經(jīng)濟(jì)統(tǒng)計(jì)和政府統(tǒng)計(jì)帶來的影響,并提出相應(yīng)的建議。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)數(shù)據(jù);政府統(tǒng)計(jì)
一、引言
隨著信息技術(shù)的不斷發(fā)展和普及,大數(shù)據(jù)時(shí)代悄然而至,給世界各個(gè)行業(yè)帶來前所未有的變化。大數(shù)據(jù)時(shí)代不僅帶來海量數(shù)據(jù),而且開啟了人們利用數(shù)據(jù)的新模式,給傳統(tǒng)統(tǒng)計(jì)帶來前所未有的強(qiáng)有力沖擊。企業(yè)、公司等如何利用海量數(shù)據(jù),政府部門如何在統(tǒng)計(jì)工作中結(jié)合大數(shù)據(jù)改革現(xiàn)有統(tǒng)計(jì)流程,成為經(jīng)濟(jì)統(tǒng)計(jì)學(xué)者們亟待思考和解決的問題。
二、大數(shù)據(jù)定義及其特征
1.大數(shù)據(jù)的定義。大數(shù)據(jù)概念最早源于IT行業(yè)的數(shù)據(jù)庫領(lǐng)域,被認(rèn)為是表示數(shù)據(jù)量很大、數(shù)據(jù)形式多樣化的非結(jié)構(gòu)化數(shù)據(jù),是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。從數(shù)據(jù)的類別上看,"大數(shù)據(jù)"指的是無法使用傳統(tǒng)流程或工具處理或分析的信息。究竟什么是大數(shù)據(jù),目前還沒有權(quán)威統(tǒng)計(jì)的定義,但是大數(shù)據(jù)必將帶來社會(huì)新的變革。
2.大數(shù)據(jù)的特征。(1)數(shù)據(jù)容量巨大。從TB級(jí)別,躍升到PB級(jí)別。傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)收集包括抽樣調(diào)查、普查等等,所得到的數(shù)據(jù)量和大數(shù)據(jù)容量不能相比。據(jù)統(tǒng)計(jì),目前世界儲(chǔ)存信息量的速度比世界經(jīng)濟(jì)的增長速度快4倍,計(jì)算機(jī)處理數(shù)據(jù)的速度比世界經(jīng)濟(jì)增長速度快9倍。(2)數(shù)據(jù)類型繁多。包括網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息,等等。世界每天以飛快的速度儲(chǔ)存著大量的數(shù)據(jù),這些數(shù)據(jù)以復(fù)雜的形式記錄下來,來供人們利用,但是其中只有很小部分被利用。(3)價(jià)值密度低。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅有一兩秒。海量的儲(chǔ)存數(shù)據(jù)中,蘊(yùn)含著巨大價(jià)值,但實(shí)際有意義的數(shù)據(jù),就在其中的特別小的一部分。(4)處理速度快。這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及遍布地球各個(gè)角落的各種各樣的傳感器,無一不是數(shù)據(jù)來源或者承載的方式。
三、大數(shù)據(jù)對(duì)統(tǒng)計(jì)的影響
1.大數(shù)據(jù)對(duì)經(jīng)濟(jì)統(tǒng)計(jì)的影響。(1)數(shù)據(jù)收集方式的變化。傳統(tǒng)的數(shù)據(jù)收集方式通常包括:普查、問卷調(diào)查、抽樣調(diào)查、報(bào)表收集等等。傳統(tǒng)的數(shù)據(jù)收集方法已不能滿足現(xiàn)代人們的數(shù)據(jù)的需求,傳統(tǒng)的數(shù)據(jù)收集方式已也不適合大數(shù)據(jù)時(shí)代的數(shù)據(jù)收集,并且海量數(shù)據(jù)的處理和分析傳統(tǒng)的應(yīng)用軟件也無法實(shí)現(xiàn)。這就要求需要轉(zhuǎn)變新的數(shù)據(jù)收集方式、處理分析手段與之相適應(yīng),才能更好的開發(fā)海量的數(shù)據(jù)庫。(2)不再依賴隨機(jī)抽樣。傳統(tǒng)的數(shù)據(jù)采集中,隨機(jī)抽樣、抽樣分析扮演著很重要的角色。但大數(shù)據(jù)時(shí)代的到來,我們需要分析更多的數(shù)據(jù),甚至可以得到與某些現(xiàn)象的全部數(shù)據(jù)。全數(shù)據(jù)模式已成為一種可能,大數(shù)據(jù)分析采用所有數(shù)據(jù),能帶來更高的準(zhǔn)確性和時(shí)效性。(3)不再尋求因果關(guān)系。傳統(tǒng)的統(tǒng)計(jì)工作中,習(xí)慣性去尋求一種因果關(guān)系。在大數(shù)據(jù)時(shí)代,我們不需要再去發(fā)現(xiàn)事物之間的因果關(guān)系,而更需要我們關(guān)注的是事物之間的相關(guān)關(guān)系,通過分析數(shù)據(jù)之間的相關(guān)關(guān)系,來發(fā)掘數(shù)據(jù)中的價(jià)值。
2.大數(shù)據(jù)對(duì)政府統(tǒng)計(jì)的影響。與傳統(tǒng)政府統(tǒng)計(jì)相比,大數(shù)據(jù)能夠給政府統(tǒng)計(jì)帶來翻天覆地的變化:擴(kuò)充記錄內(nèi)容量,擴(kuò)大調(diào)查樣本范圍,提高調(diào)查時(shí)效和結(jié)果的準(zhǔn)確性。
(1)居民消費(fèi)價(jià)格調(diào)查。當(dāng)前采用的居民消費(fèi)價(jià)格(CPI)中包含很多種類,包括食雜店、百貨店、超市、購物中心、農(nóng)貿(mào)市場(chǎng)及服務(wù)消費(fèi)單位等,每月發(fā)布一次,存在一定的滯后性。如果應(yīng)用大數(shù)據(jù)技術(shù),調(diào)查范圍更加廣泛,樣本量更大,得到的CPI是對(duì)市場(chǎng)價(jià)格的實(shí)時(shí)反映,可以做到每天發(fā)布,提高價(jià)格調(diào)查的時(shí)效性和數(shù)據(jù)質(zhì)量。
(2)人口普查。我國是一個(gè)人口大國,傳統(tǒng)的人口普查是通過入戶調(diào)查、填寫問卷、光電掃描錄入或人口錄入數(shù)據(jù)而得到相關(guān)數(shù)據(jù)的?;ㄙM(fèi)大量的人力、物力、財(cái)力,信息也有較大的時(shí)間滯后性。如果建立一套有效的人口管理系統(tǒng),利用大數(shù)據(jù)庫,可以高時(shí)效和高精度地完成全國人口普查。
(3)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量。統(tǒng)計(jì)部門每年要對(duì)我國經(jīng)濟(jì)社會(huì)各個(gè)方面進(jìn)行檢測(cè),通過抽樣調(diào)查獲得大量數(shù)據(jù),難免會(huì)出現(xiàn)誤差。在大數(shù)據(jù)時(shí)代,政府部門如果建立一套有效機(jī)制,很好的利用大數(shù)據(jù)庫,不僅可以減少統(tǒng)計(jì)誤差,而且能夠保證發(fā)布數(shù)據(jù)的時(shí)效性和真實(shí)可靠性。
四、結(jié)論
1.改進(jìn)統(tǒng)計(jì)方法,充分利用大數(shù)據(jù)庫。大數(shù)據(jù)時(shí)代帶來了海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)收集方式已不能與之相匹配,全數(shù)據(jù)模式開啟了統(tǒng)計(jì)方法的變革。在大數(shù)據(jù)庫面前,傳統(tǒng)的抽樣調(diào)查沒有被淘汰,而是一些抽樣調(diào)查可以被全新的數(shù)據(jù)收集方式取代,通過新的收據(jù)處理可以更準(zhǔn)確的反映社會(huì)經(jīng)濟(jì)現(xiàn)象。
2.有效利用大數(shù)據(jù),提高統(tǒng)計(jì)質(zhì)量。傳統(tǒng)的政府統(tǒng)計(jì),是在利用現(xiàn)有的統(tǒng)計(jì)方法來實(shí)現(xiàn)對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象的觀測(cè)。大數(shù)據(jù)時(shí)代的到來,必然對(duì)原有政府統(tǒng)計(jì)產(chǎn)生強(qiáng)有力的沖擊。政府部門可以通過現(xiàn)有技術(shù)條件,有效利用大數(shù)據(jù)庫,不僅能夠提高統(tǒng)計(jì)數(shù)據(jù)質(zhì)量,而且能夠提高數(shù)據(jù)發(fā)布的時(shí)效性。
參考文獻(xiàn):
[1]喬晗.“大數(shù)據(jù)”背景下利用掃描數(shù)據(jù)編制中國CPI問題研究[J].統(tǒng)計(jì)與信息論壇,2014(2):12-18.
[2]曾凡斌.大數(shù)據(jù):一場(chǎng)管理革命[J].中國傳媒科技,2013(1)
[3]涂子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命[M].廣西師范大學(xué)出版,2012(7)
[4]李國杰,稱學(xué)旗.大數(shù)據(jù)的研究現(xiàn)狀與決策思考[J].戰(zhàn)略與決策研究,2012(6)
作者簡(jiǎn)介:李士猛(1987- )男,漢族,河南信陽人?,F(xiàn)為河南財(cái)經(jīng)政法大學(xué)統(tǒng)計(jì)學(xué)院2012級(jí)研究生,研究方向:經(jīng)濟(jì)統(tǒng)計(jì)學(xué);步倩(1988- )女,漢族,河南駐馬店人?,F(xiàn)為河南財(cái)經(jīng)政法大學(xué)統(tǒng)計(jì)學(xué)院2012級(jí)研究生,研究方向:經(jīng)濟(jì)統(tǒng)計(jì)學(xué)endprint