國外學(xué)者對大數(shù)據(jù)的研究可以追溯到《Nature》于 2008 年推出的 Big Data 專刊,也就是說大數(shù)據(jù)概念在2008年就已經(jīng)被提出。隨著社會對大數(shù)據(jù)的逐漸了解,維基百科給出了一個關(guān)于大數(shù)據(jù)的描述:大數(shù)據(jù)指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。大數(shù)據(jù)科學(xué)家John Rauser提出一個簡單的定義是,大數(shù)據(jù)是指任何超過了一臺計算機處理能力的數(shù)據(jù)。
近年來,在我國對大數(shù)據(jù)的研究和應(yīng)用不僅引起了我國自然科學(xué)和人文社會科學(xué)界的廣泛重視,也受到我國中央政府的高度關(guān)注,并將大數(shù)據(jù)列入國家戰(zhàn)略。《“十二五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》明確提出支持海量數(shù)據(jù)存儲、處理技術(shù)的研發(fā)與產(chǎn)業(yè)化,《國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要》中也提出了“實施國家大數(shù)據(jù)戰(zhàn)略”,這些都說明我國早在“十二五”期間就已經(jīng)在推動大數(shù)發(fā)展,并配套出臺了一系列的文件,如國家先后頒布了《關(guān)于做好制定“互聯(lián)網(wǎng)+”行動計劃有關(guān)工作的通知》《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020)》《關(guān)于組織實施促進大數(shù)據(jù)發(fā)展重大工程的通知》《促進大數(shù)據(jù)發(fā)展行動綱要》等。
作為政府統(tǒng)計部門,國家統(tǒng)計局也在高度關(guān)注大數(shù)據(jù)在統(tǒng)計工作中的應(yīng)用。2012年8月國家統(tǒng)計局科研所就召開了大數(shù)據(jù)應(yīng)用研究座談會,提出了在大數(shù)據(jù)時代運用現(xiàn)代信息技術(shù)建立統(tǒng)計云架構(gòu)的研究目標(biāo)。2013年11月,國家統(tǒng)計局與上海鋼聯(lián)電子商務(wù)股份有限公司、山東卓創(chuàng)資訊集團有限公司、58同城信息技術(shù)有限公司、天云融創(chuàng)數(shù)據(jù)科技(北京)有限公司、中國聯(lián)合網(wǎng)絡(luò)通信有限公司、天脈聚源(北京)傳媒科技有限公司、百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司、阿里巴巴(中國)有限公司、紐海信息技術(shù)(上海)有限公司、昆明泛亞有色金屬交易所股份有限公司和南京擎天科技有限公司共11家企業(yè)簽訂了大數(shù)據(jù)戰(zhàn)略合作框架協(xié)議,共同推進大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用。通過國家統(tǒng)計局的一系列動作可以看出,“大數(shù)據(jù)+統(tǒng)計”的大數(shù)據(jù)宏觀管理時代已經(jīng)到來,并即將對未來的統(tǒng)計工作影響深遠。
目前來看,大數(shù)據(jù)已經(jīng)引起了統(tǒng)計部門的高度重視,大數(shù)據(jù)的應(yīng)用必將掀起全國統(tǒng)計系統(tǒng)的一場革命,面對“大數(shù)據(jù)+統(tǒng)計”,統(tǒng)計系統(tǒng)既要抓住機遇,又要迎接挑戰(zhàn)。
大數(shù)據(jù)促進了部門數(shù)據(jù)的共享。我國的統(tǒng)計體系分為政府綜合統(tǒng)計和部門統(tǒng)計兩大體系,大量的數(shù)據(jù)分布各個領(lǐng)域,由于沒有統(tǒng)一的數(shù)據(jù)規(guī)范,跨部門、跨行業(yè)、跨地區(qū)的信息很難實現(xiàn)互連互通,形成許多信息孤島,導(dǎo)致數(shù)據(jù)無法系統(tǒng)地進行整合,對數(shù)據(jù)的挖掘、分析造成了壁壘。在大數(shù)據(jù)時代,通過建立政府部門與應(yīng)用平臺之間的統(tǒng)一數(shù)據(jù)交換接口,有效地規(guī)范和整合各部門、行業(yè)間的信息資源,來滿足各方面需求,進而提高工作效率?,F(xiàn)在的市場上的商用企業(yè)信息查詢系統(tǒng),“啟信寶”、 “天眼查”、“企查查”等大數(shù)據(jù)平臺,就是充分利用了全國企業(yè)信用信息公示系統(tǒng)中的企業(yè)信息數(shù)據(jù)為基礎(chǔ),再將中國裁判文書網(wǎng)、中國執(zhí)行信息公開網(wǎng)、國家知識產(chǎn)權(quán)局、商標(biāo)局、版權(quán)局等網(wǎng)上公開的企業(yè)信息數(shù)據(jù)進行挖掘和整合,而形成的大數(shù)據(jù),這些數(shù)據(jù)對于社會公眾全面了解企業(yè)發(fā)展現(xiàn)狀具有很大的幫助作用。
大數(shù)據(jù)創(chuàng)新了數(shù)據(jù)的采集方式,提高了采集效率。 “一套表”聯(lián)網(wǎng)直報是目前統(tǒng)計信息化的重要工具之一,有利于統(tǒng)一業(yè)務(wù)流程,保證數(shù)據(jù)質(zhì)量,但也存在平臺不完善,制度不健全,管理模式不合理等缺點。大數(shù)據(jù)時代將為政府統(tǒng)計部門提供一個更加完善的、開放的的信息系統(tǒng),以便在相對統(tǒng)一的數(shù)據(jù)收集框架下開展數(shù)據(jù)采集工作,并及時解決數(shù)據(jù)存在的冗余、空缺和錯誤,以及更新不及時等問題,進一步提高統(tǒng)計數(shù)據(jù)質(zhì)量。傳統(tǒng)的數(shù)據(jù)采集方式多是通過紙質(zhì)報表和手工記錄來完成,數(shù)據(jù)采集過程中對人員的專業(yè)要求比較高,而在大數(shù)據(jù)時代,統(tǒng)計數(shù)據(jù)的采集是通過互聯(lián)網(wǎng)、計算機等工具來完成,只要采集人員能夠熟練掌握互聯(lián)網(wǎng)、計算機等新興的信息化技術(shù)即可。這些方式不僅能降低統(tǒng)計信息采集的門檻,還能吸引更多非統(tǒng)計專業(yè)人員參與到統(tǒng)計工作中來。另一方面,通過大數(shù)據(jù)也提高了數(shù)據(jù)采集效率,使統(tǒng)計數(shù)據(jù)能夠及時、準(zhǔn)確地反映經(jīng)濟社會發(fā)展現(xiàn)狀。
大數(shù)據(jù)對統(tǒng)計工作帶來了機遇也帶來了新的挑戰(zhàn)。在當(dāng)前的政府統(tǒng)計工作中全面運用大數(shù)據(jù)進行統(tǒng)計分析還需要很長一段時間。在這個傳統(tǒng)與現(xiàn)代統(tǒng)計生產(chǎn)方式相互交織的過程中,對政府統(tǒng)計能力提出了新挑戰(zhàn)。一方面政府統(tǒng)計數(shù)據(jù)還要繼續(xù)使用傳統(tǒng)的統(tǒng)計調(diào)查方法、數(shù)據(jù)采集和數(shù)據(jù)處理方式來開展日常工作,以滿足國家當(dāng)前宏觀管理和社會公眾需要。另一方面,政府統(tǒng)計系統(tǒng)還要超前謀劃,積極主動地投入大量的人力物力進行大數(shù)據(jù)的挖掘、處理和運用,否則將無法適應(yīng)大數(shù)據(jù)宏觀管理時代和公眾社會時代對統(tǒng)計工作的新要求。
大數(shù)據(jù)對統(tǒng)計數(shù)據(jù)的權(quán)威性帶來了挑戰(zhàn)。過去提到數(shù)據(jù)不由自主地就會想到統(tǒng)計部門。但是,倘若現(xiàn)在再堅持這種的觀點,那就不是與時俱進了,而是逆潮流而退了?,F(xiàn)代社會,以電子商務(wù)、網(wǎng)絡(luò)社交、網(wǎng)絡(luò)游戲和在線搜索為主體的互聯(lián)網(wǎng)經(jīng)濟日新月異,海量數(shù)據(jù)由統(tǒng)計部門掌控的時代已經(jīng)一去不在復(fù)返。各個企業(yè)和國民經(jīng)濟各個部門以及社會群體都擁有大量的可觀數(shù)據(jù),只要對其進行數(shù)據(jù)挖掘,便可得到十分重要的“數(shù)據(jù)寶藏”。面對大數(shù)據(jù)時代,統(tǒng)計系統(tǒng)如果還沉浸在“法定數(shù)據(jù)”、“法定部門”的官本位思想中,并試圖繼續(xù)維護統(tǒng)計部門的權(quán)威性將越來越艱難。
面對當(dāng)前大數(shù)據(jù)時代的到來,統(tǒng)計部門在開展各項調(diào)查、周期性普查工作中,不可回避大數(shù)據(jù)時代對統(tǒng)計工作的沖擊。2018年將開展“四經(jīng)普”工作,如何充分利用大數(shù)據(jù)成果開展經(jīng)濟普查工作,將是一個嶄新的課題,也是對新時代統(tǒng)計工作的一個檢驗。
2018年第四次全國經(jīng)濟普查,是在十九大后習(xí)近平新時代背景下,開展的第一次全國大型普查,也為我國制定“十四五”規(guī)劃提供重要的基礎(chǔ)性資料,此次普查要全面調(diào)查我國第二產(chǎn)業(yè)和第三產(chǎn)業(yè)的發(fā)展規(guī)模、布局和效益,了解產(chǎn)業(yè)組織、結(jié)構(gòu)、技術(shù)、形態(tài)的現(xiàn)狀以及各生產(chǎn)要素的構(gòu)成,并摸清全部法人單位資產(chǎn)負債和新興產(chǎn)業(yè)發(fā)展情況,進一步查實各類單位的基本情況和主要產(chǎn)品產(chǎn)量、服務(wù)活動,全面準(zhǔn)確反映供給側(cè)結(jié)構(gòu)性改革、新動能培育、經(jīng)濟結(jié)構(gòu)優(yōu)化等方面的新進展??梢钥闯鼋?jīng)濟普查的指標(biāo)多,涉及到單位的方方面面內(nèi)容。而在商事制度改革后,各類經(jīng)濟主體日新月異,每天都有大量的經(jīng)濟單元“誕生”,這就要求摸清普查對象單位數(shù)據(jù)是一項重要的基礎(chǔ)性工作,如實填報普查對象的經(jīng)營信息是普查最低要求。面對繁重的普查工作,如何利用大數(shù)據(jù)來提高普查數(shù)據(jù)質(zhì)量和工作效率將顯得尤為重要。
1.充分利用商用企業(yè)信息查詢系統(tǒng)大數(shù)據(jù),開展企業(yè)單位清查。根據(jù)《普查試點方案》要求,此次普查明確提出,在正式登記前進行全面的地毯式單位清查。2013年的經(jīng)濟普查,由于沒有單獨地進行單位清查,在正式普查登記階段,耗費了大量的時間進行查遺補漏,而結(jié)果卻不是令人十分滿意。建議在現(xiàn)有名錄庫數(shù)據(jù)的基礎(chǔ)上,充分利用商用企業(yè)信息查詢系統(tǒng)對名錄庫數(shù)據(jù)進行全面的更新維護。首先,按照單位名稱信息剔除工商部、編制、民政等部門已注銷的單位名錄,然后利用企業(yè)2018年上半年工商企業(yè)年報信息對單位名稱和法人代表相同的單位進行全面的覆蓋式更新,進而解決名錄庫工作中的歷史遺留問題,凈化名錄庫數(shù)據(jù)。
2.充分利用編制、人社、民政部門大數(shù)據(jù)覆蓋更新機關(guān)、事業(yè)、社團等單位信息。根據(jù)社會統(tǒng)一信用代碼證辦理規(guī)定,2017年底所有的單位必須完成換證工作,同時結(jié)合機關(guān)、事業(yè)單位養(yǎng)老制度改革,充分利用部門數(shù)據(jù)實現(xiàn)全面批量覆蓋統(tǒng)計部門名錄庫中的機關(guān)、事業(yè)、社團單位名錄。通過上述兩種方式摸清轄區(qū)內(nèi)的單位“家底”,減輕基層普查中的查遺補漏工作量。
3.充分利用稅務(wù)、財政、人社部門財務(wù)大數(shù)據(jù),更新維護單位財務(wù)指標(biāo)。企業(yè)的生產(chǎn)經(jīng)營指標(biāo)可以通過稅務(wù)的納稅記錄進行更新,機關(guān)、事業(yè)單位的非企業(yè)支出、從業(yè)人員可以通過財政部門和人社部門的數(shù)據(jù)進行更新,確保在清查階段開始前,能夠?qū)⒁粋€精準(zhǔn)、完整的普查單位名錄清單以及財務(wù)指標(biāo)數(shù)據(jù)導(dǎo)入到PDA數(shù)據(jù)采集終端中,普查員只要利用PDA數(shù)據(jù)采集終端逐一上門核實、更新變動的相關(guān)數(shù)據(jù)信息便可。
4.充分利用大數(shù)據(jù)開展后期普查數(shù)據(jù)的開發(fā)利用。當(dāng)今世界,大數(shù)據(jù)、云計算、人工智能等技術(shù)迅速發(fā)展,地理信息技術(shù)也開始擁抱大數(shù)據(jù)。統(tǒng)計地理信息系統(tǒng)是未來統(tǒng)計成果展示的發(fā)展方向,在“四經(jīng)普”后期資料開發(fā)中要充分將普查成果進行可視化處理,并進一步整合人口普查、一套表數(shù)據(jù)、年鑒以及其他相關(guān)部門的資料,讓在數(shù)據(jù)通過各種圖表進行融合展示,使普查成果更好地服務(wù)社會大眾。地理信息技術(shù)與大數(shù)據(jù)結(jié)合將會產(chǎn)生非常神奇的效果,可以讓人做到“所見既所得”,使數(shù)據(jù)的展現(xiàn)更加直觀、易讀。
綜上所述“四經(jīng)普”是2018年全國統(tǒng)計系統(tǒng)的一項重要工作,充分利用大數(shù)據(jù)是普查工作的必由之路。目前,不管是“大數(shù)據(jù)”依托統(tǒng)計工作,還是統(tǒng)計工作依托“大數(shù)據(jù)”,這已不是主要問題,但是統(tǒng)計工作如何充分利用“大數(shù)據(jù)”,做到“大數(shù)據(jù)”與傳統(tǒng)統(tǒng)計無縫銜接卻是目前統(tǒng)計工作需要解決的問題。在大數(shù)據(jù)時代下,統(tǒng)計的生命在于服務(wù),統(tǒng)計部門應(yīng)該順勢而為,充分挖掘、利用好“大數(shù)據(jù)”,進而提高統(tǒng)計信息服務(wù)水平,以適應(yīng)國家宏觀管理和決策的需要。