徐楊
摘 要:隨著政府對(duì)經(jīng)濟(jì)活動(dòng)認(rèn)識(shí)的不斷深入,統(tǒng)計(jì)調(diào)查的方式也由全面普查到抽樣調(diào)查,再發(fā)展到大數(shù)據(jù)時(shí)代的全面調(diào)查。大數(shù)據(jù)擁有的智能化、高效率的優(yōu)勢(shì),在與傳統(tǒng)調(diào)查方式的對(duì)比中逐漸凸顯出來(lái)。本文對(duì)大數(shù)據(jù)時(shí)代下抽樣調(diào)查存在的意義和方式進(jìn)行探討,比較分析大數(shù)據(jù)在政府統(tǒng)計(jì)中的應(yīng)用和抽樣調(diào)查的優(yōu)缺點(diǎn),探索大數(shù)據(jù)和抽樣調(diào)查有效銜接的可行性,達(dá)到兩者融合發(fā)展的目的。
關(guān)鍵詞:大數(shù)據(jù)? 抽樣調(diào)查? 政府統(tǒng)計(jì)
中圖分類號(hào):F270.7?文獻(xiàn)標(biāo)識(shí)碼:A?文章編號(hào):2096-0298(2020)03(b)--02
1 數(shù)據(jù)獲取方式的發(fā)展過(guò)程
1.1 抽樣調(diào)查技術(shù)發(fā)展回顧
抽樣調(diào)查是19世紀(jì)從概率論中發(fā)展而來(lái)的一門調(diào)查技術(shù),抽樣調(diào)查方法在我國(guó)經(jīng)歷了曲折的發(fā)展,具體來(lái)說(shuō),新中國(guó)成立以來(lái)抽樣調(diào)查技術(shù)的發(fā)展變化主要有以下幾個(gè)階段:
抽樣調(diào)查技術(shù)的運(yùn)用首先是在農(nóng)業(yè)領(lǐng)域。20世紀(jì)60年代初期,成立了全國(guó)各級(jí)農(nóng)產(chǎn)量調(diào)查隊(duì),運(yùn)用抽樣調(diào)查的方式進(jìn)行農(nóng)作物產(chǎn)量調(diào)查,標(biāo)志著我國(guó)運(yùn)用抽樣技術(shù)完成統(tǒng)計(jì)調(diào)查的開(kāi)始。
然而隨后的20世紀(jì)60年代時(shí)期,抽樣調(diào)查技術(shù)的發(fā)展一度陷入停滯,20世紀(jì)70年代,人們重新開(kāi)始重視抽樣調(diào)查的科學(xué)性和重要性。1980年4月,國(guó)務(wù)院恢復(fù)職工家庭生活抽樣調(diào)查。這一時(shí)期,存在著以全面統(tǒng)計(jì)為主,抽樣調(diào)查為輔的兩種統(tǒng)計(jì)方法。
從1994 年開(kāi)始,政府統(tǒng)計(jì)系統(tǒng)對(duì)統(tǒng)計(jì)調(diào)查制度進(jìn)行修訂,提出采用抽樣調(diào)查和全面調(diào)查相結(jié)合的方法。改革開(kāi)放使經(jīng)濟(jì)、科學(xué)技術(shù)飛速發(fā)展,也對(duì)統(tǒng)計(jì)調(diào)查范圍提出新的要求。1996年國(guó)務(wù)院開(kāi)始對(duì)全國(guó)第二、三產(chǎn)業(yè)中各種經(jīng)濟(jì)類型、各種經(jīng)濟(jì)規(guī)模的企業(yè)進(jìn)行抽樣調(diào)查。與此同時(shí),抽樣調(diào)查在更多的領(lǐng)域得到廣泛應(yīng)用。1993—2000年,我國(guó)建立了人口、工業(yè)、農(nóng)業(yè)、第三產(chǎn)業(yè)、基本單位和對(duì)外經(jīng)濟(jì)等普查制度,基本單位名錄庫(kù)更新維護(hù)制度,建立了個(gè)體私營(yíng)企業(yè)名錄庫(kù)定期更新維護(hù)制度,為開(kāi)展各種抽樣調(diào)查提供了全面準(zhǔn)確的點(diǎn)名庫(kù)和抽樣框,為拓展抽樣調(diào)查奠定了堅(jiān)實(shí)基礎(chǔ)。
1.2 大數(shù)據(jù)時(shí)代來(lái)臨
大數(shù)據(jù),指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn) 。
大數(shù)據(jù)的特征有以下四點(diǎn):(1)數(shù)據(jù)量巨大。(2)類型繁多。(3)價(jià)值密度低。(4)速度快、時(shí)效高。隨著大數(shù)據(jù)的發(fā)展速度不斷加快,政府統(tǒng)計(jì)工作的方法也在發(fā)生變化,逐漸由傳統(tǒng)的抽樣調(diào)查方法向大數(shù)據(jù)分析過(guò)渡。例如,近年來(lái)國(guó)家統(tǒng)計(jì)局通過(guò)與阿里巴巴、百度、騰訊等17家企業(yè)簽署大數(shù)據(jù)戰(zhàn)略合作協(xié)議,直接獲取互聯(lián)網(wǎng)上部分電商交易、行業(yè)平臺(tái)、搜索引擎等多方面的海量數(shù)據(jù),這些數(shù)據(jù)可以對(duì)政府統(tǒng)計(jì)工作進(jìn)行有效補(bǔ)充。由于大數(shù)據(jù)無(wú)可比擬的優(yōu)勢(shì),使得傳統(tǒng)抽樣調(diào)查方法的地位受到挑戰(zhàn),因此,其在今后的政府統(tǒng)計(jì)工作中應(yīng)該何去何從是一個(gè)值得探討的問(wèn)題。
2 調(diào)查方法優(yōu)劣勢(shì)分析
2.1 抽樣調(diào)查優(yōu)勢(shì)與不足
抽樣調(diào)查是一種非全面調(diào)查,它是按照一定程序從總體中抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來(lái)推斷總體特征的數(shù)據(jù)調(diào)查方法。一般來(lái)說(shuō),抽樣調(diào)查既能節(jié)省人力、物力、財(cái)力,又可以提高資料的時(shí)效性,具有許多優(yōu)點(diǎn)。在統(tǒng)計(jì)工作中采用抽樣調(diào)查的好處:第一,經(jīng)濟(jì)性。由于調(diào)查的樣本單位通常是總體單位中的很小一部分,調(diào)查的工作量小,因此調(diào)查費(fèi)用較低。第二,時(shí)效性強(qiáng)。抽樣調(diào)查可以迅速、及時(shí)地獲得所需要的信息。由于工作量小,調(diào)查的準(zhǔn)備時(shí)間、調(diào)查時(shí)間、數(shù)據(jù)處理時(shí)間等都可以大大縮減,從而提高數(shù)據(jù)的時(shí)效性。第三,適應(yīng)面廣。抽樣調(diào)查可以獲得更廣泛的信息,它適用于對(duì)各個(gè)領(lǐng)域、各種問(wèn)題的調(diào)查。例如,產(chǎn)品質(zhì)量檢查、農(nóng)產(chǎn)品實(shí)驗(yàn)、醫(yī)藥的臨床試驗(yàn)等。第四,準(zhǔn)確性高。由于抽樣調(diào)查工作量小,可使各環(huán)節(jié)的工作做得更細(xì)致,誤差往往更小。
當(dāng)然,抽樣調(diào)查也存在明顯缺陷。第一,抽樣調(diào)查對(duì)樣本的代表性和有效性有比較嚴(yán)苛的要求,而在實(shí)際工作中常常難以得到理想的樣本,使得統(tǒng)計(jì)工作難以保證抽樣的科學(xué)性和推算的準(zhǔn)確性。第二,抽樣調(diào)查存在一定的誤差,可能產(chǎn)生于調(diào)查方案設(shè)計(jì)、抽樣設(shè)計(jì)、數(shù)據(jù)搜集、數(shù)據(jù)處理及分析等各個(gè)階段與環(huán)節(jié)。第三,在總體數(shù)據(jù)過(guò)少的情況下,采用抽樣調(diào)查的隨機(jī)性會(huì)受到限制,影響抽樣的代表性。第四,對(duì)于調(diào)查的結(jié)果來(lái)說(shuō),一旦樣本調(diào)查結(jié)果不夠準(zhǔn)確,意味著在總體進(jìn)行推算的時(shí)候會(huì)有較大的誤差。
2.2 大數(shù)據(jù)在政府統(tǒng)計(jì)中的作用分析
與傳統(tǒng)的抽樣調(diào)查方法產(chǎn)生的信息數(shù)據(jù)不同,大數(shù)據(jù)具有數(shù)據(jù)大量化、類型多樣化、快速化、價(jià)值高等特征。現(xiàn)代信息技術(shù)使海量網(wǎng)絡(luò)數(shù)據(jù)成為統(tǒng)計(jì)數(shù)據(jù)的來(lái)源之一。如在居民消費(fèi)價(jià)格統(tǒng)計(jì)(CPI)中,利用互聯(lián)網(wǎng)信息特別是電商交易價(jià)格數(shù)據(jù)以補(bǔ)充完善調(diào)查樣本;在農(nóng)業(yè)統(tǒng)計(jì)中,結(jié)合使用衛(wèi)星影像、空間高分辨圖像和地面定位系統(tǒng)采集設(shè)備、傳感器、物聯(lián)網(wǎng)等技術(shù),獲取有關(guān)農(nóng)作物種植面積、農(nóng)作物種類等海量數(shù)據(jù)。大數(shù)據(jù)并不僅僅擁有海量的數(shù)據(jù)信息,還包括對(duì)數(shù)據(jù)采取專業(yè)化處理。利用大數(shù)據(jù)和云計(jì)算在獲取大量實(shí)時(shí)數(shù)據(jù)的同時(shí),通過(guò)對(duì)這些數(shù)據(jù)的清洗、處理、挖掘和分析,可以在第一時(shí)間了解當(dāng)前經(jīng)濟(jì)社會(huì)的發(fā)展?fàn)顩r,對(duì)發(fā)現(xiàn)的問(wèn)題快速?zèng)Q策快速解決,提高統(tǒng)計(jì)能力和工作效率。
相較于傳統(tǒng)的抽樣調(diào)查方法,大數(shù)據(jù)在政府統(tǒng)計(jì)中的優(yōu)勢(shì)主要有:
(1)快速獲取數(shù)據(jù)信息。大數(shù)據(jù)可以直接調(diào)用現(xiàn)成的、已有的數(shù)據(jù),不需要進(jìn)行抽樣調(diào)查的一系列工作,減少了獲取數(shù)據(jù)所花費(fèi)的時(shí)間,提高了獲得數(shù)據(jù)的時(shí)效性。
(2)在抽樣調(diào)查中,根據(jù)樣本數(shù)據(jù)推論總體狀況往往會(huì)不可避免地存在一定誤差,而大數(shù)據(jù)則不存在這一問(wèn)題,數(shù)據(jù)經(jīng)過(guò)層層記錄毫無(wú)保留地呈現(xiàn),能夠有效避免傳統(tǒng)抽樣調(diào)查方法的弊端。
(3)省去抽樣調(diào)查中諸如調(diào)查方案設(shè)計(jì)、精確度估計(jì)等環(huán)節(jié),相對(duì)于抽樣調(diào)查方法更進(jìn)一步節(jié)省人力物力,提高效率。
(4)為發(fā)現(xiàn)不同領(lǐng)域數(shù)據(jù)間的關(guān)系提供可能。由于大數(shù)據(jù)強(qiáng)大的數(shù)據(jù)處理能力,使得其可以發(fā)現(xiàn)不同領(lǐng)域數(shù)據(jù)間的相關(guān)性,進(jìn)而揭示這些不同領(lǐng)域的數(shù)據(jù)間存在怎樣的聯(lián)系,這使得數(shù)據(jù)的價(jià)值超越了統(tǒng)計(jì)工作預(yù)先設(shè)定的目的。
因此,運(yùn)用大數(shù)據(jù)開(kāi)展統(tǒng)計(jì)工作是大勢(shì)所趨,是時(shí)代發(fā)展的必然選擇。
2.3 融合方法探索
大數(shù)據(jù)與抽樣數(shù)據(jù)互為補(bǔ)充。
一是將大數(shù)據(jù)融入抽樣調(diào)查數(shù)據(jù)搜集階段??梢岳没ヂ?lián)網(wǎng)和手機(jī)移動(dòng)端、數(shù)字化的行政商業(yè)記錄等方式降低調(diào)查成本,縮短調(diào)查時(shí)間,彌補(bǔ)政府抽樣調(diào)查中出現(xiàn)的數(shù)據(jù)難以獲取、數(shù)據(jù)造假、抽樣總體不一致等問(wèn)題。
二是將大數(shù)據(jù)融入抽樣調(diào)查數(shù)據(jù)處理階段。在大數(shù)據(jù)資源不斷生成的今天,抽樣調(diào)查可以利用大數(shù)據(jù)的資源,讓大數(shù)據(jù)幫助抽樣調(diào)查統(tǒng)計(jì)中存在的數(shù)據(jù)誤差問(wèn)題,將調(diào)查數(shù)據(jù)與記錄數(shù)據(jù)相結(jié)合,對(duì)采集數(shù)據(jù)起到互相驗(yàn)證的作用,從而提高數(shù)據(jù)真實(shí)性。
三是將大數(shù)據(jù)融入抽樣調(diào)查數(shù)據(jù)分析階段。新時(shí)期下,政府統(tǒng)計(jì)部門的任何統(tǒng)計(jì)調(diào)查活動(dòng),都是為反映發(fā)展規(guī)律、服務(wù)科學(xué)決策、體現(xiàn)經(jīng)濟(jì)社會(huì)發(fā)展而制定和實(shí)施的,因此,統(tǒng)計(jì)調(diào)查的落腳點(diǎn)在于通過(guò)對(duì)搜集上來(lái)的數(shù)據(jù)進(jìn)行分析,利用統(tǒng)計(jì)分析打造經(jīng)濟(jì)運(yùn)行的“千里眼”、民生發(fā)展的“晴雨表”、企業(yè)運(yùn)行的“百寶箱”??梢酝ㄟ^(guò)使用大數(shù)據(jù)的分析挖掘技術(shù),將大量數(shù)據(jù)轉(zhuǎn)換為自己所需要的數(shù)據(jù)并進(jìn)行儲(chǔ)存,進(jìn)而構(gòu)建一個(gè)智能分析體系,再結(jié)合抽樣數(shù)據(jù)找到數(shù)據(jù)間的關(guān)聯(lián)性,了解存在的因果關(guān)系。
四是利用部門大數(shù)據(jù)提高抽樣調(diào)查效率。通過(guò)整合政府統(tǒng)計(jì)機(jī)構(gòu)和各政府部門資源,建立全面、系統(tǒng)的統(tǒng)計(jì)制度及部門協(xié)作機(jī)制。由于現(xiàn)在的統(tǒng)計(jì)調(diào)查趨于多元化,如果僅依靠統(tǒng)計(jì)部門,得到的數(shù)據(jù)是不全面的、低效率的。政府統(tǒng)計(jì)部門應(yīng)順應(yīng)時(shí)代發(fā)展需要,利用現(xiàn)有的技術(shù)手段和行政記錄避免許多中間環(huán)節(jié),提高調(diào)查效率,通過(guò)嘗試部門數(shù)據(jù)采集方法,搭建地方政府統(tǒng)計(jì)信息共享數(shù)據(jù)庫(kù),保證抽樣調(diào)查數(shù)據(jù)的全面性、完整性。
3 結(jié)語(yǔ)
信息化的快速發(fā)展給統(tǒng)計(jì)調(diào)查工作創(chuàng)造了新形勢(shì)、新環(huán)境,我們希望用較少的時(shí)間、較少的人力、物力,提供準(zhǔn)確的統(tǒng)計(jì)信息,達(dá)到快速獲取數(shù)據(jù)、科學(xué)分析數(shù)據(jù)的目的。本文在分析抽樣調(diào)查存在的優(yōu)點(diǎn)和不足,以及大數(shù)據(jù)在政府統(tǒng)計(jì)中的作用的基礎(chǔ)上,提出將大數(shù)據(jù)分析與抽樣調(diào)查分析相結(jié)合的思路,認(rèn)為政府抽樣調(diào)查要適應(yīng)新環(huán)境,要將大數(shù)據(jù)應(yīng)用在抽樣調(diào)查的數(shù)據(jù)搜集、數(shù)據(jù)處理及分析等各環(huán)節(jié),完成一個(gè)調(diào)查項(xiàng)目不僅需要選擇合適的抽樣方案和抽樣技術(shù),還需要實(shí)時(shí)的樣本數(shù)據(jù)資料進(jìn)行驗(yàn)證,使調(diào)查數(shù)據(jù)與記錄數(shù)據(jù)相結(jié)合,同時(shí)發(fā)揮部門大數(shù)據(jù)的優(yōu)勢(shì),加強(qiáng)政府部門間的協(xié)調(diào)合作,體現(xiàn)抽樣調(diào)查工作的科學(xué)性。
參考文獻(xiàn)
[1]劉建平,王克林.中美抽樣調(diào)查發(fā)展的比較與思考[J].統(tǒng)計(jì)研究,2009(9).
[2]寧鑫.大數(shù)據(jù)時(shí)代的政府應(yīng)急管理研究[J].廈門廣播電視大學(xué)學(xué)報(bào),2017(15).
[3]金勇進(jìn),戴明峰.我國(guó)政府統(tǒng)計(jì)抽樣調(diào)查的回顧與思考[J].統(tǒng)計(jì)與咨詢,2012(4).
[4]王瑩,萬(wàn)舒晨.大數(shù)據(jù)時(shí)代抽樣調(diào)查面臨的挑戰(zhàn)與機(jī)遇[J].統(tǒng)計(jì)與信息論壇,2016(6).
[5]郭新穎.大數(shù)據(jù)背景下的抽樣問(wèn)題探討[D].蘭州:蘭州財(cái)經(jīng)大學(xué),2017.
[6]杜西平,曹宗泉,等.大政府統(tǒng)計(jì)構(gòu)建中部門數(shù)據(jù)共享的實(shí)踐與研究[J].中國(guó)統(tǒng)計(jì),2016(10).