【摘要】大數據時代對統(tǒng)計工作提出了新的要求和挑戰(zhàn)。統(tǒng)計調查作為統(tǒng)計工作的基礎,應該按照規(guī)定的步驟進行,這樣的調查結果才是真實可靠的。同時,調查方式也要創(chuàng)新,傳統(tǒng)的抽樣調查方式應當與網絡調查和一定范圍內的普查相結合。
【關鍵詞】大數據時代 統(tǒng)計調查
統(tǒng)計學領域當前較為流行的詞語之一就是“大數據”。時代要求對海量數據進行加工、提煉,以得到有價值的信息資料。統(tǒng)計調查是統(tǒng)計工作的基礎,如果不能對“大數據”這一新課題進行深入研究,調查結果就會與實際有差距。本文就大數據時代如何開展統(tǒng)計調查進行初步探討。
一、大數據時代統(tǒng)計數據的特點
一是數據總量巨大。2014年8月,IBM(國際商業(yè)機器公司)的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規(guī)模將增長43倍。
二是類型繁多。傳統(tǒng)的統(tǒng)計數據一般側重于對數字關系的計算和對比。在大數據時代,數字只是數據的一小部分,更多的數據表現為網絡日志、音頻、視頻、圖片等等。
三是數據價值密度相對較低。隨著互聯(lián)網技術的進步,大量碎片式的信息不斷被制造出來。但對特定部門和人員來說,其中的絕大多數價值并不大。如何發(fā)揮計算機的強大計算功能更迅速地完成數據價值“提純”,是目前亟待解決的難題。
四是時效性要求高。市場形勢瞬息萬變。如果對市場信息未加及時的分析,政府管理部門就不會做出科學的方針政策,企業(yè)就會在市場競爭時處于劣勢甚至被淘汰。
二、傳統(tǒng)統(tǒng)計調查方式的欠缺
隨著市場經濟的深入推進,統(tǒng)計調查方法改革勢在必行。而現實情況是,多年來,我國各級政府發(fā)布的統(tǒng)計數字不能反映經濟社會發(fā)展真實情況,有關部門陷入了“塔西佗陷阱”的尷尬境地,沒有進行統(tǒng)計調查方法的科學選擇是主要原因。
一是沒有真正做到抽樣調查,樣本的選擇不具代表性。市場經濟條件下,同一行業(yè)內部經營規(guī)模有相當大的差距。為掌握該行業(yè)的總體經營情況,必須確定代表性的樣本,通過對樣本的計算推算出該行業(yè)的總規(guī)模。而現實情況是,受各種主客觀因素制約,在開展調查工作時,沒有嚴格按照抽樣調查的原則要求進行。有的通過網絡調查的方式進行,有的則采取大街上發(fā)放調查問卷的方式,甚至進行“選擇性”調查,也就是怎么方便怎么調查,等等。這些調查方式,雖然名義上是抽樣了,實際上樣本沒有做到“隨機”,所以其代表性大打折扣。
二是統(tǒng)計調查過程不嚴謹,數據處理不科學。許多統(tǒng)計調查不是由專業(yè)的統(tǒng)計機構而是由行業(yè)管理部門自身開展的。受各種因素制約和影響,樣本確定后,有的部門不考慮影響數據變動的有關因素,對調查到的數據只進行簡單處理。比如,為反映一個城市公交發(fā)展成都,需要計算該市的公交分擔率。這就需要計算有關公交線路的客運量。據本人查看有關資料,有的部門出于各種目的,會有意識地選擇或避開客運高峰時段進行客運量統(tǒng)計。這樣一來,計算出的結果往往差距好幾個百分點。又如,各級統(tǒng)計部門公布的人均可支配收入指標,經常遭到大家質疑。這是因為可支配收入指:個人收入扣除向政府繳納的各種直接稅以及非商業(yè)性費用等以后的余額,可以基本認為是每人的實發(fā)工資。而在當下中國,相當一部分人其實還有一部分支出,那就是每月要還房貸,許多年輕夫婦一人的大部分收入用于還貸,還貸壓力很大。所以在需要還貸的這段時間,他的實際可支配收入可能很低,與官方公布的人均數據差距很大。
三是調查資料利用度低。第一,許多統(tǒng)計調查僅有數據的羅列,或是進行簡單的求和、平均、增長速度等處理,沒有進行正態(tài)檢驗、相關回歸等基本統(tǒng)計分析和主成分分析、因子分析等多元統(tǒng)計分析。第二,許多統(tǒng)計調查報告文字說明有余,數據資料不足。有論點沒有論證,加上論據不足,所以調查資料的指導意義不大。第三,信息化建設滯后,有的統(tǒng)計調查信息陳舊,需要資料時不能隨時查閱。還有,許多統(tǒng)計調查工作多部門都在開展但資源彼此不能共享,重復進行。浪費了人力、物力和財力。
三、如何開展科學的統(tǒng)計調查
針對當前我國各行各業(yè)統(tǒng)計調查尤其是行業(yè)管理部門統(tǒng)計調查中存在的薄弱環(huán)節(jié),為取得有價值的統(tǒng)計資料,筆者認為首先要改進統(tǒng)計調查工作。
一是加強行業(yè)主管部門和綜合統(tǒng)計主管部門的合作。進行大規(guī)模的行業(yè)統(tǒng)計調查時,行業(yè)主管部門的統(tǒng)計工作人員應該主動向綜合統(tǒng)計主管部門說明統(tǒng)計調查的思路,介紹本行業(yè)的特點,在樣本選定、數據計算和修正等方面聽取他們的意見,爭取得到他們的業(yè)務支持或指導。
二是加強統(tǒng)計能力建設。大數據時代,統(tǒng)計工作面臨著新的機遇和挑戰(zhàn)。各有關部門和單位尤其是行業(yè)管理部門的統(tǒng)計工作人員一定要樹立大數據的理念,掌握網絡技術,跟上信息技術的發(fā)展。同時,加強統(tǒng)計基礎知識學習,不僅熟練掌握分類、回歸、聚類、偏差等傳統(tǒng)方法,還要掌握最新的數據分析軟件,才能夠從大量數據中提取有用的信息。
參考文獻
[1]黃良文主編.《統(tǒng)計學原理》.中國統(tǒng)計出版社,2000.6.
[2]梅長林,周家良編著.《實用統(tǒng)計方法》.科學出版社,2002.
[3]李強,王吉利主編.《統(tǒng)計基礎知識與統(tǒng)計實務》.中國統(tǒng)計出版社,2005.6.
[4]季曉晶.《大數據時代統(tǒng)計調查工作的挑戰(zhàn)與思考》.《統(tǒng)計與咨詢》,2013-5.
[5]維克托·邁爾·舍恩伯格著,盛楊燕譯.《大數據時代》.浙江人民出版社,2013.1.
[6]曾鴻鐘.《論網絡調查和傳統(tǒng)調查方法的綜合應用》.《工業(yè)技術經濟》,2006.12.
作者簡介:宋立京(1973-),男,山東臨沂人,碩士,山東省淄博市交通運輸管理處統(tǒng)計師。