宋立京
(淄博市交通運輸管理處,山東 淄博 255000)
在比較國民收入差距時有一個客觀的統計指標,即用全國收入最高的20%的人均收入和最低的20%的人均收入做一個對比。這一比值的結果,中國是10.7,美國是8.4,俄羅斯是4.5,印度是4.9,可見我國的收入差距之大到了何等不合理的地步。①這也為我們重新認識和評價某些平均指標提出了課題。
究其原因,有些部門對統計數據處理后,致使某些平均指標與現實情況有很大差距。為提升數據利用價值,回歸平均數本質屬性,讓平均數反映數據集中趨勢是統計工作中的重要一環(huán)。
平均指標分為數值平均數和位置平均數。數值平均數包括算術平均數、調和平均數、幾何平均數;位置平均數包括中位數、眾數。平均數多數情況下是指數值平均數中的算術平均數。用公式表示:平均指標=∑各標志值/單位總數。中位數和眾數也是描述一組數據的平均指標。將總體單位按標志值大小排列并平分為兩部分,使得半數單位標志值小于這個數,另外半數單位標志值大于這個數,這個中間值就是這一組數據的中位數。當該組數據個數是偶數時,中位數是中間兩個數的平均數;當數據個數為奇數時,中間位置的數就是中位數。比如,一組排好序列的數據1,2,3,4,5,6中位數是3.5,即(3+4)/2。當數據序列是1,2,3,4,5時,中位數就是3。眾數,顧名思義就是一組數據中出現頻率最多的、最流行的數值。比如,一商品實際售價可能經常變化,而成交數量最多的那個價位就是該商品價格的眾數。在許多情況下,用中位數和眾數表示給定總體的一般水平,更容易為大家接受,具有更強的說服力。
統計學中有“ 平均數不是數”的說法,意思是平均數只代表了這組數據的集中趨勢,可能與任何個體都不一致,有時甚至懸殊很大。產生這種現象的原因有二:
第一,復雜的經濟社會問題的統計資料調查整理過程中往往存在誤差?!?大數據②”時代已經來臨,抽樣調查成為目前統計調查中的主要方法。但是,抽樣調查根據事先確定的誤差允許范圍由部分推斷總體,調查過程中會產生誤差。所以,許多經濟社會問題統計調查的最終結果與身處其中的社會成員主觀感受往往有差距。
第二,數據處理方法不當是造成平均指標不反映數據集中趨勢的重要原因。計算平均指標時,算術平均數是最重要的形式。但是,該指標有它的缺陷,這是由指標計算方法決定的。計算一組數據算術平均數時,如果數據出現較大波動,極端數據會極大地影響平均值的代表性。比如,當數據序列為1,2,3,5,100時,算術平均數是22.2。稍加分析,22.2并不能代表序列中5個數的集中趨勢。
為保證耗費大量人力物力財力算出的數據不至于成為無用數據,政府統計部門應與時俱進,做好以下工作。
一是科學理解平均指標的概念和應用范圍。對于算術平均數、中位數、眾數這三者的定義和特點、適用范圍首先要搞清楚。自2011年2月起,國家統計局每月公布的所謂70個大中城市住宅銷售價格變動情況時,就不再發(fā)布全國70個大中城市房價漲幅平均數,主要就是考慮到在樣本值離散程度較大的情況下計算的平均數有很大誤差,而且還容易引起不必要的誤讀。
其實,有些部門公布的城市平均房價很多情況下也與實際相差較大。這是因為,隨著城市化步伐的快速邁進,原來的郊區(qū)甚至偏僻的村鎮(zhèn)不斷變?yōu)槌菂^(qū),納入了城市房價的統計范圍。而中心城區(qū)由于各種軟件、硬件設施條件好,體現在房價上,就遠遠高于郊區(qū)。計算城市房價時,不考慮這個因素,就犯了忽視數據極端值,簡單套用算術平均數公式的錯誤。
二是根據國情,對有關指標的計算方法進行適當調整。比如,城鎮(zhèn)居民人均可支配收入指標是關乎每個城鎮(zhèn)居民利益的重要指標,也是政府統計部門經常公布的指標,用以反映城鎮(zhèn)居民的生活水平。計算公式是:城鎮(zhèn)居民人均可支配收入=人均總收入-交納所得稅-個人交納的社會保障支出。其實,這樣計算出的數值只能算是賬面上的實際收入,不能算是可支配收入。比如,城市居民每月都要支付一定的房租或房貸。對這部分人來說,他們的可支配收入必須是扣除房租或房貸后的余額。否則,計算出的結果就會偏大。
三是結合其他指標對平均數指標進行必要的補充說明。在計算一組數據的平均指標時,引入標準差、方差、基尼系數等體現數據差異程度的指標非常必要。如果差異程度大,說明平均指標不具有很好的代表性,需要考慮在樣本抽取或是計算方面是否需要改進。
2009年,國家統計局改變了沿襲幾十年的城鎮(zhèn)單位勞動工資統計方法,將工資水平相對較低的私營單位正式納入統計范圍;2010年,又直接采用當地房地產管理部門的網簽數據代替房地產開發(fā)企業(yè)直報數據。這些改進都可以算是抽樣調查過程時更多地考慮到了樣本的代表性問題,統計數據質量有明顯提高。但是,這些工作還有進一步細化的必要。比如,公布城市房價時,對以下相關資料進行附加說明可能會使得結果更加讓人信服。
1.抽樣調查的高、中、低價位的樓盤價格分別是多少;
2.不同價位樓盤各占總樓盤數的多少比例;
3.計算方法是選擇算術平均數還是中位數,抑或眾數;
4.計算出的房屋均價的標準差是多少。
截至目前,平均指標仍然在經濟社會統計中有廣泛的應用,發(fā)揮不可替代的作用。但是,平均數有時并不代表“ 大多數”。正因如此,我們使用這個指標時要注意對計算結果進行校對和糾偏。經濟發(fā)展和社會進步需要全體成員參與,讓人民共享改革發(fā)展成果是我們的方向,也是一個讓平均數變成“ 大多數”的過程。我們需要厘清平均指標的含義和適用條件,查找“ 平均數不反映集中趨勢”問題的原因,并予以針對性解決,使平均指標變得更具有說服力,為反映各種社會問題提供真實的數據參考。
注釋
①北京晚報,2014-12-22,中國國民收入差距達10.7倍 遠高于美國俄羅斯》
②大數據:Big data,或稱巨量資料,指資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理,成為幫助經營決策的資訊。
[1]黃良文主編.《統計學原理》.中國統計出版社,2000.6.
[2]梅長林,周家良編著.《實用統計方法》.科學出版社,2002.
[3]李強,王吉利主編.《統計基礎知識與統計實務》.中國統計出版社,2005.6.
[4]劉飛編著.《高級統計師實務教程》.陜西人民出版社,2012.1.