統(tǒng)計數(shù)據(jù)伴隨著我們的工作和生活,是具體、詳細(xì)、清晰地認(rèn)識事物時不可或缺的重要工具。當(dāng)說明事物的狀態(tài)時,如果僅從定性的角度加以描述,很可能給人以模糊不清的印象。比如,評論某人收入很高,某企業(yè)發(fā)展很快,那么多少算高、多少算快呢?讓我們換一種說法來描述:某人月收入5萬元,某企業(yè)年銷售增長率達(dá)50%——這樣的信息,讓人們對某人的收入狀況與某企業(yè)的發(fā)展速度了然于心。這就是統(tǒng)計數(shù)據(jù)的魅力。統(tǒng)計數(shù)據(jù)在幫助我們認(rèn)識事物及決策方面具有迷人的功效。正如一位資深的統(tǒng)計學(xué)家所說:統(tǒng)計就和柴米油鹽醬醋茶一樣,存在的時候并不是很突出,一旦不見了,人生就是黑白的了。
然而,如果數(shù)據(jù)運用不當(dāng),或者角度偏狹、單一,又或者缺乏對數(shù)據(jù)本質(zhì)的正確認(rèn)識,則不僅不能幫助我們正確認(rèn)識事物,甚至?xí)淙霐?shù)據(jù)的陷阱中。因此,數(shù)據(jù)運用不好,它又會讓人迷惑。就拿最常見的平均數(shù)來說,它似乎是統(tǒng)計中最簡單不過的概念了。然而,你真的了解它嗎?下面就讓筆者通過一些實例帶您領(lǐng)略平均數(shù)的獨特內(nèi)涵。
算術(shù)平均數(shù)的背后
算術(shù)平均數(shù)是最基本的也是最常用的平均指標(biāo),它表明的是同類事物的一般水平。在現(xiàn)實應(yīng)用中經(jīng)常出現(xiàn)對算術(shù)平均數(shù)的理解出現(xiàn)偏差或者不理解的現(xiàn)象。在此,通過兩個例子對應(yīng)用算術(shù)平均數(shù)的前提條件及其影響因素加以說明。
算術(shù)平均數(shù)的應(yīng)用前提——同質(zhì)總體
在日常工作及生活中,經(jīng)常用到算術(shù)平均數(shù),如平均工資、人均消費支出、平均成績等。但是,媒體上發(fā)布的該類數(shù)據(jù)經(jīng)常會遭到公眾的質(zhì)疑。為什么會產(chǎn)生這樣的結(jié)果呢?在此通過一個簡單的例子來說明這個問題。
假如某公司有8個員工,基年和報告年年收入資料如下,計算人均收入增長率:
基年平均收入:
1310000/8=163750元
報告年平均收入:
1510000/8=188750元
人均收入報告年比基年增長:
188750/163750-1=15.27%
該計算結(jié)果發(fā)布出來,7人(占總?cè)藬?shù)的87.5%)會覺得不可思議:我們的收入沒有超過10萬的,平均收入?yún)s達(dá)到16萬以上;我們的收入一分沒漲,平均收入?yún)s增長15.2%。但是,平均收入計算是沒有錯誤的。
讓我們來看看平均數(shù)的計算過程:每一個人的收入在平均數(shù)的計算中都發(fā)揮了一定的作用,由于員工中出現(xiàn)一個極端高收入者,達(dá)到100萬元以上,致使總體的平均收入被大大拉高了,偏離了大多數(shù)員工的收入水平。因此,從計算的結(jié)果來看,該平均收入并不具有代表性。
平均數(shù)的本質(zhì)是反映同類事物數(shù)據(jù)一般水平的代表值,當(dāng)該數(shù)據(jù)不具有代表性時,說明總體并非同質(zhì)總體,即不是同一類事物。該例中8號員工不是普通的員工,作為高層管理人員和其他員工存在質(zhì)的差異,應(yīng)當(dāng)分別計算平均收入。
因此,不是任何一堆數(shù)據(jù)放在一起都是可以計算平均數(shù)的,對非同質(zhì)總體計算平均數(shù)毫無意義,強(qiáng)行計算出的平均數(shù)不具有代表性。在上述事例中,8號員工收入達(dá)到100萬,與另外7個人的收入出現(xiàn)顯著差異,8號員工與另外7人應(yīng)該不屬于同一總體范疇,而由此計算出的平均數(shù)163750元不能夠反映上述員工的收入一般水平,該平均數(shù)不具有代表性。對于該例,在計算平均收入時,應(yīng)將8號員工剔除出該總體范圍??傊?,正確應(yīng)用平均數(shù)的基本前提條件是建立同質(zhì)總體。
結(jié)構(gòu)因素對平均數(shù)的影響
一個朋友在兩個地段分別經(jīng)營了兩個商鋪,某月份兩個店鋪每天的價格記錄如下。她困惑地找到我,為什么甲店每天的價格都比乙店高,而平均價格卻低于乙店?為了能夠更清楚地說明問題,在此將數(shù)據(jù)進(jìn)行了處理,并計算如下(見下表):
平均數(shù)的影響因素有兩個:被平均的數(shù)據(jù)和數(shù)據(jù)出現(xiàn)的次數(shù)。
f(或f/∑f)為權(quán)數(shù),它具有權(quán)衡輕重的作用,即哪一組變量值出現(xiàn)的次數(shù)多,哪一組變量值在平均數(shù)計算的過程中發(fā)揮的作用就大。
該例資料顯示,盡管甲店每天的價格都高于乙店,但是平均價格甲店卻低于乙店。之所以會出現(xiàn)該種情形是因為甲店價格處于108以上的高位時,其銷售量占比為10%,而處于102及以下的低價位時,其銷量占比高達(dá)55%;乙店恰好相反,價格處于106以上高位時,銷量占比達(dá)55%,價格處于100及以下低位時,其銷售量占比為10%。
可見,數(shù)據(jù)的結(jié)構(gòu)是平均數(shù)計算過程中的一個重要影響因素。
相對數(shù)的平均算法
正如前文所述,算術(shù)平均數(shù)是最常用的平均指標(biāo),但是,對產(chǎn)品合格率這一類的相對數(shù)求平均,算術(shù)平均數(shù)就不適用了。請看下面二例:
(1)某種零件加工需經(jīng)過鋸、磨、車、插四道工序?,F(xiàn)加工1000個零件,各道工序的合格率分別是95%、98%、93%、100%,計算各道工序的平均合格率。由于合格率不能相加,所以采用算術(shù)平均法求平均合格率是不可行的。
下面分析一下該例的特點,四道工序存在相關(guān)性,后道工序必須在前道工序的基礎(chǔ)上進(jìn)行加工生產(chǎn)。經(jīng)過四道工序,最終得到的合格產(chǎn)品數(shù)量是:
1000×95%×98%×93%×100%
=865(件)
產(chǎn)品總的合格率為865/1000
=95%×98%×93%×100%
=86.5%
由于總的比率等于被平均比率的連乘積,因此,四道工序的平均合格率要用幾何平均法計算:
幾何平均數(shù)是針對特定的相對數(shù)求平均的方法,它是變量值連乘積的n次方根。當(dāng)被平均的相對數(shù)的連乘積等于總的比率或總速度時,應(yīng)該采用幾何平均法求平均。
(2)某公司下屬四個企業(yè)生產(chǎn)同一種產(chǎn)品,某月份產(chǎn)出量分別為300件、500件、600件、1000件,合格率分別為95%、98%、93%、100%,計算該企業(yè)產(chǎn)品的平均合格率。
該問題也是對相對數(shù)求平均,但是,被平均的四個相對數(shù)之間沒有相關(guān)性。對這類相對數(shù)求平均既不能采用算術(shù)平均法,也不適合采用幾何平均法。
由于是對相對數(shù)求平均,最終結(jié)果仍然是相對數(shù)。而相對數(shù)是根據(jù)兩個數(shù)值之比求得,對這類不存在相關(guān)性的相對數(shù)求平均,其平均體現(xiàn)在該相對數(shù)的分子和分母上,即對該相對數(shù)的分子和分母分別求平均,再對比,在此,把它稱為比值平均數(shù)。本例產(chǎn)品平均合格率的計算方法如下:
對相對數(shù)求平均的方法提示:對相對數(shù)求平均,絕對不可采用算術(shù)平均法。當(dāng)被平均的相對數(shù)存在相關(guān)性時,即其連乘積等于總的比率,則采用幾何平均法;如果被平均的相對數(shù)不存在相關(guān)性,則采用比值平均法。
看似簡單的平均數(shù)其實奧妙無窮,正確加以運用,有助于我們認(rèn)識事物和分析問題,是科學(xué)決策不可缺少的有力武器。