陳 芳
“三數”知多少
陳 芳
歷史上,平均數最早是用來估計總體的.公元4世紀,在古印度有一個故事:古印度國王圖潘納發(fā)現一棵枝繁葉茂的大樹,他想估計這棵樹上的樹葉和果實的數目.他首先找到根部的一個粗細中等的樹枝,并數出上面樹葉和果實的數目,用這一個樹枝上的樹葉和果實數目乘上樹枝的數目,從而估算出這顆樹上的樹葉和果實的總數目.在這個故事中,圖潘納選用粗細中等的樹枝作為整棵樹枝上樹葉和果實的代表值,這可能是算數平均數的直覺使用,因為所選的樹枝代表了其余所有的樹枝,其數量處于“中間”位置.
平均一詞源于海事法,與保險、公平分享利潤和損失有關.一般地,平均是把一列累加起來,等量分配到每一個個體,使之相等,體現了一種公平、公正精神的訴求,在引申應用中,平均逐漸指代算術平均數.不同起源的算術平均數表現著它的不同內涵,直到19世紀,歷史上的算術平均數才作為一種數據處理方法而出現,和估算有著密切的關系.
1874年,費歇爾試圖用天文學中行之有效的方法描述心理和社會現象,他使用了中位數,還號召簡化中位數的計算,使用中位數的重要原因是它計算的簡化和直覺的清晰性.
平均數、中位數和眾數這三個統(tǒng)計量的相同之處主要表現在:都是來描述數據集中趨勢的統(tǒng)計量;都可用來反映數據的一般水平;都可用來作為一組數據的代表.但它們之間存在著區(qū)別,主要表現在以下方面.
1.定義不同.
平均數:一組數據的總和除以這組數據的個數所得到的商叫這組數據的平均數.
中位數:將一組數據按大小順序排列,如果數據的個數是奇數,那么處在最中間位置的一個數叫做這組數據的中位數;如果數據的個數是偶數,那么處于中間位置的兩個數的平均數叫做這組數據的中位數.
眾數:在一組數據中出現次數最多的數叫做這組數據的眾數.
2.求法不同.
平均數:用所有數據相加的總和除以數據的個數,需要計算才能求出.
中位數:將數據按照從小到大或從大到小的順序排列,處于最中間位置的數,由位置決定,不需或只需簡單的計算.
眾數:一組數據中出現次數最多的那個數,不必計算就可求出.
3.個數不同.
在一組數據中,平均數和中位數都具有唯一性,但眾數有時不具有唯一性.在一組數據中,可能不止一個眾數,也可能沒有眾數.
4.呈現不同.
平均數:是一個“虛擬”的數,是通過計算得到的,它不是數據中的原始數據.
中位數:是一個不完全“虛擬”的數.當一組數據有奇數個時,它就是該組數據進行排序后最中間的那個數據,是這組數據中真實存在的一個數據;但在數據個數為偶數的情況下,中位數是最中間兩個數據的平均數,它不一定與這組數據中的某個數據相等,此時的中位數就是一個“虛擬”的數.
眾數:是一組數據中的原數據,它是真實存在的.
5.代表不同.
平均數:反映了一組數據的平均大小,常用來代表數據的總體“平均水平”.
中位數:像一條分界線,將數據分成前半部分和后半部分,因此用來代表一組數據的“中等水平”.
眾數:反映了出現次數最多的數據,用來代表一組數據的“多數水平”.
這三個統(tǒng)計量雖反映有所不同,但都可表示數據的集中趨勢,都可作為數據一般水平的代表.
6.特點不同.
平均數:與每一個數據都有關,其中任何數據的變動都會引起平均數的變動.主要缺點是易受極端值的影響,這里的極端值是指偏大或偏小數,當出現偏大數時,平均數將會被抬高,當出現偏小數時,平均數會降低.
中位數:與數據的排列位置有關,某些數據的變動對它沒有影響;它是一組數據中間位置上的代表值,不受數據極端值的影響.
眾數:與數據出現的次數有關,著眼于對各數據出現的頻率的考察,其大小只與這組數據中的部分數據有關,不受極端值的影響,其缺點是具有不唯一性,一組數據中眾數可能會有一個,也可能會有多個或沒有.
7.作用不同.
平均數:是統(tǒng)計中最常用的數據代表值,比較可靠和穩(wěn)定,因為它與每一個數據都有關,反映出來的信息最充分.平均數既可以描述一組數據本身的整體平均情況,也可以用來作為不同組數據比較的一個標準.因此,它在生活中應用最廣泛,比如我們經常所說的平均成績、平均身高、平均體重等.
中位數:作為一組數據的代表,可靠性比較差,因為它只利用了部分數據.但當一組數據的個別數據偏大或偏小時,用中位數來描述該組數據的集中趨勢就比較合適.
眾數:作為一組數據的代表,可靠性也比較差,因為它也只利用了部分數據.在一組數據中,如果個別數據有很大的變動,且某個數據出現的次數最多,此時用該數據(即眾數)表示這組數據的“集中趨勢”就比較適合.
(作者單位:江蘇省宿遷市泗洪縣第一實驗學校)