謝 翰
(廣東省汕尾市陸豐市龍山中學(xué) 516500)
統(tǒng)計(jì)中最基本的是對(duì)一組數(shù)據(jù)的概括性度量,集中趨勢(shì)(算術(shù)平均數(shù)、中位數(shù))與離散程度(平均差、標(biāo)準(zhǔn)差)作為描述數(shù)據(jù)分布特征的一體兩面 , 反映了一組數(shù)據(jù)的中心值和各數(shù)據(jù)遠(yuǎn)離其中心值的程度.只考慮集中趨勢(shì)會(huì)使我們作出對(duì)總體的片面判斷,只有把集中趨勢(shì)和離散程度結(jié)合在一起分析,才能概括出總體的實(shí)際狀態(tài).
離散程度指標(biāo)主要有平均差和標(biāo)準(zhǔn)差兩種,平均差(mean deviation)是各數(shù)據(jù)到其算術(shù)平均數(shù)的平均距離,它綜合反映了各單位相對(duì)其算術(shù)平均數(shù)的平均波動(dòng)程度.
平均差的含義明確,計(jì)算方法簡(jiǎn)單明了,它能夠充分、客觀地反映離散程度.但也要看到,它是以離差的絕對(duì)值為計(jì)算基礎(chǔ)的,這就不利于進(jìn)一步進(jìn)行代數(shù)運(yùn)算了.所以很多教科書都認(rèn)為考察離散程度的大小最常用的統(tǒng)計(jì)量是標(biāo)準(zhǔn)差而非平均差.很多教科書指出,平均差不是變量的解析函數(shù),也沒有函數(shù)的可導(dǎo)性,因而在代數(shù)推斷和應(yīng)用方面都受到很大限制,并在實(shí)際使用上被標(biāo)準(zhǔn)差所取代.據(jù)此,本文從離差和平均數(shù)的性質(zhì)重新出發(fā),推導(dǎo)出了不含絕對(duì)值的平均差新公式.
因?yàn)楦鲉挝恢蹬c其算術(shù)平均數(shù)離差之和等于零,即
(1)
我們將公式(1)稱為新的平均差計(jì)量公式,它是由離差和平均數(shù)的性質(zhì)推導(dǎo)出來的,運(yùn)用公式(1)計(jì)算所得的平均差,不僅在數(shù)值上與傳統(tǒng)方法計(jì)算出來的平均差等價(jià),而且擁有很多優(yōu)良的特性.
從計(jì)算方式、數(shù)學(xué)關(guān)系和敏感性等幾個(gè)方面對(duì)平均差與標(biāo)準(zhǔn)差進(jìn)行比較,可以得出以下結(jié)論:
第一,對(duì)于誰計(jì)算更簡(jiǎn)便的問題,在數(shù)字計(jì)算時(shí),平均差計(jì)算不存在平方和開平方計(jì)算,計(jì)算量遠(yuǎn)低于標(biāo)準(zhǔn)差.在進(jìn)行代數(shù)運(yùn)算時(shí),有了不含絕對(duì)值的平均差新公式,平均差計(jì)算更簡(jiǎn)便的觀點(diǎn)在算術(shù)領(lǐng)域和在代數(shù)領(lǐng)域都能成立.平均差新公式在數(shù)學(xué)處理上比標(biāo)準(zhǔn)差更為合理和優(yōu)越.
第二,對(duì)于同一組統(tǒng)計(jì)數(shù)據(jù),平均差(Md)與標(biāo)準(zhǔn)差(σ)一定是如下關(guān)系:
σ≥Md≥0
第三,標(biāo)準(zhǔn)差的計(jì)算過程中,在離差的絕對(duì)值大于1時(shí)有高估離散程度問題,在離差的絕對(duì)值小于1時(shí)有低估離散程度問題.這種現(xiàn)象,在U形分布中比在鐘形分布中更為明顯.
第四,平均差新公式大大拓展了平均差具有的數(shù)學(xué)性質(zhì),并且與標(biāo)準(zhǔn)差相比,它兼具反映離散程度的準(zhǔn)確性優(yōu)勢(shì).從測(cè)量離差的普遍思路出發(fā),標(biāo)準(zhǔn)差只是平均差的代替;在不必使用絕對(duì)值的平均差新計(jì)算方法的情況下,更能代表平均偏離本真的平均差優(yōu)于標(biāo)準(zhǔn)差,應(yīng)當(dāng)大力推廣使用和普及.
除此之外,簡(jiǎn)化后的標(biāo)準(zhǔn)差公式更加簡(jiǎn)潔而易記:先計(jì)算各數(shù)據(jù)平方的平均數(shù),再減掉各數(shù)據(jù)平均數(shù)的平方,得出的就是方差.標(biāo)準(zhǔn)差公式的化簡(jiǎn)過程如下:
(2)
(3)