許多問題具有不確定性,例如,擲一枚均勻的硬幣,事先并不能說準(zhǔn)硬幣落地后是哪一面向上的;射擊打靶之前,不能確定子彈落在靶上的確切位置;年初時,很難準(zhǔn)確地預(yù)報某地區(qū)全年的降水量,這類問題被稱為不確定性問題或隨機性問題.
為了研究不確定性問題,更深入地研究已發(fā)生的現(xiàn)象和較準(zhǔn)確地預(yù)測未發(fā)生的現(xiàn)象,人們想到了利用統(tǒng)計數(shù)據(jù)的方法.具有不確定性的對象雖然不好把握,但是人們可以收集與其相關(guān)的數(shù)據(jù),通過分析這些數(shù)據(jù),來發(fā)現(xiàn)對象的變化規(guī)律,從而作出更接近于客觀的估計.這就是統(tǒng)計的作用.
每一個統(tǒng)計過程都是從收集數(shù)據(jù)起步的,收集到的數(shù)據(jù)叫做原始數(shù)據(jù).雖然原始數(shù)據(jù)包含了研究對象的大量信息,但是它們往往是初級的、表層的,人們經(jīng)常要對其加工整理,從中挖掘出更有用的深層信息.在加工整理原始數(shù)據(jù)時,人們會得到一些能從某個角度反映研究對象的某些特征的數(shù)值.常用的平均數(shù)、中位數(shù)和眾數(shù)都是反映研究對象的集中趨勢的數(shù)值,方差則是反映研究對象離散(波動)程度的數(shù)值.
一、平均數(shù)
在一個具有不確定性的問題中,與研究對象相關(guān)的數(shù)據(jù)可能有大有小.數(shù)據(jù)的平均數(shù)是反映研究對象的平均水平的數(shù)值.數(shù)據(jù)的算術(shù)平均數(shù)為.這是最簡單的平均數(shù),
例l 甲、乙兩名選手各射擊10次,所取得的成績?nèi)绫?所示.試比較每人的單槍平均成績,并說明其含義.
解析:甲的單槍平均成績?yōu)?/p>
從另一個角度看,甲10槍中命中6環(huán)2次.7環(huán)3次,8環(huán)2次,9環(huán)1次,10環(huán)2次,共5種成績,所以他的單槍平均成績也可以如下計算:
用同樣的算法可得乙的單槍平均成績?yōu)?/p>
由可知,雖然甲、乙兩人的成績不完全相同,但是從單槍平均水平的角度看兩人的成績相同.
一般地,如果一組數(shù)據(jù)中共有m種不同的值,記它們?yōu)椴⑶移渲蟹謩e叫做的權(quán).數(shù)值叫做這組數(shù)據(jù)的加權(quán)平均數(shù),例如,上面的和都是加權(quán)平均數(shù).可以看出,這里的加權(quán)平均數(shù)是算術(shù)平均數(shù)的一個簡化形式,它在計算上會更加簡便.
二、中位數(shù)
除了用平均數(shù)反映對象的平均水平外,還可以用中位數(shù)來反映對象的居中水平.
把n個數(shù)據(jù)從小到大排成一列,相同的數(shù)重復(fù)進行排列.當(dāng)n是奇數(shù)時,排在正中間位置的一個數(shù),叫做這n個數(shù)據(jù)的中位數(shù);當(dāng)n是偶數(shù)時,排在中間位置的兩個數(shù)的平均數(shù),叫做這n個數(shù)據(jù)的中位數(shù).例如,1,l,2,3,5,6,7這7個數(shù)的中位數(shù)是3;l,l,2,3,4,5,6,7這8個數(shù)的中位數(shù)是.中位數(shù)體現(xiàn)了一組數(shù)據(jù)中間位置的數(shù)據(jù)水平,它反映了具有不確定性的研究對象在中等狀態(tài)下的水平.
例2 根據(jù)表1,比較甲、乙射擊成績的中位數(shù),并說明其含義.
解析:把甲、乙的各次成績分別從小到大依次排列,得到如下兩組數(shù)據(jù):
甲 6 6 7 7 7 8 8 9 10 10
乙 7 7 7 7 8 8 8 8
9
9
甲射擊成績的中位數(shù)為(7+8)÷2=7.5,乙射擊成績的中位數(shù)為(8+8)÷2=8.這說明,在一般情形下,甲發(fā)揮到中等水平時成績約介于7環(huán)和8環(huán)之間,乙發(fā)揮到中等水平時成績可能為8環(huán).乙的中位數(shù)較大,如果兩人都是中等水平發(fā)揮,乙的成績略好的可能性要大些.
三、眾數(shù)
具有不確定性的研究對象,在相同的試驗條件下,可能有不同的表現(xiàn),哪種表現(xiàn)的可能性最大呢?這可以用統(tǒng)計數(shù)據(jù)的眾數(shù)來反映,
一組數(shù)據(jù)中出現(xiàn)的次數(shù)最多的數(shù),叫做這組數(shù)據(jù)的眾數(shù).例如,數(shù)據(jù)1,2,1,3,3,6,4,5,3的眾數(shù)是3;數(shù)據(jù)3,1,2,l,5,1,2,3,2的眾數(shù)是1和2.如果一組數(shù)據(jù)中各個不同的數(shù)出現(xiàn)的次數(shù)都相同,則這組數(shù)據(jù)中不存在眾數(shù).眾數(shù)表現(xiàn)了一組數(shù)據(jù)的聚集點(或稱為“熱點”),它反映了具有不確定性的研究對象通常最可能呈現(xiàn)的水平.
例3 根據(jù)表1,比較甲、乙射擊成績的眾數(shù),并說明其含義.
解析:甲的成績有5種,其中6環(huán)出現(xiàn)2次,7環(huán)出現(xiàn)3次,8環(huán)出現(xiàn)2次,9環(huán)出現(xiàn)1次,10環(huán)出現(xiàn)2次.7環(huán)出現(xiàn)的次數(shù)最多,所以眾數(shù)是7.
乙的成績有3種,其中7環(huán)出現(xiàn)4次.8環(huán)出現(xiàn)4次,9環(huán)出現(xiàn)2次,出現(xiàn)次數(shù)最多的是7環(huán)和8環(huán),所以眾數(shù)是7和8.
從比較兩組數(shù)據(jù)的眾數(shù)的角度來看,在一般情形下,甲射中7環(huán)比取得其他成績的可能性要大些,乙射中7環(huán)或8環(huán)比取得其他成績的可能性要大些,
一組數(shù)據(jù)的集中趨勢,包括數(shù)據(jù)的平均水平、居中水平和聚集水平,平均數(shù)、中位數(shù)和眾數(shù)分別代表了這三個水平.所以說它們是描述數(shù)據(jù)的集中趨勢的三個代表,
四、方差
考察具有不確定性的對象的特征時,除了從集中趨勢的角度研究以外,還可以研究與研究對象相關(guān)的數(shù)據(jù)的變化幅度,即數(shù)據(jù)的離散程度,從整體上看,如果一組數(shù)據(jù)的值比較接近,則說這組數(shù)據(jù)分布得比較緊密,它的離散程度較小;反之,如果一組數(shù)據(jù)的值差距較大,則說這組數(shù)據(jù)分布得比較松散,它的離散程度較大,離散程度較小的一組數(shù)據(jù),從整體上看各數(shù)據(jù)偏離平均數(shù)的程度較??;離散程度較大的一組數(shù)據(jù),從整體上看各數(shù)據(jù)偏離平均數(shù)的程度較大.
為了精確地反映一組數(shù)據(jù)的離散程度,可以把一組數(shù)據(jù)中的全部n個數(shù)據(jù),的平均數(shù)x作為基準(zhǔn),計算各數(shù)據(jù)與x的差的平方,這些平方的平均數(shù)就叫做這組數(shù)據(jù)的方差.因為方差可以從整體上反映數(shù)據(jù)偏離平均數(shù)的程度,所以它成為了反映研究對象離散程度的數(shù)值.
例4 根據(jù)表l,比較甲、乙射擊成績的方差,并說明其含義.
解析:從例1可知,甲、乙射擊成績的平均數(shù)都是7.8.把甲、乙的各次成績依次代人下式:得
比較兩個方差可以估計:就目前的情況來說,甲射擊成績的離散程度較大.這說明,兩人相比甲的表現(xiàn)波動大些,乙相對更穩(wěn)定些.這可以為選拔選手和制定有針對性的訓(xùn)練計劃提供依據(jù).
以上圍繞一個射擊問題,簡單地說明了反映對象特征的四種數(shù)值.同學(xué)們在學(xué)習(xí)統(tǒng)計知識時應(yīng)注意結(jié)合一些具體事例去理解它們,要逐步體會統(tǒng)計在實際生活中的應(yīng)用,而不是僅僅關(guān)注一些具體的計算.
中學(xué)生數(shù)理化·八年級數(shù)學(xué)人教版2015年5期