徐向榮
我們從總體中抽取樣本是為了認識總體,通過抽樣調(diào)查了解總體的情況。用樣本估計總體是一種重要的數(shù)學思想。通過對數(shù)據(jù)的分析,根據(jù)統(tǒng)計結(jié)果,我們可以做出合理的判斷和預(yù)測。
一、用樣本的平均數(shù)和中位數(shù)分析總體
例1 下表是隨機抽取的某公司部分員工的月收入資料。
(1)請計算以上樣本的平均數(shù)和中位數(shù):
(2)甲、乙兩人分別用樣本平均數(shù)和中位數(shù)來估計推斷公司全體員工月收入水平,請你寫出甲、乙兩人的推斷結(jié)論;
(3)指出誰的推斷比較科學合理,能真實地反映公司全體員工月收入水平,并說出另一個人的推斷依據(jù)不能真實反映公司全體員工月收入水平的原因。
【分析】(1)根據(jù)平均數(shù)、中位數(shù)的定義即可求解;
(2)甲、乙兩人分別用樣本平均數(shù)和中位數(shù)來估計推斷公司全體員工月收入水平,根據(jù)(1)中的結(jié)論可直接寫出;
(3)乙的推斷比較科學合理,用平均數(shù)來推斷公司員工的月收入易受極端值影響。
解:(1)樣本平均數(shù)=1/26×(45000+18000+10000+5500×3+5000×6+3400+3000×11+2000×2)=6150(元),中位數(shù):3400+3000/2=3200(元)。
(2)甲:由樣本平均數(shù)6150元,估計全體員工月平均收入大約為6150元。乙:由樣本中位數(shù)為3200元,估計全體員工中大約有一半的員工月收入超過3200元,有一半的員工月收入不足3200元。
(3)乙的推斷比較科學合理,用平均數(shù)來推斷公司員工的月收入易受極端值45000的影響,這里只有3個工人的月收入超過平均水平。
二、用樣本的頻數(shù)分布狀況分析總體
例2 為了掌握八年級數(shù)學考試卷的命題質(zhì)量與難度系數(shù),命題組教師赴外地選取一個水平相當?shù)陌四昙壈嗉夁M行預(yù)測,將考試成績分布情況進行處理分析,制成頻數(shù)分布表如下(成績得分均為整數(shù)):
根據(jù)表中提供的信息解答下列問題:
(1)頻數(shù)分布表中的a=__,b=__,C=__;
(2)已知全區(qū)八年級共有200個班(平均每班40人),用這份試卷檢測,108分及以上為優(yōu)秀,預(yù)計優(yōu)秀的人數(shù)約為
,72分及以上為及格,預(yù)計及格的人數(shù)約為__,及格的百分比約為__:
(3)補充完整頻數(shù)分布直方圖。
某班數(shù)學成縮分布盲方圖
【分析】(1)由第一組的頻數(shù)和頻率,結(jié)合頻率=頻數(shù)/總數(shù),可求出總數(shù),繼而可分別得出a、b、c的值;
(2)首先明確樣本中優(yōu)秀的頻率、及格的頻率和及格的百分比,然后利用樣本估計總體的思想,根據(jù)頻率=頻數(shù)/總數(shù)的關(guān)系分別求出總體中優(yōu)秀的人數(shù)、及格的人數(shù)、及格的百分比;
(3)根據(jù)(1)中a、b的值即可補全圖形。
解:(1)∵被調(diào)查的總?cè)藬?shù)=2÷0.05=40(人),
∴a=40×0.2=8,b=40-(2+4+8+10+6)=10,c=10÷40=0.25。
(2)預(yù)計優(yōu)秀的人數(shù)約為200×0.15×40=1200(人),
預(yù)計及格的人數(shù)約為200×(0.2+0.25+0.25+0.15)×40=6800(人),
及格的百分比約為(0.2+0.25+0.25+0.15)×100%=85%。
(3)補全頻數(shù)分布直方圖如下:
在統(tǒng)計里,我們通常從總體中抽取一個樣本,通過研究樣本的某些特性(如平均數(shù)、眾數(shù)等)來估計總體的相應(yīng)特性,這種用樣本估計總體的方法是行之有效的,有一定的科學性。但同時我們需要注意的是:為了獲取較為準確的調(diào)查結(jié)果,抽樣時要注意樣本的代表性和廣泛性。