眾數(shù)、中位數(shù)、平均數(shù)、百分位數(shù)和頻數(shù)是統(tǒng)計數(shù)據(jù)的重要特征數(shù),主要描述數(shù)據(jù)的集中趨勢。
一、眾數(shù)
例1 為了弘揚體育精神,某校組織秋季運動會,在一項比賽中,學生甲進行了8組投籃,得分分別為10,8,5,8,7,9,6,8,則這組數(shù)據(jù)的眾數(shù)為____。
解:因為數(shù)據(jù)10,8,5,8,7,9,6,8中出現(xiàn)次數(shù)最多的是8,所以這組數(shù)據(jù)的眾數(shù)為8。
評注:在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)就是這組數(shù)據(jù)的眾數(shù)。
二、中位數(shù)
例2 (1)一個樣本數(shù)據(jù)按從小到大的順序排列為13,14,19,x,23,27,28,31,中位數(shù)為22,則x=____。
(2)某工廠對一批新產品的長度(單位:mm)進行檢測,圖1是檢測結果的頻率分布直方圖,據(jù)此估計這批產品的中位數(shù)為( )。
A.20 B.25
C.22.5 D.22.75
解:(1)由中位數(shù)的定義可得x+23/2 =22,則x=21。
(2)易得中位數(shù)在第3組。設中位數(shù)為x,則0.02×5+0.04×5+0.08×(x-20)=0.5,解得x=22.5。應選C。
評注:將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個數(shù)據(jù)或最中間兩個數(shù)據(jù)的平均數(shù)叫作這組數(shù)據(jù)的中位數(shù);在頻率分布直方圖中,中位數(shù)左邊和右邊的頻率分布直方圖的面積應該相等。
三、平均數(shù)
例3 (1)一組觀察值4,3,5,6出現(xiàn)的次數(shù)分別是3,2,4,2,則樣本的平均數(shù)為( )。
A.4.55 B.4.5
C.12.5 D.1.64
(2)已知樣本數(shù)據(jù)x1,x2,…,xn 的均值x=5,則樣本數(shù)據(jù)2x1+1,2x2+1,…,2xn +1的均值為____。
解:(1)由題意得樣本的平均數(shù)為(4×3+3×2+5×4+6×2)/(3+2+4+2)≈4.55。應選A。
(2)由條件知x=(x1+x2+…+xn)/n =5。所以所求的均值x0=(2x1+1+2x2+1+…+2xn +1)/n=(2(x1+x2+…+xn)+n)/n=2x+1=2×5+1=11。
評注:如果給定的一組數(shù)據(jù)是x1,x2,…,xn ,那么這組數(shù)據(jù)的平均數(shù)為x=1n(x1 +x2+…+xn)。
四、百分位數(shù)
例4 (1)一個容量為20的樣本,其數(shù)據(jù)按從小到大的順序排列為1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,則該組數(shù)據(jù)的第75百分位數(shù)為,第86百分位數(shù)為____。
(2)將高三某班60名學生參加某次數(shù)學模擬考試所得的成績(成績均為整數(shù))整理后畫出頻率分布直方圖,如圖2所示,則此班的模擬考試成績的80%分位數(shù)約為____。(結果保留兩位小數(shù))
解:(1)因為75%×20=15,所以第75百分位數(shù)為第15個數(shù)據(jù)與第16個數(shù)據(jù)的平均值,即為14+15/2 =14.5。
因為86%×20=17.2,所以第86百分位數(shù)為第18個數(shù)據(jù),即為17。
(2)由頻率分布直方圖可知,分數(shù)在120分以下的學生所占的比例為(0.01+0.015+0.015+0.03)×10×100% =70%,分數(shù)在130分以下的學生所占的比例為(0.01+0.015+0.015+0.03+0.0225)×10×100%=92.5%,所以80% 分位數(shù)一定位于區(qū)間[120,130)內。
因為120+( 0.8-0.7/0.925-0.7)×10≈124.44,所以此班的模擬考試成績的80%分位數(shù)約為124.44。
評注:25%,50%,75%這三個分位數(shù)把一組由小到大排列后的數(shù)據(jù)分成四等份,因此稱為四分位數(shù),其中第25百分位數(shù)也稱為第一四分位數(shù)或下四分位數(shù),第75百分位數(shù)也稱為第三四分位數(shù)或上四分位數(shù)。
五、頻數(shù)
例5 (1)在樣本的頻率分布直方圖中,共有9個小長方形,若中間一個小長方形的面積等于其他8個小長方形的面積和的25,且樣本容量為140,則中間一組的頻數(shù)為( )。
A.28 B.40
C.56 D.60
(2)一個容量為32的樣本,已知某組樣本的頻率為0.125,則該組樣本的頻數(shù)為( )。
A.2 B.4
C.6 D.8
解:(1)設中間一組的頻數(shù)為x。因為中間一個小長方形的面積等于其他8個小長方形的面積和的2/5,所以其他8組的頻數(shù)和為5/2x。由x +5/2x =140,解得x =40。應選B。
(2)因為頻率= 頻數(shù)/樣本容量,所以頻數(shù)=頻率×樣本容量=0.125×32=4。應選B。
評注:頻率分布直方圖的縱坐標是頻率/組距,每一組對應的小矩形的高與頻率成正比,且每個小矩形的面積等于這一組對應的頻率,所有小矩形的面積之和為1。
感悟與提高
一個單位有職工500人,其中不到35歲的有125人,35歲至49歲的有280人,50歲及50歲以上的有95人。為了解這個單位職工與身體狀態(tài)有關的某項指標,要從中抽取100名職工作為樣本,職工年齡與這項指標有關,應該怎樣抽?。?/p>
提示:該抽樣為比例分配的分層隨機抽樣,抽取步驟如下。
①按年齡將500名職工分成三層,不到35歲的職工;35歲至49 歲的職工;50 歲及50歲以上的職工。② 由抽樣比為100/500=1/5,可知在不到35歲的職工中抽取125×1/5=25(人);在35歲至49歲的職工中抽取280×1/5=56(人);在50歲及50歲以上的職工中抽取95×1/5=19(人)。③ 各層按隨機數(shù)法抽取樣本。④ 匯總每層抽樣,組成容量為100的樣本。
作者單位:湖北省巴東縣第三高級中學
(責任編輯 郭正華)