隨機抽樣是從總體中抽取樣本,借助頻率分布表畫出頻率分布直方圖,可以提升數(shù)據(jù)分析和讀圖的能力,凸顯直觀想象、數(shù)據(jù)分析的核心素養(yǎng)。從樣本數(shù)據(jù)中提取樣本的數(shù)字特征(如平均數(shù)、標準差),并做出合理的解釋,凸顯數(shù)學運算的核心素養(yǎng)。用樣本的頻率分布估計總體分布,用樣本的基本數(shù)字特征估計總體的基本數(shù)字特征,凸顯數(shù)學建模的核心素養(yǎng)。
題型一:簡單隨機抽樣
例1 (1)“嫦娥五號”的成功發(fā)射,實現(xiàn)了中國航天史上的五個“首次”,某中學為此舉行了“講好航天故事”演講比賽。將報名的30位同學依次編號為01,02,…,30,利用下面的隨機數(shù)表來決定他們的出場順序,選取方法是從隨機數(shù)表第1行的第5列和第6列數(shù)字開始由左到右依次選取兩個數(shù)字,重復的跳過,則選出來的第7 個個體的編號為( )。
35,24,10,16,20,33,32,51,26,38,79,78,45,04。
38,23,16,86,38,42,38,97,01,50,87,75,66,81。
A.26 B.01
C.16 D.04
(2)采用抽簽法從含有3個個體的總體1,3,8 中抽取一個容量為2的樣本,則所有可能的樣本為____。
解:(1)由隨機數(shù)表,按照規(guī)則選出。依次從表中讀出的有效編號為10,16,20,26,04,23,01,…,故選出來的第7個個體的編號為01。應選B。
(2)由總體{1,3,8}中隨機抽取兩個可能的情況,即得所有可能的樣本。從總體中任取兩個個體可組成樣本,則所有可能的樣本為{1,3},{1,8},{3,8}。
素養(yǎng):不論哪種抽樣方法,總體中的每個個體入樣的概率都是相同的。
題型二:分層隨機抽樣
例2 (多選題)某公司生產(chǎn)三種型號的轎車,年產(chǎn)量分別為1500 輛、6000 輛和2000輛。為檢驗產(chǎn)品質(zhì)量,公司質(zhì)檢部門要抽取57輛進行檢驗,則下列說法中正確的是( )。
A.應采用分層隨機抽樣抽取
B.應采用抽簽法抽取
C.三種型號的轎車依次應抽取9輛、36輛、12輛
D.這三種型號的轎車,每一輛被抽到的可能性相同
解:對于A,因為是三種型號的轎車,個體差異明顯,所以選擇分層隨機抽樣,A 正確。對于B,個體數(shù)目較多,若用抽簽法制簽難,攪拌不均勻,抽出的樣本不具有代表性,B錯誤。對于C,因為57/1500+6000+2000=3/500,所以1500× (3/500)=9(輛),6000× (3/500)=36(輛),2000× (3/500)=12(輛),即三種型號的轎車依次抽取9輛、36輛、12輛,C 正確。對于D,分層隨機抽樣中,每個個體被抽到的可能性相同,D正確。應選ACD。
素養(yǎng):在分層隨機抽樣中,為了保證每個個體被抽到的可能性是相同的,這就要求各層所抽取的個體數(shù)與該層的個體數(shù)之比等于樣本容量與總體個體數(shù)之比。
題型三:樣本的數(shù)字特征的計算與應用
例3 在一組樣本數(shù)據(jù)中,1,2,3,4出現(xiàn)的頻率分別為p1,p2,p3,p4,且Σ4i=1pi =1,則下面四種情形中,對應樣本的標準差最大的一組是( )。
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
解:計算對應數(shù)據(jù)的平均數(shù)和方差,由此得到標準差最大的一組。對于A,該組數(shù)據(jù)的平均數(shù)為xA =(1+4)×0.1+(2+3)×0.4=2.5,方差為s2A = (1-2.5)2 ×0.1+(2-2.5)2 ×0.4+(3-2.5)2 ×0.4+(4-2.5)2×0.1=0.65。對于B,該組數(shù)據(jù)的平均數(shù)為xB =(1+4)×0.4+(2+3)×0.1=2.5,方差為s2B = (1-2.5)2 ×0.4+ (2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.85。對于C,該組數(shù)據(jù)的平均數(shù)為xC =(1+4)×0.2+(2+3)×0.3=2.5,方差為s2C=(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.05。對于D,該組數(shù)據(jù)的平均數(shù)為xD =(1+4)×0.3+(2+3)×0.2=2.5,方差為s2D =(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.45。因此,B 選項這一組的標準差最大。應選B。
素養(yǎng):平均數(shù)反映了數(shù)據(jù)取值的平均水平;標準差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大小。標準差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標準差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定。方差的簡化計算公式:s2=1/n(x21+x22+…+x2n)-x2,即方差等于原數(shù)據(jù)平方的平均數(shù)減去平均數(shù)的平方。
題型四:頻率分布直方圖的應用
例4 為研究某藥品的療效,選取若干名志愿者進行臨床試驗,所有志愿者的舒張壓數(shù)據(jù)(單位:kPa)的分組區(qū)間為[12,13),[13,14),[14,15),[15,16),[16,17],將其按從左到右的順序分別編號為第一組,第二組,…,第五組,圖1是根據(jù)試驗數(shù)據(jù)制成的頻率分布直方圖。已知第一組與第二組共有20人,第三組中沒有療效的有6人,則第三組中有療效的人數(shù)為( )。
A.8 B.12 C.16 D.18
解:利用頻率分布直方圖求出志愿者的總人數(shù),再求出第三組的人數(shù),最后求出有療效的人數(shù)。因為志愿者的總人數(shù)為20/(0.24+0.16)×1=50,所以第三組的人數(shù)為50×0.36=18,所以有療效的人數(shù)為18-6=12。應選B。
素養(yǎng):頻率分布直方圖中的眾數(shù)的估計值為最高矩形的中點對應的橫坐標;平均數(shù)的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和;中位數(shù)的估計值的左邊和右邊的小矩形的面積和是相等的。在頻率分布直方圖中,各個小矩形的面積之和為1。
感悟與提高
下列抽取樣本的方式屬于簡單隨機抽樣的個數(shù)為( )。
①從無限多個個體中抽取100個個體作為樣本。②盒子里共有80個零件,從中選出5個零件進行質(zhì)量檢驗,在抽樣操作時,從中任意拿出一個零件進行質(zhì)量檢驗后再把它放回盒子里。③從20件玩具中一次性抽取3件進行質(zhì)量檢驗。④某班有56名同學,指定個子最高的5名同學參加學校組織的籃球賽。
A.0 B.1 C.2 D.3
提示:①不是簡單隨機抽樣,因為被抽取樣本的總體的個數(shù)是無限的,而不是有限的。②不是簡單隨機抽樣,因為它是有放回抽樣。③不是簡單隨機抽樣,因為這是“一次性”抽取,而不是“逐個”抽取。④不是簡單隨機抽樣,因為不是等可能抽樣。應選A。
作者單位:河北新河中學
(責任編輯 郭正華)