■姚踐紅
統(tǒng)計(jì)是高中數(shù)學(xué)的重要內(nèi)容之一,也是新高考的必考知識(shí)點(diǎn)。高考主要考查隨機(jī)抽樣,考查用樣本估計(jì)總體等。下面舉例分析,供同學(xué)們學(xué)習(xí)與提高。
題型一:簡(jiǎn)單隨機(jī)抽樣
①?gòu)臒o(wú)數(shù)個(gè)個(gè)體中抽取50 個(gè)個(gè)體作為樣本;②倉(cāng)庫(kù)中有1萬(wàn)支奧運(yùn)火炬,從中一次性抽取100支火炬進(jìn)行質(zhì)量檢查;③一彩民選號(hào),從裝有36 個(gè)大小、形狀都相同的號(hào)簽的盒子中無(wú)放回地抽出6個(gè)號(hào)簽;④箱子里共有100個(gè)零件,從中選出10個(gè)零件進(jìn)行質(zhì)量檢驗(yàn),在抽樣操作中,從中任意取出1個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)后,再把它放回箱子里。
解:根據(jù)簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)逐個(gè)判斷。①不是簡(jiǎn)單隨機(jī)抽樣,因?yàn)楹?jiǎn)單隨機(jī)抽樣要求被抽取的樣本總體的個(gè)數(shù)是有限的。②不是簡(jiǎn)單隨機(jī)抽樣,雖然“一次性抽取”和“逐個(gè)抽取”不影響個(gè)體被抽到的可能性,但簡(jiǎn)單隨機(jī)抽樣要求的是“逐個(gè)抽取”。③是簡(jiǎn)單隨機(jī)抽樣,因?yàn)榭傮w中的個(gè)體數(shù)是有限的,并且是從總體中逐個(gè)進(jìn)行抽取的,是不放回、等可能的抽樣。④不是簡(jiǎn)單隨機(jī)抽樣,因?yàn)樗怯蟹呕爻闃?。答案為③?/p>
題型二:分層隨機(jī)抽樣
使用分層隨機(jī)抽樣的原則:將相似的個(gè)體歸入一類(lèi),即為一層,要求每層的各個(gè)個(gè)體互不交叉,即遵循不重復(fù)、不遺漏的原則;為保證每個(gè)個(gè)體等可能入樣,需遵循在各層中進(jìn)行簡(jiǎn)單隨機(jī)抽樣,使每層樣本數(shù)量與每層個(gè)體數(shù)量的比等于抽樣比。
例2 某校500名學(xué)生中,O 型血有200人,A 型血有125人,B 型血有125人,AB 型血有50人,為了研究血型與色弱的關(guān)系,需從中抽取一個(gè)容量為20 的樣本。按照比例分配的分層隨機(jī)抽樣方法抽取樣本,各種血型的人分別抽多少?
故O 型血抽8人,A 型血抽5人,B型血抽5人,AB型血抽2人。
題型三:獲取數(shù)據(jù)的途徑
獲取數(shù)據(jù)的途徑一般有四種:調(diào)查,試驗(yàn),觀(guān)察和查詢(xún)。在應(yīng)用以上四種方式獲取數(shù)據(jù)時(shí),要清楚數(shù)據(jù)的類(lèi)型,選擇適當(dāng)?shù)墨@取方式。
例3 為了緩解城市的交通擁堵情況,某市準(zhǔn)備出臺(tái)限制私家車(chē)的政策,為此要進(jìn)行民意調(diào)查。某個(gè)調(diào)查小組調(diào)查了一些擁有私家車(chē)的市民,你認(rèn)為這樣的調(diào)查結(jié)果能很好地反映該市市民的意愿嗎?
解:一個(gè)城市的交通狀況的好壞將直接影響著生活在這個(gè)城市里的每個(gè)人,關(guān)系到每個(gè)人的利益。為了調(diào)查這個(gè)問(wèn)題,在抽樣時(shí)應(yīng)當(dāng)關(guān)注到各種人群,既要抽到擁有私家車(chē)的市民,也要抽到?jīng)]有私家車(chē)的市民。
如果只對(duì)擁有私家車(chē)的市民進(jìn)行調(diào)查,結(jié)果一定是片面的,不能代表所有市民的意愿。因此,要對(duì)生活在該城市的所有市民進(jìn)行隨機(jī)地抽樣調(diào)查,不要只關(guān)注到擁有私家車(chē)的市民。
題型四:頻率分布直方圖的應(yīng)用
例4 為了迎接某市作為全國(guó)文明城市的復(fù)查,愛(ài)衛(wèi)會(huì)隨機(jī)抽取了60位路人進(jìn)行問(wèn)卷調(diào)查,調(diào)查項(xiàng)目是自己對(duì)該市各方面衛(wèi)生情況的滿(mǎn)意度(假設(shè)被問(wèn)卷的路人回答是客觀(guān)的),以分?jǐn)?shù)表示問(wèn)卷結(jié)果,并統(tǒng)計(jì)他們的問(wèn)卷分?jǐn)?shù),把其中不低于50 分的分成五段:[50,60),[60,70),…,[90,100]后畫(huà)出如圖1所示的部分頻率分布直方圖,觀(guān)察圖形信息,回答下列問(wèn)題。
圖1
(1)求出問(wèn)卷調(diào)查分?jǐn)?shù)低于50分的被問(wèn)卷人數(shù)。
(2)估計(jì)全市市民滿(mǎn)意度在60分及以上的百分比。
解:(1)因?yàn)楦鹘M的頻率之和等于1,所以低于50分的頻率為f=1-(0.015×2+0.03+0.025+0.005)×10=0.1,故低于50分的人數(shù)為60×0.1=6。
(2)依題意可知,60分及以上的頻率和為(0.015+0.03+0.025+0.005)×10=0.75,所以抽樣滿(mǎn)意度在60分及以上的百分比為75%。
于是可以估計(jì)全市市民滿(mǎn)意度在60 分及以上的百分比為75%。
題型五:百分位數(shù)的計(jì)算
一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個(gè)值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等于這個(gè)值,且至少有(100-p)%的數(shù)據(jù)大于或等于這個(gè)值。計(jì)算一組n個(gè)數(shù)據(jù)的第p百分位數(shù)的三個(gè)步驟:第1步,按從小到大排列原始數(shù)據(jù);第2步,計(jì)算i=n×p%;第3步,若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第p百分位數(shù)為第j項(xiàng)數(shù)據(jù);若i是整數(shù),則第p百分位數(shù)為第i項(xiàng)與第(i+1)項(xiàng)數(shù)據(jù)的平均數(shù)。利用頻率分布直方圖求百分位數(shù)的方法:百分位數(shù)表示左側(cè)小矩形的面積之和,先確定在哪個(gè)區(qū)間,再?gòu)淖蟮接矣?jì)算所有小矩形的面積和,百分位數(shù)所在區(qū)間需按照對(duì)應(yīng)邊比例計(jì)算面積。
例5 某中學(xué)舉行電腦知識(shí)競(jìng)賽,現(xiàn)將高一參賽學(xué)生的成績(jī)進(jìn)行整理后分成五組繪制成如圖2 所示的頻率分布直方圖,已知圖中從左到右的第一、二、三、四、五小組的頻率分別是0.3,0.4,0.15,0.1,0.05。
圖2
求高一參賽學(xué)生成績(jī)的第60百分位數(shù)。
題型六:眾數(shù)、中位數(shù)、平均數(shù)的計(jì)算
眾數(shù)、中位數(shù)及平均數(shù)都是描述一組數(shù)據(jù)集中趨勢(shì)的量。平均數(shù)的大小與一組數(shù)據(jù)里每個(gè)數(shù)的大小均有關(guān)系,任何一個(gè)數(shù)據(jù)的變動(dòng)都會(huì)引起平均數(shù)的變動(dòng)。眾數(shù)考查各數(shù)出現(xiàn)的頻率,其大小與這組數(shù)據(jù)中部分?jǐn)?shù)據(jù)有關(guān),當(dāng)一組數(shù)據(jù)中有不少數(shù)據(jù)重復(fù)出現(xiàn)時(shí),其眾數(shù)往往更能反映問(wèn)題。中位數(shù)僅與數(shù)據(jù)的排列位置有關(guān),某些數(shù)據(jù)的變動(dòng)對(duì)中位數(shù)沒(méi)有影響,中位數(shù)可能出現(xiàn)在所給數(shù)據(jù)中,也可能不在所給數(shù)據(jù)中,當(dāng)一組數(shù)據(jù)中個(gè)別數(shù)據(jù)較大時(shí),可用中位數(shù)描述這組數(shù)據(jù)的集中趨勢(shì)。
例6 某公司的33名職工的月工資(以元為單位)如表1所示。
表1
(1)求該公司職工月工資的平均數(shù)、中位數(shù)、眾數(shù)。
(2)假設(shè)副董事長(zhǎng)的工資從5000元提升到20000元,董事長(zhǎng)的工資從5500 元提升到30000元,那么新的平均數(shù)、中位數(shù)、眾數(shù)又是多少? (精確到元)
(3)你認(rèn)為哪個(gè)統(tǒng)計(jì)量更能反映這個(gè)公司員工的工資水平? 結(jié)合此問(wèn)題談一談你的看法。
(3)在這個(gè)問(wèn)題中,中位數(shù)或眾數(shù)均能反映該公司員工的工資水平。因?yàn)楣局猩贁?shù)人的工資與大多數(shù)人的工資差別較大,這樣導(dǎo)致平均數(shù)與中位數(shù)偏差較大,所以平均數(shù)不能反映這個(gè)公司員工的工資水平。
題型七:用樣本的標(biāo)準(zhǔn)差、方差估計(jì)總體幅度,標(biāo)準(zhǔn)差越大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差越小,數(shù)據(jù)的離散程度越小。用樣本估計(jì)總體時(shí),樣本的平均數(shù)、標(biāo)準(zhǔn)差只是總體平均數(shù)、標(biāo)準(zhǔn)差的近似。在實(shí)際應(yīng)用中,常常把平均數(shù)與方差結(jié)合起來(lái)進(jìn)行決策。在平均值相等的情況下,比較標(biāo)準(zhǔn)差以確定穩(wěn)定性。
例7 從甲、乙兩種玉米苗中各抽10株,分別測(cè)得它們的株高(單位:cm)如下。
甲:25,41,40,37,22,14,19,39,21,42。
乙:27,16,44,27,44,16,40,40,16,40。
(1)哪種玉米苗長(zhǎng)得高?
(2)哪種玉米苗長(zhǎng)得齊?
題型八:利用頻率分布直方圖求眾數(shù)、中位數(shù)、平均數(shù)
頻率分布直方圖的數(shù)字特征:眾數(shù)一般用頻率分布表中頻率最高的一組的組中值來(lái)顯示,在樣本數(shù)據(jù)的頻率分布直方圖中,眾數(shù)是最高小矩形的底邊中點(diǎn)的橫坐標(biāo);在頻率分布直方圖中,中位數(shù)就是頻率分布直方圖面積的一半所對(duì)應(yīng)的橫坐標(biāo),中位數(shù)左邊和右邊的直方圖的面積相等;平均數(shù)等于每個(gè)小矩形的高乘以底邊中點(diǎn)的橫坐標(biāo)之和。
例8 從高三抽出50名學(xué)生參加數(shù)學(xué)競(jìng)賽,由成績(jī)得到的頻率分布直方圖,如圖3。
圖3
由于一些數(shù)據(jù)丟失,試?yán)妙l率分布直方圖求:
(1)這50名學(xué)生成績(jī)的眾數(shù)與中位數(shù)。
(2)這50名學(xué)生的平均成績(jī)。
解:(1)由眾數(shù)的概念可知,眾數(shù)是出現(xiàn)次數(shù)最多的數(shù)。在頻率分布直方圖中,最高的小長(zhǎng)方形的底邊中點(diǎn)的橫坐標(biāo)即為眾數(shù),所以眾數(shù)應(yīng)為75。
由于中位數(shù)是所有數(shù)據(jù)中的中間值,故在頻率分布直方圖中體現(xiàn)的是中位數(shù)的左右兩邊頻數(shù)應(yīng)相等,即頻率也相等,從而就是小矩形的面積和相等。因此在頻率分布直方圖中將所有小矩形的面積一分為二的垂直于橫軸的直線(xiàn)與橫軸交點(diǎn)的橫坐標(biāo)所對(duì)應(yīng)的成績(jī)即為所求。因?yàn)?.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,所以前三個(gè)小矩形面積的和為0.3。而第四個(gè)小矩形面積為0.03×10=0.3,0.3+0.3>0.5,所以中位數(shù)應(yīng)位于第四個(gè)小矩形內(nèi)。設(shè)其底邊為x,則高為0.03。令0.03x=0.2,可得x≈6.7。故中位數(shù)約為70+6.7=76.7。
(2)樣本平均值應(yīng)是頻率分布直方圖的“重心”,即所有數(shù)據(jù)的平均值,也就是每個(gè)小矩形底邊中點(diǎn)的橫坐標(biāo)乘以每個(gè)小矩形的面積之和。
所以平均成績(jī)?yōu)?5×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85× (0.024×10)+95×(0.016×10)=76.2。
題型九:動(dòng)態(tài)樣本的平均數(shù)、方差問(wèn)題
利用動(dòng)態(tài)樣本求平均數(shù)、方差的策略:平均數(shù)、方差的基本公式不變,但要注意變化前后的關(guān)系;適當(dāng)結(jié)合平均數(shù)、方差的意義進(jìn)行估值。
題型十:其他統(tǒng)計(jì)圖表中反映的集中趨勢(shì)與離散程度
圖4
圖5