■呂澤晟
高考對(duì)統(tǒng)計(jì)的考查主要是圍繞三種抽樣方法、樣本的數(shù)字特征、用樣本估計(jì)總體以及線性相關(guān)性和回歸方程等展開的,凸顯數(shù)據(jù)收集處理以及運(yùn)算推理素養(yǎng)的應(yīng)用。
例1某單位有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取一個(gè)容量為n的樣本,如果采用系統(tǒng)抽樣和分層抽樣方法抽取,都不用剔除個(gè)體;如果樣本容量增加1個(gè),則在采用系統(tǒng)抽樣時(shí),需要在總體中先剔除1個(gè)個(gè)體,求樣本容量n的值。
解:明確系統(tǒng)抽樣的間隔和分層抽樣的抽樣比是解決問題的關(guān)鍵??傮w容量為6+12+18=36。當(dāng)樣本容量為n時(shí),由題意知系統(tǒng)抽樣的間隔是分層抽樣的抽樣比是,所以抽取工程師人數(shù)為,技術(shù)員人數(shù)為,技工人數(shù)為,可知n應(yīng)是6的倍數(shù),36的約數(shù),即6,12,18,24。當(dāng)樣本容量為時(shí),總體容量是35,系統(tǒng)抽樣的間隔為,因?yàn)楸仨毷钦麛?shù),所以n只能取6,即樣本容量n=6。
素養(yǎng):三種抽樣在抽樣過程中,每個(gè)個(gè)體被抽到的可能性相等,三種抽樣之間又相互聯(lián)系,對(duì)抽取的樣本來說,可謂異曲同工。在抽樣時(shí)應(yīng)結(jié)合三種抽樣方法的特點(diǎn)和實(shí)際情況,靈活選擇抽樣方法解決問題。
例2某企業(yè)有甲、乙兩個(gè)研發(fā)小組,為了比較他們的研發(fā)水平,現(xiàn)隨機(jī)抽取這兩個(gè)小組往年研發(fā)新產(chǎn)品的結(jié)果如下其中分別表示甲組研發(fā)成功和失敗分別表示乙組研發(fā)成功和失敗。
若某組成功研發(fā)一種新產(chǎn)品,則給該組記1分,否則記0分。試計(jì)算甲、乙兩組研發(fā)新產(chǎn)品的成績的平均數(shù)和方差,并比較甲、乙兩組的研發(fā)水平。
解:由研發(fā)成功與否,轉(zhuǎn)化為得分情況,求出其平均數(shù)與方差,再依據(jù)數(shù)字特征來比較兩組的研發(fā)水平。
甲組研發(fā)新產(chǎn)品的成績?yōu)?,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均數(shù)為,易得方差
乙組研發(fā)新產(chǎn)品的成績?yōu)?,0,1,1,0,
素養(yǎng):平均數(shù)與方差都是重要的數(shù)字特征,是對(duì)總體的一種簡明的描述,它們所反映的情況有著重要的實(shí)際意義。平均數(shù)、中位數(shù)、眾數(shù)描述其集中趨勢,方差和標(biāo)準(zhǔn)差描述其波動(dòng)大小。
例3從某校隨機(jī)抽取100名學(xué)生,獲得了他們一周課外閱讀時(shí)間(單位:h)的數(shù)據(jù),整理得到數(shù)據(jù)分組及頻數(shù)分布表(如表1)和頻率分布直方圖(如圖1)。
表1
圖1
(1)從該校隨機(jī)選取1名學(xué)生,試估計(jì)這名學(xué)生該周課外閱讀時(shí)間少于12h的概率。
(2)求頻率分布直方圖中a,b的值。
(3)假設(shè)同一組中的每個(gè)數(shù)據(jù)可用該組區(qū)間的中點(diǎn)值代替,試估計(jì)樣本中的100名學(xué)生該周課外閱讀時(shí)間的平均數(shù)在第幾組(只需寫出結(jié)論)。
解:(1)根據(jù)頻數(shù)分布表,可知100名學(xué)生中課外閱讀時(shí)間不少于12h的學(xué)生人數(shù)為6+2+2=10,所以樣本中的學(xué)生課外閱讀時(shí)間少于12h的頻率是,即從該校隨機(jī)選取1名學(xué)生,估計(jì)這名學(xué)生該周課外閱讀時(shí)間少于12h的概率為0.9。
(2)課外閱讀時(shí)間落在區(qū)間[4,6)上的有17人,頻率為0.17,所以
課外閱讀時(shí)間落在區(qū)間[8,10)上的有25人,頻率為0.25,所以
(3)估計(jì)樣本中的100名學(xué)生課外閱讀時(shí)間的平均數(shù)在第4組。
素養(yǎng):樣本數(shù)據(jù)的頻率(數(shù))分布表和頻率分布直方圖,反映整個(gè)樣本數(shù)據(jù)的頻率分布情況,并由此可估計(jì)總體的分布情況。
例4表2提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(t)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對(duì)應(yīng)數(shù)據(jù)。
表2
(1)請(qǐng)畫出表2中的數(shù)據(jù)的散點(diǎn)圖。
(2)根據(jù)表2提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程
(3)已知該廠技術(shù)改造前100 t甲產(chǎn)品能耗為90噸標(biāo)準(zhǔn)煤,試根據(jù)(2)求出的線性回歸方程,預(yù)測生產(chǎn)100 t甲產(chǎn)品的生產(chǎn)能耗比技術(shù)改造前降低多少噸標(biāo)準(zhǔn)煤。(參考數(shù)值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)把產(chǎn)量x作為橫坐標(biāo),相應(yīng)的生產(chǎn)能耗y作為縱坐標(biāo),在直角坐標(biāo)系中描點(diǎn)(xi,作出散點(diǎn)圖如圖2所示。
圖2
(2)由圖可知,這些點(diǎn)大致分布在一條直線附近,故生產(chǎn)甲產(chǎn)品的產(chǎn)量x和相應(yīng)的生產(chǎn)能耗y的線性相關(guān)關(guān)系顯著,所以求回歸直線方程是有意義的。
(3)當(dāng)x=100 時(shí),70.35,所以預(yù)測生產(chǎn)100t甲產(chǎn)品的生產(chǎn)能耗比技術(shù)改造前降低90—70.35=19.65(噸標(biāo)準(zhǔn)煤)。
素養(yǎng):利用散點(diǎn)圖判斷兩個(gè)變量是否具有相關(guān)關(guān)系是比較簡便的方法。由部分?jǐn)?shù)據(jù)得到的回歸直線,可以對(duì)兩個(gè)變量間的線性相關(guān)關(guān)系進(jìn)行估計(jì),這實(shí)際上是將非確定性的相關(guān)關(guān)系問題轉(zhuǎn)化成確定性的函數(shù)關(guān)系問題進(jìn)行研究的。由于回歸直線將部分觀測值所反映的規(guī)律進(jìn)行延伸,所以它在情報(bào)預(yù)測、資料補(bǔ)充等方面有著廣泛的應(yīng)用。