■胡 煥
高考命題中的統(tǒng)計(jì)問題,雖然難度不大,但解題也得講究方法,可謂方法得當(dāng),事半功倍。那么統(tǒng)計(jì)問題主要有哪些常用的解題方法呢?
統(tǒng)計(jì)學(xué)是一門獨(dú)立的學(xué)科,統(tǒng)計(jì)術(shù)語有著獨(dú)特的含義,求解統(tǒng)計(jì)問題應(yīng)遵循相關(guān)的定義。
例1(1)在一次馬拉松比賽中,35名運(yùn)動員的成績(單位:min)的莖葉圖如圖1所示。
圖1
若將運(yùn)動員按成績由好到差編號為1~35號,再用系統(tǒng)抽樣方法從中抽取7人,則其中成績在區(qū)間[139,151]上的運(yùn)動員人數(shù)是
(2)我國古代數(shù)學(xué)名著《數(shù)書九章》有“米谷粒分”題,其大意是:糧倉開倉收糧,有人送來米1534石,驗(yàn)得米內(nèi)夾谷,抽樣取米一把,數(shù)得254粒內(nèi)夾谷28粒,則這批米內(nèi)夾谷約為( )。
A.134石 B.169石
C.338石 D.1365石
解:(1)依題意可將編號為1~35號的35個數(shù)據(jù)分成7組,每組有5個數(shù)據(jù)。
在區(qū)間[139,151]上共有20個數(shù)據(jù),分在4個小組內(nèi),每組抽取1人,共抽取4人。答案為4。
(2)254粒和1534石中夾谷的百分比含量是大致相同的,據(jù)此可估計(jì)這批米內(nèi)夾谷的數(shù)量。設(shè)1534石米內(nèi)夾谷x石。由題意可得解得x≈169(石),即這批米內(nèi)夾谷約為169石。應(yīng)選B。
本題涉及簡單隨機(jī)抽樣和系統(tǒng)抽樣的有關(guān)定義,只有掌握了相關(guān)定義才能順利解題。對于系統(tǒng)抽樣,不僅要理解它的適用范圍,更要掌握這種抽樣的方法和特征。
依據(jù)統(tǒng)計(jì)中有關(guān)概念的意義建立方程求解問題,也是統(tǒng)計(jì)問題常用的解題方法。
例2將容量為n的樣本中的數(shù)據(jù)分成6組,繪制頻率分布直方圖,若第1組至第6組數(shù)據(jù)的頻率之比為2∶3∶4∶6∶4∶1,且前三組數(shù)據(jù)的頻數(shù)之和等于27,則n的值為( )。
A.60 B.55
C.50 D.45
解:由題意可設(shè)第1組至第6組數(shù)據(jù)的頻率分別為2x,3x,4x,6x,4x,x,則2x+3x+4x+6x+4x+x=1,解得所以前三組數(shù)據(jù)的頻率分別是由題意可得前三組數(shù)據(jù)的頻數(shù)之和為,解得n=60。應(yīng)選A。
本題通過兩次列方程并解方程,使問題得到解決,這充分說明方程思想在統(tǒng)計(jì)問題中的重要性。
統(tǒng)計(jì)問題離不開運(yùn)算,而且有時運(yùn)算相當(dāng)煩瑣,這時根據(jù)統(tǒng)計(jì)中的有關(guān)公式的特點(diǎn),采用整體代換的方法,可以大大減少計(jì)算量。
例3現(xiàn)有10個數(shù),其平均數(shù)是4,且這10個數(shù)的平方和是200,那么這組數(shù)的標(biāo)準(zhǔn)差是( )。
A.1 B.2
C.3 D.4
(2)已知樣本數(shù)據(jù)x1,x2,…,xn的平均數(shù)為,樣本數(shù)據(jù)y1,y2,…,ym的平均數(shù)為),若樣本數(shù)據(jù)x1,x2,…,xn,y1,y2,…,ym的平均數(shù)為=a+(1-a),其中0<a<,則n,m的大小關(guān)系為( )。
A.n<m B.n>m
C.n=m D.不能確定
解:(1)設(shè)這10個數(shù)為a1,a2,…,a10,則++…+=200,且a1+a2+…+a10=40,所以其方差s2=×[(a1-4)2+(a2-4)2+…+(a10-4)2]=×[++…+-8(a1+a2+…+a10)+160]=4,可知標(biāo)準(zhǔn)差為4=2。應(yīng)選B。
在有關(guān)方差的計(jì)算問題中,利用整體代換的方法可以優(yōu)化解題過程。
統(tǒng)計(jì)中經(jīng)常涉及一些圖表問題,解題時往往需要制作圖表,或從給出的圖表中讀取有關(guān)信息,因此解決統(tǒng)計(jì)問題必須要用好圖表,且要重視數(shù)形結(jié)合法的應(yīng)用。
例4理論預(yù)測某城市2020年到2024年人口總數(shù)與年份的關(guān)系如表1所示。
表1
(1)請畫出表中數(shù)據(jù)的散點(diǎn)圖。
(2)指出x與y是否線性相關(guān)。
(3)若x與y線性相關(guān),請根據(jù)表中提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的回歸方程=bx+a。
(4)據(jù)此估計(jì)2025年該城市的人口總數(shù)。
(參數(shù)數(shù)據(jù):0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)
解:(1)畫出表中數(shù)據(jù)的散點(diǎn)圖,如圖2所示。
圖2
(2)由散點(diǎn)圖可知,樣本點(diǎn)大致分布在一條直線附近,故x與y呈線性相關(guān)關(guān)系。
對兩個變量進(jìn)行研究,通常是先作出兩個變量間的散點(diǎn)圖,根據(jù)散點(diǎn)圖直觀判斷兩個變量是否具有線性相關(guān)關(guān)系,如果具有線性相關(guān)關(guān)系,就可以應(yīng)用最小二乘法求出線性回歸方程。由于樣本可以反映總體,所以可以利用所求的線性回歸方程,對這兩個變量所確定的總體進(jìn)行估計(jì),即根據(jù)一個變量的取值,預(yù)測另一個變量的取值。