華東師范大學(xué)附屬周浦中學(xué)
凌燕萍 (郵編:201318)
上教版高三數(shù)學(xué)(試用本)中給出的樣本方差、樣本標(biāo)準(zhǔn)差的計(jì)算公式不同于其他版本的教材,教材中也沒有給出說明,給廣大老師的教學(xué)和學(xué)生的學(xué)習(xí)帶來不少困擾.
方差和標(biāo)準(zhǔn)差給出的是一組數(shù)據(jù)偏離平均數(shù)程度的大小,數(shù)值越小,說明這組數(shù)據(jù)越向平均數(shù)集中,數(shù)據(jù)越大,說明這組數(shù)據(jù)偏離平均數(shù)的程度越大.在某些統(tǒng)計(jì)問題中,做不到也沒必要對(duì)總體中的每一個(gè)個(gè)體進(jìn)行研究,就需要從總體中抽樣研究.那么怎么用樣本的標(biāo)準(zhǔn)差來估計(jì)總體的標(biāo)準(zhǔn)差呢?不同的版本有不同的說明:
某賽季甲乙兩名籃球運(yùn)動(dòng)員在若干場(chǎng)比賽中的得分情況如下:甲:18、20、21、22、23、25、28、29、30、30、32、34.乙:8、13、14、16、23、26、28、33、38、39、48.問誰的比賽成績(jī)比較穩(wěn)定.(結(jié)果精確到0.01)
解析易得甲乙兩名運(yùn)動(dòng)員每場(chǎng)得分的平均值均為26分.
設(shè)甲得分的標(biāo)準(zhǔn)差為s1,記甲的每場(chǎng)得分與其得分平均值的差的平方和為∑1,則∑1=(18-26)2+(20-26)2+(21-26)2+…+(32-26)2+(34-26)2=296,
設(shè)乙得分的標(biāo)準(zhǔn)差為s2,同理得
因?yàn)閟2>s1,所以甲運(yùn)動(dòng)員的比賽成績(jī)比較穩(wěn)定.
為了解某體校學(xué)生長(zhǎng)跑的情況,觀察隨機(jī)抽取的20名學(xué)生一周內(nèi)跑步的累積千米數(shù),在各個(gè)區(qū)間內(nèi)頻數(shù)記錄如下表所示:
表1
求一周內(nèi)學(xué)生平均累積跑步的千米數(shù)及其標(biāo)準(zhǔn)差.
解析先求出各個(gè)區(qū)間的中點(diǎn)值:8、13、18、23、28、33、38.
s=
本題中,n=20,m=7.經(jīng)計(jì)算得:x=24.5,s=8.29.
因此可知:學(xué)生平均每周累計(jì)跑24.5千米,標(biāo)準(zhǔn)差為8.29千米.
從一堆蘋果中任取5只,稱得它們的質(zhì)量如下(單位:克)125 124 121 123 127則該樣本標(biāo)準(zhǔn)差s=______(克)(用數(shù)字作答).
以上三個(gè)例題都用到了樣本標(biāo)準(zhǔn)差,由于教材不同,選用了不同的公式,那么,上教版中的樣表標(biāo)準(zhǔn)差為什么要除以n-1?這么做能消除系統(tǒng)偏差的依據(jù)是什么呢?對(duì)應(yīng)地,樣本均值為什么沒有除以n-1呢?
根據(jù)樣本統(tǒng)計(jì)量對(duì)相應(yīng)總體參數(shù)所作的估計(jì)叫做總體參數(shù)估計(jì),總體參數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì).點(diǎn)估計(jì)是指用某一樣本統(tǒng)計(jì)量的值來估計(jì)相應(yīng)的總體參數(shù)的值.比如,用樣本均值和樣本標(biāo)準(zhǔn)差來估計(jì)總體平均數(shù)和總體標(biāo)準(zhǔn)差就是點(diǎn)估計(jì).
點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)是:無偏性、有效性、一致性.
當(dāng)用某一個(gè)樣本統(tǒng)計(jì)量的值估計(jì)總體參數(shù)值時(shí),總會(huì)有所偏差,有的大于總體參數(shù),有的小于總體參數(shù),如果一切可能個(gè)樣本統(tǒng)計(jì)量的值與總體參數(shù)值偏差的平均值為0,這種統(tǒng)計(jì)量就是總體參數(shù)的無偏估計(jì)量.
兩個(gè)定義:
μ=E(X);
σ2=D(X)=E(X-EX)2.
數(shù)學(xué)期望有以下性質(zhì):
(1)常數(shù)性E(C)=C,其中C為常數(shù);
(2)齊次性E(CX)=CE(X);
(3)可加性E(X+Y)=E(X)+E(Y);
(4)獨(dú)立性E(X·Y)=E(X)·E(Y),其中X,Y相互獨(dú)立.
方差具有下列性質(zhì):
(1)常數(shù)性D(C)=0,其中C為常數(shù);
(2)二次性D(CX)=C2D(X);
(3)可加性D(X+Y)=D(X)+D(Y),其中X,Y相互獨(dú)立.
可見:樣本均值x是總體均值μ的一個(gè)無偏估計(jì)量.
所以,S*2為σ2的一個(gè)無偏估計(jì)量.
當(dāng)總體參數(shù)不止有一種無偏估計(jì)時(shí),某一種估計(jì)量的一切可能樣本值的方差小的為有效性高,方差大的為有效性低.如:樣本均值x、中位數(shù)Md、眾數(shù)M0都是總體平均數(shù)μ的無偏估計(jì)量,但x的一切可能樣本值的方差最小,所以x是總體平均數(shù)μ最有效的估計(jì)量.
當(dāng)樣本容量無限增大時(shí),估計(jì)量的值能越來越接近它所估計(jì)的總體參數(shù)值,這種估計(jì)量是總體參數(shù)一致性估計(jì)量.如:樣本均值x是總體平均數(shù)μ的一致性估計(jì)量,樣本標(biāo)準(zhǔn)差s是總體標(biāo)準(zhǔn)差σ的一致性估計(jì)量.
通過上面的分析可見,上海教材里將樣本的標(biāo)準(zhǔn)差
作為總體標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值是合理的.
1 劉新平,劉存?zhèn)b.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論[M].北京:科學(xué)出版社.2012
2 王孝玲.教育統(tǒng)計(jì)學(xué)[M].上海:華東師范大學(xué)出版社.2003