劉文慧 張淑梅 張唯一
(1.北京師范大學數(shù)學科學學院 100875; 2.北京師范大學統(tǒng)計學院 100875; 3.人民教育出版社 100081)
在第二次世界大戰(zhàn)期間,由于許多戰(zhàn)略上的理由,盟軍想知道二戰(zhàn)期間德軍總共制造了多少輛坦克[1].盟軍請來了統(tǒng)計學家參與情報的收集和分析工作,從戰(zhàn)后發(fā)現(xiàn)的德國記錄來看,運用統(tǒng)計方法估計的結(jié)果與德國實際生產(chǎn)的坦克數(shù)量非常接近.原來,德國人在制造坦克時是墨守成規(guī)的,他們把坦克從1開始進行了連續(xù)編號.在戰(zhàn)爭進行過程中,盟軍繳獲了一些德軍坦克,并記錄了它們的生產(chǎn)編號[1].統(tǒng)計學家將繳獲的德軍坦克編號作為樣本觀測數(shù)據(jù),用樣本估計總體的方法推斷總的坦克數(shù)量.生活中還有類似的問題:
問題1某大學美術(shù)系平面設(shè)計專業(yè)的報考人數(shù)連創(chuàng)新高,今年報名剛結(jié)束,某考生想知道報考人數(shù).考生的考號按0001,0002,…的順序從小到大依次排列.這位考生隨機地了解了50個考生的考號.請給出一種方法,根據(jù)這50個隨機抽取的考號,幫助這位考生估計考生總數(shù).[1]
問題2某個袋子里有N個小球,標號按1,2,3,…的順序從小到大排列.將袋內(nèi)的小球充分攪拌后,隨機不放回地抽取了10個小球,記下編號.請給出一種方法,根據(jù)這10個編號,估計袋子內(nèi)小球的總數(shù).
這是一個比較好的統(tǒng)計案例,可以啟發(fā)學生思考,同時可以幫助學生理解統(tǒng)計解決實際問題時,更加關(guān)注統(tǒng)計方法優(yōu)劣,而不是對錯.
這類問題的特征為假設(shè)事先個體已經(jīng)按自然數(shù)編號,通過不放回抽樣得到的樣本估計總體總數(shù)的問題,即:在1,2,3,…,N個自然數(shù)中不放回地隨機抽取n個數(shù),將抽取的樣本從小到大排序后記為x(1),x(2),...,x(n),且滿足n≤x(n)≤N.在實際問題中,我們不知道N是多少,要估計N的值.
在教學中可以啟發(fā)學生思考解決這個問題的方法,討論每種方法的合理性,對不同方法進行比較.下面給出幾種估計方法,每種方法都有其合理性,不能說哪種方法是錯誤的,但可以用統(tǒng)計理論從某個角度,或者在某個準則下對它們進行比較.
方法一:用樣本的最大值估計總體的最大值的思想
方法二:用樣本中位數(shù)估計總體中位數(shù)的思想
方法三:用樣本平均數(shù)估計總體平均數(shù)的思想
我們知道,中位數(shù)對樣本數(shù)據(jù)的信息利用率較低,僅用到中間的一個數(shù)據(jù)或兩個數(shù)據(jù),有的學生會考慮用樣本的平均數(shù)估計總體平均數(shù)的思想,來估計N.即
方法四:分析區(qū)間長度的方法
樣本將這N個數(shù)據(jù)分為幾段,端點選取不同,可以得到不同的估計值.
區(qū)間長度法1:
區(qū)間長度法2:
區(qū)間長度法3:
由區(qū)間長度法的思想得到的三個估計值相差不超過1,這樣的差距在實際問題中是可以忽略的.比如在估計考生人數(shù)的問題中,估計的總數(shù)相差1并不會影響決策,這也體現(xiàn)了統(tǒng)計與數(shù)學的區(qū)別.這三個估計方法都是可以應用的,盡管它們得到的估計值不盡相同,但不能說明哪個結(jié)果是錯誤.
根據(jù)不同的估計思想,我們得到了六個估計量,這些估計量哪個更好?評價估計量的好壞常用的標準有無偏性和均方誤差.估計量是一個統(tǒng)計量,也是一個隨機變量,隨著樣本的改變而改變.如果一個估計量的均值等于要估計參數(shù)的真值,就稱該估計量具有無偏性,其含義是如果多次抽樣,并且每次樣本量相同,那么得到的多個估計值在參數(shù)真值左右,其平均值與參數(shù)真值接近.接下來,我們從理論的角度推導x(n)的均值,從而討論上面的哪個估計量是無偏估計.
從1到N中不放回隨機抽取n個數(shù),其中最大的數(shù)記為x(n),則x(n)的分布列為:
x(n)nn+1n+2…N-1NP1CnNCn-1nCnNCn-1n+1CnN…Cn-1N-2CnNCn-1N-1CnN
由此,可以計算第1個估計量和后三個估計量的均值,結(jié)果如下:
另外兩個估計量的均值計算很難,后面僅給出模擬的結(jié)果.
注意:(1)我們不能用一次抽樣的樣本得到的估計值評價估計量的好壞.(2)估計量是隨機變量,而估計值是估計量的一次觀測值,是一個具體數(shù)據(jù).
在模擬試驗中,取N=100,n=10,m=1000,即從1,2,…,100中不放回隨機抽取10個數(shù),這樣的模擬試驗重復1000次.
計算機模擬步驟如下:
①在1, 2,…,N這N個自然數(shù)中不放回抽取n個數(shù)據(jù),組成一個樣本;
②將樣本中的n個數(shù)據(jù)從小到大進行排列,記為x(1),x(2),…,x(n);
③分別計算六個估計量的值;
④多次重復步驟①—③.
在下圖中,前六個圖形為散點圖,橫坐標為觀測序號,縱坐標分別為六個估計量在1000次獨立重復試驗中的觀測值.
六個估計量的散點圖和頻率分布直方圖
六個估計量的平均偏差和均方誤差如下表:
六個估計量的平均偏差和均方誤差
通過對高中教師進行問卷調(diào)查,了解到高中教師對統(tǒng)計知識儲備不足[3].本文希望借助經(jīng)典的德國坦克估計問題的背景,介紹一個實際的估計問題,通過在探索多種估計方法的過程中讓讀者感受統(tǒng)計解決實際問題的魅力,理解統(tǒng)計解決實際問題時,更加關(guān)注哪種統(tǒng)計方法好,而不是對錯,體會統(tǒng)計與數(shù)學的區(qū)別,并了解可以從理論和模擬兩個角度比較估計方法的好壞.