陳玲玲
(作者單位:江蘇省海安市李堡中學(xué))
戈賽特(Gosset)是t檢驗(yàn)(也叫studentt檢驗(yàn))的創(chuàng)始人。與許多學(xué)者一樣,他當(dāng)時(shí)并沒有直接從事統(tǒng)計(jì)學(xué)的研究,畢竟,在100多年前,統(tǒng)計(jì)學(xué)甚至還算不上一門學(xué)科。他從事的是啤酒釀造行業(yè),然而就是在這一似乎與統(tǒng)計(jì)無關(guān)的行業(yè)里,他做了一項(xiàng)研究,想弄清楚發(fā)酵時(shí)需要加多少酵母最合適。當(dāng)時(shí)戈賽特做出了結(jié)果并準(zhǔn)備將其發(fā)表,可惜他所在的是釀酒行業(yè),貿(mào)然發(fā)表的話會(huì)有泄露商業(yè)機(jī)密之嫌。但戈賽特又確實(shí)想發(fā)表這一文章,因此采取了折中的辦法:匿名發(fā)表。他采用了一個(gè)筆名,也就是現(xiàn)在我們?nèi)钥梢栽诮y(tǒng)計(jì)學(xué)教材上見到的“student”。
戈賽特最重要的一個(gè)貢獻(xiàn)就是提出了小樣本的檢驗(yàn)思想?,F(xiàn)在我們看起來似乎并無任何出奇,但在當(dāng)時(shí),統(tǒng)計(jì)學(xué)幾乎就是大樣本的科學(xué),一提起統(tǒng)計(jì)學(xué),就想到大樣本。當(dāng)時(shí)卡爾·皮爾遜幾乎所有的工作都是基于大樣本的假設(shè)。但戈賽特根據(jù)自己的經(jīng)驗(yàn)認(rèn)為,有的情況下,大樣本對(duì)于研究者來講太過于奢侈了,必須專注于小樣本。不過一旦用小樣本分析,無可避免地會(huì)牽扯到誤差的問題。在大樣本情況下,你可以假定沒有誤差或者誤差很小可以忽略不計(jì),而小樣本必須考慮到這一問題。那么小樣本情況下,誤差有多大呢?這就是戈賽特所關(guān)注的。
戈賽特通過不斷地演算,最終于1908年發(fā)表了一篇極為重要的文章《Theprobableerrorofthemean》,提出了t分布,這也是至今我們?nèi)栽趶V泛應(yīng)用的t檢驗(yàn)的基礎(chǔ)??紤]一下當(dāng)時(shí)的條件,可想而知戈賽特做出了多少次的計(jì)算才得出這一結(jié)論。他需要一次一次地計(jì)算均數(shù)、標(biāo)準(zhǔn)誤,以確定相關(guān)數(shù)據(jù)的概率分布?,F(xiàn)在條件下通過計(jì)算機(jī)模擬可能很快得出結(jié)果,但當(dāng)時(shí)顯然是很復(fù)雜的。不管如何,戈賽特通過努力,最終發(fā)現(xiàn)了小樣本的分析規(guī)律,并奠定了小樣本分析的基礎(chǔ)?,F(xiàn)在,人們通常稱其為小樣本理論的鼻祖。