[摘要]概率統(tǒng)計的起源相當(dāng)有趣,它源于對賭博問題的研究。惠更斯在他的著作當(dāng)中,給出了概率、數(shù)學(xué)期望的基本概念的雛形,并得到相應(yīng)的性質(zhì)和計算方法,概率統(tǒng)計從此自成系統(tǒng)。文本回溯概率論與數(shù)理統(tǒng)計的起源、發(fā)展與完善過程,探討其在現(xiàn)實生活中的應(yīng)用。
[關(guān)鍵詞]概率統(tǒng)計方法 預(yù)測 調(diào)查 應(yīng)用
概率統(tǒng)計的起源相當(dāng)有趣,它源于對賭博問題的研究?;莞乖谒闹鳟?dāng)中,給出了概率、數(shù)學(xué)期望的基本概念的雛形,并得到相應(yīng)的性質(zhì)和計算方法,概率統(tǒng)計從此自成系統(tǒng)。
擲骰子是生活中常見的現(xiàn)象,每次擲出的點數(shù)是偶然的,似乎是沒有規(guī)律可尋的,但是通過大量的實驗可以發(fā)現(xiàn)每個點出現(xiàn)的頻數(shù)是趨于某個常數(shù)的,他們就是在這種看似無規(guī)律的現(xiàn)象中去探求規(guī)律,把它們用抽象的數(shù)學(xué)語言表達(dá)出來,最終奠定了一個與以往的確定性數(shù)學(xué)完全不同的數(shù)學(xué)分支——概率論的基礎(chǔ)。在帕斯卡等人的努力下,概率論已經(jīng)成為數(shù)學(xué)系統(tǒng)下一門獨立科學(xué),而后來的經(jīng)濟發(fā)展又為其進(jìn)一步豐富發(fā)展提供了絕好的契機。
18世紀(jì)的歐洲,工商業(yè)迅速發(fā)展,一門嶄新的事業(yè)——保險業(yè)開始興起。保險公司為了獲取豐厚的利潤,必須先確定水、火災(zāi)等意外事件發(fā)生的概率,據(jù)此來確定保險價格。因此,各國數(shù)學(xué)家紛紛加入對概率統(tǒng)計的研究。在這種推動下,研究成果層出不窮。1713年,瑞典數(shù)學(xué)家雅各布#8226;伯努利得出了著名的伯努利定理。他們的工作使得建立在經(jīng)驗分析基礎(chǔ)上的頻率穩(wěn)定性的估計理論化,概率論也從此由對特殊問題的求解發(fā)展成為對一般理論的概括階段。而同時期的法國數(shù)學(xué)家棣莫弗首次定義了獨立事件的乘法定理,給出了二項分布式,以及正態(tài)分布的概念,對概率論的發(fā)展做出了重要貢獻(xiàn)。后來泊松、高斯、切比雪夫、馬爾科夫、柯爾莫戈洛夫等人也都對這門學(xué)科做出了重要貢獻(xiàn),使之最終發(fā)展成了一門系統(tǒng)化的理論,廣泛地應(yīng)用于各個領(lǐng)域。
舉一個概率與統(tǒng)計方法被應(yīng)用于生物學(xué)領(lǐng)域的例子:人們或許會認(rèn)為生男生女的可能性是相等的,但事實并非如此。一般來說,男嬰的出生率要比女嬰高一些,發(fā)現(xiàn)這個問題的并不是生物學(xué)家,而是法國的數(shù)學(xué)家拉普拉斯,他通過對倫敦、巴黎等城市的人口統(tǒng)計報告的研究得出了這個結(jié)論。
我們再來看看彩票預(yù)測。如果隨便買一注彩票的話,相信沒有一個人會去買類似隨機數(shù)1234567的傳統(tǒng)型彩票組合。為什么像1234567這樣的數(shù)根本不會出現(xiàn)呢?這要從物質(zhì)相似性及慣性理論來解釋。事實上,要想在搖獎機中真正產(chǎn)生隨機數(shù)是一件非常困難的事情,其難度不亞于在傳統(tǒng)的6+1型彩票中中得一等獎。英國牛津大學(xué)專門從事隨機數(shù)研究的Tomshen教授發(fā)表過一篇文章,里面寫到:實踐表明,真正的隨機數(shù)的產(chǎn)生是極端困難的,不管是用計算機還是機械裝置。各種精心設(shè)計的輪盤賭工具在仔細(xì)檢查之后都能發(fā)現(xiàn)其中有瑕疵,因此產(chǎn)生的不是真正的隨機數(shù),而是一種偽隨機。另外,大部分彩民包括一些所謂的專家都把概率混同于幾率,實際上這是一個重大的誤區(qū)。概率是研究在理想情況下大量的隨機數(shù)據(jù)發(fā)生頻率多少的學(xué)科,這里要強調(diào)的一點是理想情況下,這種情況非常難以達(dá)到,只是理論上的一種假設(shè)。而幾率是研究在目前狀況下事物發(fā)展趨勢的學(xué)科,即雖然在非常大量的統(tǒng)計上數(shù)據(jù)也許會趨向于隨機分布,但是在短期、局部的時間內(nèi)卻可以看到明顯的趨勢性,正是因為有這樣的現(xiàn)象,我們研究彩票的預(yù)測才有了根據(jù)。這就好比一個人生下來應(yīng)該有3種狀況,富、一般、貧,按照概率論的說法世界上這3種人應(yīng)該一樣多,可事實上呢,富人和窮人都不太多,最多的是一般的人,他們的分布呈現(xiàn)鐘形的正態(tài)分布。這個道理很淺顯,可是一旦換成彩票有些人就認(rèn)識不清了,當(dāng)然在這里不是說彩票的分布是正態(tài)分布,也不是說概率論在彩票預(yù)測中沒有用處,而是說要恰當(dāng)應(yīng)用概率論。美國的flinotiny彩票軟件就曾使20多人在1年內(nèi)中過特等獎,這就很好的說明了問題。
在社會科學(xué)領(lǐng)域,經(jīng)常要作一些抽樣調(diào)查,如敏感問題(家庭暴力、或婚外戀、服用興奮劑、吸毒)調(diào)查、健康問題調(diào)查、人口普查等,都需要運用概率統(tǒng)計知識。如在調(diào)查家庭暴力所占家庭的比例 p時,被調(diào)查者往往不愿回答真相,這使得調(diào)查數(shù)據(jù)失真。為得到實際的p同時又不侵犯個人隱私,調(diào)查人員將袋中放入比例是p0的紅球和比例是q0=1-p0的白球。被調(diào)查者獨自在袋中任取一球然后放回,并承諾取得紅球就講真話,取到白球就講假話。被調(diào)查者只需在匿名調(diào)查表中選“是”(有家庭暴力)或“否”,然后將表放入投票箱。沒人能知道被調(diào)查者是否講真話和回答的是什么。如果聲稱有家庭暴力的家庭比例是p1,求p.運用全概率公式計算可知:只要p0≠q0,就有p=p1-q0p0-q0。實際問題中,p1是未知的,需要經(jīng)過調(diào)查得到。假定調(diào)查了n個家庭,其中有k個家庭回答“是”,則可以用p^1=k/n,于是可以用p^=p^1-q0p0-q0估計p。如果袋中裝30個紅球,50個白球,調(diào)查了320個家庭,其中有195個家庭回答“是”,則 p0=3/8,q0=5/8,p^1=195/320,p^=195/320-5/83/8-5/8=6.25%??梢宰C明 |p0-q0|越大,得到的結(jié)論越可靠。(但 |p0-q0|越大,調(diào)查方案越不易為被調(diào)查者所接受。)
各國政府也經(jīng)常要做一些抽樣調(diào)查,來了解民眾對某項政策的滿意程度或者通過民意調(diào)查來為是否出臺某項政策提供現(xiàn)實依據(jù),用樣本信息去推斷總體信息,這樣可以大大減少財政支出。而大部分的企業(yè)在決定是否投資某個產(chǎn)品的開發(fā)之前都會做市場調(diào)查,通過被調(diào)查人的態(tài)度來推測產(chǎn)品推出后會不會受歡迎,然后再決定是否進(jìn)行投資,這樣就降低了投資風(fēng)險,這也是運用了概率統(tǒng)計用樣本信息去估計總體的基本思想。而對收集到的數(shù)據(jù)的處理也從原來的依靠人算的階段,發(fā)展到利用各種計算機軟件來處理的階段。實際上這種軟件的開發(fā)也是利用了數(shù)理統(tǒng)計的知識。
隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,概率統(tǒng)計方法將會越來越廣泛地運用于處理龐大而繁雜的信息,對考察的現(xiàn)象作出推斷與預(yù)測,為決策和行動提供科學(xué)的依據(jù)和建議,在社會生活、科學(xué)技術(shù)各領(lǐng)域發(fā)揮巨大的積極作用。
參考文獻(xiàn):
[1]朱家生.數(shù)學(xué)史.高等教育出版社.
[2][美]M.克來因.古今數(shù)學(xué)思想史.上??萍汲霭嫔?
[3]何書元.概率論與數(shù)理統(tǒng)計.高等教育出版社.
[4]陳吉象,戴瑛,鄭棄冰,吳忠華.文科數(shù)學(xué)基礎(chǔ).高等教育出版社.
[5]Iversen G R, Gergen M.統(tǒng)計學(xué).高等教育出版社.
(作者單位:遼寧沈陽師范大學(xué))