程和祥,楊迎瑩
(西南政法大學(xué) 行政法學(xué)院&監(jiān)察法學(xué)院,重慶 401120)
概率論是一門研究隨機(jī)現(xiàn)象數(shù)量規(guī)律的數(shù)學(xué)學(xué)科。第一個有明確文獻(xiàn)記載的概率論研究者是意大利的卡爾達(dá)諾,他在研究賭博中擲骰子的各種可能情況時提出了概率問題。到了18、19世紀(jì),隨著自然科學(xué)的發(fā)展,學(xué)者們注意到某些自然現(xiàn)象和社會現(xiàn)象類似于機(jī)會游戲,從而概率論也被嘗試應(yīng)用到自然科學(xué)和社會科學(xué)中。概率論真正成為一門學(xué)科,歸功于瑞士數(shù)學(xué)家雅各布·伯努利,正是他建立了概率論中的第一個極限定理,概率論才正式成為數(shù)學(xué)的一個分支學(xué)科。隨后棣莫弗和拉普拉斯又導(dǎo)出了第二個基本極限定理的原始形式,概率論也由此迎來了新的發(fā)展階段。19世紀(jì)末,俄國數(shù)學(xué)家切比雪夫、馬爾可夫、李亞普諾夫等人用分析方法建立了大數(shù)定律及中心極限定理的一般形式。20世紀(jì)初,受物理學(xué)的影響,柯爾莫哥洛夫、維納、馬爾可夫、辛欽、萊維及費勒等人開始研究隨機(jī)過程,取得了一些成果。盡管如此,關(guān)于概率的定義,學(xué)者們?nèi)员娬f紛紜。梳理歷史上不同學(xué)派的觀點,可以得到五種概率定義[1],它們大致可以分為兩大類:面向人的認(rèn)知能力的認(rèn)識論解釋和適用于自然科學(xué)或數(shù)理科學(xué)的客觀解釋。認(rèn)識論的概率解釋適用于研究人際互動的社會科學(xué),如經(jīng)濟(jì)學(xué)、法學(xué)和社會學(xué)等——這些學(xué)科刻畫了人的認(rèn)知能力差異;客觀的概率解釋適用于自然科學(xué),如物理、化學(xué)和生物學(xué)等——這些學(xué)科研究自然界的客觀規(guī)律。實際上,在實踐中運用概率時,我們還需要根據(jù)具體情況總結(jié)一些經(jīng)驗法則,如概率均等原理、偏態(tài)原理和慣性原理。本文將利用2008年中國福利彩票開獎數(shù)據(jù),說明這些原理的具體應(yīng)用。當(dāng)然,即使如此,我們也還是無法得出必然性的開獎結(jié)果;因此,在實際的博彩游戲中,投注仍需講究策略。
法國數(shù)學(xué)家拉普拉斯提出了概率的古典定義,即不進(jìn)行任何統(tǒng)計試驗,僅僅根據(jù)演繹法就可事前計算隨機(jī)事件中各種可能發(fā)生的結(jié)果及其出現(xiàn)的次數(shù)。在古典概率的定義中,有一個假設(shè),即隨機(jī)事件中各種可能的情況是有限互斥的,并且每個基本事件發(fā)生的可能性相等。這個假設(shè)其實是值得懷疑的:基本事件的概率真的具有精確的相同的概率值?通俗地說,硬幣真的是完美的嗎?骰子制造的是均勻的嗎?骰子的重心一定位于正中心?輪盤真的不具有傾向性(不會傾向于某一個數(shù)字)?對于這種質(zhì)疑,古典的概率論者提出了“不充分理由原則”:如果沒有直接的證據(jù)來證明A事件的概率大于B事件的概率,那么可以假定A、B兩事件的概率等值。這個辯護(hù)同樣適用于輪盤賭游戲中的輪盤,也適用于一切賭博游戲中的“賭具”,如撲克牌。顯然,“不充分理由原則”確實是不充分的,在實踐中應(yīng)用范圍大大受限。
20世紀(jì)20年代,英國著名經(jīng)濟(jì)學(xué)家凱恩斯出版了《論概率》(1921)一書,對帕斯卡概率做了邏輯解釋,建立了第一個概率邏輯系統(tǒng),后來卡爾納普等人繼續(xù)發(fā)展了這一理論。該理論假定,對于相同的證據(jù),所有理智正常的成年人都會對某一假說持有相同的置信度。凱恩斯認(rèn)為:如果h以α的程度部分地衍推a,那么給定h,以α的程度相信a是合理的。因此,概率關(guān)系可以刻畫合理信念的程度。
在概率的邏輯解釋中,凱恩斯與卡爾納普都采用了無差別原則。由于無差別原則是基于“不充分”理由之上的,因而不可避免地會導(dǎo)致荒謬的結(jié)論[2-5],如酒 - 水悖論[6]和伯特蘭悖論[7-8],為了克服這些悖論,概率的主觀解釋應(yīng)運而生。
拉姆齊和德·芬內(nèi)蒂大約在同一時期(20世紀(jì)20年代中期)獨立地發(fā)現(xiàn)了概率的主觀理論,即將概率解釋為主觀置信度。薩維奇在《統(tǒng)計學(xué)基礎(chǔ)》(1954年)中拓展了這個思想。概率的主觀解釋通常又稱為貝葉斯概率解釋,但有些貝葉斯主義者宣稱他們的概率解釋不僅僅是主觀的,不具有客觀性,如耶納斯、杰方斯以及伯格。
概率的主觀主義者認(rèn)為,不同的正常成年個體,盡管都被假定為是理性的,但由于他們的天賦不同以及后天受教育的狀況、生活環(huán)境和個人運氣等因素的影響,他們對浩瀚的宇宙、對復(fù)雜社會的認(rèn)知能力和認(rèn)知水平并不相同。即使給定同樣的證據(jù)e,小張和小王對假說h也會有不同的信念度。因而,概率被定義為特定個體的信念度。這不可避免使得初始概率或先驗概率具有主觀任意性。拉姆齊也承認(rèn)這種主觀任意性,在他看來,先驗概率或初始概率只需要滿足概率公理即可,而這顯然與現(xiàn)實不符合。因為在現(xiàn)實生活中,專家與業(yè)余人員的意見和判斷顯然具有不同的概率。因此,先驗概率的隨意性遭受了許多的批評。面對批評,德·芬內(nèi)蒂提出了著名的“意見收斂定理”,為證明意見收斂定理,他又提出了“事件的可換性”,而事件的可換性并不具有說服力,使得德·芬內(nèi)蒂的觀點歸于失敗。另外,主觀主義者在用打賭測量個體信念度時,只討論了兩個主體。然而實際上,目前地球上有70多億人,僅中國就有13億~14億。對于無窮多個主體,主觀主義者提出了主體交互解釋。
19世紀(jì)中期,劍橋?qū)W派的埃利斯和約翰·文恩提出了概率的頻率解釋。隨后,頻率解釋被漢斯·萊欣巴赫和馮·米塞斯進(jìn)一步發(fā)展。萊欣巴赫和馮·米塞斯根據(jù)極限頻率來定義概率:在事件的無窮序列中,某一事件或某一屬性出現(xiàn)的相對頻率的極限。概率的頻率定義,非常適合自然科學(xué)領(lǐng)域,因而在自然科學(xué)領(lǐng)域中被當(dāng)作重要的認(rèn)知工具。但事實上,人的壽命是有限的,人們不能觀察到所有事物的極限頻率,有些事物的極限頻率,人們是無法在有生之年觀察到的,人們只能觀察到無窮序列中的某一段。另外,單稱事件的概率和極限頻率的經(jīng)驗確證問題也是頻率解釋的概率陳述無法解釋的。因此,波普爾提出了新的概率解釋理論。
1957 年,波普爾發(fā)表論文《概率演算與量子論的傾向解釋》。在這篇論文中,他提出了概率的傾向解釋。隨后,他在《科學(xué)發(fā)現(xiàn)的邏輯》(1959)、《猜想與反駁:科學(xué)知識的增長》(1963)和《客觀知識:一個進(jìn)化論的研究》(1972)以及《開放的宇宙》(1982)等一系列著作中,對這一理論進(jìn)行了詳細(xì)的闡釋和發(fā)展。傾向解釋認(rèn)為,概率在某些解釋中是一種物理的傾向,這一點與頻率的概念是完全不同的。根據(jù)波普爾的傾向解釋,當(dāng)相關(guān)條件僅僅被重復(fù)幾次時,我們可以假定概率存在。因而,相較概率的頻率解釋,波普爾的傾向解釋對概率論應(yīng)用的情形提供了一種在具體的科學(xué)實踐中可以接受的理論。雖然后期波普爾的單個事例傾向解釋面臨檢驗的困難,但吉利斯的長趨勢傾向解釋能夠很好地克服這一困境。
總的說來,根據(jù)概率解釋的多元論觀點,不同的解釋適合不同的領(lǐng)域,對應(yīng)于不同的學(xué)科。古典解釋是適用于機(jī)會游戲的,如拋硬幣和擲骰子,但對于概率的所有現(xiàn)代應(yīng)用都不適合;邏輯解釋因為無差別原則而面臨一些困境;概率的主觀解釋和主體間解釋在社會科學(xué)領(lǐng)域是有效的,但顯然不適合具有客觀性的自然科學(xué)——主觀解釋本身就是用來刻畫人的認(rèn)知差異的,并不描述宇宙的客觀性;頻率解釋適用于經(jīng)典數(shù)學(xué);概率的傾向解釋比頻率理論能更好地說明自然科學(xué)中的概念創(chuàng)新。因此,五種概率解釋中,較具有可行性的是主觀解釋與傾向解釋。盡管主體交互解釋與主觀解釋一樣都具有一定的局限性,但考慮到現(xiàn)實生活中千千萬萬個體的認(rèn)知能力千差萬別,因而它們在社會科學(xué)中有廣泛的應(yīng)用。目前,人們將概率的主觀解釋和貝葉斯定理結(jié)合起來,對不確定的信息進(jìn)行推理,這種概率推理系統(tǒng)中最著名的當(dāng)屬朱迪·佩爾于1988年提出的貝葉斯概率網(wǎng)絡(luò)模型;除此之外,英國南安普頓大學(xué)的蘇基·芬恩基于貝葉斯概率推理給出了愛情方程式Cr updated(p)=Cr initial(p|e)。在當(dāng)前可利用的客觀解釋之中,傾向解釋已經(jīng)替代了頻率解釋。由于在自然科學(xué)中要找到一系列獨立的可重復(fù)條件是有可能的,因而客觀解釋在自然科學(xué)中有廣泛的應(yīng)用,如當(dāng)前最熱門的大數(shù)據(jù)推理。
回顧概率論幾百年的發(fā)展歷史,從16世紀(jì)的古典概率到20世紀(jì)概率的傾向解釋,人們對概率的認(rèn)識構(gòu)成一個從古典到主觀、從主觀到客觀的解釋譜系。古典階段,人們對隨機(jī)現(xiàn)象數(shù)量規(guī)律的認(rèn)識停留在抽象的可能階段;邏輯階段,概率學(xué)者基于正常成年人的理性來定義概率;主觀階段,概率學(xué)者從現(xiàn)實生活中人的理性認(rèn)知能力千差萬別出發(fā),來討論一個個具體的概率;客觀階段,人類的思維對象開始向大自然擴(kuò)展。這樣一個從古典到主觀,從主觀到客觀的認(rèn)識過程,反映了人類對隨機(jī)現(xiàn)象數(shù)量規(guī)律的認(rèn)識不斷加深,不斷清晰的過程。
當(dāng)我們討論概率解釋的譜系的時候,也提及了每種概率的具體應(yīng)用領(lǐng)域。但事實上,在實際應(yīng)用中,上述說明是遠(yuǎn)遠(yuǎn)不夠的。如20世紀(jì)80年代美國電視游戲節(jié)目“Let’s Make a Deal”的主持人提出的三門問題,即蒙提·霍爾悖論[9],并不是用我們上述的概率論知識就能輕易解決的。另外,古典概率當(dāng)然適用于機(jī)會游戲,但顯然難以找到一種機(jī)會游戲完全符合古典概率。拋擲錢幣、骰子和輪盤賭這些當(dāng)然都屬于機(jī)會游戲。在這些機(jī)會游戲中,投注的技巧和策略是不可缺少的:一是資金要合理分配,不要孤注一擲;二是要定一個“止損點”,到點主動出局。但除此之外,這些機(jī)會性游戲又涉及另一個重要概念,即隨機(jī)數(shù)——也就是數(shù)字和數(shù)字之間毫無關(guān)系。真正的隨機(jī)數(shù)是使用物理性隨機(jī)數(shù)發(fā)生器產(chǎn)生的,而物理性隨機(jī)數(shù)發(fā)生器技術(shù)要求比較高。在實際的生產(chǎn)和日常生活中,大多數(shù)場合僅僅使用偽隨機(jī)數(shù)就能滿足需要。這種偽隨機(jī)數(shù)不是完全隨機(jī)的數(shù)列,而是表現(xiàn)出一定的周期性,但是在統(tǒng)計特征上類似于隨機(jī)數(shù)。偽隨機(jī)數(shù)產(chǎn)生相對簡單,通常通過計算機(jī)或計算器產(chǎn)生。我們?nèi)粘I钪械臄?shù)字型彩票,它的中獎號碼就是隨機(jī)數(shù)字生成器產(chǎn)生的[10]。即使不考慮人為(操縱)因素,由于受到各種條件的限制,比如機(jī)器的機(jī)械性能、機(jī)電配合等因素的影響,電腦彩票產(chǎn)生的中獎號碼其實是一種偽隨機(jī)數(shù)——盡管它的隨機(jī)性很強(qiáng)。一方面,由于隨機(jī)性強(qiáng),因而試圖采用某種算法準(zhǔn)確算出每一期的中獎號碼是不可能的;另一方面,由于是偽隨機(jī)數(shù),那么中獎號碼不可避免就會表現(xiàn)出一些特征或規(guī)律,利用這些規(guī)律將中獎號碼壓縮到一個很小的范圍,再采取適當(dāng)?shù)耐蹲⒉呗?,確保盈利是完全可能的。當(dāng)前的博彩業(yè)已經(jīng)是高科技行業(yè),每一個賭場都擁有較多數(shù)學(xué)工程師和計算機(jī)程序員?,F(xiàn)代搖獎機(jī)程序的設(shè)計,匯集了一系列數(shù)學(xué)大師的智慧——高斯的概率論、泰勒的級數(shù)論和著名的凱利公式都有應(yīng)用。但是在長期的彩票游戲中,人們根據(jù)實際經(jīng)驗,總結(jié)出了如下三個實用的結(jié)論:
第一,概率均等原理。這里的概率可以理解為頻率(在事件的無窮序列中,某一事件或某一屬性出現(xiàn)的相對頻率的極限),是一種大的整體的趨勢與規(guī)律;幾率,是指在已經(jīng)發(fā)生的隨機(jī)事件中,某一種隨機(jī)事件所占的比例,是較少數(shù)據(jù)統(tǒng)計的結(jié)果,表明階段性的趨勢和規(guī)律。以前由于技術(shù)所限,人們難以獲得開獎的歷史數(shù)據(jù)?,F(xiàn)在,由于計算機(jī)技術(shù)和移動互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們獲得這些數(shù)據(jù)并不特別困難,甚至輕而易舉。
第二,偏態(tài)原理。所謂偏態(tài),指的是某個指標(biāo)未開出的期數(shù)與開出期數(shù)的百分比。彩票搖獎的開獎號碼在長期趨勢中表現(xiàn)出來的是隨機(jī)性,就有限期次來說,在不考慮人為因素的情況下,開獎數(shù)據(jù)表現(xiàn)的恰恰是一種偽隨機(jī)性。由于搖獎機(jī)的構(gòu)造、彩球的制作等人們無法確知的因素,使各個備選獎球被搖出的概率在一定時期內(nèi)表現(xiàn)的并不完全均等,在某個相對短暫的時期內(nèi)恰恰表現(xiàn)出一種或明或隱的偏態(tài)。不管是福利彩票(3D、新3D和雙色球以及刮刮樂等),還是體育彩票(排列3、排列5和超級大樂透以及七星彩),我們都能發(fā)現(xiàn)這種現(xiàn)象。下文將有實例,此處暫且不表。
第三,慣性原理。由于備選獎球在質(zhì)量、 形狀方面的差異以及彩票搖獎機(jī)的固有特性,使某些獎球在短期內(nèi)中出現(xiàn)的次數(shù)多于其他的獎球,從而出現(xiàn)“強(qiáng)者恒強(qiáng)”的情況。
這三大原理是彩民在實際的博彩游戲中,根據(jù)經(jīng)驗做出的總結(jié),有極強(qiáng)的實用性。當(dāng)然,在具體的應(yīng)用過程中,對三大原理都可作適當(dāng)修正和延伸。例如,彩民們在中國福利彩票和中國體育彩票中針對數(shù)字型和樂透型彩票使用的遺漏分析技術(shù),就是基于概率均等原理和偏態(tài)原理。慣性原理本意是指某些獎球在短期內(nèi)中出現(xiàn)的次數(shù)多于其他的獎球,而在博彩實踐中,有時候我們需要考慮的不僅僅是一個個獎球,而是獎球和獎球構(gòu)成的號碼組合,考察號碼組合之間的依賴關(guān)系,最經(jīng)典的莫過于2008年的案例。在2008年年初,中國福利彩票3D的開獎數(shù)據(jù)有一些值得研究的現(xiàn)象[11-12]。例如,2008007 期、2008008 期、2008036 期、2008037期、2008043期、2008044期共6期,開獎數(shù)據(jù)用表1展示如下:
從表1可以看出,號碼組合320和號碼組合149之間表現(xiàn)出很強(qiáng)的依賴性,且奇跡般地在短時間之內(nèi)(45天之內(nèi))出現(xiàn)三次。
根據(jù)概率的古典定義,2008年2月20日開獎號碼為149的概率是1/1000;根據(jù)概率的頻率解釋,開獎號碼為149的概率依舊很低;而如果我們采用傾向解釋,根據(jù)上一期的開獎號碼320,可以得出下一次開獎號碼傾向于149。通過福彩中心的數(shù)據(jù),我們可以發(fā)現(xiàn)2008年2月20日,不少職業(yè)彩民抓住了這次機(jī)遇,這一點可以從中獎注數(shù)79291注看出來——當(dāng)期中獎注數(shù)明顯偏高,返獎比例高達(dá)200.18%。出現(xiàn)這種情況的原因,有可能是搖獎機(jī)的程序陷入某種死循環(huán),在一系列“天時地利人和”的綜合作用下,出現(xiàn)這種巧合。因此,這種情況屬于小概率事件,不是必然規(guī)律。因此,不能把這種現(xiàn)象當(dāng)作長期的投注依據(jù),更不能“孤注一擲”。事實上,在整個2008年的359期中,除了剛才討論的6期,320和149之間再也沒有這樣相鄰出現(xiàn)過。而其他號碼組合,也僅僅發(fā)生過一例:064與028。具體情況,如表2所示:
表1 2008年1—2月中國福利彩票部分開獎狀況
從表2可見,064與028之間的依賴性顯然不如320與149,因而看出這種特征的人并不多,中獎注數(shù)能很好地說明這一點。
號碼組合之間的依賴性只是我們的一種分析方法,在實際的3D博彩游戲中,職業(yè)彩民還會從多個角度分析開獎號碼的屬性,如開獎號碼的和值、和尾、跨度、大小、奇偶以及質(zhì)合等屬性。有的彩民還會從試機(jī)號入手,也有的彩民采用012路分析方法。總之,在彩票游戲當(dāng)中,中獎號碼的產(chǎn)生是偽隨機(jī)的,時間一長,這些中獎號碼就會形成某種可以預(yù)測的模式。因此,在“數(shù)字型”彩票游戲當(dāng)中,我們可以對歷年的中獎號碼進(jìn)行分析,從而預(yù)測未來趨勢,以便正確地估計最有可能在下次開獎中出現(xiàn)的號碼。將這種思路貫穿于雙色球游戲之中,我們可以得到如下結(jié)論:(1)不要選擇過去的中獎號碼;(2)不要選擇6個連續(xù)的數(shù)字;(3)不要選擇屬于同一個數(shù)字區(qū)間的數(shù)字;(4)不要選擇01-02-03-04-05-06-07型號碼組合;(5)不要選擇模式化的號碼;(6)不要選擇倍數(shù)型號碼;(7)運用智慧和技巧投注,而不是讓機(jī)器來選擇。一句話,我們應(yīng)該跳出概率解釋的框架,從模式的角度來理解。除了這些技術(shù)分析外,在真實的博彩游戲中,彩民還需要考慮賠率問題,需要考慮投注的策略。還是以福彩3D為例,它的投注方式就有十三種:“單選”“組選”“1D”“2D”“通選”“和數(shù)”“包選”“猜大小”“猜1D”“猜2D”“猜三同”“拖拉機(jī)”“猜奇偶”等。因而,彩民,尤其是職業(yè)彩民,需要根據(jù)自己的經(jīng)驗和博彩技術(shù),選擇相應(yīng)的投注方式,在確保不輸?shù)那闆r下,贏取盡可能多的利潤。尤其是時時彩這種高頻彩票,策略選擇得當(dāng),并且技巧高超,有可能在短期內(nèi)賺取豐厚的利潤。概率起源于賭博,因而在人類的一切賭博活動中皆有滲透。例如,在21點和橋牌游戲中,皆有概率論的應(yīng)用。和博彩業(yè)相比,這些活動表現(xiàn)為人與人之間的競技,因而“概率”也處于不斷的運動變化和調(diào)整之中。
表2 2008年5—8月中國福利彩票部分開獎狀況
所有的賭場游戲,從數(shù)學(xué)上講,一開始就是對賭徒不公平的游戲。根據(jù)大數(shù)定律,賭徒下注賭博的次數(shù)越多,輸?shù)母怕试酱?,破產(chǎn)的概率也越高。因此,進(jìn)入賭場之前,掌握一定程度的概率知識是十分必要的[13]。因為你不僅僅是在和機(jī)器較量,你同時也在和數(shù)學(xué)家對決——這是一場智力游戲。當(dāng)然,在中國博彩,你還需要了解中國的國情。正因為這種機(jī)會游戲本身的不公平以及中國國情的復(fù)雜性,越是發(fā)達(dá)地區(qū),越是受教育程度高的人群,寄希望于運氣的人越少。