蔣驍飛
曾有人起訴貝克萊大學(xué),說(shuō)他們歧視女性,有數(shù)據(jù)顯示他們學(xué)校男性錄取率比女性錄取率高。后來(lái)校方也給出數(shù)據(jù),雖然從全校來(lái)看,男性錄取率比女性高,但從各系來(lái)看,女性錄取率都比男性高。后來(lái),經(jīng)法院調(diào)查證實(shí)貝克萊大學(xué)所言不虛,貝克萊大學(xué)最終勝訴。這里出現(xiàn)了一件令人匪夷所思的事——各系女性錄取率比男性高,但全校女性錄取率卻比男性低。這究竟是怎么回事?先來(lái)看看下面這個(gè)簡(jiǎn)化的例子,也許能幫助你消除困惑。
假設(shè)某大學(xué)只有A系和B系,招生時(shí)共有130名男生和130名女生報(bào)名。A系有50男80女參加考試,錄取10男20女,女生錄取率(20/80)大于男生錄取率(10/50);B系有80男50女參加考試,錄取60男40女,此時(shí),女生錄取率(40/50)仍高于男生錄取率(60/80)。兩系女生錄取率都大于男生錄取率,這是否意味著全校錄取女生的總數(shù)高于男生的總數(shù)呢?你也許會(huì)毫不猶豫地給出肯定答案。然而,實(shí)際情況并非如此,總共被錄取女生是(20+40)個(gè),總共被錄取男生是(10+60)個(gè),男生多于女生。這意味著,從全???,女生錄取率(60/130)是低于男生錄取率(70/130)的。
這個(gè)例子說(shuō)明,分組比較中都占優(yōu)勢(shì)的一方,也許在總評(píng)中反而是失勢(shì)的一方。大家不要對(duì)此迷惑不解,這并不是這個(gè)例子有什么高深莫測(cè)的地方,而是我們慣常的思維方式存在著一個(gè)隱蔽的缺陷——喜歡將局部的階段性的評(píng)價(jià)相加匯總作為總體的全程性的評(píng)價(jià)。
再來(lái)看一個(gè)體育賽事的例子。我們通常用勝率來(lái)衡量運(yùn)動(dòng)員在某一時(shí)期的運(yùn)動(dòng)水平,勝率高意味著運(yùn)動(dòng)成績(jī)好?,F(xiàn)有甲乙兩名運(yùn)動(dòng)員,在一個(gè)賽季的上半程,甲7戰(zhàn)2勝,乙2戰(zhàn)皆輸,甲的勝率(2/7)高于乙的勝率(0/2);在這個(gè)賽季的下半程,甲3戰(zhàn)2勝,乙8戰(zhàn)5勝,此時(shí)甲的勝率(2/3)仍高于乙的勝率(5/8)。但從總個(gè)賽季來(lái)看,甲的勝率(4/10)低于乙的勝率(5/10),階段性評(píng)價(jià)中占優(yōu)的甲運(yùn)動(dòng)員在全程性評(píng)價(jià)中卻處于了劣勢(shì)。
現(xiàn)實(shí)中存在不少這樣的現(xiàn)象——某個(gè)條件下的兩組數(shù)據(jù),分別討論時(shí)都會(huì)滿足某種性質(zhì),可是一旦合并考慮,卻可能導(dǎo)致相反的結(jié)論。英國(guó)統(tǒng)計(jì)學(xué)家辛普森曾深入研究過(guò)這種現(xiàn)象,于是人們就把這種局部評(píng)價(jià)與總體評(píng)價(jià)相悖的現(xiàn)象稱(chēng)為辛普森悖論。辛普森曾說(shuō)過(guò)一句發(fā)人深省的話:“量與質(zhì)是不等價(jià)的,無(wú)奈的是,量比質(zhì)容易測(cè)量,所以人們總是習(xí)慣用量的多少來(lái)評(píng)定質(zhì)的好壞。然而,不少事實(shí)證明,數(shù)據(jù)其實(shí)并沒(méi)有我們認(rèn)為的那么重要、可靠?!?