——為名師例析數(shù)學(xué)文化(5)統(tǒng)計(jì)與統(tǒng)計(jì)案例"/>
■北京市教育學(xué)院豐臺(tái)分院 張 琦
■北京市第十二中學(xué)高中部 高慧明
本刊特邀欄 介:
高慧明首 佳班主任,全國(guó)著名數(shù)學(xué)特級(jí)教師,國(guó)家教育部課程改革“全國(guó)先進(jìn)工作者”,全國(guó)著名高考數(shù)學(xué)命題與考試研究專(zhuān)家,國(guó)家教育部“國(guó)培計(jì)劃”全國(guó)中小學(xué)教師培訓(xùn)、班主任培訓(xùn)、校長(zhǎng)培訓(xùn)特邀主講專(zhuān)家,受邀在全國(guó)各地做有關(guān)高考科學(xué)備考、班級(jí)管理等多場(chǎng)專(zhuān)題報(bào)告?,F(xiàn)任教于北京市第十二中學(xué)高中部。
隨著時(shí)代的發(fā)展,對(duì)“管理”的要求也越來(lái)越高,除對(duì)客觀(guān)現(xiàn)象進(jìn)行定性分析以外,還需要進(jìn)行相應(yīng)的定量分析,這時(shí)候“統(tǒng)計(jì)”發(fā)揮著重要的作用。在對(duì)“統(tǒng)計(jì)”進(jìn)行介紹之前,我們先來(lái)欣賞二戰(zhàn)時(shí)期的數(shù)據(jù)分析故事。
第一則見(jiàn)于Cudmund R.Iversen和MaryGergen所著的《統(tǒng)計(jì)學(xué)——基本概念和方法》,故事如下。
第二次世界大戰(zhàn)期間,盟軍很想知道德軍總共制造了多少輛坦克。德國(guó)人長(zhǎng)于邏輯思維而乏于機(jī)變,在給坦克編號(hào)時(shí)非??贪?他們把坦克從1開(kāi)始編號(hào)。戰(zhàn)爭(zhēng)之中,盟軍繳獲了一些德軍坦克,并記錄下了它們的生產(chǎn)編號(hào)。這些編號(hào)對(duì)于了解德軍的坦克總量有用處嗎?在統(tǒng)計(jì)學(xué)家眼里,這些編號(hào)組成了一個(gè)樣本,可由此去估計(jì)總的坦克數(shù)量。
制造出來(lái)的坦克數(shù)肯定不小于記錄中的最大編號(hào),為了推測(cè)它比繳獲坦克中的最大編號(hào)大多少,可以先計(jì)算已知編號(hào)的平均值,并把這個(gè)平均值視為全部編號(hào)的中點(diǎn)。因此,樣本均值乘以2就是坦克總數(shù)的一個(gè)估計(jì),當(dāng)然,這里必須存在一個(gè)假設(shè):繳獲的坦克代表了所有坦克的一個(gè)隨機(jī)樣本。使用這種方法估計(jì),有可能出現(xiàn)一個(gè)荒謬的結(jié)果:作為全部坦克數(shù)量估計(jì)值的樣本均值的2倍居然小于樣本中的最大值。另一種估計(jì)方法是用觀(guān)測(cè)到的最大編號(hào)乘以(1+1/n),如果繳獲坦克數(shù)量為1 0,其中最大編號(hào)為5 0,那么坦克總數(shù)的一個(gè)估計(jì)是5 0×(1+1/1 0)=5 5。這種方法的各種變形的確用于二戰(zhàn)之中。從戰(zhàn)后發(fā)現(xiàn)的德軍記錄來(lái)看,盟軍的估計(jì)值非常接近于德軍生產(chǎn)坦克的實(shí)際值。記錄還表明統(tǒng)計(jì)估計(jì)比其他情報(bào)方式所做的估計(jì)要大大接近于真實(shí)數(shù)目。統(tǒng)計(jì)學(xué)家做得比間諜們更漂亮!
第二則見(jiàn)于MichaelMorit在其Linkedin上發(fā)表的一篇有關(guān)數(shù)據(jù)挖掘在二戰(zhàn)里運(yùn)用的文章之中。
二戰(zhàn)時(shí)狼群戰(zhàn)術(shù)的發(fā)明者鄧尼茨在一戰(zhàn)時(shí)期就是一名潛艇指揮官,被俘后在戰(zhàn)俘營(yíng)想出了狼群戰(zhàn)術(shù)。狼群戰(zhàn)術(shù)主要核心就是當(dāng)一艘潛艇發(fā)現(xiàn)目標(biāo)后立即通知潛艇指揮部,把敵人的速度、航行、數(shù)量等情況說(shuō)明。潛艇指揮部立即發(fā)報(bào)命令目標(biāo)周?chē)臐撏иs去支援和攻擊,這樣可以大大提高攻擊成功率,最大地殺傷敵人(潛艇多,攜帶的魚(yú)雷就多),減少己方的危險(xiǎn)性。狼群戰(zhàn)術(shù)在二戰(zhàn)殘酷的海戰(zhàn)中證明是一種有效的戰(zhàn)術(shù),特別是鄧尼茨當(dāng)上潛艇司令官后。如果不是美國(guó)在關(guān)鍵時(shí)候伸出援手支持了英國(guó),很有可能英國(guó)就會(huì)被小小的潛艇打敗。丘吉爾在戰(zhàn)時(shí)對(duì)潛艇的一番評(píng)價(jià)最有說(shuō)服力:“我們的脖子快被這些小家伙掐斷了!”
盟軍貨船被德國(guó)潛艇狼群戰(zhàn)術(shù)弄得苦不堪言,但海軍與空軍將領(lǐng)在很長(zhǎng)的一段時(shí)間內(nèi)都拒絕改變他們的信條——小編制比大編制更安全,盡管有著鐵證證明這是錯(cuò)誤的。Blackett證明了在一個(gè)有1 5~2 4艘船的艦隊(duì)中,每艘船有2.3%的概率被擊沉;而在艦隊(duì)船只數(shù)量高于4 5時(shí),被擊中的概率只有1.1%。
欣賞完這兩則故事,也許大家對(duì)統(tǒng)計(jì)的重要作用有了初步的認(rèn)識(shí)。那么,什么是統(tǒng)計(jì)呢?如果理解為動(dòng)詞,就是對(duì)一系列的數(shù)據(jù)進(jìn)行分析處理;如果理解為名詞,那可以簡(jiǎn)單理解為統(tǒng)計(jì)學(xué),統(tǒng)計(jì)學(xué)是一門(mén)具有方法論性質(zhì)的應(yīng)用性科學(xué),它在概率論基礎(chǔ)上,發(fā)展出一系列的原理和方法,研究如何采集和整理反映事物總體信息的數(shù)字資料,并依據(jù)這些復(fù)雜的數(shù)據(jù)(稱(chēng)為樣本)對(duì)總體的特征和現(xiàn)象背后隱藏的規(guī)律進(jìn)行分析和推斷。
法國(guó)數(shù)學(xué)家拉普拉斯有句名言:“生活中最重要的問(wèn)題,絕大部分其實(shí)只是概率問(wèn)題?!蔽覀兛磦€(gè)具體例子,給定一根木棒,誰(shuí)都不會(huì)懷疑它有自身的“客觀(guān)”的長(zhǎng)度,長(zhǎng)度是多少?我們可以用各種儀器去測(cè)量,但是不管我們的儀器多么精確,你得到的數(shù)據(jù)也總是穩(wěn)定在木棒真實(shí)長(zhǎng)度的附近。事實(shí)上,我們?nèi)粘V胁痪褪前褱y(cè)量所得的值當(dāng)作真實(shí)的“長(zhǎng)度”而進(jìn)行各類(lèi)應(yīng)用嗎?
我們現(xiàn)在再來(lái)看看《普通高中數(shù)學(xué)課程標(biāo)準(zhǔn)(2 0 1 7年版)》對(duì)這部分內(nèi)容的要求:“數(shù)據(jù)收集和整理的方法、數(shù)據(jù)直觀(guān)圖表的表示方法、數(shù)據(jù)統(tǒng)計(jì)特征的刻畫(huà)方法”和“樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義,了解一元線(xiàn)性回歸模型和2×2列聯(lián)表,運(yùn)用這些方法解決簡(jiǎn)單的實(shí)際問(wèn)題”。從思想上來(lái)講,需要同學(xué)們“通過(guò)具體實(shí)例,感悟在實(shí)際生活中進(jìn)行科學(xué)決策的必要性和可能性;體會(huì)統(tǒng)計(jì)思維與確定性思維的差異、歸納推斷與演繹證明的差異”?!镀胀ǜ咧袛?shù)學(xué)課程標(biāo)準(zhǔn)(2 0 1 7年版)》對(duì)高中階段教學(xué)內(nèi)容進(jìn)行這樣的要求,是有其歷史原因和現(xiàn)實(shí)背景的,下面我們就對(duì)其歷史進(jìn)行簡(jiǎn)單的梳理和介紹。
統(tǒng)計(jì)學(xué)是隨著統(tǒng)計(jì)的產(chǎn)生而產(chǎn)生的,而統(tǒng)計(jì)作為一種社會(huì)實(shí)踐活動(dòng)已有悠久的歷史。在中國(guó),夏禹時(shí)代就有了人口數(shù)量的記載;為了賦稅、徭役和兵役的需要,歷代都有田畝和戶(hù)口等記錄。在國(guó)外,古巴比倫、埃及和羅馬帝國(guó)也有人口和資源的詳細(xì)記錄;到中世紀(jì),西歐各國(guó)都有人口、軍隊(duì)、領(lǐng)地、職業(yè)、財(cái)產(chǎn)的統(tǒng)計(jì)。
比如被譽(yù)為古代數(shù)學(xué)“算經(jīng)十書(shū)”(漢唐之間出現(xiàn)的十部古算書(shū))之首的《九章算術(shù)》就蘊(yùn)涵著豐富的統(tǒng)計(jì)思想和統(tǒng)計(jì)理念。例如統(tǒng)計(jì)分組、線(xiàn)性擬合、抽樣推斷、加權(quán)平均等。
我國(guó)古代數(shù)學(xué)名著《九章算術(shù)》衰分章十七問(wèn)為“生絲干耗”問(wèn)題:“今有生絲三十斤,干之,耗三斤十二兩。今有干絲一十二斤,問(wèn)生絲幾何?!?/p>
本題中以生絲三十得干絲過(guò)程損耗重量計(jì)算可得所謂“干絲率”,其實(shí)就是以此作為一個(gè)抽樣,并以該抽樣的平均數(shù)(即干、生絲的比值)來(lái)推斷總體,也就是所有生絲所能獲得干絲的比例,之后以該比例解決其他重量的生、干絲關(guān)系問(wèn)題。暗含了以此個(gè)體數(shù)據(jù)作為整體通例數(shù)據(jù)的思想,抽樣推斷的痕跡十分明顯。
在應(yīng)用統(tǒng)計(jì)學(xué)進(jìn)行抽樣的時(shí)候,問(wèn)卷的設(shè)計(jì)是一門(mén)很大的學(xué)問(wèn)。特別是對(duì)一些敏感性問(wèn)題,即使調(diào)查是無(wú)記名的,也會(huì)使被調(diào)查者感到尷尬,從而使得結(jié)果與實(shí)際情況出入比較大。
這時(shí)候,我們就可以設(shè)計(jì)如下方案可使被調(diào)查者愿意作出真實(shí)的回答:在一個(gè)箱子里放進(jìn)1個(gè)紅球和1個(gè)白球。被調(diào)查者在摸到球后記住顏色并立刻將球放回,然后根據(jù)球的顏色是紅和白分別回答如下問(wèn)題:你的生日是不是奇數(shù)?你是否有過(guò)偷稅漏稅行為?回答時(shí)只要在一張預(yù)備好的白紙上寫(xiě)下是或否。假定被調(diào)查者有2 0 0人,統(tǒng)計(jì)出共有5 8個(gè)是。
由題意可知,每個(gè)人從箱子中摸出1個(gè)白球或紅球的概率都是0.5,也就是我們期望大約有1 0 0個(gè)人回答了第一個(gè)問(wèn)題,另1 0 0個(gè)人回答了第二個(gè)問(wèn)題。在摸出紅球的情況下,答是的概率為0.5。因而大約有8個(gè)人回答了關(guān)于偷稅漏稅的問(wèn)題。我們可以估計(jì)大約有8%的人有過(guò)偷稅漏稅行為。
上述問(wèn)題的概率解釋為,已知P(紅)=0.5,P(是|紅)=0.5,P(是)=0.2 9,求條件概率P(是|白),用概率論中的貝葉斯公式算出的答案是8%。
概率論起源于中世紀(jì)的歐洲,那時(shí)盛行擲骰子賭博,人們提出了許多有趣的概率問(wèn)題。當(dāng)時(shí)法國(guó)的帕斯卡、費(fèi)爾馬和旅居巴黎的荷蘭數(shù)學(xué)家惠更斯都對(duì)此類(lèi)問(wèn)題感興趣,他們用組合數(shù)學(xué)研究了許多與擲骰子有關(guān)的概率計(jì)算問(wèn)題。
概率論是統(tǒng)計(jì)推斷的基礎(chǔ),是在給定數(shù)據(jù)生成過(guò)程下觀(guān)測(cè)、研究數(shù)據(jù)的性質(zhì);而統(tǒng)計(jì)推斷則根據(jù)觀(guān)測(cè)的數(shù)據(jù),反向思考其數(shù)據(jù)生成過(guò)程。預(yù)測(cè)、分類(lèi)、聚類(lèi)、估計(jì)等,都是統(tǒng)計(jì)推斷的特殊形式,強(qiáng)調(diào)對(duì)于數(shù)據(jù)生成過(guò)程的研究。概率論大數(shù)定律的三個(gè)定理就是要說(shuō)明為什么樣本均值可以估計(jì)總體均值,而這個(gè)估計(jì)的準(zhǔn)確性卻是要由統(tǒng)計(jì)學(xué)說(shuō)了算。對(duì)于各種分布的參數(shù)估計(jì),之后的模擬估測(cè),雖然與概率論看似完全無(wú)關(guān),實(shí)際上卻是由它們?cè)谥沃y(tǒng)計(jì)學(xué)這個(gè)科目。這個(gè)情況對(duì)于參數(shù)統(tǒng)計(jì)、非參數(shù)統(tǒng)計(jì)、半?yún)?shù)統(tǒng)計(jì),都是一樣的。
我們來(lái)看一個(gè)有關(guān)概率的案例——生日悖論:
眾所周知,在生活中,如果能夠遇到與自己同一天生日的人,我們大多會(huì)很驚喜,覺(jué)得這種緣分似乎很少見(jiàn),又或者說(shuō)這是一個(gè)很小的概率。那我們是否有想過(guò),假如在2 3個(gè)人當(dāng)中,出現(xiàn)兩個(gè)人是同一天生日的這種緣分的概率有多大呢?是5%?1 0%?還是2 0%?又或者是更多呢?下面我們一起來(lái)看看。
文章開(kāi)始我們不想長(zhǎng)篇大論地把很多公式給搬上來(lái),那樣沒(méi)意思,吊足了大家的胃口,卻不受待見(jiàn)。所以,在開(kāi)始的時(shí)候,我們就不打算寫(xiě)那么多計(jì)算過(guò)程,留著后面慢慢討論和解釋。那么告訴各位:2 3個(gè)人中,有兩個(gè)人生日是同一天的概率約為5 0%(甚至比這個(gè)數(shù)值還高出那么一點(diǎn)點(diǎn)),在5 0個(gè)人中有相同生日的概率,竟然高達(dá)9 7%,這兩個(gè)數(shù)值,這兩個(gè)結(jié)果,各位是不是有點(diǎn)不太敢相信?
其實(shí)這個(gè)結(jié)果并沒(méi)有算錯(cuò),是有理有據(jù)的,只是我們的直覺(jué)錯(cuò)了,科學(xué)與生活,就好比夢(mèng)想和現(xiàn)實(shí)一樣:夢(mèng)想往往是豐滿(mǎn)的,現(xiàn)實(shí)呢,卻常常是骨感的。正因?yàn)榻?jīng)過(guò)科學(xué)方法計(jì)算出來(lái)的結(jié)果與我們?nèi)粘I畹慕?jīng)驗(yàn)產(chǎn)生了如此大的落差,所以我們把這類(lèi)問(wèn)題稱(chēng)為“生日悖論(B i r t h d a yP a r a d o x)”。
在分析時(shí),我們不把某一年有2月2 9日或者某兩人是雙胞胎這樣的或者類(lèi)似的外界因素算在內(nèi),只考慮純粹的隨機(jī)概率,也就是說(shuō)每個(gè)人出生的日子都隨機(jī)分布在一年3 6 5天的任何一天。同時(shí)假設(shè)如果此時(shí)有n個(gè)人在同一房間內(nèi),要計(jì)算至少有兩個(gè)人生日是同一天的概率,假設(shè)一年3 6 5日出生概率是平均分布的(雖然在現(xiàn)實(shí)生活中,出生時(shí)間并不是平均分布的)。下面我們運(yùn)用數(shù)學(xué)知識(shí)來(lái)慢慢解答和計(jì)算:
首先,假設(shè)P(n)代表n個(gè)人中每個(gè)人生日都不一樣的概率,前面說(shuō)了,n不能大于3 6 5,故0≤n≤3 6 5,那么P(n)為:
第一個(gè)人的生日是3 6 5天的其中一天,假設(shè)是一定的,是不變的,那么第二個(gè)人不能跟第一個(gè)人有相同的生日的概率就是
理第三個(gè)人不能跟前兩個(gè)人生日相同,依此類(lèi)推。很容易用階乘寫(xiě)成如下形式
如果P(n)表示n個(gè)人中至少2人生日相同的概率,那么:
當(dāng)n≥3 6 5時(shí)P(n)=1是必然的。當(dāng)n=2 3時(shí),代入公式得,概率大約是0.5 0 7。其,同他數(shù)字的概率用上面的算法可以近似地得出來(lái),這里我們從網(wǎng)上下載了一張圖表(表1),我們可以大致感受下其變換過(guò)程:
表1
從上表可以看出,當(dāng)n為4 1人是就已經(jīng)超過(guò)了9 0%,4 7人時(shí)就已經(jīng)超過(guò)了9 5%了。為什么實(shí)際情況與我們想象的差別這么大呢?我們把問(wèn)題稍作改動(dòng),就能得到啟發(fā)。新的問(wèn)題是:在一群人當(dāng)中,有人與你同一天生日,這個(gè)概率有多大?仔細(xì)想想,這個(gè)問(wèn)題還是比較簡(jiǎn)單的。記p(n)表示房間中n個(gè)其他人中與特定人(比如你)有相同生日的概
有大約0.0 5 9,約高于十七分之一。如果n個(gè)人中有5 0%概率存在某人跟你有相同生日,n至少要達(dá)到2 5 3,注意這個(gè)數(shù)字大大高于
所以,“生日悖論”產(chǎn)生的原因就是因?yàn)楫?dāng)我們看到“有人生日相同”時(shí),下意識(shí)地用“與我生日相同”去推測(cè),以至于把火箭發(fā)射當(dāng)成了平穩(wěn)增長(zhǎng),造成了生日悖論。到了這里,大家是否對(duì)“生日悖論”有了更深一步的了解呢?所以生日悖論的本質(zhì)其實(shí)就是,隨著元素的增多,出現(xiàn)重復(fù)元素的概率會(huì)以驚人的速率增加,但是我們往往低估了它的速率。
2 0世紀(jì)初以來(lái),科學(xué)技術(shù)迅猛發(fā)展,社會(huì)發(fā)生了巨大變化,統(tǒng)計(jì)學(xué)進(jìn)入了快速發(fā)展時(shí)期。歸納起來(lái)有以下幾個(gè)方面。
由記述統(tǒng)計(jì)向推斷統(tǒng)計(jì)發(fā)展。記述統(tǒng)計(jì)是對(duì)所搜集的大量數(shù)據(jù)資料進(jìn)行加工整理、綜合概括,通過(guò)圖示、列表和數(shù)字,如編制次數(shù)分布表、繪制直方圖、計(jì)算各種特征數(shù)等,對(duì)資料進(jìn)行分析和描述。而推斷統(tǒng)計(jì),則是在搜集、整理觀(guān)測(cè)的樣本數(shù)據(jù)基礎(chǔ)上,對(duì)有關(guān)總體作出推斷。其特點(diǎn)是根據(jù)帶隨機(jī)性的觀(guān)測(cè)樣本數(shù)據(jù)以及問(wèn)題的條件和假定(模型),而對(duì)未知事物作出的,以概率形式表述的推斷。目前,西方國(guó)家所指的科學(xué)統(tǒng)計(jì)方法,主要就是指推斷統(tǒng)計(jì)來(lái)說(shuō)的。但受到高中知識(shí)所限,我們現(xiàn)在所學(xué)內(nèi)容還只限于記述統(tǒng)計(jì)。
計(jì)算技術(shù)和一系列新技術(shù)、新方法在統(tǒng)計(jì)領(lǐng)域不斷得到開(kāi)發(fā)和應(yīng)用。近幾十年,計(jì)算機(jī)技術(shù)不斷發(fā)展,使統(tǒng)計(jì)數(shù)據(jù)的搜集、處理、分析、存貯、傳遞、印制等過(guò)程日益現(xiàn)代化,提高了統(tǒng)計(jì)工作的效能。計(jì)算機(jī)技術(shù)的發(fā)展,日益擴(kuò)大了傳統(tǒng)的和先進(jìn)的統(tǒng)計(jì)技術(shù)的應(yīng)用領(lǐng)域,促使統(tǒng)計(jì)科學(xué)和統(tǒng)計(jì)工作發(fā)生了革命性的變化。如今,計(jì)算機(jī)科學(xué)已經(jīng)成為統(tǒng)計(jì)科學(xué)不可分割的組成部分。隨著科學(xué)技術(shù)的發(fā)展,統(tǒng)計(jì)理論、實(shí)踐深度和廣度方面也不斷發(fā)展。
受高中知識(shí)所限,我們不對(duì)最新統(tǒng)計(jì)知識(shí)進(jìn)行介紹,而是再來(lái)欣賞三則統(tǒng)計(jì)悖論。
第一則案例——猜獎(jiǎng)游戲:
這一問(wèn)題出自美國(guó)的一個(gè)電視游戲節(jié)目,問(wèn)題的名字來(lái)自該節(jié)目的主持人蒙提·霍爾。上世紀(jì)9 0年代曾在美國(guó)引起廣泛和熱烈的討論。
假定在臺(tái)上有三扇關(guān)閉的門(mén),其中一扇門(mén)后面有一輛汽車(chē),另外兩扇門(mén)后面各有一只山羊。主持人是知道哪扇門(mén)后面有汽車(chē)的。當(dāng)競(jìng)猜者選定了一扇門(mén)但尚未開(kāi)啟它的時(shí)候,節(jié)目主持人去開(kāi)啟剩下兩扇門(mén)中的一扇,露出的是山羊。主持人會(huì)問(wèn)參賽者要不要改猜另一扇未開(kāi)啟的門(mén)。
解決問(wèn)題的關(guān)鍵是改猜另一扇未開(kāi)啟的門(mén)是否比不改猜贏得汽車(chē)的概率要大。正確的答案是:改猜能增大贏得汽車(chē)的概率,從原來(lái)的1/3增大為2/3。這是因?yàn)楦?jìng)猜者選定的一扇門(mén)后面有汽車(chē)的概率是1/3,在未選定的兩扇門(mén)后面有汽車(chē)的概率是2/3,主持人開(kāi)啟其中一扇門(mén)把這門(mén)后面有汽車(chē)給排除了,所以另一扇未開(kāi)啟的門(mén)后面有汽車(chē)的概率是2/3。
第二則案例——“統(tǒng)計(jì)平均”的陷阱:
假定某大學(xué)數(shù)學(xué)系有教授1 5人、副教授4 0人、講師和助教2 5人,這三類(lèi)人的平均年收入分別是1 5萬(wàn)、1 2萬(wàn)、8萬(wàn),該單位職工平均年收入為1 0萬(wàn)。又假定科學(xué)院某研究所有研究員6 0人、副研究員3 0人、助研3 0人,這三類(lèi)人的平均年收入分別是1 4萬(wàn)、1 1萬(wàn)、7萬(wàn),但該研究所職工平均年收入為1 1.5萬(wàn),高出那個(gè)系職工平均年收入1.5萬(wàn)。這一例子表明:由于各單位人員構(gòu)成比例不同,單位職工平均年收入這一指標(biāo)不能真實(shí)反映單位職工的收入狀況。
第三則案例——“辛普森悖論”:
看下面例子。假定有兩種藥(A和B),要通過(guò)分組臨床試驗(yàn)對(duì)比其療效。表2是試驗(yàn)結(jié)果的統(tǒng)計(jì)表。從甲乙兩組試驗(yàn)結(jié)果看,藥物A的療效都優(yōu)于藥物B,但總體來(lái)看,藥物B的療效反而優(yōu)于藥物A(如表2所示)。
表2
早在2 0世紀(jì)初,人們就發(fā)現(xiàn)了這種現(xiàn)象:在分組比較中都占優(yōu)勢(shì)的一方,在總評(píng)中反而是失勢(shì)。直到1 9 5 1年英國(guó)統(tǒng)計(jì)學(xué)家辛普森在他發(fā)表的論文中才正式對(duì)這一現(xiàn)象給予理論解釋。后人就把這一現(xiàn)象稱(chēng)為“辛普森悖論”。
理論上該如何解釋呢?
在最后總計(jì)A和B的治愈率時(shí),實(shí)際上是對(duì)A和B治愈率按用藥率進(jìn)行加權(quán)平均,即:
總計(jì)A的治愈率=甲組A的治愈率×甲組A的用藥率+乙組A的治愈率×乙組A的用藥率。
總計(jì)B的治愈率=甲組B的治愈率×甲組B的用藥率+乙組B的治愈率×乙組B的用藥率。
在這里的權(quán)數(shù)是用藥率。
按表2中所給數(shù)據(jù),具體算式是:
不難發(fā)現(xiàn),藥物A的療效都優(yōu)于藥物B,但總體來(lái)看,藥物B的療效反而優(yōu)于藥物A??梢?jiàn),悖論的產(chǎn)生是由于“權(quán)重”的不同傾斜。在計(jì)算A的治愈率時(shí),用藥率高的甲組的權(quán)重大,用藥率低的乙組的權(quán)重小;而在計(jì)算B的治愈率時(shí),用藥率高的乙組的權(quán)重大,用藥率低的甲組的權(quán)重小。至于是什么原因引起權(quán)重的這種傾斜,則需要具體問(wèn)題具體分析。
統(tǒng)計(jì)在現(xiàn)代化管理和社會(huì)生活中的地位日益重要。隨著社會(huì)、經(jīng)濟(jì)和科學(xué)技術(shù)的發(fā)展,統(tǒng)計(jì)在現(xiàn)代化國(guó)家管理和企業(yè)管理中的地位,在社會(huì)生活中的地位,越來(lái)越重要了。人們的日常生活和一切社會(huì)生活都離不開(kāi)統(tǒng)計(jì)。英國(guó)統(tǒng)計(jì)學(xué)家哈斯利特說(shuō):“統(tǒng)計(jì)方法的應(yīng)用是這樣普遍,在我們的生活和習(xí)慣中,統(tǒng)計(jì)的影響是這樣巨大,以致統(tǒng)計(jì)的重要性無(wú)論怎樣強(qiáng)調(diào)也不過(guò)分?!鄙踔劣械目茖W(xué)家還把我們的時(shí)代叫作“統(tǒng)計(jì)時(shí)代”。顯然,2 0世紀(jì)統(tǒng)計(jì)科學(xué)的發(fā)展及其未來(lái),已經(jīng)被賦予了劃時(shí)代的意義。
事實(shí)上,統(tǒng)計(jì)學(xué)產(chǎn)生于應(yīng)用,在應(yīng)用過(guò)程中發(fā)展壯大。隨著經(jīng)濟(jì)社會(huì)的發(fā)展、各學(xué)科相互融合趨勢(shì)的發(fā)展和計(jì)算機(jī)技術(shù)的迅速發(fā)展,統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域、統(tǒng)計(jì)理論與分析方法也將不斷發(fā)展,在所有領(lǐng)域展現(xiàn)它的生命力和重要作用。