[摘要]文章以一個(gè)典例的解答所產(chǎn)生的疑惑為起點(diǎn),對(duì)二項(xiàng)分布與超幾何分布的區(qū)別與聯(lián)系進(jìn)行深入剖析,并給出較為詳盡的解釋,對(duì)教師的教學(xué)起到積極的促進(jìn)作用,最后簡(jiǎn)單闡述了概率統(tǒng)計(jì)中總體分布教學(xué)的若干思考,
[關(guān)鍵詞]二項(xiàng)分布;超幾何分布;總體分布;釋疑
1呈現(xiàn)題目并闡述疑問的由來
題目為了解甲、乙兩廠的產(chǎn)品質(zhì)量,抽檢人員采用分層抽樣的方法從甲、乙兩廠生產(chǎn)的產(chǎn)品中分別抽取14件和5件,測(cè)量產(chǎn)品中微量元素x,y的含量(單位:毫克),當(dāng)產(chǎn)品中的微量元素含量滿足x≥175且y≥75時(shí),該產(chǎn)品為優(yōu)等品,下表是乙廠的
5件產(chǎn)品的測(cè)量數(shù)據(jù):
(1)已知甲廠生產(chǎn)的產(chǎn)品共98件,求乙廠生產(chǎn)的產(chǎn)品數(shù)量:
(2)用上述樣本數(shù)據(jù)估計(jì)乙廠生產(chǎn)的優(yōu)等品的數(shù)量:
(3)從乙廠抽出的上述5件產(chǎn)品中再隨機(jī)抽取2件,求抽取的2件產(chǎn)品中優(yōu)等品數(shù)x的分布列與數(shù)學(xué)期望。
分析這道題目的前兩問是容易得到的,本文僅探討第(3)問,下面給出學(xué)生解決問題的過程中常見的兩種解答。
解法1由題意可知,抽取的5件產(chǎn)品中有2件優(yōu)等品,則x的可能取值為0.1.2。
產(chǎn)生上述兩種解法的原因是好多學(xué)生混淆了超幾何分布與二項(xiàng)分布,但是學(xué)生們還有一個(gè)疑惑:為什么兩種做法所得到的數(shù)學(xué)期望是一樣的?好多一線教師對(duì)此也不甚了解,這難道是巧合嗎?
我們不妨設(shè)產(chǎn)品中優(yōu)等品的件數(shù)為m,不是優(yōu)等品的件數(shù)為n,則在不放回和有放回的情況下,隨機(jī)變量x的分布列為
從上述定義中我們可以清楚地看到二者的本質(zhì)區(qū)別:首先,超幾何分布描述的是不放回抽樣的問題,而二項(xiàng)分布描述的是有放回抽樣的問題:其次,超幾何分布中的概率計(jì)算實(shí)質(zhì)上是古典概型問題,而二項(xiàng)分布實(shí)質(zhì)上是相互獨(dú)立事件的概率計(jì)算問題。
基于上述本質(zhì)區(qū)別,結(jié)合篇首題目的情境,我們?nèi)菀字澜夥ㄒ皇钦_的,在教學(xué)過程中,教師可以利用教材中的例題及習(xí)題引導(dǎo)學(xué)生進(jìn)行深入探究,以便于他們更好地理解和區(qū)分這兩種分布,我們可以以人教A版教材59頁的習(xí)題為例作進(jìn)一步的探討。
典例某批N件產(chǎn)品的次品率為2%,現(xiàn)從中任意地依次抽取3件進(jìn)行檢驗(yàn),試問:當(dāng)Ⅳ=500.5000.50000時(shí),分別以放回和不放回的方式抽取,求恰好抽到1件次品的概率各是多少?
解析任意抽取3件產(chǎn)品,次品的件數(shù)記為隨機(jī)變量x
通過上述問題所得結(jié)果我們可以看到,當(dāng)產(chǎn)品的數(shù)量N很大時(shí),通過不放回抽樣所得結(jié)果與有放回抽樣所得結(jié)果非常接近(隨著Ⅳ的增大,近似的精度也在增大),可以認(rèn)為超幾何分布近似為二項(xiàng)分布,這也與我們的主觀感受相符,因?yàn)楫?dāng)產(chǎn)品的總數(shù)很大而抽出的產(chǎn)品較少時(shí),每次不放回的抽取1件產(chǎn)品后,次品率近似不變,這樣就可以近似看成每次抽樣的結(jié)果是相互獨(dú)立的,抽出產(chǎn)品中的次品件數(shù)近似服從二項(xiàng)分布,這也可以看作是兩種分布之問的內(nèi)在聯(lián)系。
3概率統(tǒng)計(jì)中總體分布教學(xué)的若干思考
總體分布教學(xué)中的難點(diǎn)之一就是如何辨認(rèn)合適的模型,所謂分布,它描述的是隨機(jī)變量的可能取值以及取相應(yīng)值的概率,現(xiàn)行高中教材中共給出四種分布,其中兩點(diǎn)分布、超幾何分布和二項(xiàng)分布均屬于離散型隨機(jī)變量服從的分布,它們所對(duì)應(yīng)的模型中都與兩種可能結(jié)果有關(guān)(如擲硬幣的“正面”與“反面”,抽取產(chǎn)品的“次品”與“正品”等),因此學(xué)生對(duì)上述模型認(rèn)識(shí)模糊的話,就會(huì)混淆分布類型,教學(xué)過程中可以給出具體的情境以便于分清各分布之間的區(qū)別與聯(lián)系,這樣會(huì)更好地幫助學(xué)生做出正確的選擇,比如,我們?cè)谇懊娼柚淅刑峁┑那榫酬U述超幾何分布與二項(xiàng)分布的根本區(qū)別是抽樣的過程中是否有放回,二者的聯(lián)系是如果產(chǎn)品數(shù)量很大,超幾何分布近似為二項(xiàng)分布,如果一共就取1件,那么結(jié)果不是“正品”就是“次品”,這時(shí)二者就是兩點(diǎn)分布了,同時(shí),超幾何分布的概率計(jì)算涉及三個(gè)參數(shù)和三次的組合運(yùn)算,而二項(xiàng)分布的概率計(jì)算僅含兩個(gè)參數(shù)和一次的組合數(shù)計(jì)算,所以在計(jì)算機(jī)技術(shù)尚未發(fā)展時(shí),利用這兩種分布的近似關(guān)系可以大大簡(jiǎn)化運(yùn)算量,教學(xué)過程中要跟學(xué)生說清楚這么做的原因,說理充分才會(huì)使他們信服。
實(shí)際教學(xué)中,鑒于學(xué)生的認(rèn)知水平,教師可以免去形式化的推導(dǎo),適時(shí)借助信息技術(shù)讓學(xué)生有更為直觀的感受,比如,借助GeoGebra數(shù)學(xué)軟件通過改變產(chǎn)品總數(shù)N和次品個(gè)數(shù)等參數(shù)的數(shù)值就可以方便快捷地讓學(xué)生感受到超幾何分布與二項(xiàng)分布之間的近似,又如,正態(tài)分布屬于連續(xù)型隨機(jī)變量服從的分布,學(xué)生在理解上難度很大,教學(xué)過程中可以運(yùn)用GeoGebra軟件讓學(xué)生感受它與熟悉的二項(xiàng)分布之間的聯(lián)系,使得正態(tài)分布的引入不是很唐突,并可以組織學(xué)生在課外利用軟件粗略地驗(yàn)證結(jié)論(圖1):“當(dāng)n很大(通常n>50),p不是太小,np>5.且n(1-p)>5時(shí),可以用正態(tài)分布N(np,np(1-p))近似二項(xiàng)分布B(n,p)?!?/p>
概率統(tǒng)計(jì)學(xué)家Kapadia和Borovcnik曾經(jīng)說過:“概率是一個(gè)難教又難學(xué)的內(nèi)容,…,在概率統(tǒng)計(jì)中,無論是其非常核心的部分,還是它的概念及其比較簡(jiǎn)單的應(yīng)用,到處都有似是而非和違背直覺的說法,”正因?yàn)槿绱?,在高中階段的教學(xué)過程中,教師需要不斷地挖掘合適的情境來講解相關(guān)內(nèi)容,讓學(xué)生真實(shí)地感受和合理地應(yīng)用概率統(tǒng)計(jì)知識(shí),真正做到以培養(yǎng)學(xué)生的數(shù)學(xué)素養(yǎng)為目的,為學(xué)生今后的可持續(xù)發(fā)展奠定良好的基礎(chǔ)。
作者簡(jiǎn)介王洪軍(1983),男,山東省德州市人,中教一級(jí),呼和浩特市名師工作室成員,呼和浩特市教研室數(shù)學(xué)中心組成員,高中新版教材核心編委(人教B版),獲全國(guó)、自治區(qū)、市教學(xué)基本功大賽獎(jiǎng)項(xiàng),參與國(guó)家級(jí)課題一項(xiàng),省級(jí)課題兩項(xiàng);主要從事中學(xué)數(shù)學(xué)教學(xué)研究,在《中學(xué)數(shù)學(xué)教學(xué)參考》《中學(xué)數(shù)學(xué)雜志》《中國(guó)數(shù)學(xué)教育》等期刊發(fā)表論文37篇,并有多篇論文獲國(guó)家級(jí)、省級(jí)一等獎(jiǎng)。