范玫瑰 汪本旺
(浙江省安吉縣孝豐高級中學)
本文以2023年教育部四省聯(lián)考概率統(tǒng)計試題為背景,追本溯源到人教2019版選擇性必修第三冊第81頁探究與發(fā)現(xiàn)中有關二項式概率函數(shù)的最大值問題,以此為啟發(fā)逐步去探究二項分布和超幾何分布的概率函數(shù)和似然函數(shù)的最大值問題,最后從中心極限理論去理解二項分布與超幾何分布的極大似然估計.
【例題】(2023·四省聯(lián)考)設一個池塘里魚的數(shù)目為N,從池塘里撈出200尾魚,并給魚作上標識,然后把魚放回池塘里,過一段時間后再從池塘里撈出500尾魚,X表示撈出的500尾魚中有標識的魚的數(shù)目.
(Ⅰ)若N=5 000,求X的數(shù)學期望;
(Ⅱ)已知撈出的500尾魚中15尾有標識,試給出N的估計值(以使得P(X=15)最大N的值作為N的估計值).
【分析】本題已知樣本是X=15,N為變量,求出現(xiàn)這個樣本量的概率最大的N的值,在統(tǒng)計學中稱為極大似然估計.
已知p(x,θ)為x,θ的二元函數(shù),其中x表示樣本的值,θ為概率模型參數(shù),若θ是確定的,x為變量,稱p(x,θ)為概率函數(shù),它描述對于不同的樣本點x,其出現(xiàn)概率是多少.若x是確定的,θ為變量,稱p(x,θ)為似然函數(shù),它描述對于不同模型參數(shù),出現(xiàn)x這個樣本點的概率是多少.而極大似然估計,就是利用已知結果信息,去推導出最大概率導致這些結果出現(xiàn)的模型參考值.
人教2019版選擇性必修第三冊第81頁探究與發(fā)現(xiàn)素材中指出:
當k<(n+1)p時,pk>pk-1,pk隨k值的增加而增加;當k>(n+1)p時,pk 教材已解決概率函數(shù)的最值問題,即樣本量x取何值時,概率最值問題,而對于似然函數(shù),它的概率最大值又如何呢? (1)當k=0時,f′(p)<0恒成立,f(p)在(0,1)單調(diào)遞減,f(p)無最值. (2)當k=n時,f′(p)>0恒成立,f(p)在(0,1)單調(diào)遞增,f(p)無最值. 對于二項分布,分別采用作高法和導數(shù)法,很容易解決概率函數(shù)和似然函數(shù)的最大值問題,并且發(fā)現(xiàn)概率函數(shù)最大值點唯一或有兩個,似然函數(shù)最大值點只有一個.超幾何分布與二項分布密不可分,那么對于超幾何分布,它的概率函數(shù)和似然函數(shù)的最大值又如何,是否有類似結論? 【例題1】(2022·張家界3月模擬·節(jié)選)2022年底,新冠病毒肆虐全國,某校期末考試時采用了線上考試和線下考試兩種形式,現(xiàn)隨機抽取200名同學的數(shù)學成績做分析,其中線上人數(shù)占40%,線下占60%,通過分別統(tǒng)計他們的數(shù)學成績得到了如下兩個頻率分布直方圖: 線上考試 線下考試 其中(50,70]稱為合格,(70,90]稱為中等,(90,110]稱為良好,(110,130]稱為優(yōu)秀,(130,150]為優(yōu)異.現(xiàn)從線下考試的學生中隨機抽取10名同學,且抽到k個學生的數(shù)學成績?yōu)橹械鹊目赡苄宰畲?試求k的值. ∴當k=10時,概率最大,即小A贏得10局的比賽概率最大. 【例題3】(回歸問題背景) (Ⅰ)略. 【例題4】某工廠的某種產(chǎn)品成箱包裝,每箱200件,每一箱產(chǎn)品在交付用戶之前要對產(chǎn)品檢驗,如檢驗出不合格品,則更換為合格品.檢驗時,先從這箱產(chǎn)品中任取20件作檢驗,再根據(jù)檢驗結果決定是否對余下的所有產(chǎn)品作檢驗,設每件產(chǎn)品不合格品的概率都為p(0 首先,我們來研究超幾何分布與二項分布關系,不妨假設X~H(N,n,M), 即當N足夠大時,超幾何分布逼近二項分布. 接下來,我們只需研究二項分布,從上述研究我們不難發(fā)現(xiàn)二項分布概率函數(shù)和似然函數(shù)圖象都具有中間大,兩邊小的特征,而此特征恰好與正態(tài)分布密度曲線形狀非常接近,那么二者之間是否存在某種關聯(lián)呢? De·Moivre和Laplace提出中心極限定理:設在獨立實驗序列中,事件A在各項試驗中發(fā)生的概率為p(0 中心極限定理說明:當n充分大時,正態(tài)分布可以認為是二項分布的極限分布,當n不是很大時,二項分布可以近似看成正態(tài)分布,圖象滿足中間大,兩邊小的規(guī)律. 對于概率函數(shù),從中心極限定理去理解,p(x,θ)的圖象呈中間大,兩邊小的規(guī)律,特別地,當數(shù)學期望取值介于1與n之間時,圖象呈先增后減趨勢,類似于二次函數(shù),當np為整數(shù)時,最大值即為期望,當np不為整數(shù)時,概率函數(shù)圖象不一定關于直線k=np對稱,仍需比較與它相鄰兩個隨機變量的概率,大的就是最大值點.三、思維萌芽
四、學以致用
五、知識升華