臧鴻雁, 張志剛, 李 娜
(北京科技大學(xué) 數(shù)理學(xué)院,北京 100083)
隨著數(shù)據(jù)科學(xué)的興起,概率論與數(shù)理統(tǒng)計(jì)的理論和方法越來(lái)越多地滲透到自然科學(xué)和社會(huì)科學(xué)的各個(gè)領(lǐng)域,成為這些領(lǐng)域解決實(shí)際問(wèn)題的強(qiáng)有力工具.著名數(shù)學(xué)家拉普拉斯曾說(shuō)過(guò):“生活中絕大多數(shù)問(wèn)題其實(shí)都是概率問(wèn)題.”講好概率論與數(shù)理統(tǒng)計(jì)課程,對(duì)提升高校人才培養(yǎng)質(zhì)量有著十分重要的作用.各高等院校的數(shù)學(xué)工作者積極探索概率論與數(shù)理統(tǒng)計(jì)課程的教學(xué)改革方法和課程中知識(shí)點(diǎn)的教學(xué)設(shè)計(jì)[1-3].
在概率論與數(shù)理統(tǒng)計(jì)課程教學(xué)中,隨機(jī)變量函數(shù)的分布是一個(gè)教學(xué)重點(diǎn)也是一個(gè)教學(xué)難點(diǎn),很多數(shù)學(xué)工作者針對(duì)隨機(jī)變量函數(shù)的分布知識(shí)點(diǎn)的教學(xué)方法進(jìn)行研究[4-6].[4]利用分布函數(shù)法構(gòu)造一類適用于求解一維隨機(jī)變量函數(shù)分布的直觀解法,該方法基于數(shù)形結(jié)合思想構(gòu)建統(tǒng)一方法求解一維隨機(jī)變量函數(shù)的分布,確定了幾類適用的場(chǎng)合,并給出了三個(gè)典型例題的應(yīng)用過(guò)程.[5]針對(duì)X,Y分別是離散、連續(xù)不同類型的隨機(jī)變量的情形,如何求其函數(shù)g(X,Y)的分布的問(wèn)題給出了求解方法和應(yīng)用舉例.[6]中探討了一維連續(xù)型隨機(jī)變量函數(shù)的分布的求法及其在產(chǎn)生隨機(jī)數(shù)中的應(yīng)用,關(guān)于隨機(jī)數(shù)的討論并未給出嚴(yán)格的數(shù)學(xué)證明和基于數(shù)值模擬的直觀結(jié)果.
荷蘭數(shù)學(xué)教育家弗萊登塔爾說(shuō):“真正的數(shù)學(xué)家,常常憑借數(shù)學(xué)的直覺思維做出各種猜想,然后加以驗(yàn)證.猜想驗(yàn)證是一種重要的數(shù)學(xué)教學(xué)方法.”本文針對(duì)一維連續(xù)型隨機(jī)變量這一知識(shí)點(diǎn),先提出問(wèn)題,依據(jù)數(shù)值模擬直觀猜測(cè)結(jié)果,再分析問(wèn)題,理論證明驗(yàn)證結(jié)果.最后以隨機(jī)數(shù)產(chǎn)生為目標(biāo),從理論分析到直觀的數(shù)值模擬結(jié)果,對(duì)連續(xù)型隨機(jī)變量函數(shù)的分布這一知識(shí)點(diǎn)進(jìn)行了拓展研究.
引例同學(xué)們?cè)诋厴I(yè)的時(shí)候,都會(huì)面臨著找工作的問(wèn)題,假設(shè)有這樣一份工作,月薪方案為底薪0.4萬(wàn)元加提成,提成為銷售額的10%,而月銷售額是個(gè)隨機(jī)變量X,假設(shè)其服從如下均勻分布X~U(2,4)(單位:萬(wàn)元),求月薪超過(guò)7000元的概率?
首先,月薪是隨機(jī)變量Y,已知X~U(2,4),可以得到X的概率密度函數(shù)為
還有一個(gè)關(guān)鍵的信息是容易獲得的,那就是Y和X之間的函數(shù)關(guān)系Y=0.4+0.1X.所以這個(gè)問(wèn)題的關(guān)鍵就是求月薪Y(jié)的分布.X經(jīng)過(guò)這樣一個(gè)線性變換之后還會(huì)服從均勻分布嗎?下面用數(shù)據(jù)做數(shù)值模擬直觀觀察Y的分布.
用數(shù)據(jù)做實(shí)驗(yàn)看直觀的結(jié)果.首先,用Matlab生成區(qū)間(2,4)上均勻分布隨機(jī)數(shù),再對(duì)這些數(shù)據(jù)進(jìn)行變換,做出變換后的數(shù)據(jù)的統(tǒng)計(jì)直方圖,如圖1.圖1(a)的變換函數(shù)為Y=0.4+0.1X.直觀感覺,均勻分布的數(shù)據(jù)變換經(jīng)過(guò)變換Y=0.4+0.1X后看起來(lái)還是均勻分布.如果改變變換函數(shù)是不是還能得到均勻分布呢?比如變換函數(shù)取對(duì)數(shù)函數(shù), 圖1(b)的變換函數(shù)為Y=lnX.由圖可見,經(jīng)過(guò)變換Y=lnX之后看起來(lái)不再均勻.直觀的結(jié)論是否正確?能否在理論上得到這樣的結(jié)果?進(jìn)一步探討理論上的解決問(wèn)題的方法.
(a)Y=0.4+0.1X (b)y=lnX
問(wèn)題是如何由X的概率密度f(wàn)X(x)和Y與X的函數(shù)關(guān)系獲得Y的概率密度f(wàn)Y(y).直接建立X的概率密度和Y的概率密度之間的關(guān)系并不容易,概率密度函數(shù)與分布函數(shù)之間有關(guān)系,分布函數(shù)是由概率定義的,那是不是能從分布函數(shù)入手來(lái)間接尋找X與Y的概率密度之間的關(guān)系呢?關(guān)系的建立思路如圖2所示.這就是分布函數(shù)法的思路,具體的關(guān)系的建立見下面的例子和定理1所描述.
圖2 分布函數(shù)法思路圖
由前面的分析知道,可以從Y的分布函數(shù)FY(y)入手,再將Y替換為X的函數(shù),從而轉(zhuǎn)換為X落入一個(gè)區(qū)間的概率,用FX(x)表示,詳細(xì)過(guò)程如下:
FY(y)=P{Y≤y}=P{0.4+0.1X≤y}=P{X≤10(y-0.4)}=FX(10(y-0.4)).
再兩邊對(duì)y求導(dǎo),有
可見,Y~U(0.6,0.8),與前面的直觀感覺是一致的,從而很容易得到月薪超過(guò)7000元的概率為1/2.問(wèn)題研究到這里就可以解決引例中的問(wèn)題了,但研究不滿足于此,這種方法推廣到一般的函數(shù),能得到什么樣的具有一般性的條件和結(jié)論呢?
很容易給出問(wèn)題的一般描述,即已知X的概率密度f(wàn)X(x)和Y與X的函數(shù)關(guān)系Y=g(X),求Y的概率密度f(wàn)Y(y).解決該問(wèn)題的思路見圖2,從Y的分布函數(shù)入手.
FY(y)=P{Y≤y}=P{g(X)≤y}
進(jìn)一步要想從不等式中解出X的表達(dá)式,必須加條件,如果y=g(x)單調(diào)遞增,則其存在反函數(shù)g-1,令g-1=h.則上式可以進(jìn)一步推導(dǎo)
FY(y)=P{Y≤y}=P{g(X)≤y}=P{g-1(g(X))≤g-1(y)}=P{X≤h(y)}=FX(h(y)).
對(duì)上式兩邊對(duì)y求導(dǎo),還需要補(bǔ)充條件,若h(y)是可導(dǎo)的,由復(fù)合函數(shù)求導(dǎo)公式,則有
fY(y)=F′Y(y)=fX(h(y))·h′(y).
這樣,很容易得到下面定理1.
定理1若隨機(jī)變量X的概率密度f(wàn)X(x)在[a,b]外等于零,在區(qū)間[a,b]上恒有g(shù)′(x)>0,(注意:包含了前面推到所需要的兩個(gè)條件y=g(x)單調(diào)遞增和h(y)可導(dǎo)),則有結(jié)論
有了上述的啟發(fā)和推導(dǎo),進(jìn)一步提出問(wèn)題:
(i)若y=g(x)單調(diào)遞減,會(huì)得到什么樣的結(jié)論?
(ii)若隨機(jī)變量X的概率密度f(wàn)X(x)在(-∞,+∞)上都非零,上述結(jié)論有什么變化?
(iii)若y=g(x)不單調(diào)怎么辦?
以上問(wèn)題讓學(xué)生自己去思考和拓展即可.另外,公式法的條件比較苛刻,[7]中給出了連續(xù)型隨機(jī)變量函數(shù)分布的更一般的公式法.
通過(guò)前面的分析,如果X~U(0,1),則X的線性函數(shù)也服從均勻分布,比如Y=2X+1,則Y~U(1,3),如圖3所示.
圖3 均勻分布的線性函數(shù)的分布
進(jìn)一步思考,如果想由均勻分布得到指數(shù)分布,能不能找到相應(yīng)的變換函數(shù)呢?為了回答這個(gè)問(wèn)題,給出以下定理2.
定理2如果X的分布函數(shù)為F(x),且F(x)為嚴(yán)格單調(diào)遞增連續(xù)函數(shù),令Y=F(X),則Y~U(0,1).(證明略)
基于上述定理,很容易得出以下結(jié)論:
如果Y~U(0,1),想利用Y得到其它分布的隨機(jī)變量,如果想獲得分布函數(shù)為F(x)的隨機(jī)變量X,則只需要做變換X=F-1(Y)即可.比如,X~U(0,1),想獲得參數(shù)為1的指數(shù)分布,其分布函數(shù)和反函數(shù)分別為
由參數(shù)為1的指數(shù)分布的分布函數(shù)的反函數(shù)形式,很容易找到變換函數(shù)為Y=-ln(1-X).所以,令Y=-ln(1-X),則Y服從參數(shù)為1的指數(shù)分布.用Matlab生成[0,1]上均勻分布的隨機(jī)數(shù)10000個(gè),對(duì)這些隨機(jī)數(shù)進(jìn)行Y=-ln(1-X)的變換,隨著數(shù)據(jù)量的增加,變換后的數(shù)據(jù)越來(lái)越接近指數(shù)分布,樣本概率密度和理論概率密度越來(lái)越接近,如圖4所示.數(shù)值模擬的結(jié)果,驗(yàn)證了理論的正確性.
圖4 Y=-ln(1-X)的分布
隨機(jī)數(shù)應(yīng)用領(lǐng)域十分廣泛,比如,彩票、博弈、通信、計(jì)算機(jī)仿真、計(jì)算物理學(xué)等,而以上結(jié)論為產(chǎn)生各種分布的隨機(jī)數(shù)提供了重要的理論依據(jù).
關(guān)于隨機(jī)變量函數(shù)的分布教學(xué)設(shè)計(jì)中,本節(jié)的問(wèn)題和解決問(wèn)題的方法是否掌握?隨機(jī)變量的函數(shù)的分布中生成隨機(jī)數(shù)的拓展是否可以理解?是否有意義?本節(jié)課的收獲怎么樣等問(wèn)題,筆者針對(duì)北京科技大學(xué)2019級(jí)的物聯(lián)網(wǎng)、信安、材控三個(gè)專業(yè)的160名左右的學(xué)生做了問(wèn)卷調(diào)查,回收問(wèn)卷145份,結(jié)果見圖5.
圖5 關(guān)于學(xué)生學(xué)習(xí)效果的調(diào)查問(wèn)卷柱狀圖
由圖5可見,學(xué)生對(duì)本文提出的教學(xué)設(shè)計(jì)有較高的認(rèn)可度.從圖5(c)的結(jié)果可以看出,盡管有些同學(xué)不能完全掌握本節(jié)的知識(shí),但依然覺得關(guān)于隨機(jī)數(shù)的拓展是十分有必要的.學(xué)生對(duì)知識(shí)拓展的需求是比較強(qiáng)烈的,而課堂上增加知識(shí)拓展部分能夠提升知識(shí)的高階性和挑戰(zhàn)度.
本文針對(duì)概率論與數(shù)理統(tǒng)計(jì)課程中的連續(xù)型隨機(jī)變量函數(shù)的分布這個(gè)知識(shí)點(diǎn)進(jìn)行了教學(xué)設(shè)計(jì),提出問(wèn)題,依據(jù)數(shù)值模擬直觀猜測(cè)結(jié)果,分析解決問(wèn)題的思路,解決問(wèn)題,推廣到更一般的問(wèn)題描述,探索更一般解決問(wèn)題的方法,以應(yīng)用為導(dǎo)對(duì)知識(shí)進(jìn)行了拓展.最后通過(guò)對(duì)學(xué)生的調(diào)查問(wèn)卷顯示,本教學(xué)設(shè)計(jì)學(xué)生能夠使學(xué)生較好地掌握本節(jié)知識(shí)點(diǎn),學(xué)會(huì)了解決問(wèn)題的方法,得到的學(xué)生認(rèn)可度較高,該教學(xué)設(shè)計(jì)方法可以類似推廣到其它知識(shí)點(diǎn)的教學(xué)設(shè)計(jì)中.
致謝作者非常感謝相關(guān)文獻(xiàn)對(duì)本文的啟發(fā)以及審稿專家提出的寶貴意見.