錢欣潔,劉 歡
(金陵科技學院 理學院,江蘇 南京 211169)
概率論與數理統(tǒng)計是研究隨機現象的學科,將隨機現象“量化”成隨機變量,并用隨機變量的不同取值表示隨機現象的不同的試驗結果。設隨機試驗的樣本空間為Ω,對每個ω∈Ω,總有一個實數X(ω)與之對應,則稱Ω上的單值實函數X(ω)為一個隨機變量[1]。隨機變量可分為離散型隨機變量、混合型隨機變量和連續(xù)型隨機變量?;旌闲碗S機變量較復雜,一般本科教材只介紹離散型隨機變量和連續(xù)型隨機變量。由于離散型隨機變量表現形式簡單,學生很容易掌握。但學生對于連續(xù)型隨機變量的相關內容理解不深,掌握不牢。連續(xù)型隨機變量的概率密度函數、函數的分布和條件概率密度是概率論與數理統(tǒng)計課程中的基礎,通過總結往年的教學經驗發(fā)現,學生學習這些內容時較吃力,很多學生只是死記硬背,無法從本質上理解掌握這部分內容,在做題時也經常出錯。
類比教學法[2]是課堂教學活動中應用較廣泛的方法之一,將類比的思維用到課堂教學活動中,通過將兩件事情做類比,可以自然而然將學習者的原有經驗,和需要學習的新知識,通過某種微妙的相似性建立起連接,從而幫助學生有效地理解新知識。本文利用類比教學法,將連續(xù)型隨機變量的概率密度函數、連續(xù)型隨機變量函數的分布和條件概率密度分別與離散型隨機變量分布律、離散型隨機變量函數的分布和條件分布律做類比,化繁為簡、深入淺出地使連續(xù)型隨機變量的相關內容具體化,有趣生動地幫助學生從本質上理解這部分內容,徹底掌握連續(xù)型隨機變量的相關知識。
本節(jié)只討論一維隨機變量,二維隨機變量的類比方法與一維相同,這里不再做詳細闡述。對于一維離散型隨機變量,我們用分布律表示它的所有可能的取值及取每個值的概率。設離散型隨機變量X的所有可能的取值為xi,X取xi的概率為pi(i∈N,i≥1;),則隨機變量X的分布律為:P{X=xi}=pi,i∈N,i≥1。它滿足性質:
這兩條性質是分布律的本質,任給一個滿足這兩條性質的函數可作為某個隨機變量的分布律。用分布律來研究離散型隨機變量的統(tǒng)計規(guī)律,簡單易懂,一目了然。
對于一維連續(xù)型隨機變量,我們也想用如此直接的方法,將隨機變量每個取值處的概率列舉出來,但這時隨機變量的取值點是不可列的。那如何像離散情況那樣給出隨機變量每個點的概率呢?或者說,如何得到一個定義在隨機變量取值點的函數,這個函數與取值點的概率有關呢?我們采取了高等數學中經常用的方法,討論“一個點”的概率情況,我們可以稍微擴范圍,考慮一個無窮小區(qū)間上的概率,這個區(qū)間概率除以區(qū)間長度就得到了“平均概率”,而當這個無窮小區(qū)間趨近于零時,“平均概率”的極限就是我們需要的函數,這里Δx表示區(qū)間長度,ΔF表示區(qū)間上的概率。
若分布函數F(x)處處可導,則處處存在,這樣可以定義函數,稱之為概率密度函數。但是現實生活中隨機現象的分布函數往往不能處處可導,所以以上概率密度函數的定義有缺陷。為了研究更多現實生活中的隨機現象,我們需要降低對分布函數F(x)的要求,即雖然分布函數F(x)不是處處可導,但是存在一個函數f(x),使其變上限積分為F(x),具體地定義如下。
定義1[3]42:如果對于隨機變量X的分布函數F(x),存在非負函數f(x),使得對于任意實數x有
則稱X為連續(xù)型隨機變量,其中f(x)稱為X的概率密度函數,簡稱概率密度。
連續(xù)型隨機變量的概率密度函數滿足性質:
這兩條性質是概率密度函數的本質,任給一個滿足這兩條性質的函數可作為某個隨機變量的概率密度函數。概率密度函數的規(guī)范性與分布律的規(guī)范性類似,因為可以看作不同測度集上的兩種積分定義方式。
由以上分析可知,離散型隨機變量用分布律來表示隨機變量取值點及其概率,連續(xù)型隨機變量是用一個定義在隨機變量每個取值點處的概率密度函數來揭示其統(tǒng)計規(guī)律。分布律與概率密度函數具有的性質十分類似,都滿足非負性和規(guī)范性。
本節(jié)只討論一維隨機變量。對于一維離散型隨機變量函數g(x)的分布問題,我們可以直接將函數代入到隨機變量的分布律中得到新的隨機變量Y=g(X)的分布律[4]。具體地,將隨機變量X中任一取值點t代入函數g(x),得到新的取值點y=g(t),而y發(fā)生的概率等于t發(fā)生的概率,最后將相同取值點的概率相加,就得到了隨機變量Y的分布律。
對于一維連續(xù)型隨機變量函數的分布問題,類比于離散型隨機變量,我們也想通過直接將連續(xù)函數g(x)代入到連續(xù)型隨機變量X的概率密度函數fX(x)中得到新的連續(xù)型隨機變量Y=g(X)的概率密度函數fy(y)。但是概率密度函數“相當于”分布函數F(x)的導函數,而求概率密度函數fy(y)就是求復合函數的導函數,我們無法直接從導函數fx(x)推出復合函數導函數fY(y),所以需要討論復合原函數的導數來得出fY(y)。也就是說,先由隨機變量X的概率密度函數推導出隨機變量X的分布函數,再由此推出隨機變量Y的分布函數,最后求導得到隨機變量Y的概率密度函數。具體流程如圖1所示。
圖1 連續(xù)型隨機變量函數概率密度推導過程
由以上分析可知,連續(xù)型與離散型隨機變量函數分布問題的求解方法具有一定的相似性,討論離散型隨機變量函數分布問題就是求解分布律,可將此函數直接代入原有分布律求得。而討論連續(xù)型隨機變量函數分布問題就是求解概率密度函數,可將此函數代入新的分布函數并求導得到。這兩種方法之間具有相似性,可以進行對比學習。
對于條件概率,我們只討論二維隨機變量。二維離散型隨機變量(X,Y),如果固定j,并且P,則稱[3]68
為在Y=yj條件下X的條件分布律。
對于二維連續(xù)型隨機變量(X,Y),我們也想討論條件概率P{X=xi|Y=yj}的值,但連續(xù)型隨機變量在一點的概率為零,即P{X=xi,Y=yj},所以考慮一點處的條件概率并沒有意義,需要討論一個區(qū)間的條件概率,即討論條件分布函數P{X≤x|Y=y} 。對于此分布函數,類似于公式(2),我們希望用公式
來定義。然而P{Y=y}=0,公式(3)沒有定義。那我們將公式(3)如何變形才能得出正確的條件分布函數的定義呢?我們用類似于高等數學中“可去間斷點”的想法來將公式(3)變形。因為公式(3)在y點沒有定義,那么稍微擴大討論范圍,討論在區(qū)間(y,y+ε]上的條件概率P{X≤x|y<Y≤y+ε},然后再令ε→0+,這樣得到。若此極限處處存在,則它可作為條件分布函數的定義。
這里0<δ1,δ2<ε。由此,固定y,當fY(y)>0,我們可以定義Y=y條件下X的條件分布函數為?,F在條件分布函數的定義得出了,那條件概率密度如何定義呢?類似于第一節(jié)的討論,我們可以用“導數的觀點”推導出條件概率密度的定義Y=y,即條件下X的條件概率密度就是
本文通過將連續(xù)型隨機變量概率密度函數,條件概率密度分別與離散型隨機變量分布律,條件分布律做類比,一步一步引出連續(xù)型隨機變量、概率密度函數和條件概率密度的概念,這樣比直接給學生定義更能讓學生接受,也更利于學生理解此概念。