——中心極限定理隨機(jī)模擬"/>

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        R語(yǔ)言在概率統(tǒng)計(jì)課堂教學(xué)中的應(yīng)用
        ——中心極限定理隨機(jī)模擬

        2022-11-16 13:34:08普映娟
        保山學(xué)院學(xué)報(bào) 2022年5期

        吳 婷 普映娟

        (保山學(xué)院 大數(shù)據(jù)學(xué)院,云南 保山 678000)

        概率統(tǒng)計(jì)課本里的理論知識(shí)雖可以為學(xué)生提供理論基礎(chǔ),但卻缺乏圖形表達(dá)和模擬來增強(qiáng)理解與動(dòng)手實(shí)踐能力。在教學(xué)實(shí)踐中,學(xué)生普遍認(rèn)為中心極限理論晦澀難懂,教學(xué)效果不理想[1]。傳統(tǒng)的黑板教學(xué)無法再滿足學(xué)生課堂教學(xué)的需求[2]。因此,在概率論教學(xué)中,利用R語(yǔ)言的隨機(jī)模擬和可視化將抽象概念轉(zhuǎn)化為具體形象的圖像,實(shí)驗(yàn)?zāi)M的動(dòng)態(tài)過程不僅可以加深學(xué)生對(duì)知識(shí)的理解,激發(fā)他們的想象力,從而促進(jìn)反思,最終掌握知識(shí),還可以提高課堂效率,使概率學(xué)習(xí)更具操作和動(dòng)手空間,提高學(xué)生的實(shí)踐能力。

        1 中心極限定理

        中心極限定理是相互獨(dú)立的隨機(jī)變量之和用正態(tài)分布近似的一類定理。直到20世紀(jì)30年代,中心極限定理的研究曾是概率論的中心內(nèi)容。至今其仍是一個(gè)活躍的方向,推廣的方向如獨(dú)立不同分布乃至非獨(dú)立的情形,由中心極限定理而引起的誤差的估計(jì),以及與之相關(guān)聯(lián)的問題如大偏差問題之類[3]。最為著名的相互獨(dú)立同分布情形下的中心極限定理,又稱為列維-林德伯格中心極限定理。列維(1886-1971年)是法國(guó)數(shù)學(xué)家,對(duì)極限理論和隨機(jī)過程理論做出杰出的貢獻(xiàn)。林德伯格(1876-1932年)是芬蘭數(shù)學(xué)家,因中心極限定理而聞名于世[4]。

        定理1(列維-林德伯格中心極限定理)設(shè)隨機(jī)變量序列X1,X2,…Xn中心相互獨(dú)立同分布,若E(Xi)=μ,D(Xi)=σ2,且0<σ2< +∞,i=1,2,…,則對(duì)任意實(shí)數(shù)x,有

        這個(gè)定理的直觀意義是,當(dāng)n足夠大時(shí),可以近似地認(rèn)為。在實(shí)際問題中,若n較大,可以利用正態(tài)分布近似求得概率。

        傳統(tǒng)的教學(xué)就是列出不同條件下的中心極限定理,簡(jiǎn)單說明在樣本量充分大時(shí)依分布收斂到正態(tài)分布。而證明過程在大多公共基礎(chǔ)課的教材基本沒有涉及到。即使教材給出了證明,作為公共基礎(chǔ)課的學(xué)生也很少對(duì)其繁瑣的推導(dǎo)過程感興趣。故在講授這項(xiàng)重要的知識(shí)點(diǎn)的時(shí)候,除理論說明和推導(dǎo)之外,還可以結(jié)合統(tǒng)計(jì)軟件R進(jìn)行教學(xué),讓學(xué)生切實(shí)體會(huì)到中心極限定理的魅力[4]。

        本文將利用R軟件生成n(n=1,2,3,4,30)個(gè)相互獨(dú)立的均勻分布X~U(0,1)之和的模擬數(shù)據(jù),繪制其直方圖和密度函數(shù)圖形。觀察隨著n的增大,n個(gè)相互獨(dú)立的變量之和是否能用正態(tài)分布近似。本文將通過2種數(shù)據(jù)模擬的思路,來說明中心極限定理。一是進(jìn)行隨機(jī)采樣,然后求和生成新的數(shù)據(jù)列,再查看和數(shù)據(jù)的分布情況;二是通過卷積推導(dǎo)出和變量的密度函數(shù),然后分別繪制密度函數(shù)線,查看分布情況。設(shè){}Xi為獨(dú)立同分布的隨機(jī)變量序列,其分布為區(qū)間(0,1)上的均勻分布,即Xi~U(0,1),i=1,2,…,30,且Xi之間相互獨(dú)立。記,由中心極限定理可知,Yn~N(nμ,nσ2)。

        2 R語(yǔ)言隨機(jī)采樣模擬

        R語(yǔ)言是一款免費(fèi)、開源的程序軟件。它由新西蘭奧克蘭大學(xué)的Robert Gentleman和Ross Ihaka等人員共同開發(fā),主要用于統(tǒng)計(jì)分析、數(shù)據(jù)挖掘以及數(shù)據(jù)可視化[2]。它不僅支持?jǐn)?shù)據(jù)分析相關(guān)的多種算法,而且其語(yǔ)法也十分簡(jiǎn)明易懂,運(yùn)行速度也可以接受,適合在教學(xué)和科研中使用。因此本文將利用R語(yǔ)言把概率論中的中心極限定理可視化,輔助教學(xué)。

        隨機(jī)采樣模擬的思路:利用R語(yǔ)言中的隨機(jī)數(shù)采樣命令runif隨機(jī)生成容量為10 000的30組數(shù)據(jù),然后得到30組的模擬值,最后使用hist命令繪制每組數(shù)據(jù)的直方圖,并增加其密度函數(shù)線。接下來運(yùn)用R軟件對(duì)其進(jìn)行統(tǒng)計(jì)模擬并加以驗(yàn)證。

        2.1 隨機(jī)采樣模擬的步驟

        (1)隨機(jī)生成容量為10 000的30組數(shù)據(jù)

        (2)依次構(gòu)造和變量Yn模擬數(shù)據(jù)

        (3)繪制和變量Yn(n=1,2,3,30)的直方圖和分布圖

        2.2 繪制直方圖和分布圖

        圖1 均勻分布隨機(jī)采樣生成 Yn(n=1,2,3,30)的直方圖

        圖2 二項(xiàng)分布隨機(jī)采樣生成Yn(n=1,2,3,30)的直方圖

        3 R語(yǔ)言密度函數(shù)模擬

        除可以通過采樣的方式生成隨機(jī)數(shù),然后加和模擬,還可以通過卷積公式嚴(yán)格地推導(dǎo)出和變量的密度函數(shù),用R軟件直接繪制密度函數(shù)來觀察分布情況。但隨著變量的增多,計(jì)算會(huì)相當(dāng)復(fù)雜,不易實(shí)現(xiàn)。

        3.1 卷積公式

        設(shè)(X,Y)是二維連續(xù)型隨機(jī)變量,它們具有概率密度(fx,y),則Z=X+Y仍為連續(xù)型隨機(jī)變量,其概率密度為。若X和Y相互獨(dú)立,設(shè)(X,Y)關(guān)于X,Y的邊緣概率密度分別為fX(x),fY(y),則上式化為

        3.2 和變量的密度函數(shù)

        設(shè){Xi}為獨(dú)立同分布的隨機(jī)變量序列,其分布為區(qū)間(0,1)上的均勻分布,即Xi~U(0,1),i=1,2,3,4,且Xi之間相互獨(dú)立。記,由中心極限定理可知,Yn~N(nμ,nσ2),令pn(y)為Yn的密度函數(shù)。根據(jù)卷積公式,可以依次求出Yn(n=1,2,3,4)的密度函數(shù)pn(y),n=1,2,3,4,如下公式(3.1)所示。

        3.3 數(shù)據(jù)模擬的步驟和R代碼

        3.3.1 利用R語(yǔ)言依次構(gòu)造Yn的密度函數(shù)pn

        3.3.2 繪制Y1,Y2,Y3,Y4的密度圖

        根據(jù)構(gòu)造Yn(n=1,2,3,4)的密度函數(shù),利用R語(yǔ)言的curve函數(shù)繪制x∈[0,4]密度函數(shù)圖。

        3.4 模擬結(jié)果

        根據(jù)上述步驟,將Yn(n=1,2,3,4)地密度函數(shù)p1(y),p2(y),p3(y),p4(y)表示在圖3中。由圖3可知:隨著n的增加,pn(y)的圖形愈來愈光滑,且越來越接近正態(tài)曲線,符合中心極限定理。

        圖3 Yn(n=1,2,3,4)的密度函數(shù)圖

        4 課堂教學(xué)案例(高爾頓釘板實(shí)驗(yàn))

        在《概率論與數(shù)理統(tǒng)計(jì)》學(xué)習(xí)中,在闡釋完中心極限定理的基本定義后,增加中心極限定理的應(yīng)用案例。高爾頓釘板實(shí)驗(yàn)常常作為應(yīng)用實(shí)例,利用中心極限定理來進(jìn)行解釋。在課上展示環(huán)節(jié),主要基于R軟件,對(duì)高爾頓實(shí)驗(yàn)進(jìn)行模擬,模擬多種情況,比如釘子層數(shù)的不同、實(shí)驗(yàn)小球的個(gè)數(shù)對(duì)于實(shí)驗(yàn)結(jié)果的影響等。

        4.1 高爾頓釘板實(shí)驗(yàn)

        有一個(gè)板上面有n排釘子,每排相鄰的兩個(gè)釘子之間的距離均相等。上一排釘子的水平位置恰巧位于下一排緊鄰的兩個(gè)釘子水平位置的正中間。從上端入口放入小球,在下落過程中小球碰到釘子后相等的可能性向左或向右偏離,碰到下一排相鄰的兩個(gè)釘子中的一個(gè)。如此繼續(xù)下去,直到落入底部隔板中的一格,如圖4所示。問當(dāng)有大量的小球從上端依次放入,任其自由下落,小球最終在底板中堆積的形態(tài)。設(shè)釘子有16排,即n=16。

        圖4 高爾頓釘板

        在街頭賭博中,莊家會(huì)在高爾頓鋼板的底板兩端距離原點(diǎn)超出8格的位置放置了值錢的東西來吸引顧客,而在原點(diǎn)附近則放置相對(duì)便宜的東西或者不放置任何。一般在賭博游戲中,大多都是莊家贏,而這個(gè)游戲也不例外。我們可以用中心極限定理來揭穿這個(gè)街頭賭博中的騙術(shù)。

        若要考察小球堆積的形態(tài),就需要考察小球最終下落在底部隔板的位置的分布。則設(shè)隨機(jī)變量X為“小球最終下落在底部隔板中的位置”,同時(shí)引入隨機(jī)變量Xi服從伯努利分布,分布律如表1所示。則μ=E(Xi)=0,σ2=D(Xi)=1。

        表1 隨機(jī)變量Xi的分布律

        為揭穿這個(gè)街頭賭博中的騙術(shù),需要計(jì)算中大獎(jiǎng)概率,即下落小球超出8格的位置的概率。設(shè)釘子有16排,即n=16。由于,此時(shí)X~N( )0,16,有

        此時(shí)計(jì)算中大獎(jiǎng)的概率不到5%,這說明顧客中大獎(jiǎng)的可能性微乎其微。

        4.2 R語(yǔ)言模擬實(shí)驗(yàn)

        接下來通過軟件模擬的方式,來模擬高爾頓釘板實(shí)驗(yàn)。

        4.2.1 模擬生成落點(diǎn)數(shù)據(jù)

        設(shè)定生成落點(diǎn)數(shù)據(jù)函數(shù)的輸入、輸出參數(shù),如表2和表3所示。

        表2 輸入?yún)?shù)

        表3 輸出參數(shù)

        下面是模擬生成落點(diǎn)數(shù)據(jù)的R函數(shù)實(shí)現(xiàn)。

        4.2.2 繪制落點(diǎn)數(shù)據(jù)的直方圖

        由上述構(gòu)造的R函數(shù)可以得到每個(gè)點(diǎn)的下落位置y,對(duì)下落位置繪制其直方圖hist,同時(shí)增加臨界位置8和-8,標(biāo)識(shí)出中大獎(jiǎng)的概率P(|X|>8)。

        4.3 實(shí)驗(yàn)結(jié)果

        根據(jù)上述步驟進(jìn)行實(shí)驗(yàn),得到在n=16排釘子下投擲分別M=10,100,1 000,10 000次落點(diǎn)的位置數(shù)據(jù),可以得到結(jié)果如圖5所示。在本次模擬下,僅投擲10次,此時(shí)獲取大獎(jiǎng)(P(|X|>8))的概率為0。當(dāng)投擲次數(shù)達(dá)到100及以上,獲取大獎(jiǎng)的概率穩(wěn)定在2%附近。同時(shí),隨著次數(shù)的增加,落點(diǎn)位置的分布更接近于正態(tài)分布。

        圖5 在16排釘子下投擲分別10,100,1 000,10 000次落點(diǎn)分布

        但同時(shí)也注意到隨著投擲次數(shù)的增加,獲取大獎(jiǎng)的概率穩(wěn)定在2%附近,與上節(jié)正態(tài)分布計(jì)算出的概率4.56%存在差異。原因是層數(shù)n僅為16不足夠大,正態(tài)近似程度不高。雖然能在一定程度上說明賭博問題,得到近似概率,但精確概率仍然需要通過卷積公式來求n重二項(xiàng)分布的和分布函數(shù)。

        由此可以得到如下結(jié)論:

        (1)試驗(yàn)測(cè)試較少時(shí),一次性命中大獎(jiǎng)幾乎不可能。

        (2)隨著次數(shù)的增加,落點(diǎn)位置的分布接近于正態(tài)分布,符合中心極限定理。

        (3)通過數(shù)據(jù)模擬得到的概率值與中心極限定理利用正態(tài)近似得到的概率相比,仍有差異。原因是層數(shù)n不足夠大。但作為近似的判斷也足夠了,不影響對(duì)此賭博問題得到近似概率,精確概率仍然需要通過卷積公式來求n重二項(xiàng)分布的和分布函數(shù)。

        5 結(jié)語(yǔ)

        中心極限定理作為概率論與數(shù)理統(tǒng)計(jì)課程教學(xué)中的重點(diǎn)和難點(diǎn)之一,在教學(xué)過程中選擇使用R語(yǔ)言隨機(jī)模擬抽樣和概率分布情況,不僅可以使學(xué)生能夠較好地理解和掌握中心極限定理的本質(zhì),也能夠訓(xùn)練學(xué)生的編程能力,增強(qiáng)其動(dòng)手能力[6]。

        在計(jì)算技術(shù)快速發(fā)展的今天,編程和數(shù)據(jù)模擬也是一項(xiàng)必備技能。大學(xué)課堂教學(xué)也應(yīng)該與時(shí)俱進(jìn),充分利用現(xiàn)代化的教學(xué)工具和手段,讓學(xué)生在學(xué)習(xí)傳統(tǒng)知識(shí)的同時(shí),領(lǐng)略現(xiàn)代科技的發(fā)展對(duì)一些學(xué)科的促進(jìn)作用,從而激發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生利用現(xiàn)代技術(shù)手段解決問題的能力[5]。

        婷婷亚洲综合五月天小说| 亚洲精品98中文字幕| 久久久久亚洲av成人人电影| 精品国产乱码久久久久久1区2区 | 午夜天堂精品一区二区| 亚洲岛国一区二区三区| 亚洲国产成人一区二区精品区 | 91天堂素人精品系列全集亚洲| 国产一区二区av男人| 欲女在线一区二区三区| 又粗又粗又黄又硬又深色的| 欧美a在线播放| 久久五月精品中文字幕| 欧美a级毛欧美1级a大片| 国产乱妇乱子在线播视频播放网站| 亚洲欧美在线观看一区二区| 中文字幕视频一区二区 | 无码一级视频在线| 国产午夜精品av一区二区三| 精品人妻系列无码人妻漫画| 军人粗大的内捧猛烈进出视频| 久久国产影视免费精品| 伊人久久亚洲综合av影院| 日本真人边吃奶边做爽电影| 成人无码一区二区三区网站| 99久久精品国产片| 久久中文字幕一区二区| 无码欧美毛片一区二区三| 激情丁香婷婷| 国产精品午夜福利天堂| 夜夜高潮夜夜爽夜夜爱爱一区| 久久久久久人妻一区二区三区| 日本中文字幕一区二区高清在线| 一本色道久久88加勒比| 中文 在线 日韩 亚洲 欧美| 精品十八禁免费观看| 国产一区二区三区特区| 吃奶摸下高潮60分钟免费视频| 欧美成人看片黄a免费看| 日本一区二区三区啪啪| 开心五月天第四色婷婷|