亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        R語言在衛(wèi)生統(tǒng)計學均數(shù)抽樣分布教學中的應(yīng)用

        2017-12-06 03:46:32高啟勝
        浙江醫(yī)學教育 2017年4期
        關(guān)鍵詞:均數(shù)樣本量標準差

        高啟勝

        (杭州醫(yī)學院,浙江 杭州 310053)

        ·教學研究與管理·

        R語言在衛(wèi)生統(tǒng)計學均數(shù)抽樣分布教學中的應(yīng)用

        高啟勝

        (杭州醫(yī)學院,浙江 杭州 310053)

        抽樣誤差和中心極限定理是衛(wèi)生統(tǒng)計學教學中的重點和難點,純理論講授學生理解較為困難。利用Excel、SPSS、SAS等軟件雖然可以進行隨機抽樣模擬試驗,但編程語言較為復(fù)雜。R語言能夠生動形象地展現(xiàn)從不同總體中進行隨機抽樣樣本均數(shù)的分布規(guī)律,有助于學生理解均數(shù)抽樣分布規(guī)律,提高教學效果。R語言具有豐富的統(tǒng)計函數(shù)和強大的繪圖功能等優(yōu)點,在衛(wèi)生統(tǒng)計學各類常用統(tǒng)計量抽樣分布教學中有重要應(yīng)用價值。

        R語言;衛(wèi)生統(tǒng)計學;抽樣分布

        由于個體變異的存在,在抽樣研究中產(chǎn)生樣本統(tǒng)計量和總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異,稱為抽樣誤差。假設(shè)一個已知總體,從該總體中抽樣,對每個樣本計算統(tǒng)計量(均數(shù)、標準差等),觀察樣本統(tǒng)計量的分布規(guī)律稱為抽樣分布規(guī)律。抽樣誤差和抽樣分布是統(tǒng)計推斷的重要基礎(chǔ)理論,由于這一內(nèi)容比較抽象,也成為衛(wèi)生統(tǒng)計學教學的難點。近年來,R語言因其開源免費、豐富的統(tǒng)計函數(shù)和模塊、靈活強大的繪圖功能等優(yōu)點,在國內(nèi)外大學統(tǒng)計教學和科研中獲得廣泛應(yīng)用[1-3]。本文嘗試利用R語言進行樣本均數(shù)的隨機抽樣模擬試驗,形象地展示抽樣分布的規(guī)律以提高衛(wèi)生統(tǒng)計學教學效果。

        1 函數(shù)模擬及程序

        1.1 均數(shù)抽樣分布

        分別設(shè)隨機變量X服從總體均數(shù)為5,標準差為2的正態(tài)分布,X~N(5,22);隨機變量Y服從總體均數(shù)和總體標準差為5的指數(shù)分布,Y~E(1/5); 隨機變量Z服從區(qū)間[1,9]上總體均數(shù)為5,總體標準差為2.3的均勻分布,Z~U(1,32)。運用R語言編程進行隨機抽樣實驗,參考程序如下:

        表1 函數(shù)模擬參考程序

        程序第1行設(shè)定圖形布局,按列順序繪圖,為4行3列。程序2-9行為編寫泛式sim.fun函數(shù),其中,m為模擬樣本次數(shù),X代表需模擬的多個函數(shù)。第10行定義函數(shù)X為從總體均數(shù)為5,標準差為2的正態(tài)分布中隨機抽樣的樣本均數(shù)。第15行定義函數(shù)Y為從總體均數(shù)和標準差為5的指數(shù)分布中隨機抽樣的樣本均數(shù)。第20號定義函數(shù)Z為從總體均數(shù)為5,標準差為2.3的均勻分布中隨機抽樣的樣本均數(shù)。第11-14行、16-19行、21-24行分別為按樣本含量為1、5、10、30模擬抽樣1000次的樣本均數(shù)的直方圖,結(jié)果見圖1。

        抽樣實驗小結(jié):當n=1時抽樣分布可看作從總體中抽取的樣本量為1000的一個樣本,其頻數(shù)分布接近總體分布。從正態(tài)總體中隨機抽樣時,樣本均數(shù)的分布仍呈現(xiàn)正態(tài)分布;從非正態(tài)總體中隨機抽樣(指數(shù)分布、均勻分布等),當樣本含量足夠大時,其樣本均數(shù)的分布逐漸逼近正態(tài)分布;樣本均數(shù)的均數(shù)位置始終在總體均數(shù)附近;隨著樣本量的增加,樣本均數(shù)的離散程度越來越小,表現(xiàn)為樣本均數(shù)的分布范圍越來越窄,其高峰越來越尖。

        1.2 中心極限定理

        圖1 從3個總體中抽取樣本量分別為1、5、10和30時樣本均數(shù)的分布

        表2 從不同總體中以不同樣本量抽樣時樣本均數(shù)和樣本標準差的描述結(jié)果

        表3 以相同樣本量從不同正態(tài)總體中抽樣時樣本均數(shù)和樣本標準差的描述結(jié)果

        2 動畫模擬及程序

        在R語言中還可以運用animation擴展包進行中心極限定理的動畫模擬實驗[4]。默認從總體均數(shù)和標準差為1的指數(shù)總體分布中按給定的樣本量(n=1,…,100)重復(fù)抽樣300次分別計算樣本均數(shù),畫出樣本均數(shù)的直方圖和相應(yīng)的核密度估計曲線,同時運用shapiro.test對均數(shù)分布進行正態(tài)性檢驗,并把P值取出來畫在下半幅圖中。程序第1、2行為安裝和載入animation包。第3行為設(shè)置時間間隔0.1秒和模擬的最大樣本量100。第4行為設(shè)定下邊距和左邊距為4行,上邊距和右邊距分別為1行和0.5行。第5行為默認進行指數(shù)分布動畫模擬,結(jié)果見圖2??梢姡敇颖玖縩超過20之后,P值會普遍偏大,可以認為樣本均值的分布和正態(tài)分布比較接近。此外,可以通過修改clt.ani()函數(shù)的參數(shù),設(shè)定抽樣次數(shù)和總體分布。如模擬1000次總體均數(shù)為5,標準差為2的正態(tài)分布的抽樣實驗,可設(shè)定clt.ani(obs=1000,FUN=rnorm,mean=5,sd=2);模擬1000次總體均數(shù)為5,標準差為2.3的均勻分布的抽樣實驗,可設(shè)定clt.ani(obs=1000,FUN=runif,mean=5,sd=2.3)等。

        表4 中心極限定理動畫模擬參考程序

        圖2 R語言動畫模擬中心極限定理

        3 討論

        運用R語言模擬樣本均數(shù)抽樣分布和中心極限定理的程序關(guān)鍵在于編寫一個隨機抽樣循環(huán)函數(shù),隨后則可以同時納入多個不同的總體分布。與以往運用SPSS、SAS等商業(yè)統(tǒng)計軟件進行模擬教學相比,運用R語言主要有以下優(yōu)勢:(1)R語言為免費開源軟件,不會引起版權(quán)爭議;(2)R編程有強大的繪圖功能,語言更加簡潔高效;(3)R語言除了圖形展示外,還定量地驗證了樣本均數(shù)和標準差的變化規(guī)律;(4)利用R語言擴展包可以動態(tài)模擬并給出正態(tài)性檢驗的P值。此外,R語言能夠繪制常用連續(xù)性分布和離散性分布概率密度和累計概率曲線,每一種分布均有4個函數(shù):d為密度函數(shù),p為累積概率密度函數(shù),q為分位數(shù)函數(shù),r為隨機數(shù)函數(shù)。利用隨機數(shù)函數(shù)可以從對應(yīng)分布總體中產(chǎn)生隨機樣本,進行模擬抽樣實驗??梢?,R語言模擬抽樣分布在衛(wèi)生統(tǒng)計學教學中對幫助學生理解各類常用統(tǒng)計量的抽樣分布具有重要應(yīng)用價值。

        [1]商豪,楊策平. 淺議 R 軟件在概率論與數(shù)理統(tǒng)計教學中的運用[J].考試周刊, 2016,(4): 56-57.

        [2]熊炳忠.基于R軟件的概率統(tǒng)計課程實驗教學探析[J].學園,2015,(34): 52-54.

        [3]張哲,張豪.淺談R語言在生物統(tǒng)計學教學中的應(yīng)用[J].教育教學論壇,2013, (27): 54-55.

        [4]趙軍,楊琳.R 軟件在大學數(shù)學教學中的應(yīng)用探討[J].高教學刊,2016, (7): 93-95.

        TheapplicationofRprogramminglanguageinthemeansampling

        GAOQisheng

        (Hangzhou Medical College, Hangzhou 310053, China)

        Sampling error and central-limit theorem are the important and difficult points in Health Statistics teaching, and it is difficult for students to understand by spoon-feed teaching. Though random sampling simulation tests can be developed by Excel, SPSS, SAS, the programming language is relatively complex. The R programming language can vividly shows sample mean distribution pattern from different population at the same time, which can help stimulate students’ interests in leaning and improve classroom teaching effects. The R programming language provides a wealth of statistic functions and powerful drawing functions, which has important application value in the teaching process of different commonly used statistics sampling distribution of health statistics.

        R programming; health statistics; sampling distribution

        高啟勝(1984-),男,江西鄱陽人,碩士,講師。研究方向:社會醫(yī)學與衛(wèi)生統(tǒng)計學教學和研究

        G642.0

        B

        1672-0024(2017)04-0001-05

        distributionteachingofHealthStatistics

        猜你喜歡
        均數(shù)樣本量標準差
        醫(yī)學研究中樣本量的選擇
        用Pro-Kin Line平衡反饋訓練儀對早期帕金森病患者進行治療對其動態(tài)平衡功能的影響
        航空裝備測試性試驗樣本量確定方法
        Sample Size Calculations for Comparing Groups with Binary Outcomes
        關(guān)于均數(shù)與偏差
        對于平均差與標準差的數(shù)學關(guān)系和應(yīng)用價值比較研究
        關(guān)于均數(shù)與偏差
        關(guān)于均數(shù)與偏差
        關(guān)于均數(shù)與偏差
        醫(yī)學科技論文中有效數(shù)字的確定
        欧亚精品无码永久免费视频 | 国产精品国产三级国a| 一区二区三区国产精品乱码| 国产精品无套一区二区久久| 亚洲日韩av无码一区二区三区人| 日本老熟欧美老熟妇| 亚洲 欧美 激情 小说 另类| 亚洲欧洲无码精品ⅤA| 黄色潮片三级三级三级免费| 久久精品国产亚洲av果冻传媒| 久久久天堂国产精品女人| 成人做爰69片免费看网站| 天天射色综合| 国产精品毛片大尺度激情| 一区二区三区在线日本视频| 一本色道久久88—综合亚洲精品| 人妻夜夜爽天天爽三区麻豆av网站 | 午夜亚洲av永久无码精品| 久久中文字幕av一区二区不卡| 精品人妻av一区二区三区不卡| 国产丝袜长腿在线看片网站| 粉嫩小泬无遮挡久久久久久| 国产一线二线三线女| 青春草国产视频| 亚洲产在线精品亚洲第一页| 国产片在线一区二区三区| 亚洲男人天堂黄色av| 色欲色欲天天天www亚洲伊| 人妻被黑人粗大的猛烈进出| 国产亚洲精品国产福利在线观看| 中文字幕日韩精品亚洲精品| 日本国产精品久久一线| 青春草在线视频免费观看| 日本一本久道| 国产日产亚洲系列av| 亚洲国产精品国自产拍性色 | 久久久亚洲精品蜜臀av| 亚洲国产综合人成综合网站| 国产草草影院ccyycom| 国产成人精品精品欧美| 伊人狼人影院在线视频|