亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SAS的高校學生成績抽樣及統(tǒng)計推斷——以東華理工大學期末試卷抽樣為例

        2015-12-18 12:27:22閆霏霏
        關鍵詞:數理統(tǒng)計概率論置信區(qū)間

        朱 琳, 閆霏霏

        (1.東華理工大學 理學院,江西 南昌330013;2.中國地質大學(武漢)數學與物理學院,湖北武漢430074;3.華中科技大學數學與統(tǒng)計學院,湖北武漢430074)

        在高校的教學過程中,經常要對成績、試卷或者其它材料進行檢查分析,以便于對前一階段的教學狀況進行評價及改進。由于高校學生人數較多、范圍較廣,而時間、經費和精力有限,往往不能對全部情況進行普查,只能進行抽查。而目前抽樣時,大部分高校使用的抽樣方法還是抽簽法,這種方法在被調查對象眾多的情況下,其費時、費力的弱點便非常明顯。本文通過高校中常需要抽樣的實際情況,結合抽樣調查理論,介紹了兩種抽樣方法并運用SAS軟件(SAS 9.1.3版)進行抽樣和推斷。SAS的抽樣功能比較強大,但現在市場上的SAS教材中介紹如何抽樣和推斷的不多,因此在文章中針對東華理工大學(以下簡稱學校)的兩門公共數學課程的試卷抽樣及成績推斷給出了具體的實現過程。

        1 高校常見的抽樣情況及抽樣方法

        1.1 簡單隨機抽樣

        在學校的課程設置中,概率論與數理統(tǒng)計屬于公共數學類課程,修課學生人數較多,但是期末試卷采取統(tǒng)一命題的形式,批改和成績登錄也都由大學數學教學部統(tǒng)一完成,批改后的試卷也集中保存。因此對試卷的抽樣調查不需要分批、分部門進行,在對試卷情況和成績的調查時可用簡單隨機抽樣法[1]進行抽樣。

        從有N個單元的總體(Y1,Y2,…,YN)中抽取n個單元(y1,y2,…,yn)作為樣本,一切可能的CnN種實現均有相同的概率出現。這時采用的無放回的等概率抽樣方式就是簡單隨機抽樣。

        在對2014年上半年學校南昌校區(qū)概率論與數理統(tǒng)計期末試卷進行抽樣調查時,有效考試(除了缺考、緩考等情況)的人數為1 844人,將這些學生名單作為總體(數據文件為gl201302)進行抽樣。按照往常抽樣的習慣,抽取總人數的10%,也就是185人,將抽的樣本保存在臨時邏輯庫work下文件sample 中,用 SAS 的過程步 proc surveyselect[2-5]可以實現,程序如下。

        其中,proc surveyselect后的選項data指定被抽樣數據是臨時邏輯庫下的gl201302;method表明了所用的抽樣方法是簡單隨機取樣(srs);rate表明抽樣比例為0.1(可用n=185代替);out表明樣本文件名,這里樣本數據存放在臨時邏輯庫下,文件名為Sample;seed=1234表明這次隨機抽樣的種子數是1234。

        運行程序后,被抽取的185位學生的名單信息保存在臨時邏輯庫下的數據文件sample中,試卷調查時,只需對該文件中的學生試卷進行調查。

        1.2 分層抽樣

        與概率論與數理統(tǒng)計不同的是,學校高等數學的教學是針對不同的教學計劃而分批次進行的,且不同批次的試卷的制定和批改均是分開的。考慮到不同批次之間的差異,在抽樣的時候需要用分層抽樣法[1]進行抽樣。

        分層抽樣是將大的總體分成若干小的總體,每一小總體成為一個層,在每層中抽取一個樣本,將各層的樣本合在一起組成原總體的一個分層樣本。有兩類情況適合進行分層抽樣,一是各小的總體之間有明顯的差異,每層內的各單元差異較小,層與層之間的差異較大;二是由于組織管理的方便,必須進行分層。

        對2014年上半年學校南昌校區(qū)高等數學Ⅱ期末試卷進行抽樣時,有效考試人數為3 288人,將這些學生名單作為總體(數據文件為gs201302)進行抽樣。仍然抽取總人數的10%,也就是329人,將抽取的樣本保存到臨時邏輯庫,文件名為sample2。由于高等數學Ⅱ的教學是分5批進行的,每批的人數不同,在分層(批)抽樣之前先統(tǒng)計每批的人數及每批的抽樣數。

        每位同學的所屬批次記錄在變量_COL2中,可以用proc freq過程步進行統(tǒng)計。

        統(tǒng)計出的每批的總人數列在表1中。

        表1 高等數學Ⅱ每批學生總人數

        抽取每批的10%時,抽取樣本數分別為138,76,36,53,26。

        在進行分層抽樣之前,先對數據gs201302按照分層變量_COL2進行排序,這里用proc sort過程進行排序。再用SAS的過程步proc surveyselect進行分層抽樣。

        用proc surveyselect進行分層抽樣時,method=srs表明每層內仍然用簡單隨機抽樣進行抽樣;n后面列舉出每層要抽的樣本數;其它的選項含義與前面相同。Strata后指明分層變量是_COL2。

        抽取的329位學生的名單信息保存在臨時邏輯庫下的數據文件sample2中,同樣地,試卷調查時,也只需這部分學生的試卷情況和成績進行調查。

        2 對總體情況的推斷

        在對抽得的兩門課程的樣本試卷進行調查后,往往希望通過樣本試卷的成績來對總體成績進行估計,通常需要估計的是總體的平均成績、優(yōu)秀率和不及格率。

        2.1 總體平均值的估計

        (1)簡單隨機樣本下的對總體的估計。在抽取簡單隨機樣本后可以用簡單估值法可得到樣本平均值,它是總體平均值的無偏估計中S2是總體方差。的一個無偏估計是,其中s2是樣本方差。

        對抽到的文件sample中的185位同學的成績進行調查后,將每位同學的成績保存至該文件,成績變量名為_COL8。對該成績進行分析,估計出總體平均值也即是南昌校區(qū)該年級學生概率論與數理統(tǒng)計的平均成績及其95%的置信區(qū)間。用過程步 proc surveymeans[2]進行實現,程序如下:

        這里,proc surveymeans后的選項data功能同上;total指定總體的人數1844;語句var后面列出要分析的變量名_COL8,也即是學生成績。

        程序運行后在結果窗口中可以看到對總體平均成績、其均方偏差和95%置信區(qū)間的估計,見表2(數據保留三位小數,下同)。

        表2 概率論與數理統(tǒng)計平均成績的估計結果

        從輸出結果可知,這次抽樣的樣本量是185,平均成績ˉy=66.403,平均成績的均方偏差v(ˉy)=1.555,總體平均分的 95% 置信區(qū)間是[63.335,69.471]也即是

        這里需要注意的是在對sample2的數據進行分析時,層與層之間的抽樣比差別不大,因此校正前后的結果差別不大。如果是在每層的抽樣比差別比較大的情況下時,加權是必要的。

        從分析結果可知,這次抽樣的樣本量是329,均的值,這里α=0.05。而事實上,由大學數學教學部統(tǒng)計出來的該學期南昌校區(qū)概率論與數理統(tǒng)計總體平均分是67.643,可以看出包含在此置信區(qū)間內。

        (2)分層樣本下的對總體的估計。如果分層抽樣樣本是從每一層獨立抽取的,每一層內抽取的是簡單隨機樣本,且每層的總體平均值ˉY用簡單估值時,則估計量是的無偏估計。對應的均方偏差為,而它的一個無偏估計為

        對樣本sample2中的329位同學的高等數學Ⅱ試卷成績進行調查統(tǒng)計后,要估計出總體平均成值及其95%的置信區(qū)間。與不分層的情況不同的是,在用過程步proc surveymeans進行樣本分析之前,要先給出每批考試的總人數。

        將每批考試的總人數讀入一個數據集groups。

        程序運行后在結果窗口中可以看到對總體成績、其均方偏差和95%置信區(qū)間的估計(見表3)。

        表3 高等數學Ⅱ平均成績的估計結果

        在抽樣的時候,由于抽樣個數是整數,取整時造成實際上各層之間單元抽樣的概率并不相同。為了對結果進行校正,可以將每層的抽樣概率的倒數作為權重對考試成績進行加權。而用proc surveyselect進行分層抽樣時各個樣本單元的抽樣比及其倒數(samplingweight)已經包含在樣本數據中,所以在proc surveymeans過程中可以將該變量作為權重進行計算,也即是在上面的語句中再加上weight samplingweight語句,可得到校正后的結果(見表4)。值,均值的均方偏差v(ˉy)=1.201,總體均值的95%置信區(qū)間是[59.648,64.373]。而事實上,大學數學教學部統(tǒng)計出來的該學期本科生高等數學Ⅱ成績均值為62.834,在此置信區(qū)間內,且與估計值絕對誤差僅有0.824。

        表4 高等數學Ⅱ平均成績校正后的估計結果

        2.2 比例估計

        在對成績進行調查時,往往還希望了解該課程的考試優(yōu)秀率(成績大于或等于90分)或不及格率(成績低于60分)。以調查不及格率為例,如果將不及格稱為特征,而我們要調查的這一特征的比例,其實就是符合該特征的個體的個數占總單元數的比例。令

        則z=z1+z2+…+zn即為樣本中具有該特征的個體總數n1,而平均數是該樣本中具有該特征的單元的比例p,是總體中具有該特征的比例P的一個無偏估計。因此我們只需要將樣本中具有該特征的個體標記出來,然后用前面介紹的proc surveymeans過程對總體進行推斷即可。

        要了解概率論與數理統(tǒng)計中考試不及格的學生占的比例,需要先生成一個數據集,將含有該課程成績的樣本中不及格的標注出來,不妨取該變量名為 fail。

        再用推斷概率論與數理統(tǒng)計平均成績的方法進行分析即可,只需將分析的數據集換成sample3,分析的變量換成fail。

        在輸出窗口看到的結果如表5所示。

        表5 概率論與數理統(tǒng)計考試不及格率的推斷結果

        從結果中可以知道,推斷總體中不及格比例為0.227,而該比例的 95% 置信區(qū)間為[0.169,0.285]。

        而對于高等數學Ⅱ成績不及格的比例的推斷過程與之類似,只需要將proc surveymeans的分析方法換成2.2節(jié)中對分層樣本的分析即可。

        3 結束語

        SAS的surveyselect過程能實現的抽樣的方法較多,除了簡單隨機抽樣(srs),可重復的簡單隨機抽樣(urs)還有系統(tǒng)抽樣(sys)、序列抽樣(seq)、pps抽樣(pps)等抽樣方法[3]。在本文中介紹的兩種抽樣方法使用比較普遍,除了對試卷的抽樣,比如還有對大四畢業(yè)生的就業(yè)實習和畢業(yè)論文的抽查,由于這些材料由各個學院組織完成,因此材料抽查要在各學院分別進行,這時要用分層抽樣法進行抽樣。但如果抽樣時只抽取學院,且要以該學院的規(guī)模大小作為權重時,使用pps抽樣比較恰當。抽樣時具體選用哪種抽樣方法進行抽樣要視應用時的實際情況而定。

        另外需要注意的是,在每次對同一個總體進行抽樣的時候,如果種子數沒有指定,或者每次隨機抽取的時候給定的種子數不同,可能得到的抽樣結果不同。在對總體情況進行推斷時,在允許的條件下盡量多抽幾次樣本,對每次抽得樣本的分析結果取平均值來作為總體的估計值。

        [1]孫山澤.抽樣調查[M].北京:北京大學出版社,2012:1-203.

        [2]黨輝,郭家鋼.SAS統(tǒng)計軟件的SURVEYSELECT過程在血吸蟲病流行病學抽樣調查中的應用[J].熱帶病與寄生蟲學.2006,4(2):67-70.

        [3]譚志軍,徐勇勇,等.應用SAS和SPSS進行復雜抽樣[J].中國衛(wèi)生統(tǒng)計,2012,29(1):145-146.

        [4]汪海波,等.SAS統(tǒng)計分析與應用——從入門到精通[M].北京:人民郵電出版社,2011:411-438.

        [5]王睿,賀佳.隨機抽樣方法的SAS實現[J].中國衛(wèi)生統(tǒng)計,2007,24(1):85,93.

        猜你喜歡
        數理統(tǒng)計概率論置信區(qū)間
        定數截尾場合三參數pareto分布參數的最優(yōu)置信區(qū)間
        p-范分布中參數的置信區(qū)間
        多個偏正態(tài)總體共同位置參數的Bootstrap置信區(qū)間
        淺談《概率論與數理統(tǒng)計》課程的教學改革
        列車定位中置信區(qū)間的確定方法
        論《概率論與數理統(tǒng)計》教學改革與學生應用能力的培養(yǎng)
        財經類院校概率論與數理統(tǒng)計教學改革的探索
        河南科技(2014年10期)2014-02-27 14:09:37
        多媒體技術在《概率論與數理統(tǒng)計》教學中的應用
        河南科技(2014年1期)2014-02-27 14:04:45
        国产精品亚洲欧美云霸高清| 免费国产在线精品一区| s级爆乳玩具酱国产vip皮裤| 亚洲av综合av一区| 无码三级在线看中文字幕完整版| 亚洲韩国在线| 水蜜桃在线观看一区二区国产| 国产精品国产亚洲精品看不卡| 亚洲产国偷v产偷v自拍色戒| 亚洲精品理论电影在线观看| 日韩av一区二区无卡| 色欲av永久无码精品无码蜜桃| 国产精品人妻一码二码尿失禁| 视频国产精品| 人妻有码中文字幕在线| 国产av无码专区亚洲版综合| 国产亚洲一区二区手机在线观看| 在线国产视频精品视频| 久久婷婷综合色一区二区| 97se亚洲国产综合自在线观看| 亚洲中文久久精品无码ww16| 一区二区三区不卡免费av| 亚洲av毛片在线网站| 99视频30精品视频在线观看| 国产精品不卡无毒在线观看| av免费在线观看在线观看| 狠狠综合亚洲综合亚洲色| 国产乱人伦在线播放| 亚洲成AV人片在一线观看| 在线观看视频免费播放| 女女互揉吃奶揉到高潮视频| 99热这里只有精品4| 久久精品国产亚洲av成人网| 亚洲国产精品婷婷久久| 美女把尿囗扒开让男人添| 精品少妇大屁股白浆无码| 视频一区二区免费在线观看| 天天做天天添av国产亚洲| 国产亚洲精久久久久久无码| 少妇高潮紧爽免费观看| 久久天堂一区二区三区av|