亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Copula理論的學生成績平均值和中位數(shù)的分布特征研究

        2016-05-10 07:04:32張曉宇徐付霞天津工業(yè)大學理學院天津300387
        大學數(shù)學 2016年1期
        關鍵詞:中位數(shù)平均值

        張曉宇, 徐付霞(天津工業(yè)大學理學院,天津300387)

        ?

        基于Copula理論的學生成績平均值和中位數(shù)的分布特征研究

        張曉宇, 徐付霞
        (天津工業(yè)大學理學院,天津300387)

        [摘 要]用高斯混合模型擬合82個班級2296名學生的考試成績分布數(shù)據(jù).用正態(tài)分布擬合考試成績的平均分和中位數(shù)成績,研究兩者間的相關性度量和相關結構,得到均值和中位數(shù)的聯(lián)合分布函數(shù).對兩個描述集中趨勢的統(tǒng)計量的概率統(tǒng)計特性進行了完備刻畫.

        [關鍵詞]混合高斯模型;平均值;中位數(shù);相關結構

        1 引 言

        平均值是常用的數(shù)據(jù)中心趨勢度量,它對非常大或非常小的觀測值較敏感,偏向尾部較厚的方向.中位數(shù)是中心趨勢的耐抵性度量,它不受極端觀測值的影響,對于偏度極大的數(shù)據(jù)集,中位數(shù)能夠較好地描述數(shù)據(jù)分布的中心.對于有一點偏度或者沒有偏度的丘型分布,均值和中位數(shù)近似相等.由于均值比中位數(shù)具有更好的數(shù)學性質,因此在推斷方法中,常用均值作為中心趨勢的度量,當這兩個量同時用在數(shù)據(jù)的統(tǒng)計分析中時,就是對數(shù)據(jù)中心的很好描述.

        學生成績一般不服從對稱的正態(tài)分布[1].我們調(diào)研整理了82個班級,2296名大學生的高等數(shù)學考試成績數(shù)據(jù),統(tǒng)計分析顯示數(shù)據(jù)不服從正態(tài)分布,可用混合高斯模型擬合學生成績的分布密度函數(shù).進一步統(tǒng)計計算每個班級考試成績的平均分和中位數(shù)成績,得到82組成績數(shù)據(jù),研究這82個平均分或中位數(shù)成績的分布,發(fā)現(xiàn)它們均服從正態(tài)分布.再研究兩者間的相關性度量和相關結構,就可以得到均值和中位數(shù)的聯(lián)合分布函數(shù).這樣就對兩個描述集中趨勢的統(tǒng)計量的概率統(tǒng)計特性進行了完備刻畫.

        2 學生成績的高斯混合分布模型

        82個班級,2296名大學生的高等數(shù)學考試成績數(shù)據(jù)的幾個描述性統(tǒng)計量值如表1,成績分布的頻率直方圖如圖1.

        表1 學生成績數(shù)據(jù)的描述性統(tǒng)計量

        數(shù)據(jù)的峰度系數(shù)為3.342(>3),偏度系數(shù)為-0.986(<0),說明學生成績的分布是尖峰厚尾左偏的.再對數(shù)據(jù)做Kolmogorov-Smirnov正態(tài)性檢驗的P值很小,為2.4433×10-31,說明數(shù)據(jù)與正態(tài)分布偏差很大.下面用高斯混合模型擬合學生成績的分布密度.

        高斯混合模型GMM(Gaussian Mixture Model)就是一些高斯(正態(tài))分布的加權組合,其概率密度函數(shù)為

        圖1 成績分布的頻率直方圖

        其中參數(shù)μzi,σzi,i=1,2,…,N分別為第i個高斯成分的均值和方差,πi是第i個高斯成分的系數(shù),滿足可用EM算法估計這些參數(shù).

        EM(Expectatioin-Maximalization)是一種聚類算法,可以求出高斯分布的參數(shù),同時將數(shù)據(jù)分類[2].混合模型聚類常通過貝葉斯信息準則(BIC)選擇模型,模型的BIC值越大,該模型就越符合實際.

        用R軟件mclust包中的Mclust函數(shù)對成績數(shù)據(jù)進行聚類并估計參數(shù)[3],比較聚為1到8類時的BIC值,見表2.可見當聚為4類時,BIC值最大,為-19901.21,此時的8個參數(shù)估計值見表3(這里π1+π2+π3+π4=1,且為了簡化模型,假定各類方差相等).

        表2 不同聚類個數(shù)的BIC值

        表3 N=4模型的參數(shù)估計值

        將表2的數(shù)據(jù)代入(1)式,就得到學生成績的分布密度函數(shù)為

        3 平均值和中位數(shù)的擬合正態(tài)分布

        82組平均分珡X和中位數(shù)m0.5數(shù)據(jù)的統(tǒng)計描述見表4的第2,3行,頻率直方圖見圖2.表4顯示,平均分珡X的最大觀測值是88分,最小值是39.63分,說明考試成績的差別還是比較顯著的.中位數(shù)m0.5最大觀測值是95.5分,最小值是27.75分,比較平均分與中位數(shù)的幾個成績指標,發(fā)現(xiàn)大體上平均成績小于中位數(shù)成績,說明學生成績的分布基本上是負偏態(tài)的,即成績好的多一些.

        表4 平均分珡X和中位數(shù)m0.5成績的基本統(tǒng)計量

        圖2 平均數(shù)、中位數(shù)的直方圖和正態(tài)密度曲線

        雖然2296個原始成績數(shù)據(jù)不服從正態(tài)分布,但是由圖2可看出82個平均分或中位數(shù)數(shù)據(jù)有可能服從正態(tài)分布.對平均分和中位數(shù)分別作均值為67.57,標準差為10.57和均值為71.66,標準差為12.38的Kolmogorov-Smirnov正態(tài)性檢驗,檢驗的p值分別為0.2017和0.6283,說明兩者均服從正態(tài)分布,即

        可以將(3)和(4)式作為中位數(shù)和平均值的邊緣分布,下面研究它們的相關性.

        通過計算,學生成績數(shù)據(jù)的平均值和中位數(shù)的線性相關系數(shù)為0.956,和諧性度量Kendall秩相關系數(shù)為0.848,Spearman秩相關系數(shù)為0.962.說明平均分成績和中位數(shù)成績之間存在較強的單增相關關系[4].為了更全面深刻地刻畫中位數(shù)和平均值的相關關系,下面利用相關結構函數(shù)Copula對兩者的相關性進行分析[5].

        4 平均值和中位數(shù)的相關結構

        先選用3類5種常用的Copula函數(shù)族進行分析,再從中挑選出與數(shù)據(jù)擬合程度較好的一種Copula.

        (i)Gaussian Copula(其中α是相關參數(shù))

        (ii)t Copula(其中ρ是相關參數(shù),k表示自由度)

        Clayton Copula

        (iii)Archimedean Copula族(其中β是相關參數(shù))Gumbel Copula

        Frank Copula

        半?yún)?shù)估計是用樣本經(jīng)驗分布函數(shù)代替邊緣分布,估計Copula函數(shù)中未知參數(shù)的方法[6].其表達式為

        其中θ為待估參數(shù)向量,ui,vi分別為隨機變量X,Y的經(jīng)驗分布函數(shù),c(ui,vi;θ)為Copula的密度函數(shù).運用半?yún)?shù)法求得學生成績的平均值和中位數(shù)的五種Copula參數(shù)估計值如表5.

        表5 5種Copula函數(shù)的參數(shù)估計值

        畫出平均分和中位數(shù)的二元頻數(shù)分布直方圖,見圖3.可以看出它們的下尾相關性較強,上尾相關性較弱,具有不對稱的尾部分布.說明學生考試成績的平均分和中位數(shù)對于下尾數(shù)據(jù)即較差的考分較敏感.

        進一步,求解上述5種Copula函數(shù)的參數(shù)和相關系數(shù)等相關性測度指標如表6.由表6可見,5種Copula的兩種秩相關系數(shù)Kendall’sτ與Spearman’sρ與樣本學生成績的兩種秩相關系數(shù)τ=0.848,ρ =0.962較接近.Clayton Copula的下尾相關系數(shù)較大,上尾相關系數(shù)為0,圖4顯示其密度函數(shù)的尾部特征與圖3較一致,所以初步認為Clayton Copula適合用來描述學生成績的平均分和中位數(shù)之間的相關關系.

        圖3 平均分和中位數(shù)的頻數(shù)分布直方圖

        圖4 Clayton Copula密度函數(shù)圖

        表6 Copula函數(shù)的相關性測度指標

        再根據(jù)距離公式[7]

        表7 5種擬合Copula與經(jīng)驗Copula函數(shù)的歐氏距離

        由表7中數(shù)據(jù)可以看出,Clayton Copula與經(jīng)驗Copula函數(shù)的歐氏距離最小,即誤差最小,所以我們選擇參數(shù)為β=8.5806的Clayton Copula函數(shù)(8)式來描述學生成績的平均分和中位數(shù)之間的相關結構,即

        由Sklar定理[5],(12)式和平均分的擬合分布(3)式、中位數(shù)的擬合分布(4)式一起構成了平均分和中位數(shù)的聯(lián)合分布函數(shù):

        上述聯(lián)合分布函數(shù)(13)式是對平均值和中位數(shù)之間關系的較完備刻畫.比如平均分小于其平均值67.57,同時中位數(shù)小于其平均值71.66(數(shù)據(jù)見表4)的概率為F(67.57,71.66)=0.4613,同理可以求出平均分和中位數(shù)同時小于各自最小值、1/4分位數(shù)、中位數(shù)、3/4分位數(shù)、最大值的概率值,數(shù)據(jù)見表4的最后一行.

        可以預見,本文所述方法還可應用于經(jīng)濟金融數(shù)據(jù)的統(tǒng)計分析,如分析城鎮(zhèn)職工的工資水平等,將平均工資和中位數(shù)工資結合起來進行分析,可能會得到更加客觀的結論.

        [參 考 文 獻]

        [1] 尹向飛.基于混合正態(tài)分布的大學生考試成績分布的擬合[J].統(tǒng)計與決策,2007(8):133-135.

        [2] Aitkin M,Wilson GT.Mixture models,Outliers,and the EM algorithm[J].Technometrics,1980(22):325-331.

        [3] 薛毅,陳立萍.統(tǒng)計建模與R軟件[M].北京:清華大學出版社,2007.

        [4] 徐付霞,董永權.泥石流地貌要素的極值相關性[J].系統(tǒng)工程理論與實踐,2009,29(2):180-185.

        [5] Nelsen R B.An Introduction to Copulas[M].New York:Springer,1999.

        [6] G Kim,M J Silvapulle,P Silvapulle.Comparison of semiparametric and parametric methods for estimating copulas[J].Computational Statistics &Data Analysis,2007(51):2836-2850.

        [7] 李玉敦,謝開貴,胡博.基于Copula函數(shù)的多維時序風速相依模型及其在可靠性評估中的應用[J].電網(wǎng)技術,2013 (3):840-846.

        The Dependence Between Mean and Median Score of Students and the Establishment of Composite Indicator

        ZHANG Xiao-yu, XU Fu-xia
        (School of Mathematics and Physics,Tianjin Polytechnic University,Tianjin 300387,China)

        Abstract:The Gaussian mixture model is applied to fit the distribution of 2296students’score in 82classes.Then we fit the distribution of median and mean score use the normal distribution.We study the dependence measures and copula between median and mean statistics and get the joint probability density function of them.We provide a complete depiction of the two statistics’probabilistic properties which represent the central tendency.

        Key words:Gaussian mixture model;mean;median;copula

        [收稿日期]2014-11-15

        [中圖分類號]O212.5

        [文獻標識碼]B

        [文章編號]1672-1454(2016)01-0056-05

        猜你喜歡
        中位數(shù)平均值
        “平均值代換”法在數(shù)學解題中的應用
        平均值的一組新不等式
        數(shù)據(jù)的數(shù)字特征教學設計
        由時變Lévy噪聲驅動的隨機微分方程的平均值原理
        中位數(shù)計算公式及數(shù)學性質的新認識
        2015年中考數(shù)學模擬試題(五)
        2015年中考數(shù)學模擬試題(二)
        中位數(shù)教學設計
        平面圖形中構造調(diào)和平均值幾例
        基于電流平均值的改進無功檢測法
        電測與儀表(2014年6期)2014-04-04 11:59:46
        在线国产丝袜自拍观看| 色狠狠一区二区三区香蕉| 国产精品厕所| 亚洲每天色在线观看视频| 亚洲永久精品日韩成人av| 一个少妇的淫片免费看| 国产成年女人毛片80s网站| 理论片午午伦夜理片影院| 亚洲欧美日韩在线中文一| 天堂精品人妻一卡二卡| 变态另类手机版av天堂看网| 无码一区二区三区免费视频| 亚洲欧美日韩精品久久亚洲区 | 国产美女精品视频线免费播放软件| 女人下面毛多水多视频| 国产在线不卡视频| 久久夜色精品亚洲天堂| 91九色人妻精品一区二区三区| 国产亚洲精品精品精品| 国产福利姬喷水福利在线观看| 久久婷婷国产综合精品| 日本一区二区免费看片| www夜片内射视频在观看视频| 被黑人猛躁10次高潮视频| 无码日日模日日碰夜夜爽| 免费啪啪av人妻一区二区| 中文字幕乱码在线人妻| 内射欧美老妇wbb| a一区二区三区乱码在线 | 欧洲| 国产三级在线看完整版| 国产免费人成视频在线| 24小时日本在线视频资源| 欧美xxxx黑人又粗又长精品| 亚洲AV无码日韩一区二区乱| 国产熟女自拍av网站| 色偷偷888欧美精品久久久| 国产成人av片在线观看| 日韩美女高潮流白浆视频在线观看| 一区二区亚洲熟女偷拍| 永久免费毛片在线播放| 一本一道久久a久久精品综合|