【摘要】本文綜述了正態(tài)分布的最新發(fā)展狀況,給出了正態(tài)分布的概念和公式,主要論述了正態(tài)分布的各種擴展,包括漸近正態(tài)分布、二元正態(tài)分布、離散正態(tài)分布、廣義正態(tài)分布、對數(shù)正態(tài)分布、多元正態(tài)分布、廣義逆正態(tài)分布、偏正態(tài)分布和截尾正態(tài)分布等,并論述了其最新進展和應用動態(tài).
【關(guān)鍵詞】正態(tài)分布;廣義正態(tài)分布;多維正態(tài)分布;偏正態(tài)分布
一、正態(tài)分布及其應用
1.正態(tài)分布定義和性質(zhì)
生產(chǎn)與科學實驗中很多隨機變量的概率分布都可以近似地用正態(tài)分布來描述,正態(tài)分布是當今應用最為廣泛的連續(xù)概率分布.17世紀,棣莫弗和拉普拉斯最早使用了正態(tài)分布,18世紀早期德國數(shù)學家高斯研究了正態(tài)分布的性質(zhì)并應用正態(tài)分布分析了天文數(shù)據(jù),所以在科學界正態(tài)分布也叫作高斯分布.正態(tài)分布的概率密度函數(shù)為:f(x)=
2.正態(tài)分布的應用
由于正態(tài)分布具有很多優(yōu)良性質(zhì),根據(jù)中心極限定理,諸多數(shù)據(jù)集合可以用它來近似擬合,所以生產(chǎn)與科學實驗中很多隨機變量的概率分布都可以近似地用正態(tài)分布來描述.例如,在生產(chǎn)條件不變的情況下,產(chǎn)品的口徑、長度等指標,同一種生物體的身長、體重等指標.一般來說,如果一個量是由許多微小的獨立隨機因素影響的結(jié)果,那么就可以認為這個量具有正態(tài)分布,還有一些常用的概率分布也是由它衍生而來的,例如對數(shù)正態(tài)分布、t分布、F分布等.
二、正態(tài)分布的新發(fā)展
實際應用中由于正態(tài)分布的不易滿足性,故針對不同問題對正態(tài)分布進行了擴展,在一般正態(tài)分布的基礎(chǔ)上,導出了漸近正態(tài)分布、二元正態(tài)分布、離散正態(tài)分布、廣義正態(tài)分布、廣義逆正態(tài)分布、對數(shù)正態(tài)分布、多元正態(tài)分布、偏正態(tài)分布和截尾正態(tài)分布等,各擴展有不同的特點和應用.
1.漸近正態(tài)分布
漸近正態(tài)分布在因子分析中應用很廣泛,因子分析主要用在行為和社會科學,如隨著年齡的增長,兒童的身高、體重會隨著變化,因為影響身高與體重的生長因子相同故有一定的相關(guān)性.漸近正態(tài)分布主要用于弱假設(shè)情況下的最大似然因子分析,通過漸近正態(tài)性可以使因子分析適用于更廣泛數(shù)據(jù)分布的分析.因子分析模型對于p可觀測隨機向量xα可以表示為:xα=μ+Λfa+ua (α=1,…,N) (7),其中μ是p維向量參數(shù),Λ是p×k階因子載荷矩陣,fα是非觀測可能包含隨機誤差的k階向量,uα是一個非觀測隨機誤差向量,而且fα和uα互相獨立.
Anderson和Amemiya分別在1956年和1987年討論了最大似然估計在弱假設(shè)情況下的性質(zhì),后者指出對于探索性因子分析,如果uα服從正態(tài)分布,因子載荷和誤差的漸近分布將對fα有更好的適應性.對于因子分析模型,Aerson和Rubin在1956年通過最大似然估計得出漸近正態(tài)分布統(tǒng)計量上提出一般性結(jié)論,指出用漸近分布來做一般分布的因子和誤差分析的可靠性.隨后在1988年Anderson 和Amemiya對該結(jié)論做了證明,并把模型拓展到Λ是λ的非線性函數(shù)上這種更一般的情況.
2.二元正態(tài)分布
二元正態(tài)分布是多元正態(tài)分布的一個特例,它的很多性質(zhì)可從多元正態(tài)分布中推出.定義:兩個連續(xù)的隨機變量x和y,x~N(μx,σ2x),y~N(μy,σ2y),它們的聯(lián)合概率密度可用下式表示:
它是左截尾的離散正態(tài)分布,同時像半邊連續(xù)正態(tài)分布一樣也是有確定期望和方差的最大熵分布.Kemp同時推出半邊正態(tài)分布是qhyperPoissonI分布,說明它和M/M/1 隊列的關(guān)系,推導了它的期望和圖形的單峰性質(zhì).
4.廣義正態(tài)分布
廣義正態(tài)分布在1972年最早由Miller et.al提出,它是作為一個非隨機誤差的模型用于粗差探測模型.它具有對稱的單峰概率密度曲線,很多其他的分布通過它概率密度式參數(shù)的指數(shù)衰減推導而出.由于廣義正態(tài)分布的強適應性、穩(wěn)定性,只需一個參數(shù)就可確定和可逼近大批量數(shù)據(jù),所以它在各個領(lǐng)域獲得了廣泛應用.
【參考文獻】
[1] Wassily Hoeffding.A Class of Statistics with AsyMptotically Normal Distribution.Institute of Statistics.
[2] T.W.Anderson,Yasuo AmeMiya.The AsyMptotic Normal Distribution of Estimators In Factor Analysis Under General Conditions.The Annals of Statistics,1988,Vol.16,No.2,159-771.
[3] P.Blaesild.Conditioning With Conic Sections In The TwoDimensional Normal distribution.The Annals of Statistics[J].1979,vol 7,No 3,169-670.
[4] ManLai Tang,WaiYin Poon.Statistical inference for equivalence trials with ordinal responses: Alatent normal distribution approach.Computational Statistics Data Analysis[J].2007,vol 51,5918-5926.
[5] D.Marcottea,E.Henry.Automatic joint set clustering using a mixture of bivariate normal distributions.International.Rock Mechanics Mining Sciences[J].2002,vol 39,323–334.
[6] S.J.van Albada,P.A.Robinson.Transformation of arbitrary distributions to the normal distribution with application to EEG testretest reliability Neuroscience Methods[J].2007,vol 161,205-211.
[7] N.E.Savin,Henry B.,Iowa City.Semiparametric Estimation of the BoxCox Model.Preliminary and Incomplete.Tippie College of Business[J].2001,vol 30.