李衛(wèi)華, 李國安, 王 偉, 李茂華
(寧波大學(xué)理學(xué)院,浙江寧波315211)
?
二元一般指數(shù)分布的識別性及其參數(shù)估計
李衛(wèi)華,李國安,王偉,李茂華
(寧波大學(xué)理學(xué)院,浙江寧波315211)
[摘要]討論了一般二元指數(shù)分布的識別性問題及參數(shù)估計問題.本文證明了兩個結(jié)論:其一、當(dāng)只有最大值隨機變量的分布已知時,僅一個參數(shù)可識別;其二、當(dāng)可識別最大值的分布已知時,所有參數(shù)皆可識別.進一步根據(jù)上述結(jié)論得到了所有參數(shù)的最大似然估計.
[關(guān)鍵詞]一般二元指數(shù)分布; 識別性; 最大似然估計
1引言
Gupta,Kundu于1999年在文獻[1]中提出了一個一般指數(shù)分布,在2009年,Kundu,Gupta在文獻[2]中導(dǎo)出了一個一般二元指數(shù)分布,本文討論二元一般指數(shù)分布的識別性問題及其參數(shù)估計.所謂參數(shù)的識別性是指總體分布的參數(shù)是否能被隨機變量的某些函數(shù)的分布所唯一確定,若能,則稱參數(shù)是可識別的.顯然,參數(shù)的識別性是其可估計的先決條件.文[3-13]討論了二元正態(tài)分布、三元正態(tài)分布、及多元正態(tài)分布的參數(shù)的識別性,在本文中,討論二元一般指數(shù)分布的參數(shù)的識別性問題.本文具體分兩種情況討論其參數(shù)的識別性問題.第一種情況為僅知道兩個隨機變量最大值的分布,這時只有部分參數(shù)能識別.為了能夠識別所有六個變量,則需要添加其他條件,本文通過添加兩隨機變量的比較識別變量來實現(xiàn),具體見后文的分析.
2二元一般指數(shù)分布的識別性
文[2]給出了如下的二元一般指數(shù)分布的定義,具體見定義1.
定義1稱二維隨機變量(X1,X2)服從二元一般指數(shù)分布,若其有如下的分布函數(shù)
F(x1,x2)=(1-e-λx1)α1(1-e-λx2)α2(1-e-λmin(x1,x2))α3,x1>0,x2>0,
記作
(X1,X2)~BVGE(α1,α2,α3,λ),
下面討論兩隨機變量的最大值的分布已知時,二元一般指數(shù)分布的參數(shù)的識別性問題.為討論的方便,引入兩個隨機變量
U=max(X1,X2),
(1)
(2)
并記U的密度函數(shù)和分布函數(shù)分別記為g(z)和G(z),二維隨機變量(U,I)的密度函數(shù)為h(u,i),其中z∈+,i∈{1,2,3}.二元一般指數(shù)分布的參數(shù)的識別性問題,具體定義見定義2.
定義2設(shè)二元隨機變量(X1,X2), (X′1,X′2)服從同類型的分布,且
(X1,X2)~ F (X1,X2, θ),(X′,Y′)~ F (X′,Y′,θ′),
這里θ,θ′同為參數(shù)或參數(shù)向量,并如(1), (2)兩式引入隨機變量(U,I) 和(U′,I′).若G(z)=G′(z)蘊含θ=θ′,則參數(shù)在此情形下是可識別的,否則參數(shù)在此情形下是不可識別的;類似地,若h(z,i)=h′(z,i)蘊含θ=θ′,則稱參數(shù)在此情形下是可識別的,否則參數(shù)在此情形下是不可識別的.
引理1若(X1,X2)~BVGE(α1,α2,α3,λ),則U的分布密度為
g(u)=αλe-λu(1-e-λu)α-1,u>0.
證由P(U≤u)=P(max(X1,X2)≤u)=P(X1≤u,X2≤u)=F(u,u)
=(1-e-λu)α1(1-e-λu)α2(1-e-λmin(u,u))α3=(1-e-λu)α,
得
g(u)=αλe-λu(1-e-λu)α-1,u>0.
引理2若(X1,X2)~BVGE(α1,α2,α3,λ),則(U,I)的分布密度為
證二元一般指數(shù)分布為混合分布,現(xiàn)對其三部分x1>x2, x1 當(dāng)x1>x2時,分布函數(shù) F1(x1,x2)=(1-e-λx1)α1(1-e-λx2)α2(1-e-λx2))α3=(1-e-λx1)α1(1-e-λx2)α2+α3, 所以 同理,當(dāng)x1 f2(x1,x2)=α2(α1+α3)λ2e-λ(x1+x2)(1-e-λx2)α2-1(1-e-λx1)α1+α3-1. P(U≤u,I=1)=P(max(X1,X2)≤u,I=1)=P(X1≤u,X1>X2) 所以 h(u,1)=α1λe-λu(1-e-λu)α-1, 同理 h(u,2)=α2λe-λu(1-e-λu)α-1. 當(dāng)x1=x2時 F1(x1,x1)=(1-e-λx1)α1+α2+α3, 所以 h(u,3)=αλe-λu(1-e-λu)α-1. 定理1設(shè) (X1,X2)~BVGE(α1,α2,α3,λ),(X′1,X′2)~BVGE(α′1,α′2,α′3,λ′), 若已知U與U′同分布,則只有參數(shù)λ可識別,其余參數(shù)皆不可識別. 證由g(u)=g′(u),得 αλe-λu(1-e-λu)α-1=α′λ′e-λ′u(1-e-λ′u)α′-1u>0, 首先得λ=λ′,α=α′.因此,參數(shù)λ可識別; α1,α2,α3均不可識別,但三者的和可識別. 定理2設(shè) (X1,X2)~BVGE(α1,α2,α3,λ),(X′1,X′2)~BVGE(α′1,α′2,α′3,λ′), 若已知(U,I)與(U′,I′)同分布,則所有參數(shù)皆可識別. 證由h(u,i)=h'(u,i),得 αiλe-λu(1-e-λu)α-1=α′iλ′e-λ′u(1-e-λ′u)α′-1,i=1,2,u>0, 得λ=λ′,α=α′,α1=α′1,α2=α′2,進而得α3=α′3.因此,所有參數(shù)可識別. 3二元一般指數(shù)分布的參數(shù)估計 文獻[2]研究了二元一般指數(shù)分布的參數(shù)估計,這里,我們從定理1和定理2出發(fā),直接分別獲得了參數(shù)λ,以及所有參數(shù)的最大似然估計. 定理3設(shè)(X1,X2)是總體,(X11,X21),…,(X1n,X2n)是來自總體(X1,X2)的容量為n的樣本,記 U=max(X1,X2),Ui=max(X1i,X2i),i=1,…,n, 若U具有以下的分布密度 g(u)=αλe-λu(1-e-λu)α-1,u>0, U1,…,Un是來自總體U的容量為n的樣本,u1,…,un為樣本值,則參數(shù)λ的最大似然估計為下列方程的解 (3) 證 其對數(shù)似然函數(shù)的駐點方程為 求解,即得結(jié)論. 定理4設(shè)(X1,X2)是總體,(X11,X21),…(X1n,X2n)是來自總體(X1,X2)的容量為n的樣本,按前文(1),(2)兩式引入U,I,同時記Ui=max(X1i,X2i),Ii=φ(X1i,X2i).現(xiàn)假定(U,I)具有如引理2所述的分布密度,(U1,I1),…,(Un,In)是來自總體(U,I)的容量為n的樣本.U的樣本值記為u1,…,un,并記 α1,α2,α3的最大似然估計為 證似然函數(shù)為 對數(shù)似然函數(shù)的駐點方程為 得參數(shù)λ滿足方程 結(jié)論僅是U的分布已知時,只有參數(shù)λ可識別,即只有參數(shù)λ可估計,當(dāng)(U,I)的分布已知時,所有參數(shù)皆可識別,即所有參數(shù)皆可估計. [參考文獻] [1]Gupta R D,Kundu D. Generalized exponential distributions[J]. Australian and New Zealand Journal of Statistics, 1999, 41: 173-188. [2]Kundu D,Gupta R D. Bivariate generalized exponential distributions [J]. Journal of Multivariate Analysis, 2009, 100: 581-593. [3]Anderson T W, Ghurye S D. Identification of parameters by the distribution of a maximum random variable [J]. Journal of the Royal Statistical Society: Series B, 1977, 39(3): 337-342. [4]Basu A P, Ghosh J K. Identifiability of the multinormal and other distributions under competing risks model [J]. Journal of Multivariate Analysis, 1978, 8(3): 413-429. [5]Gilliland D C, Hannan J. Identification of the Ordered Bivariate Normal Distribution by Minimum Variate [J]. Journal of the American Statistical Association, 1980, 75: 651-654. [6]Mukherjea A, Stephens R. The problem of identification of parameters by the distribution of the maximum random: Solution for the trivariate normal case[J].Journal of Multivariate Analysis, 1990, 34(1): 95-115. [7]Mukherjea A, Stephens R. Identification of parameters by the distribution of the maximum random variable: The general multivariate normal case[J]. Probability Theory and Related Fields,1990, 34(1): 289-296. [8]Gong J, Mukherjea A. Solution of a problem on the identification of parameters by the distribution of the maximum random variable: a multivariate normal case[J]. Journal of Theoretical Probability, 1991, 4(4): 783-790. [9]Mukherjea A, Stephens R. Identification of the parameters of a trivariate normal vector by the distribution of the minimum [J]. Journal of Statistical Planning and Inference, 1999, 78(1): 23-37. [10]Dai M, Mukherjea A. Identification of the parameters of a multivariate normal vector by the distribution of the maximum [J]. Journal of Theoretical Probability, 2001, 14: 267-298. [11]Davis J, Mukherjea A. Identification of parameters by the distribution of the minimum: The tri-variate normal case with negative correlations [J]. Journal of Multivariate Analysis, 2007, 98(6): 1141-1159. [12]Bi L, Mukherjea A. Identification of parameters and the distribution of the minimum of the tri-variate normal [J]. Statistics & Probability Letters, 2010, 80(23): 1819-1826. [13]Mukherjea A, Elnaggar M. Solution of the problem of the identified minimum for the tri-variate normal [J]. Proceedings - Mathematical Sciences, 2012, 4(122): 645-660. Identifiability of the Bivariate Generalized Exponential Distributions LIWei-hua,LIGuo-an,WANGWei,LIMao-hua (Department of Mathematics, Ningbo University, Ningbo Zhejiang 315211, China) Abstract:If two random variable has a bivariate generalized exponential distribution,when the distribution of the maximum is known,then only one of parameters is identified,when the distribution of the identified minimum is known,then all of parameters are identified;hence,the maximum likelihood estimator of all of parameters are derived. Key words:bivariate generalized exponential distribution; identifiability; maximum likelihood estimator [收稿日期]2014-10-13;[修改日期] 2016-03-08 [基金項目]浙江省自然科學(xué)基金(LQ12A01006);浙江省自然科學(xué)基金(LY15A010005) [作者簡介]李衛(wèi)華(1979-),男,碩士,實驗師,從事數(shù)值計算、應(yīng)用統(tǒng)計等研究.Email: liweihua@nbu.edu.cn [中圖分類號]O29;TE312 [文獻標(biāo)識碼]C [文章編號]1672-1454(2016)02-0081-05
——以在線評價平臺為例