亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        混合偏正態(tài)數(shù)據(jù)下中位數(shù)回歸模型的參數(shù)估計

        2021-11-11 05:48:30吳劉倉曹幸運
        關(guān)鍵詞:模型

        曾 鑫,吳劉倉,曹幸運

        (昆明理工大學(xué) 理學(xué)院,云南 昆明 650093)

        0 引 言

        在計量經(jīng)濟(jì)學(xué)文獻(xiàn)中,混合回歸模型也稱為轉(zhuǎn)換回歸模型,它為研究來自兩個或兩個以上總體的數(shù)據(jù)提供了有效的工具. 自Goldfeld等[1]首次提出有限混合回歸模型以來,混合回歸模型在生物學(xué)、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、環(huán)境科學(xué)、抽樣調(diào)查和工程技術(shù)等領(lǐng)域得到了廣泛的應(yīng)用,可參考文獻(xiàn)[2-5].現(xiàn)實世界中, 我們搜集到的數(shù)據(jù)往往不嚴(yán)格服從正態(tài)分布, 當(dāng)數(shù)據(jù)存在偏斜時, 我們再使用正態(tài)分布、t分布或Laplace分布等對稱分布來描述它們是不合理的.因此, 自Azzalini[6]首次提出偏正態(tài)分布及其性質(zhì)以來, 偏正態(tài)分布比傳統(tǒng)的正態(tài)分布更加廣泛地應(yīng)用于實際數(shù)據(jù)的擬合, 關(guān)于偏正態(tài)分布的更多細(xì)節(jié)可以參考[7].基于偏正態(tài)分布,吳劉倉等[8]研究了聯(lián)合位置與尺度混合專家回歸模型的參數(shù)估計,馬婷等[9]基于Gauss-Newton迭代法研究了聯(lián)合位置、尺度與偏度模型的極大似然估計,李世凱等[10]研究了偏正態(tài)數(shù)據(jù)下混合非線性回歸模型的參數(shù)估計.

        以上文獻(xiàn)僅局限于均值模型的參數(shù)估計,目前還沒有文獻(xiàn)研究混合偏正態(tài)數(shù)據(jù)下中位數(shù)回歸模型的參數(shù)估計,為了提高偏正態(tài)數(shù)據(jù)下參數(shù)估計的靈活性,本文研究了混合偏正態(tài)數(shù)據(jù)下中位數(shù)回歸模型的參數(shù)估計.模擬和實例研究結(jié)果顯示該模型的方法是有效的.

        1 混合偏正態(tài)中位數(shù)回歸模型

        1.1 偏正態(tài)分布

        如果一個隨機(jī)變量Y的概率密度函數(shù)[6]可以表示為:

        (1)

        其中:μ為位置參數(shù),σ為尺度參數(shù),λ為偏度參數(shù),則稱隨機(jī)變量Y服從偏正態(tài)分布,記為Y~SN(μ,σ2,λ).其中?(·)和Φ(·)分別為標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)與分布函數(shù).易知,當(dāng)偏度參數(shù)λ=0時,Y的密度函數(shù)退化為正態(tài)分布的密度函數(shù),即此時偏正態(tài)分布SN(μ,σ2,λ)退化為正態(tài)分布N(μ,σ2);當(dāng)λ>0和λ<0分別稱為右偏和左偏.

        同時,若隨機(jī)變量Y服從偏正態(tài)分布,則Y的隨機(jī)表達(dá)形式為:

        (2)

        (3)

        即偏正態(tài)分布可以分層表示為一個截尾正態(tài)分布R和一個條件正態(tài)分布Y|(R=r),其中截尾正態(tài)分布TN(0,1;(0,∞))表示一個標(biāo)準(zhǔn)正態(tài)分布在區(qū)間(0,∞)的截尾,概率密度函數(shù)可表示為:

        偏正態(tài)分布的隨機(jī)表達(dá)形式和分層表達(dá)形式將分別在Monte Carlo模擬和EM算法中使用到.此外,Azzalini等[7]提出偏正態(tài)分布的均值和眾數(shù)可以表示為:

        Mean(Y)=μ+μ0(λ)σ,Mode(Y)=μ+m0(λ)σ

        其中:

        并且:

        由均值、中位數(shù)和眾數(shù)之間的數(shù)量關(guān)系|mean(Y)-mode(Y)|≈3|mean(Y)-median(Y)|,有:

        (4)

        1.2 混合偏正態(tài)中位數(shù)回歸模型

        為了研究概率密度函數(shù)(1)的解釋變量與中位數(shù)之間的關(guān)系,我們提出下列混合偏正態(tài)數(shù)據(jù)下的中位數(shù)回歸模型:

        (5)

        (6)

        1.3 模型的可識別性

        模型的可識別性是統(tǒng)計推斷的重要部分,這也是混合回歸模型的關(guān)鍵問題. Titterington等[11]提出連續(xù)分布的有限混合在大多數(shù)情況下都是可識別的.本文中,模型:

        可識別的充要條件為m=m*,θ=θ*,i=1,2,…,n;j=1,2,…,m,其中μij由(6)定義.對于偏正態(tài)分布,不同的參數(shù)對應(yīng)不同的偏正態(tài)分布,即分布可識別,則模型可識別.

        2 參數(shù)估計的EM算法

        EM算法可以極大化任意分布有限混合的對數(shù)似然函數(shù),可參考Dempster等[12].記潛變量zi=(zi1,zi2,…,zim),其中

        通過使用偏正態(tài)分布的分層表達(dá)(3),我們得到下列混合偏正態(tài)分布的分層表達(dá)形式:

        (7)

        其中,Z服從多點分布.因此,當(dāng)zij=1時(Y,R)的聯(lián)合密度為:

        其中,eij=yi-μij.根據(jù)貝葉斯準(zhǔn)則,可得:

        因此有:

        E-步:計算

        求替代函數(shù)如下:

        Q(θ|θ(t))=E[l(θ|Ycom)|Yobs,θ(t)]=Q1+Q2+Q3+Q4

        (8)

        式(8)中:

        且:

        M-步:給定初值θ(0)=(β(0)T,σ(0),λ(0),π(0)),θ(1)=(β(1)T,σ(1),λ(1),π(1)).基于兩點步長梯度法[13]給定下列梯度迭代以更新:

        θ(t+1)=θ(t)+s(t)G(θ(t))

        (9)

        其中:得分函數(shù)G(θ(t))和步長s(t)定義為:

        計算得分函數(shù)為:

        其中:

        其中:

        且:

        3 Monte Carlo模擬

        為了評價上述參數(shù)估計方法的估計效果,需要對有限樣本性質(zhì)進(jìn)行模擬研究.為了節(jié)省空間, 我們只討論混合偏正態(tài)中位數(shù)回歸模型, 參數(shù)的估計精度使用均方誤差來衡量,定義為:

        表1 混合偏正態(tài)中位數(shù)回歸模型的模擬結(jié)果

        從表1可以得出以下結(jié)論:

        2) 對于給定的樣本量n,當(dāng)混合比例時1=2=0.5時,兩個子聚類估計的均方誤差(MSE)接近;當(dāng)混合比例1=0.35,2=0.65時,子聚類2估計的均方誤差(MSE)比子聚類1估計的均方誤差(MSE)小.

        以上結(jié)論表明,本文提出的混合偏正態(tài)中位數(shù)回歸模型及使用的EM算法對參數(shù)的極大似然估計取得了較理想的效果.

        4 實例分析

        在本節(jié)中,我們利用Cook和Weisberg[15]所測量的數(shù)據(jù)集來論證本文所提出的模型和方法的實際應(yīng)用效果. 數(shù)據(jù)集包括來自澳大利亞體育學(xué)院的100名女性運動員和102名男性運動員的身體質(zhì)量指數(shù)(BMI)數(shù)據(jù),其中響應(yīng)變量為BMI(y),解釋變量為紅細(xì)胞計數(shù)(x1),血漿鐵蛋白濃度(x2),皮膚褶皺和(x3),身體脂肪百分比(x4).根據(jù)不同性別的數(shù)據(jù)特征,我們將數(shù)據(jù)分為兩個子聚類.圖1顯示了男性運動員和女性運動員的直方圖,容易看出數(shù)據(jù)右偏且不存在尖峰厚尾的情況,近似服從偏正態(tài)分布.

        圖1 男性運動員和女性運動員BMI直方圖Fig.1 Histogram of BMI data for male and female athletes

        我們考慮下列混合偏正態(tài)中位數(shù)回歸模型,其中子聚類1(男性)所占比例為1=102/202≈0.505,子聚類2(女性)所占比例為2=100/202≈0.495.

        基于第2節(jié)提出的方法,分別使用兩個子聚類的數(shù)據(jù)和總的數(shù)據(jù),經(jīng)算法迭代收斂,表2給出了實際數(shù)據(jù)下混合偏正態(tài)中位數(shù)回歸模型的參數(shù)估計結(jié)果.

        表2 BMI數(shù)據(jù)的模型參數(shù)估計結(jié)果

        由表2可以得出,使用三種數(shù)據(jù)所估計的參數(shù)是存在差異的.從回歸系數(shù)的正負(fù)來看,紅細(xì)胞計數(shù)(x1)和身體脂肪百分比(x4)與女性運動員BMI呈正相關(guān),而與男性運動員BMI呈負(fù)相關(guān);血漿鐵蛋白濃度(x2)與男性運動員BMI呈正相關(guān),而與女性運動員BMI呈負(fù)相關(guān);皮膚褶皺和(x3)與男女性運動員都呈正相關(guān).從系數(shù)的大小來看,各解釋變量對男性運動員和女性運動員BMI的影響程度也不相同.因此,若不考慮對來自異質(zhì)總體的數(shù)據(jù)進(jìn)行分類研究,得到的結(jié)果可能是不準(zhǔn)確甚至是錯誤的.

        5 結(jié) 論

        與其他文獻(xiàn)所提出的模型相比,本文提出的模型有以下方面的優(yōu)勢:

        1)建立的混合回歸模型可以同時對各異質(zhì)總體進(jìn)行參數(shù)估計,這一點在實際問題中有很重要的意義.

        2)基于偏正態(tài)數(shù)據(jù)的特征,對中位數(shù)進(jìn)行建模并進(jìn)行參數(shù)估計,相比于傳統(tǒng)的均值模型的參數(shù)估計更加靈活.

        模擬研究和實例分析結(jié)果表明:與現(xiàn)有的模型和參數(shù)估計方法相比,本文提出的混合偏正態(tài)中位數(shù)回歸模型具有較大的靈活性,能夠很好的結(jié)合實際數(shù)據(jù)進(jìn)行分析.本文提出的模型及參數(shù)估計方法具有實用性和有效性.

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        亚洲永久精品ww47永久入口| 久久伊人精品一区二区三区| 无码人妻一区二区三区在线视频| 毛片免费在线观看网址| 在线免费观看亚洲天堂av| 成人免费av色资源日日| 国产精品成人网站| 国产精品一区二区久久精品| 嗯啊 不要 啊啊在线日韩a| 青青青爽在线视频免费播放| 一本加勒比hezyo无码专区| 在线va免费看成| 色婷婷精品综合久久狠狠| 国产女人精品一区二区三区 | 欧美午夜精品久久久久久浪潮 | 婷婷四房播播| 国产精品狼人久久久影院| 亚洲国产精品中文字幕久久| 国产后入又长又硬| 欧美成人免费观看国产| 人妻少妇粉嫩av专区一| 老太婆性杂交视频| 福利视频一二三在线观看| 成人国产在线观看高清不卡| 久久亚洲免费精品视频| 欧美日韩亚洲中文字幕二区| 东京热久久综合久久88| 一区二区三区岛国av毛片| 午夜少妇高潮在线观看| 男男受被攻做哭娇喘声视频| 毛片av在线播放亚洲av网站| 精品国产女主播一区在线观看 | 久久精品国产免费一区二区三区 | 国产精品免费久久久久影院仙踪林 | 亚洲羞羞视频| 精品专区一区二区三区| 亚洲最新无码中文字幕久久| 全免费a级毛片| 一本色道久久综合狠狠躁中文| 91视色国内揄拍国内精品人妻 | 无码人妻丰满熟妇区五十路百度|