亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Gibbs-DA算法的貝葉斯分位回歸模型研究*

        2014-09-18 03:35:30朱慧明曾昭法任英華李招來
        關(guān)鍵詞:分位指數(shù)分布后驗

        朱慧明,翁 元,曾昭法,任英華,李招來

        (1.湖南大學(xué) 工商管理學(xué)院,湖南 長沙 410082;2.湖南大學(xué) 金融與統(tǒng)計學(xué)院,湖南 長沙 410079)

        回歸分析模型是實踐中應(yīng)用廣泛的一類統(tǒng)計模型,如果模型中的隨機擾動項來自均值為零而且同方差的分布,回歸系數(shù)的OLS估計具有最佳線性無偏性,并且,如果隨機擾動項服從正態(tài)分布,回歸系數(shù)的OLS估計量和ML估計為最小方差無偏估計.但是,在現(xiàn)實社會經(jīng)濟系統(tǒng)中,這些假設(shè)條件通常難以得到滿足,例如,數(shù)據(jù)可能出現(xiàn)尖峰或厚尾分布和異方差等問題,此時OLS估計量不再具有上述優(yōu)良性.為了彌補OLS估計方法的不足之處, Koenker和Bassett[1]提出了分位回歸模型的建模思想.與OLS方法相比,分位回歸通過加權(quán)誤差絕對值之和最小化方法得到參數(shù)的估計,這些估計量不容易受到異常值的影響,穩(wěn)健性強.分位回歸模型在金融風(fēng)險度量、時間序列和生存分析等領(lǐng)域中獲得了廣泛應(yīng)用[2-5].

        分位回歸模型參數(shù)估計方法很多,例如,對偶單純形估計算法、內(nèi)點法和外點法等.但是,它們是建立在經(jīng)典統(tǒng)計理論基礎(chǔ)之上,參數(shù)是固定不變常數(shù).為了考慮參數(shù)不確定性問題,Yu和Moyeed[6],Tony和Sung[7],Tsionas[8]和曾惠芳[9]等利用MCMC抽樣方法構(gòu)建貝葉斯分位模型.但是,它們沒有研究模型參數(shù)的隨機抽樣問題.本文利用Gibbs抽樣和數(shù)據(jù)擴展(Data Augmentation,DA)算法,構(gòu)建基于Gibbs-DA抽樣算法的貝葉斯分位回歸模型,解決模型參數(shù)不確定性風(fēng)險問題.

        1 非對稱Laplace分布的混合表示

        定義1如果隨機變量U具有如下密度函數(shù):

        (1)

        則稱U服從位置參數(shù)μ,尺度參數(shù)σ和偏度參數(shù)τ的非對稱Laplace分布,記作U~ALD(μ,σ,τ).特別地,當(dāng)μ=0,σ=1時,記作U~ALD(τ).如果隨機變量U服從非對稱Laplace分布ALD(μ,σ,τ),則它的數(shù)學(xué)期望和方差如下:

        U的特征函數(shù)為:

        (2)

        非對稱Laplace分布與指數(shù)分布、正態(tài)分布之間存在密切關(guān)系:服從非對稱Laplace分布的隨機變量可以用指數(shù)分布、正態(tài)分布的隨機變量的函數(shù)來表示.如果U1,U2分別服從指數(shù)分布Exp(1)和正態(tài)分布N(0,1),并且兩者相互獨立,記:

        (3)

        (4)

        這就是μ=0,σ=1時非對陣Laplace分布的特征函數(shù).根據(jù)特征函數(shù)的唯一性定理可知:U~ALD(τ).

        2 貝葉斯分位回歸算法

        假設(shè)y與p維變量x之間具有線性函數(shù)關(guān)系:

        y=x'β+ε

        (5)

        此處β=(β1,β2,…,βp)',隨機誤差項ε的概率分布函數(shù)為F.顯然,對于給定的x,隨機變量y的τ分位數(shù)等于x'β+F-1(τ),即:

        Qy(τ|x,β)=x'β+F-1(τ)

        (6)

        其等價形式為:

        Qy(τ|x,β(τ))=x'β(τ)

        (7)

        此處β(τ)=(β1(τ),β2(τ),…,βm(τ))',也就是說,β(τ)與分位數(shù)τ的取值大小有關(guān).

        假設(shè)(x1,y1),(x2,y2),…,(xn,yn)是(x,y)的一組觀察值,則β(τ)的估計為:

        (8)

        其中ρτ(u)=u(τ-I(u<0))為損失函數(shù),I(u<0)為示性函數(shù).由于

        (9)

        等價于

        (10)

        而后者恰好是非對稱Laplace變量的聯(lián)合分布密度函數(shù)的核,因此,根據(jù)非對陣Laplace分布的性質(zhì),分位回歸建模問題可以進一步轉(zhuǎn)化為

        i=1,2,…,n

        (11)

        中的參數(shù)β(τ);此處zi,ui相互獨立,zi服從標(biāo)準(zhǔn)指數(shù)分布Exp(1),ui服從標(biāo)準(zhǔn)正態(tài)分布;模型(8)稱為數(shù)據(jù)擴展模型,zi稱為潛變量(latent variable).

        則模型(8)可以簡化為如下矩陣形式:

        (12)

        L(Y|X;Z,β(τ))

        (13)

        由于Z的分量相互獨立,并且均服從標(biāo)準(zhǔn)指數(shù)分布Exp(1),其概率分布密度函數(shù)

        (14)

        為了進行貝葉斯分析,需要進一步設(shè)置分位回歸模型參數(shù)的先驗分布.根據(jù)文獻[10]的觀點,選擇如下均值向量β0,協(xié)方差陣Σ0的多元正態(tài)分布作為模型參數(shù)β(τ)的先驗分布,即

        β(τ)~Np(β0,Σ0),β0∈Rp,Σ0>0

        (15)

        此處β0,Σ0可以由Koenker的經(jīng)典分位回歸方法確定.根據(jù)貝葉斯定理,潛變量和參數(shù)的后驗分布密度與似然函數(shù)、先驗分布密度的乘積成正比,即:

        (16)

        為了能夠進行MCMC抽樣算法,研究潛變量和參數(shù)完全條件后驗分布.

        1)參數(shù)β(τ)的完全條件后驗分布.通過π(β(τ),Z|Y,X)關(guān)于β(τ)的積分運算,獲得Z的邊緣后驗分布密度函數(shù)π(Z|Y,X),據(jù)此計算β(τ)的完全條件后驗分布密度函數(shù)π(β(τ)|Y,X'Z).不難驗證:參數(shù)β(τ)的完全條件后驗分布密度函數(shù)為

        (17)

        顯然,β(τ)的完全條件后驗分布是均值μβ(τ),協(xié)方差陣Στ的正態(tài)分布,即

        (β(τ)|Y,X;Z)~Np(μβ(τ),Στ)

        (18)

        2)潛變量U的完全條件后驗分布.同樣地,通過π(β(τ),Z|Y,X)關(guān)于Z的積分運算,求出參數(shù)β(τ)的邊緣后驗分布密度函數(shù)π(β(τ)|Y,X),據(jù)此進一步計算Z的完全條件后驗分布密度函數(shù)π(Z|Y,X;β(τ)).對于給定的Y,X和β(τ),Z的完全條件后驗分布密度函數(shù)為:

        (19)

        (zi|Y,X;β(τ))~GIG(1/2,χi,ψ),

        i=1,2,…,n

        (20)

        其分布密度函數(shù)為

        π(Z|Y,X;β(τ))

        其中

        根據(jù)潛變量Z和模型參數(shù)β(τ)的完全后驗條件分布,確定貝葉斯分位回歸模型的MCMC抽樣步驟:

        Step 1.設(shè)置參數(shù)β(τ)的初始值β(0)(τ),以及樣本量lN.并且,假設(shè)(Z(j-1),β(j-1)(τ))為(Z,β(τ))的第j-1次抽樣結(jié)果;

        以上是基于Gibbs-DA抽樣的單鏈條算法.當(dāng)然,為了便于分析Markov鏈的平穩(wěn)性,也利用Gibbs-DA抽樣同時生成β(τ)的多條鏈.例如,給定β(τ)的m個初始值{β(i0)(τ),i=1,2,…,m},生成如下m個長度為lN的Markov鏈:

        然后,根據(jù)Gelman-Rubin收斂診斷檢驗統(tǒng)計量分析Markov鏈{β(ij)(τ),i=1,…,m;j=1,…,lN}的收斂性問題.如果Gelman-Rubin檢驗統(tǒng)計量的取值介于1.0到1.2之間,則鏈條達到平穩(wěn)狀態(tài),此時利用樣本{(Z(i, lj),β(i, lj)(τ)),i=1,2,…,m;j=M+1,M+2,…,N},對模型參數(shù)進行統(tǒng)計推斷,求出模型參數(shù)點估計及置信水平1-α的區(qū)間估計,并對模型進行擬合分析.

        3 實證研究

        作為上述方法的應(yīng)用,我們考慮我國歷年能源消耗彈性的貝葉斯分位回歸問題.模型變量包括能源消耗總量(y,單位:萬噸標(biāo)準(zhǔn)煤)、國內(nèi)生產(chǎn)總值(GDP,單位:億元),以及第二產(chǎn)業(yè)所占比重(P,單位:%)數(shù)據(jù)研究.?dāng)?shù)據(jù)來源于歷年 《中國統(tǒng)計年鑒》、《中國能源統(tǒng)計年鑒》,涉及全國30個省市自治區(qū)(不含西藏),同時,為了便于比較分析,GDP數(shù)據(jù)按2005年價格計算.能源消耗總量、國內(nèi)生產(chǎn)總值和第二產(chǎn)業(yè)所占比重之間存在如下關(guān)系:

        ln (y)=β0+β1ln (GDP)+β2ln (P)+ε

        此處P=GDP2/GDP×100;β1表示能源消耗的GDP彈性系數(shù),而β2為能源消耗的產(chǎn)業(yè)結(jié)構(gòu)彈性系數(shù).

        首先,利用2010年全國30個地區(qū)的數(shù)據(jù),分別建立3個分位點(τ=0.25,0.50和0.75)的貝葉斯分位回歸模型.為此,運用Quantreg初步估計分位回歸模型系數(shù),并將估計結(jié)果作為貝葉斯分位回歸模型參數(shù)先驗分布的均值向量;同時,參數(shù)先驗分布的協(xié)方差矩陣如下:Σ0=diag(1 000,1 000,1 000).為獲得模型參數(shù)的貝葉斯估計,通過運用R2WinBUGS軟件,對每個參數(shù)模擬生成兩條Markov鏈,每條Markov鏈的迭代次數(shù)均為100 000次,以確保Markov鏈的收斂性.在MCMC模擬初始階段,Markov鏈取值可能與參數(shù)的初始值選擇有關(guān),為此,舍棄每條鏈的前50 000次抽樣結(jié)果,利用余下的50 000次數(shù)據(jù)進行統(tǒng)計分析.表1給出了分位回歸模型系數(shù)的貝葉斯估計結(jié)果.

        表1 分位回歸模型參數(shù)的貝葉斯估計結(jié)果

        根據(jù)表1所列出的計算結(jié)果,0.25分位點的GDP彈性系數(shù)為0.681 2,也就是說,在產(chǎn)業(yè)結(jié)構(gòu)保持不變的條件下,GDP增加大于1%,能源消耗總量增加0.681 2%;0.75分位點的GDP彈性系數(shù)為0.491 2,低于0.25分位點的估計值;與能源消耗的GDP彈性系數(shù)情況不同,0.75分位點的產(chǎn)業(yè)結(jié)構(gòu)彈性系數(shù)的取值為1.016 0,大于0.25分位點的產(chǎn)業(yè)結(jié)構(gòu)彈性系數(shù).為了能夠從時間維度和不同分位點兩個方面分析能源消耗總量與GDP、產(chǎn)業(yè)結(jié)構(gòu)之間的關(guān)系,利用2001-2009年的統(tǒng)計數(shù)據(jù),根據(jù)前面的建模思路,進一步構(gòu)建0.25,0.50和0.75三個分位點的貝葉斯分位回歸分析模型,合計27個模型.

        表2匯總了2001-2010年能源消耗的GPD彈性系數(shù),即:30個分位回歸模型系數(shù) 的估計,該表最后一列等于(β1(0.25)-β1(0.75))/β1(0.75)×100. 從時間維度來看,2001-2010年3個分位點的GDP彈性系數(shù)變化不大,但是,0.75分位點的GDP彈性系數(shù)明顯小于0.25分位點的彈性系數(shù).由于0.75分位點代表能源消費量較高的地區(qū),主要是東部地區(qū);而0.25分位點代表能源消費量低的地區(qū),主要是中、西部地區(qū).這說明我國東部整體單位經(jīng)濟增長所消耗的能源少于中、西部整體單位經(jīng)濟增長所消耗的能源,東部的能源利用率和節(jié)能力度優(yōu)于中、西部.

        表2 2001-2010年能源消耗的GDP彈性系數(shù)

        表3匯總了2001-2010年能源消耗的產(chǎn)業(yè)結(jié)構(gòu)彈性系數(shù),即:30個分位回歸模型系數(shù)β2的估計,該表的最后一列等于(β2(0.75)-β2(0.25))/β2(0.25)×100. 從時間維度來看,2001-2010年三個分位點的產(chǎn)業(yè)結(jié)構(gòu)彈性系數(shù)下降趨勢明顯,但是,與GDP彈性系數(shù)情況不同,0.75分位點的產(chǎn)業(yè)結(jié)構(gòu)彈性系數(shù)大于0.25分位點的彈性系數(shù).這說明2001-2010年東部的高產(chǎn)出相對西部來說是依靠高能耗實現(xiàn)的.

        表3 2001-2010年能源消耗的產(chǎn)業(yè)結(jié)構(gòu)彈性系數(shù)

        4 結(jié) 論

        本文討論了貝葉斯線性分位回歸模型的構(gòu)建、MCMC仿真分析及其應(yīng)用問題.通過模型的統(tǒng)計結(jié)構(gòu)分析,根據(jù)非對稱Laplace分布的正態(tài)—指數(shù)分布的混合表示性質(zhì),利用服從指數(shù)分布的潛變量,據(jù)此獲得模型的似然函數(shù),推斷了多元正態(tài)先驗分布條件下分位回歸模型參數(shù)的后驗分布,證明了潛變量的完全條件分布為廣義逆高斯分布.在此基礎(chǔ)上,根據(jù)MCMC仿真分析思想,設(shè)計了貝葉斯分位回歸模型的Gibbs-DA隨機抽樣步驟及統(tǒng)計分析.利用我國2001-2010年期間各地區(qū)的能源消耗總量,GDP和產(chǎn)業(yè)結(jié)構(gòu)數(shù)據(jù)進行實證分析,研究結(jié)果表明,貝葉斯方法可以有效地應(yīng)用于分位回歸建模問題.

        [1]KOENKER R, BASSETT G. Regression quantiles[J]. Econometrica, 1978, 46(1): 33-50.

        [2]WOLTERS M H. Estimating monetary policy reaction functions using quantile regressions[J]. Journal of Macroeconomics, 2012, 34(2): 342-361.

        [3]BAUR D G , DIMPFL T, JUNG R C. Stock return autocorrelations revisited: A quantile regression approach[J]. Journal of Empirical Finance, 2012, 19(2): 254-265.

        [4]FITZENBERGER B F, KOENKER R, MACHADO J A F. Economic applications of quantile regression[M]. Heidelberg: Sprink, 2002:135-148.

        [5]羅幼喜,田茂再.面板數(shù)據(jù)的分位回歸方法及其模擬研究[J]. 統(tǒng)計研究, 2010, 27(10): 81-87.

        LUO You-xi,TIAN Mao-zai. Quantile regression for panel data and its simulation study [J]. Statistical Research, 2010, 27(10): 81-87.(In Chinese)

        [6]YU K M, MOYEED R A. Bayesian quantile regression[J]. Statistics & Probability Letters, 2001, 54(4): 437-447.

        [7]TONY L, SUNG J J. Bayesian quantile regression methods[J]. Journal of Applied Econometrics, 2010, 25(2): 287-307.

        [8]TSIONAS E G. Bayesian quantile inference[J]. Journal of Statistical Computation and Simulation,2003,73(9): 659 - 674.

        [9]曾惠芳,朱慧明,李素芳,等.基于MH算法的貝葉斯分位自回歸模型[J].湖南大學(xué)學(xué)報:自然科學(xué)版,2010,37(2):88-92.

        ZENG Hui-fang, ZHU Hui-ming, LI Su-fang,etal.Bayesian inference on the quantile autoregressive models with MH algorithm[J]. Journal of Hunan University: Natural Sciences, 2010,37(2):88-92. (In Chinese)

        [10]ALHAMZAWI R, YU K M. Power prior elicitation in bayesian quantile regression[J]. Journal of Probability and Statistics, 2011, 3(1): 1-16.

        猜你喜歡
        分位指數(shù)分布后驗
        基于兩階段Expectile回歸的風(fēng)險保費定價
        當(dāng)前市場位置和潛在空間
        基于對偶理論的橢圓變分不等式的后驗誤差分析(英)
        貝葉斯統(tǒng)計中單參數(shù)后驗分布的精確計算方法
        一種基于最大后驗框架的聚類分析多基線干涉SAR高度重建算法
        基于“業(yè)績與薪酬雙對標(biāo)”的國有企業(yè)負責(zé)人薪酬研究
        西部論叢(2017年10期)2017-02-23 06:31:36
        指數(shù)分布抽樣基本定理及在指數(shù)分布參數(shù)統(tǒng)計推斷中的應(yīng)用
        二元Weinman型指數(shù)分布隨機變量之和、差、積、商及比率的分布
        一個有效估計:半?yún)?shù)非時齊擴散模型的局部線性復(fù)合分位回歸估計
        基于貝葉斯后驗?zāi)P偷木植可鐖F發(fā)現(xiàn)
        少妇久久久久久人妻无码| 天堂视频一区二区免费在线观看| 中文字幕人妻av一区二区| 香蕉成人伊视频在线观看| 精品无码久久久久成人漫画| 一本到无码AV专区无码| 国产精品美女自在线观看| 久久久精品国产视频在线| 国产精品成人一区二区在线不卡| 国产精品成熟老女人| 久久久久亚洲av无码专区首jn| 成人国产午夜在线视频| 精品丝袜一区二区三区性色| 最好的99精品色视频大全在线| 午夜影视免费| 特级婬片国产高清视频| 人妻av一区二区三区av免费| 中文字幕一区二区三区| 女人高潮内射99精品| 白嫩少妇激情无码| 久久久久久无中无码| 性色国产成人久久久精品二区三区 | 亚洲国产成人一区二区精品区| 影音先锋男人站| 国产主播在线 | 中文| 女同亚洲一区二区三区精品久久| 国产精品区一区二区三在线播放| 欧美黑人疯狂性受xxxxx喷水| 婷婷亚洲国产成人精品性色| av在线资源一区二区| 永久免费视频网站在线| 国产亚洲精品久久久闺蜜 | 亚洲精品久久激情国产片| 无码人妻精品一区二区三区在线 | 日本精品国产1区2区3区| 成年人观看视频在线播放| 精品偷拍被偷拍在线观看| 91久久青青草原免费| 男女男生精精品视频网站 | 激情内射日本一区二区三区| 欧美成人在线A免费观看|