王秀文,王景旭
(1.溫州大學數學與信息科學學院,浙江溫州 325035;
2.華中農業(yè)大學經濟管理學院,湖北武漢 430000)
分位數回歸與局部線性回歸的估計的穩(wěn)健性比較研究
王秀文1,王景旭2
(1.溫州大學數學與信息科學學院,浙江溫州 325035;
2.華中農業(yè)大學經濟管理學院,湖北武漢 430000)
在介紹分位數回歸估計方法理論和局部線性回歸估計方法理論的基礎上,分別建立模型分析了2008 – 2011年我國通貨膨脹和海關進出口總額之間的關系,結果表明:分位數回歸估計方法具有更加穩(wěn)健的特點;在研究通貨膨脹和海關進出口總額之間關系時,使用分位數回歸模型更加有效.
分位數回歸;局部線性回歸;通貨膨脹;海關進出口總額;穩(wěn)健性
分位數回歸自提出以來在經濟、金融、醫(yī)學、教育等領域得到了廣泛的應用,它本身屬于一種半參數回歸估計的方法,而且它的穩(wěn)健性在理論上和應用方面都得到了證實.但是,有關其穩(wěn)健性與其他估計方法比較的研究還相對較少,本文用分位數回歸估計的方法與局部線性回歸估計的方法分析了2008 – 2011年我國的通貨膨脹和海關進出口總額之間的關系,以便比較哪一模型的穩(wěn)健性更好.
分位數回歸模型[1-2]是關于因變量的條件分位數和自變量之間線性關系的估計方法,即由分位數取0 – 1之間的任何值來調節(jié)回歸平面的位置和轉向,讓自變量估計不同分位數的因變量.它在一定程度上代表所有數據的信息,特別是特定區(qū)域(如極端位置)的數據.
在不同的τ下就能得到不同的分位數函數.隨著τ從0取到1即可得到所有z在x上條件分布的一簇曲線;而且隨著計算機技術的發(fā)展,求回歸系數b(τ)的各種算法現(xiàn)在也可以通過統(tǒng)計軟件實現(xiàn).
不變窗寬的局部線性估計是局部化的線性回歸模型加權的最小二乘估計,在局部用直線來近似曲線,因此,不變窗寬局部線性估計在內點處的收斂速度和邊界點處的一樣,即不存在邊界效應的問題.
下面我們只給出解釋變量為隨機變量的不變窗寬的估計性質.
3.1 數據的來源及說明
居民消費價格指數是反映通貨膨脹的重要指標.本文用居民消費價格指數來代替通貨膨脹指標.記CPI為居民消費價格指數,TIE為海關商品進出口總額(億美元).采用2008年01月份到2011年06月份42個月的月度資料,運用分位數回歸方法和局部線性回歸方法分別對通貨膨脹與海關進出口總額的關系進行實證分析.相關的居民消費價格指數資料取自宏觀財經-鳳凰網(http://app.finance.ifeng.com/data/mac/jmxf.php),要將該數據轉換成基期相同(按照國家統(tǒng)計局公布的物價指數以2000年價格為基期)的可比價格數;海關商品進出口額資料來自東方財富網(http://data.eastmoney.com/cjsj/hgjck.html).居民消費價格指數CPI和海關商品進出口總額TIE的月度數據如表1所示:
表1 居民消費價格指數CPI和海關商品進出口總額TIE(億美元)的月度數據
2008年05月 107.7 2213.1 2010年02月 102.7 1814.3 2008年06月 107.1 2215.9 2010年03月 102.4 2314.6 2008年07月 106.3 2480.7 2010年04月 102.8 2381.6 2008年08月 104.9 2408.7 2010年05月 103.1 2439.9 2008年09月 104.6 2434.6 2010年06月 102.9 2547.7 2008年10月 104.0 2214.2 2010年07月 103.3 2623.1 2008年11月 102.4 1898.9 2010年08月 103.5 2585.7 2008年12月 101.2 1833.4 2010年09月 103.6 2731.0 2009年01月 101.0 1417.9 2010年10月 104.4 2448.1 2009年02月 98.4 1249.5 2010年11月 105.1 2837.6 2009年03月 98.8 1620.2 2010年12月 104.6 2952.2 2009年04月 98.5 1707.4 2011年01月 104.9 2950.1 2009年05月 98.6 1641.3 2011年02月 104.9 2007.8 2009年06月 98.3 1825.7 2011年03月 105.4 3042.6 2009年07月 98.2 2002.1 2011年04月 105.3 2999.5 2009年08月 98.8 1917.0 2011年05月 105.5 3012.7 2009年09月 99.2 2189.4 2011年06月 106.4 3016.9
3.2 分位數回歸理論建模
考慮我國居民消費價格指數(CPI)與海關進出口總額(TIE)之間的線性關系,采用一元條件分位數回歸模型:
下面我們只給出中位數回歸的模型及最小二乘回歸估計的結果:
從(12)式、(13)式可以看出OLS回歸的均值要高于中位數回歸的模型估計,當分位數τ的值分別取0.01,0.05,0.09,0.1,0.2,0.25,0.5,0.75,0.8,0.85,0.90,0.95,0.99時,所得的結果如圖1所示①主要考慮在極端值的情況下, 分位數回歸估計的效果如何, 所以選擇比較偏向左尾和右尾的數據..
觀察圖1可得,對于局部線性回歸估計未能很好的反映出的奇異值的變化情況,分位數回歸在τ取遍0 – 1內的所有值時,尤其是在分位數τ足夠小或是逐漸接近于1時,我們可以看到,分位數回歸對極端值的估計擬合的更好.對于每一個分位數都可以很好的反映出局部的有針對性的信息,當τ走遍0到1時,就可以將整體數據的全面信息都反映出來了.
圖1 線性分位數回歸模型估計的擬合圖
當分位數較小時,對于同一個分位數,擬合直線的斜率為正,說明居民消費價格指數(CPI)隨海關進出口總額(TIE)的增加而增加;當分位數接近1時,擬合直線的斜率為負,表明隨著TIE的增加CPI反而降低了.當斜率為正且越來越小時,國家可根據TIE現(xiàn)狀對貨幣和財政政策進行相應的宏觀調控;當斜率為負且越來越小時,TIE對于CPI的影響在逐漸減小,國家也應相應減少針對貨幣和財政政策的調整.因此,國家可依據統(tǒng)計分析的結果,制定相應的政策.這樣建立的模型具有較強的實用性強,并隨著計算機技術的迅猛發(fā)展,對分位數回歸的實現(xiàn)已經有多款軟件可以實行,如Matlab,R,SAS,Stata等程序軟件和Eviews6.0等操作軟件.
3.3 局部線性回歸建模
利用所收集的有關通貨膨脹的數據(CPI指標來代替)和海關貿易進出口總額(TIE)的數據,建立模型(8)進行非參數的局部線性回歸估計(局部線性估計時用統(tǒng)計學軟件R[5]中的locfit()函數),得到的結果如圖2所示:
從圖2可以看出,局部線性回歸模型的斜率在一直變化,基本上把居民消費價格指數隨商品進出口總額的總體變化趨勢描述出來了.從擬合曲線上我們得到開始時當海關進出口總額增加時,曲線斜率為正,而且越來越大,CPI的大多數值就會不斷的上升;隨后斜率變?yōu)樨撝?,CPI的值總體上有下降的趨勢,隨后有所上升.但是,我們還可以看到在擬合曲線的上方數據和下方數據都沒有準確的擬合出來,這樣勢必會造成一部分信息的丟失,沒有完整的把奇異值的代表信息反映出來,建立的模型在穩(wěn)健性方面就會有些質疑了.
圖2 局部線性回歸的估計擬合圖
在介紹分位數回歸模型和局部線性回歸模型理論的基礎上,并就這兩種模型對我國的海關進出口總額在通貨膨脹中的表現(xiàn)做了對比分析,由圖形得到,分位數回歸模型具有更加穩(wěn)定的特性.在研究通貨膨脹和海關進出口總額之間關系時,使用分位數回歸模型更加有效.
[1] 李育安. 分位數回歸及應用簡介[J]. 統(tǒng)計與信息論壇, 2006, 21(3): 35-38.
[2] Wang X W. The Two Comparative Study of Methods Based on the Financial Risk Empirical Analysis [C] // 吳仰儒,李延喜. 第三屆(2011)金融風險與公司金融國際研討會論文集. 大連: 大連理工大學出版社, 2011: 796-799.
[3] 葉阿忠. 非參數計量經濟學[M]. 天津: 南開大學出版社, 2003: 63-69.
[4] 王星. 非參數統(tǒng)計[M]. 北京: 清華大學出版社, 2009: 203-225.
[5] 湯銀才. R語言與統(tǒng)計分析[M]. 北京: 高等教育出版社, 2008: 7-68.
Comparison of Robustness in Estimation of Quantile Regression and Local Linear Regression
WANG Xiuwen1, WANG Jingxu2
(1. School of Mathematics and Information Science, Wenzhou University, Wenzhou, China 325035;
2. School of Economics and Management, Huazhong Agricultural University, Wuhan, China 430000)
Based on the introduction of theory of quantile regression estimation method and of local linear regression estimation method, separate models were established to analyze relations between China’s inflation and volume of customs import and export from 2008 to 2011. Results showed that: while quantile regression estimation method is more robust; in study of relations between inflation and the volume of customs import and export, quantile regression model is more effective.
Quantile Regression; Local Linear Regression; Inflation; Volume of Customs Import and Export; Robustness
O212
A
1674-3563(2012)06-0007-06
10.3875/j.issn.1674-3563.2012.06.002 本文的PDF文件可以從xuebao.wzu.edu.cn獲得
(編輯:封毅)
2011-12-21
王秀文(1985- ),女,山東聊城人,碩士研究生,研究方向:應用統(tǒng)計