亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        嶺回歸分析在解決經(jīng)濟(jì)數(shù)據(jù)共線性問題中的應(yīng)用

        2018-08-24 02:52:22
        經(jīng)濟(jì)研究導(dǎo)刊 2018年22期
        關(guān)鍵詞:共線性回歸系數(shù)回歸方程

        王 銳

        (上海理工大學(xué) 管理學(xué)院,上海 200093)

        引言

        多元線性回歸模型是處理數(shù)據(jù)常用的方法,但經(jīng)濟(jì)數(shù)據(jù)集中高維數(shù)據(jù)頻繁地出現(xiàn),使得經(jīng)典線性回歸統(tǒng)計(jì)方法受到較大沖擊。較高維數(shù)據(jù)常會(huì)出現(xiàn)多重共線性問題[1]。多重共線性不是模型設(shè)定的錯(cuò)誤,但使用傳統(tǒng)的最小二乘法(OLS,Ordinary Least Squares)處理這類經(jīng)濟(jì)數(shù)據(jù)時(shí),往往會(huì)出現(xiàn)回歸系數(shù)計(jì)算不穩(wěn)定、模型解釋性較差、預(yù)測準(zhǔn)確性較低等問題[2]。目前,嶺回歸(Ridge Regression)是處理嚴(yán)重共線性常用方法[2]。Hoerl于1962年最早提出嶺回歸,這是一種改進(jìn)的最小二乘估計(jì)法,到1970年,Hoerl&Kennard對該方法進(jìn)行了更詳細(xì)的討論[3]。

        一、多重共線性檢驗(yàn)

        一般,多元回歸模型假設(shè)各個(gè)預(yù)測變量之間沒有很強(qiáng)的依賴關(guān)系,即模型[4]:

        或用矩陣形式表示:

        預(yù)測變量 X1,X2,…,Xp是相互獨(dú)立,或(X′X)不接近奇異矩陣,但當(dāng)預(yù)測變量間存在較強(qiáng)的線性關(guān)系,稱之為(多重)共線性問題。通常,多重共線性問題的產(chǎn)生有如下原因:經(jīng)濟(jì)變量相關(guān)的共同趨勢;滯后變量的引入;樣本資料的限制[4]。

        方差膨脹因子(VIF,Variance Inflation Factor)[2]是度量共線性常用的方法,VIF是回歸系數(shù)OLS估計(jì)平方誤差之和的期望與正交條件下期望的比值,定義式為:

        通常帶截距項(xiàng)OLS回歸,VIFj取值從1到無窮大。當(dāng)VIFj=1時(shí),認(rèn)為模型中各變量間沒有任何線性關(guān)系,當(dāng)VIFj值逐漸增大,變量之間逐步走向共線性,當(dāng)VIFj>10時(shí),認(rèn)為模型存在多重共線性[2]。

        二、嶺回歸分析

        (一)嶺回歸參數(shù)估計(jì)

        對于回歸模型,當(dāng)預(yù)測變量具有較高的共線性時(shí),嶺回歸提供了一種有效的估計(jì)方法,其基本思想[2]是:對回歸模型進(jìn)行中心化和標(biāo)準(zhǔn)化處理,建立模型:

        其中,響應(yīng)變量 Z=(Z1,Z2,Zj,…,Zp),Zj是原始數(shù)據(jù),是通過以下變換所得:

        那么嶺回歸正規(guī)方程組變?yōu)椋?/p>

        由上式中解得參數(shù)α估計(jì)為:

        上式中,嶺參數(shù)K值選取準(zhǔn)則是調(diào)和總方差和偏倚兩者的關(guān)系,過小或過大都會(huì)導(dǎo)致估計(jì)誤差擴(kuò)大[2]。常用方法包括固定點(diǎn)方法、迭代方法、嶺跡法[2],其中,嶺跡法是一種圖像方法,通過觀察嶺跡圖選取合適的K值。一般要求各嶺回歸系數(shù)估計(jì)值基本穩(wěn)定,即嶺跡平穩(wěn)。

        (二)嶺回歸進(jìn)行變量選擇

        實(shí)際應(yīng)用中,回歸模型所涉及的預(yù)測變量往往不是事先確定的,確定一組優(yōu)秀的變量子集不僅能更清晰地解釋預(yù)測變量和響應(yīng)變量之間的關(guān)系,同時(shí)能提高預(yù)測精度。

        嶺回歸能產(chǎn)生一個(gè)系數(shù)穩(wěn)定的回歸方程,借鑒嶺跡法進(jìn)行變量剔除,該剔除過程有兩個(gè)準(zhǔn)則[2]:第一準(zhǔn)則,刪去那些系數(shù)穩(wěn)定但絕對值很小的預(yù)測變量;第二準(zhǔn)則,剔除那些不穩(wěn)定但是回歸系數(shù)θ^j(K)隨著K值的變大而趨向于0的變量。

        第一次嶺回歸剔除一個(gè)或幾個(gè)變量后,可重復(fù)以上過程,直到剩下的變量嶺跡穩(wěn)定,最后運(yùn)用OLS對所選變量進(jìn)行回歸,但若所保留變量仍有共線性,可考慮使用嶺回歸方法進(jìn)行參數(shù)估計(jì),建立嶺回歸模型。

        三、實(shí)例分析

        實(shí)例分析為我國就業(yè)情況與相關(guān)經(jīng)濟(jì)指標(biāo)的關(guān)系,數(shù)據(jù)為1997—2016年的宏觀經(jīng)濟(jì)數(shù)據(jù),源于《中國統(tǒng)計(jì)年鑒》[5]。指標(biāo)選擇參考Longley數(shù)據(jù)集[6],設(shè)定1個(gè)響應(yīng)變量和5個(gè)預(yù)測變量組成的宏觀經(jīng)濟(jì)數(shù)據(jù)集,包含就業(yè)人員(萬人)(Y)、年份(X1)、人均國內(nèi)生產(chǎn)總值(元)(X2)、年末總?cè)丝冢ㄈf人)(X3)、法人單位數(shù)(個(gè))(X4)、城鎮(zhèn)登記失業(yè)人數(shù)(萬人)(X5)。

        本文為研究以上5個(gè)變量對就業(yè)人員的影響,擬建立多元線性回歸模型,即:

        (一)OLS估計(jì)及共線性檢驗(yàn)

        為了確保模型設(shè)定合理性及預(yù)測結(jié)果有效性,需要對模型進(jìn)行回歸診斷。首先,使用SPSS軟件運(yùn)用OLS回歸分析,結(jié)果(見表 1)。

        表1 數(shù)據(jù)OLS回歸分析結(jié)果

        由表1可得,用OLS擬合線性回歸方程為:

        雖然從表1中R2來看,模型解釋性很好,同時(shí)標(biāo)準(zhǔn)化殘差檢驗(yàn)顯示出模型無明顯誤設(shè)問題,但OLS擬合回歸方程中p值及部分系數(shù)符號并不合理。

        所以,考慮把兩兩預(yù)測變量的散點(diǎn)圖排成矩陣圖1)。通過散點(diǎn)圖—相關(guān)系數(shù)矩陣觀察可得,各指標(biāo)相關(guān)系數(shù)都在0.75以上,散點(diǎn)圖基本都呈線性模式。

        圖1 散點(diǎn)圖—相關(guān)系數(shù)矩陣

        再使用SPSS軟件中共線性檢驗(yàn)功能,可以得到各變量方差膨脹因子:

        該經(jīng)濟(jì)數(shù)據(jù)的VIF值的變化范圍為21—4 792,預(yù)測變量VIF值均大于10,由檢查數(shù)據(jù)集中預(yù)測變量的相關(guān)系數(shù),方差膨脹因子VIF,都說明該數(shù)據(jù)存在嚴(yán)重的多重共線性,必須采取措施消除共線性的影響。

        (二)變量選擇

        運(yùn)用SPSS軟件實(shí)現(xiàn)對經(jīng)濟(jì)數(shù)據(jù)嶺回歸分析,嶺參數(shù)K的取值從0~0.2,間隔為0.005,共記錄了40個(gè)嶺參數(shù)取值,做嶺跡圖。對全部5個(gè)變量嶺跡進(jìn)行分析,發(fā)現(xiàn)嶺跡比較雜亂,且變量之間存在高度線性關(guān)系,故首先考慮剔除部分變量。

        根據(jù)選擇變量準(zhǔn)則,先考慮剔除X4,因?yàn)闃?biāo)準(zhǔn)化回歸系數(shù)估計(jì)變化較穩(wěn)定,但絕對值趨于0;當(dāng)K=0時(shí),變量X3的標(biāo)準(zhǔn)回歸系數(shù)最大,但當(dāng)K增加時(shí)迅速下降,變量X1則變化相反,且當(dāng)K增大后,X1、X3與X5嶺跡幾乎重合,三者相關(guān)系數(shù)達(dá)到0.94以上,三個(gè)變量可近似合并為一,故試著保留X3。最終,去掉X1、X4、X5(剔除這 3 個(gè)變量不違反經(jīng)濟(jì)常識(shí))。再次,進(jìn)行嶺回歸分析,生成2變量的嶺跡圖,圖中嶺跡基本穩(wěn)定。最終,選擇人均國內(nèi)生產(chǎn)總值(元)(X2)、年末總?cè)丝冢ㄈf人)(X3)作為模型預(yù)測變量。

        圖2 5變量嶺跡圖

        圖3 變量X1、X3嶺跡圖

        (三)嶺估計(jì)

        在剔除X1、X4、X5之后,保留變量之間仍存在一定線性關(guān)系,計(jì)算得X2、X3的OLS回歸系數(shù)方差膨脹因子接近10,分別為 VIF2=9.55,VIF3=9.55。

        故對保留變量進(jìn)行嶺回歸分析,通過兩變量嶺跡來看,當(dāng)K值達(dá)到0.7~0.9的范圍時(shí),各個(gè)θj(K)(j=2,3)大體上趨于穩(wěn)定,選取嶺參數(shù)K=0.8,計(jì)算可得嶺回歸結(jié)果(見表 2)。

        表2 嶺回歸分析結(jié)果(K=0.8)

        由表2最終獲得嶺回歸方程:X2、X3系數(shù)更加合理。同時(shí),嶺回歸后各變量的方差膨脹因子極大地降低,VIFj(0.1)<10(j=2,3),表示非共線性狀態(tài)。

        并且,從表2中結(jié)果可知,2預(yù)測變量數(shù)據(jù)變異總和占響應(yīng)變量變異的84.4%。雖然,該占比不及OLS回歸,但嶺回歸后

        (四)誤差分析

        求得經(jīng)濟(jì)數(shù)據(jù)集的嶺回歸方程后,將實(shí)際總就業(yè)人數(shù)Y與模型預(yù)測值Y^進(jìn)行對比,可得到該模型平均相對誤差(MRE,Mean Relative Error):

        式中,yi為第i個(gè)樣本的實(shí)際值為通過嶺回歸模型求得對應(yīng)的預(yù)測值。由(11)式求得MRE為0.97%,這意味著基于嶺回歸建立的模型誤差較小,擬合效果較好。

        結(jié)語

        將多元回歸模型應(yīng)用于經(jīng)濟(jì)數(shù)據(jù)時(shí),若該數(shù)據(jù)集存在多重共線性,OLS無法進(jìn)行有效的估計(jì)和預(yù)測,而嶺回歸方法引入正數(shù)K修正OLS正規(guī)方程組,通過一種有偏估計(jì)方法,消除多重共線性對模型的影響。在實(shí)例分析時(shí),首先對宏觀經(jīng)濟(jì)數(shù)據(jù)集進(jìn)行模型假設(shè)檢驗(yàn),在模型設(shè)定無誤情況下,運(yùn)用變量相關(guān)矩陣圖、VIF對共線性進(jìn)行診斷,在確定數(shù)據(jù)存在嚴(yán)重共線性后,運(yùn)用嶺跡圖剔除變量,再進(jìn)行嶺回歸?;貧w結(jié)果通過顯著性檢驗(yàn)且消除了共線性的影響,同時(shí)模型誤差小,擬合效果較好。

        但嶺回歸參數(shù)的選擇原則和方法存在一定主觀性,沒有明確的含義,所以選擇變量時(shí)需要特別謹(jǐn)慎,要靈活運(yùn)用嶺回歸方法,如比較剔除不同變量子集的回歸效果。當(dāng)然,對于共線性問題可根據(jù)具體情況采用其他方法,如主成分分析、Lasso 回歸[7]等。

        猜你喜歡
        共線性回歸系數(shù)回歸方程
        采用直線回歸方程預(yù)測桑癭蚊防治適期
        線性回歸方程的求解與應(yīng)用
        線性回歸方程要點(diǎn)導(dǎo)學(xué)
        銀行不良貸款額影響因素分析
        文氏圖在計(jì)量統(tǒng)計(jì)類課程教學(xué)中的應(yīng)用
        ——以多重共線性內(nèi)容為例
        走進(jìn)回歸分析,讓回歸方程不再是你高考的絆腳石
        不完全多重共線性定義存在的問題及其修正建議
        多元線性回歸的估值漂移及其判定方法
        電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
        多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時(shí)Bayes估計(jì)及優(yōu)良性
        国产亚洲精品久久情侣| 中字幕久久久人妻熟女| 思思99热| av网址不卡免费在线观看| 日本av一级视频在线观看| 中文字幕av久久亚洲精品| 国产又粗又黄又爽的大片| 欧美巨大性爽| 精品无码国产一二三区麻豆| 精品亚洲av一区二区| 极品一区二区在线视频观看| 亚洲成aⅴ人片久青草影院| 久久久精品人妻一区二区三区四 | 国产最新一区二区三区天堂| 亚洲乱码中文字幕综合69堂| 丁香婷婷六月综合缴清| 久久99精品久久久久久噜噜| 欧洲精品免费一区二区三区| 亚洲VA中文字幕欧美VA丝袜| 男女羞羞的视频免费网站| 国语对白在线观看免费| 后入到高潮免费观看| 中国xxx农村性视频| 人妻少妇精品无码专区app| 亚洲一区二区视频免费看| 天堂网av一区二区三区在线观看| 久久视频在线| 国产成人免费a在线视频| 亚洲av一二三又爽又爽又色| 国内自拍偷国视频系列| 久久只精品99品免费久23| 亚洲精品国偷拍自产在线观看蜜臀| 久久亚洲精品成人综合| 中文字幕有码在线亚洲 | 每天更新的免费av片在线观看| 亚洲综合综合在线| 日本女优中文字幕亚洲| 狠狠摸狠狠澡| 性动态图av无码专区| 丰满人妻一区二区乱码中文电影网| 一本色道88久久加勒比精品|