亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機(jī)器學(xué)習(xí)理論在商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)影響因素度量中的應(yīng)用研究

        2018-07-10 10:09:26吳金旺顧洲一
        財(cái)務(wù)與金融 2018年3期
        關(guān)鍵詞:區(qū)域性銀行指標(biāo)

        吳金旺 顧洲一

        一、引 言

        金融是國(guó)之重器,在現(xiàn)代經(jīng)濟(jì)體系中處于核心地位,伴隨著我國(guó)供給側(cè)結(jié)構(gòu)性改革的全面深化,大數(shù)據(jù)、云金融、區(qū)塊鏈、物聯(lián)網(wǎng)等新型金融科技技術(shù)創(chuàng)新及應(yīng)用不斷深化,金融科技為經(jīng)濟(jì)產(chǎn)業(yè)供給側(cè)改革資金來(lái)源提供更加多元、精準(zhǔn)的渠道,也推動(dòng)金融產(chǎn)品供給側(cè)結(jié)構(gòu)性改革,促進(jìn)我國(guó)金融市場(chǎng)的發(fā)展與活躍,金融產(chǎn)品的內(nèi)涵和外延不斷豐富,尤其是第三方支付、互聯(lián)網(wǎng)基金銷(xiāo)售、P2P網(wǎng)貸、股權(quán)眾籌、互聯(lián)網(wǎng)銀行、互聯(lián)網(wǎng)保險(xiǎn)、互聯(lián)網(wǎng)信托、互聯(lián)網(wǎng)消費(fèi)金融等互聯(lián)網(wǎng)金融模式的出現(xiàn)以及云計(jì)算、區(qū)塊鏈等新技術(shù)的出現(xiàn),對(duì)國(guó)內(nèi)銀行業(yè)的穩(wěn)定性帶來(lái)了明顯的沖擊,傳統(tǒng)存、貸、匯等方面業(yè)務(wù)質(zhì)量和數(shù)量下降。同時(shí)在資本約束深化、金融脫媒和利率市場(chǎng)化加速的市場(chǎng)環(huán)境下,銀行利潤(rùn)空間受到擠壓,傳統(tǒng)銀行業(yè)務(wù)面臨著巨大的挑戰(zhàn)。為了應(yīng)對(duì)新時(shí)代、新金融形勢(shì)下的改革,實(shí)現(xiàn)“去產(chǎn)能、去庫(kù)存、去杠桿、降成本、補(bǔ)短板”五大任務(wù)目標(biāo),積極響應(yīng)“后峰會(huì)”時(shí)期大力發(fā)展數(shù)字普惠金融的理念,在這種鯰魚(yú)效應(yīng)下,商業(yè)銀行以互聯(lián)網(wǎng)化變革來(lái)探索新路徑,獨(dú)立發(fā)展金融科技部門(mén),或者購(gòu)買(mǎi)社會(huì)服務(wù)技術(shù)外包,行企合作,全面借助技術(shù)提高金融服務(wù)范圍,為推進(jìn)區(qū)域協(xié)同、城鄉(xiāng)一體化發(fā)展、全面實(shí)現(xiàn)小康社會(huì)貢獻(xiàn)社會(huì)責(zé)任。

        銀行是經(jīng)營(yíng)貨幣的企業(yè),本質(zhì)上也是經(jīng)營(yíng)風(fēng)險(xiǎn)的特殊企業(yè),通過(guò)經(jīng)營(yíng)承擔(dān)風(fēng)險(xiǎn),獲得相應(yīng)盈利,是銀行生存和發(fā)展的最基本模式。時(shí)代在快速變化,如何適應(yīng)時(shí)代要求,包括經(jīng)營(yíng)環(huán)境、政府監(jiān)管、國(guó)際金融秩序等,及時(shí)、有效、充分、準(zhǔn)確的識(shí)別、計(jì)量、預(yù)警和防控風(fēng)險(xiǎn)是商業(yè)銀行經(jīng)營(yíng)管理的永恒主題。

        銀行業(yè)面臨的風(fēng)險(xiǎn)主要來(lái)自于兩個(gè)方面:一是宏觀經(jīng)濟(jì)因素的沖擊,二是銀行體系自身的脆弱性,而這兩個(gè)因素除了可能引發(fā)單個(gè)銀行風(fēng)險(xiǎn),并通過(guò)風(fēng)險(xiǎn)傳染性,造成區(qū)域性和系統(tǒng)性的風(fēng)險(xiǎn)(劉春航和朱元倩,2011)。當(dāng)前的銀行風(fēng)險(xiǎn)評(píng)價(jià)包括單一銀行風(fēng)險(xiǎn)的微觀評(píng)價(jià)分析和對(duì)一國(guó)整體性風(fēng)險(xiǎn)的宏觀評(píng)價(jià)研究,在宏觀行政區(qū)域領(lǐng)域,理論很少涉及。實(shí)踐中,每一家銀行都有自己的風(fēng)險(xiǎn)評(píng)估模型,但對(duì)區(qū)域性風(fēng)險(xiǎn)卻無(wú)能為力。我國(guó)地域廣闊、經(jīng)濟(jì)發(fā)展不平衡,經(jīng)濟(jì)呈現(xiàn)出很強(qiáng)的集聚性,比如長(zhǎng)三角、珠三角,中部地區(qū)、西部地區(qū),各行政區(qū)域內(nèi)的銀行風(fēng)險(xiǎn)并不是隨機(jī)的,很容易受到空間外溢作用影響,具有較強(qiáng)的內(nèi)在關(guān)聯(lián),同時(shí)又是國(guó)家銀行金融系統(tǒng)性風(fēng)險(xiǎn)的基本構(gòu)成部分,所以宏觀視角來(lái)研究是非常有必要的(高旺東,2012)。

        在我國(guó)商業(yè)銀行金融機(jī)構(gòu)實(shí)行總分支行制度,均存在典型的區(qū)域集中性特征。以大型國(guó)有商業(yè)銀行郵儲(chǔ)銀行為例,作為銀行業(yè)體系中重要的組成部分,擁有近4萬(wàn)個(gè)實(shí)體網(wǎng)點(diǎn),70%以上分布在縣域地區(qū),以服務(wù)地方經(jīng)濟(jì)為宗旨,屬于具有強(qiáng)區(qū)域性特征的金融機(jī)構(gòu)。當(dāng)風(fēng)險(xiǎn)小范圍的局限于一家或者幾家空間相鄰的郵儲(chǔ)銀行時(shí),其表現(xiàn)特征為個(gè)別銀行風(fēng)險(xiǎn)。但是,由于郵儲(chǔ)銀行在總行層面,至上而下的具有明確統(tǒng)一的戰(zhàn)略定位(服務(wù)社區(qū)、服務(wù)中小企業(yè)、服務(wù)“三農(nóng)”),具有相對(duì)統(tǒng)一的風(fēng)險(xiǎn)管理體系,相鄰地區(qū)的資產(chǎn)負(fù)債結(jié)構(gòu)、主營(yíng)客戶群體、小微企業(yè)行業(yè)屬性等方面具有較高的相似性,所以當(dāng)受宏觀經(jīng)濟(jì)因素、技術(shù)變革等外部沖擊,或者說(shuō)自身經(jīng)營(yíng)內(nèi)控能力差、經(jīng)營(yíng)脆弱性的內(nèi)部影響時(shí),很容易導(dǎo)致相鄰區(qū)域或者屬性類(lèi)似地區(qū)的郵儲(chǔ)銀行發(fā)生風(fēng)險(xiǎn),從而引發(fā)區(qū)域性風(fēng)險(xiǎn),更為嚴(yán)重者將產(chǎn)生系統(tǒng)性金融風(fēng)險(xiǎn)。各省市數(shù)量眾多的城市商業(yè)銀行和農(nóng)村商業(yè)銀行業(yè)務(wù)更加集中,難以做好分散化經(jīng)營(yíng),區(qū)域因素更加明顯。

        本文結(jié)合現(xiàn)有文獻(xiàn)和大數(shù)據(jù)因素構(gòu)建指標(biāo),從宏觀經(jīng)濟(jì)的角度和微觀銀行自身的角度入手,通過(guò)機(jī)器學(xué)習(xí)的方法對(duì)大規(guī)模和多維度的歷史數(shù)據(jù)進(jìn)行建模挖掘,從理論上預(yù)測(cè)區(qū)域性風(fēng)險(xiǎn)發(fā)生的可能性,探索區(qū)域性風(fēng)險(xiǎn)的影響因素,為商業(yè)銀行推動(dòng)區(qū)域性風(fēng)險(xiǎn)管理提供指導(dǎo),為監(jiān)管部門(mén)借助大數(shù)據(jù)實(shí)現(xiàn)非現(xiàn)場(chǎng)監(jiān)管提供借鑒。

        二、文獻(xiàn)綜述

        科學(xué)地、深入的發(fā)現(xiàn)和挖掘商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)的影響因素,實(shí)現(xiàn)風(fēng)險(xiǎn)提前有效預(yù)警是有效預(yù)防和控制銀行風(fēng)險(xiǎn)的客觀方法,一直以來(lái)受到了學(xué)界和監(jiān)管者的高度重視,在實(shí)際操作過(guò)程中,每家銀行、各分支機(jī)構(gòu)也都會(huì)形成自己特有的經(jīng)驗(yàn),但系統(tǒng)性、科學(xué)性明顯不強(qiáng),主要依賴主觀判斷。目前,國(guó)內(nèi)學(xué)術(shù)界關(guān)于銀行區(qū)域性風(fēng)險(xiǎn)的文獻(xiàn)相對(duì)較少,尤其是實(shí)證研究類(lèi)的文獻(xiàn)更少。僅有錢(qián)水土等(2016)基于Z省81家農(nóng)村信用社2006-2012年風(fēng)險(xiǎn)數(shù)據(jù),得到可以通過(guò)增加資本充足率和生產(chǎn)總值增長(zhǎng),來(lái)規(guī)避區(qū)域性風(fēng)險(xiǎn)。

        (一)風(fēng)險(xiǎn)預(yù)警模型應(yīng)用的演變

        自上個(gè)世紀(jì)80年代以來(lái),銀行體系規(guī)模不斷擴(kuò)大,銀行經(jīng)營(yíng)更加多元化,銀行危機(jī)在全球范圍內(nèi)頻繁爆發(fā),從貨幣信用危機(jī)到銀行危機(jī)再到金融危機(jī),最后引發(fā)經(jīng)濟(jì)危機(jī),對(duì)世界經(jīng)濟(jì)發(fā)展造成了嚴(yán)重的沖擊,同時(shí)銀行破產(chǎn)、清算或倒閉的現(xiàn)象也頻頻發(fā)生,由此大量學(xué)者對(duì)其展開(kāi)實(shí)證研究(Peek and Rosengren,2000;Canbas et al.,2005)。從已有研究文獻(xiàn)來(lái)看,預(yù)警模型眾多,比如:一元判別分析(SDA)、多元判別分析(MDA)、Z評(píng)分模型等,離散選擇Probit回歸模型、Logit回歸模型已經(jīng)成為判別銀行早期風(fēng)險(xiǎn)的主要方法。Martin(1977)首次將Logit模型應(yīng)用于銀行破產(chǎn)影響模型構(gòu)建之中,以1970-1977美聯(lián)儲(chǔ)成員銀行中58家困難銀行為樣本,從25個(gè)財(cái)務(wù)指標(biāo)中選取8個(gè)財(cái)務(wù)比率建立了Logit模型,以此對(duì)分析對(duì)象進(jìn)行風(fēng)險(xiǎn)評(píng)估和決策。Demirgüc-Kunt和 Detragiache(1999)通過(guò)建立多元Logit模型,發(fā)現(xiàn)如果實(shí)際利率、通貨膨脹率較高、GDP增長(zhǎng)率較低,會(huì)顯著提高銀行危機(jī)發(fā)生概率,另外一些因素比如財(cái)政赤字、貿(mào)易沖擊以及貨幣貶值對(duì)銀行危機(jī)基本沒(méi)有影響。Probit模型與Logit模型在很多地方是類(lèi)似的,區(qū)別在于在Probit模型中,假設(shè)條件之一是標(biāo)準(zhǔn)正態(tài)分布是量化積分,Logit模型能夠比較不同因素的重要性(Demirgüc-Kunt and Detragiache,1999;Davis and Karim,2008)。綜合來(lái)看,在分析銀行風(fēng)險(xiǎn)影響因素時(shí),Logit模型具有獨(dú)特優(yōu)勢(shì),是當(dāng)前最為主流的方法之一,而且Logit模型中的Logistic分布更為簡(jiǎn)單,現(xiàn)實(shí)應(yīng)用更為廣泛,同時(shí)也更加容易被解釋?zhuān)↘liestik et al.,2015)。

        隨著大數(shù)據(jù)時(shí)代的迅速到來(lái),數(shù)據(jù)維度和數(shù)據(jù)體量爆炸式的增長(zhǎng),特別是出現(xiàn)了很多非結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)統(tǒng)計(jì)分析模型的局限制越發(fā)明顯,比如:(1)處理變量間的相關(guān)性及共線性是建模之前的基本步驟,而當(dāng)變量個(gè)數(shù)變多到一定程度時(shí),處理過(guò)程就變得異常復(fù)雜;(2)統(tǒng)計(jì)方法一般先尋找自變量和因變量的相關(guān)性,繼而擬定相應(yīng)函數(shù)關(guān)系,但是當(dāng)因變量和自變量之間無(wú)法用函數(shù)進(jìn)行描述時(shí),則很難進(jìn)行深入研究;(3)很多情況下,傳統(tǒng)的統(tǒng)計(jì)方法依賴于一些前提假設(shè),而現(xiàn)實(shí)應(yīng)用中很多假設(shè)無(wú)法滿足,導(dǎo)致模型準(zhǔn)確性不高、穩(wěn)定性無(wú)法保障、解釋能力弱(張萬(wàn)軍,2016)。機(jī)器學(xué)習(xí)技術(shù)由于不受到變量分布假設(shè)的約束,擁有良好的魯棒性 和泛化性,所以目前將機(jī)器學(xué)習(xí)與傳統(tǒng)統(tǒng)計(jì)模型相結(jié)合成為了學(xué)界和互聯(lián)網(wǎng)企業(yè)的關(guān)注點(diǎn)。

        (二)區(qū)域性風(fēng)險(xiǎn)的量化

        區(qū)域性風(fēng)險(xiǎn)可以理解為在某一個(gè)特定區(qū)域內(nèi),由于一些金融機(jī)構(gòu)組織的金融活動(dòng)從而引發(fā)金融損失的現(xiàn)象。在研究商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)時(shí),國(guó)外許多學(xué)者將法律意義上的銀行是否破產(chǎn)定義為被解釋變量,采用Logit模型,即將銀行破產(chǎn)定義為1,反之設(shè)定為 0(Avery and Hanweck,1984;Demirgü?-Kunt and Detragiache,2005)。然而與國(guó)外情況不同,國(guó)內(nèi)政府對(duì)銀行提供了隱性擔(dān)保,即使出現(xiàn)資不抵債的情況(所有者權(quán)益小于或者等于0),依然會(huì)正常運(yùn)行,因此國(guó)外采用法律破產(chǎn)定義區(qū)域性風(fēng)險(xiǎn)的模式并無(wú)法在國(guó)內(nèi)實(shí)行?;诖耍瑖?guó)內(nèi)學(xué)者在研究銀行風(fēng)險(xiǎn)時(shí)采用了替代方法,林平等(2001)將是否被擠兌作為銀行風(fēng)險(xiǎn)的衡量指標(biāo),這在我國(guó)銀行從國(guó)有經(jīng)濟(jì)體制向市場(chǎng)經(jīng)濟(jì)體制過(guò)渡時(shí),具有一定的科學(xué)合理性性。然而,陳鑫云(2017)根據(jù)國(guó)內(nèi)銀行深化改革后的現(xiàn)狀,認(rèn)為擠兌事件作為虛擬變量具有很大的局限性,不能客觀的量化銀行破產(chǎn)的概念,并創(chuàng)新地提出了以經(jīng)濟(jì)破產(chǎn)的概念作為虛擬因變量來(lái)研究銀行區(qū)域性風(fēng)險(xiǎn)和系統(tǒng)性風(fēng)險(xiǎn)。本文借鑒最新的研究成果,采用以經(jīng)濟(jì)破產(chǎn)為虛擬變量,用權(quán)益資產(chǎn)比率來(lái)代表發(fā)生區(qū)域性風(fēng)險(xiǎn)的概率。

        (三)區(qū)域性風(fēng)險(xiǎn)的影響因素

        目前大多數(shù)文獻(xiàn)都以系統(tǒng)性風(fēng)險(xiǎn)為入手點(diǎn),分別從宏觀經(jīng)濟(jì)層面或微觀內(nèi)部角度來(lái)探究其風(fēng)險(xiǎn)影響因素,并沒(méi)有能夠?qū)烧呔C合考慮;同時(shí)系統(tǒng)性風(fēng)險(xiǎn)與區(qū)域性風(fēng)險(xiǎn)聯(lián)系緊密,其影響因素相似度極高(錢(qián)水土等,2016)。從宏觀經(jīng)濟(jì)層面來(lái)看,主要有以下四大類(lèi)指標(biāo):第一類(lèi)是信貸存量指標(biāo),主要有信貸增長(zhǎng)率(Bordo and Meissner,2012)和信貸與GDP之比(Davis et al.,2012),這類(lèi)指標(biāo)通常會(huì)被滯后 i階,其結(jié)果也不盡相同。第二類(lèi)是資產(chǎn)價(jià)格,由于近些年房產(chǎn)在投資中的比例很高,直接影響了社會(huì)經(jīng)濟(jì)方方面面的運(yùn)行,研究過(guò)程中運(yùn)用最多的是房地產(chǎn)價(jià)格波動(dòng)數(shù)據(jù)(王春麗等,2014),其次就是股票數(shù)據(jù)(股市收益率、價(jià)格波動(dòng)率),雖然此類(lèi)數(shù)據(jù)可獲性相對(duì)容易,但是實(shí)際效果并不好(Schularick et al.,2009)。第三類(lèi)是GDP指標(biāo),該指標(biāo)由于容易獲得,且相對(duì)準(zhǔn)確,被廣泛應(yīng)用,但是各類(lèi)研究結(jié)果卻又呈現(xiàn)完全相反的兩個(gè)方面,一方面經(jīng)濟(jì)增速突然放慢,銀行壞賬增加,緊跟著發(fā)生銀行危機(jī)(Hagen et al.,2007),另一方面是經(jīng)濟(jì)增長(zhǎng)與銀行危機(jī)并沒(méi)有必然的聯(lián)系(Rose et al.,2012)。第四類(lèi)是對(duì)外經(jīng)濟(jì)指標(biāo),例如:外貿(mào)依存度(王春麗等,2014)、對(duì)外開(kāi)放程度(張紹樂(lè),2017)以及國(guó)際資本流動(dòng)等(Jordàet al.,2011)。此外,還有財(cái)政赤字、地方政府債務(wù)增長(zhǎng)率、M2乘數(shù)、高利率等也被用來(lái)作為相關(guān)指標(biāo)(王春麗等,2014;Kauko,2014)。

        從銀行微觀內(nèi)部角度來(lái)看,早期國(guó)外大多數(shù)文獻(xiàn)構(gòu)建的指標(biāo)主要以銀行的資產(chǎn)負(fù)債表和損益表為主(Martin,1977;Avery and Hanweck,1984)。Demirg ü?-Kunt(1989)較早的發(fā)現(xiàn)資產(chǎn)質(zhì)量、資本充足率、收益水平是影響銀行區(qū)域性風(fēng)險(xiǎn)的重點(diǎn)指標(biāo)。國(guó)內(nèi),仲彬等(2002)對(duì)區(qū)域性風(fēng)險(xiǎn)指標(biāo)提出了理論探索,提出了兼顧流動(dòng)性、盈利性、安全性等方面的指標(biāo)構(gòu)建,并從理論上構(gòu)建了風(fēng)險(xiǎn)預(yù)警系統(tǒng)。之后大量的國(guó)內(nèi)學(xué)者對(duì)區(qū)域性風(fēng)險(xiǎn)防范作出巨大的貢獻(xiàn)(鄭凱華,2014;陳強(qiáng),2014;黃學(xué)軍,2015;錢(qián)水土等,2016)。

        隨著互聯(lián)網(wǎng)特別是移動(dòng)互聯(lián)網(wǎng)的普及,以網(wǎng)絡(luò)信息技術(shù)為代表的科技與產(chǎn)業(yè)迅速萌發(fā),大量的網(wǎng)絡(luò)信息能夠被采集、篩選、利用。近年來(lái),有相當(dāng)多的文獻(xiàn)討論了網(wǎng)絡(luò)信息對(duì)金融決策行為的影響。Karlan(2005)提供了網(wǎng)絡(luò)信息影響個(gè)體信貸決策的證據(jù)。Zhang等(2011)分析每條Twitter所包含的積極情緒和消極情緒,構(gòu)建一個(gè)自變量(總Twitter數(shù)量中包含情緒的Twitter數(shù)量占的比例)發(fā)現(xiàn)這個(gè)自變量與芝加哥期權(quán)交易所波動(dòng)率指數(shù)顯著正相關(guān),但與標(biāo)普500指數(shù)、納斯達(dá)克指數(shù)以及道瓊斯指數(shù)均顯著負(fù)相關(guān)。國(guó)內(nèi)學(xué)者金雪軍等(2013)利用文本挖掘技術(shù)來(lái)處理非結(jié)構(gòu)化數(shù)據(jù),探討中小投資者在股票論壇的討論與股票收益率與成交量之間的相關(guān)關(guān)系。楊曉蘭等(2016)以新浪財(cái)經(jīng)博客為數(shù)據(jù)來(lái)源,利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)實(shí)時(shí)爬取網(wǎng)絡(luò)博客數(shù)據(jù),定量描述投資者基于博客進(jìn)行社會(huì)互動(dòng)的程度及其情緒傾向,進(jìn)一步檢驗(yàn)了行為金融學(xué)中社交互動(dòng)對(duì)股票市場(chǎng)的影響。國(guó)內(nèi)外學(xué)者已有的研究充分表明了網(wǎng)絡(luò)信息對(duì)金融行為的重要性,同時(shí)隨著黨的十九大行動(dòng)綱領(lǐng)和發(fā)展藍(lán)圖的出臺(tái),明確提出要建設(shè)“網(wǎng)絡(luò)強(qiáng)國(guó)、數(shù)字中國(guó)和智慧社會(huì)”,推動(dòng)數(shù)字化和實(shí)體經(jīng)濟(jì)深度融合,認(rèn)識(shí)到數(shù)據(jù)的價(jià)值并深入挖掘,有效利用網(wǎng)絡(luò)信息必將成為未來(lái)金融研究的熱點(diǎn)。對(duì)于區(qū)域性風(fēng)險(xiǎn)來(lái)說(shuō),傳統(tǒng)的風(fēng)險(xiǎn)指標(biāo)構(gòu)建中缺乏具有網(wǎng)絡(luò)信息的代表性影響因素,目前尚未有學(xué)者對(duì)其展開(kāi)深入研究。本文將對(duì)傳統(tǒng)風(fēng)險(xiǎn)指標(biāo)進(jìn)行優(yōu)化,并加入網(wǎng)絡(luò)信息指標(biāo)(例如:互聯(lián)網(wǎng)輿情數(shù)據(jù)、微信、微博、博客以及交易類(lèi)、社交類(lèi)APP的行為數(shù)據(jù))來(lái)刻畫(huà)區(qū)域性風(fēng)險(xiǎn)的影響因素。

        雖然銀行區(qū)域性風(fēng)險(xiǎn)的系統(tǒng)性還不夠,但學(xué)術(shù)界對(duì)區(qū)域金融風(fēng)險(xiǎn)的研究由來(lái)已久,并提出很多科學(xué)客觀的規(guī)避風(fēng)險(xiǎn)的方法。本文在學(xué)習(xí)借鑒現(xiàn)有文獻(xiàn)資料的基礎(chǔ)上,通過(guò)選取科學(xué)、合理、適時(shí)的區(qū)域經(jīng)濟(jì)金融發(fā)展特點(diǎn)的評(píng)價(jià)指標(biāo),構(gòu)建相對(duì)完整、多元化的銀行區(qū)域風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系,為做好銀行區(qū)域風(fēng)險(xiǎn)識(shí)別、計(jì)量和控制打好基礎(chǔ)。

        三、商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)指標(biāo)體系構(gòu)建

        本文參照國(guó)內(nèi)外文獻(xiàn),將區(qū)域性風(fēng)險(xiǎn)影響指標(biāo)分為宏觀經(jīng)濟(jì)和商業(yè)銀行內(nèi)部?jī)纱箢?lèi),同時(shí)利用爬蟲(chóng)等現(xiàn)代信息技術(shù),在傳統(tǒng)金融指標(biāo)的基礎(chǔ)引入最新的網(wǎng)絡(luò)信息因素。

        (一)宏觀經(jīng)濟(jì)指標(biāo)

        從宏觀經(jīng)濟(jì)指標(biāo)來(lái)看,本文主要考慮外部發(fā)展環(huán)境對(duì)區(qū)域性風(fēng)險(xiǎn)的影響因素,并以月度為時(shí)間單位,以省或者市為樣本區(qū)域分界。從以下4個(gè)角度來(lái)刻畫(huà):

        第一:經(jīng)濟(jì)總量

        金融風(fēng)險(xiǎn)是否會(huì)發(fā)生跟經(jīng)濟(jì)環(huán)境密切相關(guān),本文采用GDP增長(zhǎng)率代表經(jīng)濟(jì)發(fā)展環(huán)境,預(yù)期該指標(biāo)與商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)具有負(fù)相關(guān)系數(shù)。不同銀行在業(yè)務(wù)發(fā)展過(guò)程中,均有側(cè)重點(diǎn),一二三產(chǎn)業(yè)分布呈現(xiàn)一定的特征。以郵儲(chǔ)銀行為例,致力于服務(wù)三農(nóng),而隨著現(xiàn)代化的進(jìn)步,農(nóng)業(yè)占整個(gè)經(jīng)濟(jì)體系的比重有所下降,這也是使得郵儲(chǔ)銀行服務(wù)三農(nóng)的潛在風(fēng)險(xiǎn)可能也會(huì)相應(yīng)增加?;卩]儲(chǔ)銀行扎根三農(nóng)、服務(wù)三農(nóng)的特點(diǎn),可以將第一產(chǎn)業(yè)在生產(chǎn)總值的比重納入指數(shù)模型中,預(yù)期該指標(biāo)與郵儲(chǔ)銀行的區(qū)域性風(fēng)險(xiǎn)具有正相關(guān)關(guān)系。如果是其他類(lèi)型的銀行,可以依據(jù)該銀行業(yè)務(wù)重點(diǎn)領(lǐng)域,選擇相應(yīng)的產(chǎn)業(yè)比重,納入該銀行的區(qū)域性風(fēng)險(xiǎn)指數(shù)中。

        第二:經(jīng)濟(jì)動(dòng)力

        經(jīng)濟(jì)發(fā)展離不開(kāi)政府,政府財(cái)政支出的增加有助于改善金融市場(chǎng)的環(huán)境,促進(jìn)經(jīng)濟(jì)健康發(fā)展,本文將財(cái)政支出增長(zhǎng)率作為指標(biāo)之一,預(yù)期其與商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)呈負(fù)相關(guān);固定資產(chǎn)投資是經(jīng)濟(jì)發(fā)展的重要引擎,同時(shí)由于現(xiàn)在我國(guó)融資結(jié)構(gòu)偏向于以銀行為主的間接融資,直接融資所占總?cè)谫Y比例較小,固定資產(chǎn)投資增長(zhǎng)大多數(shù)表現(xiàn)為日益增長(zhǎng)的銀行貸款需求,故本文以固定資產(chǎn)投資增長(zhǎng)率作為指標(biāo)之一,預(yù)期其與商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)。隨著國(guó)際化進(jìn)程的不斷深入,特別是東部沿海地區(qū)對(duì)外貿(mào)出口依存度較大,容易受到來(lái)自外部經(jīng)濟(jì)的影響,故本文考慮將外貿(mào)依存度納入指標(biāo)體系,預(yù)期該指標(biāo)與商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)。

        第三:區(qū)域性金融總量

        商業(yè)銀行的物理網(wǎng)點(diǎn)的建立和核心業(yè)務(wù)發(fā)展,受該地區(qū)金融環(huán)境影響很大。假如此區(qū)域貸款占生產(chǎn)總值的比重過(guò)大,那么貸款支持實(shí)體經(jīng)濟(jì)的效率將會(huì)下滑,貸款風(fēng)險(xiǎn)也會(huì)增加,同時(shí)過(guò)高的比重意味著后續(xù)貸款業(yè)務(wù)繼續(xù)增長(zhǎng)的可能性也在降低。本文采用該區(qū)域所有貸款占生產(chǎn)總值比重這一指標(biāo),預(yù)期該指標(biāo)與商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)關(guān)系。存款是商業(yè)銀行最主要的負(fù)債來(lái)源,隨著互聯(lián)網(wǎng)金融業(yè)務(wù)的發(fā)展,當(dāng)前銀行存款流失現(xiàn)象比較明顯,而存款可以為貸款等資產(chǎn)業(yè)務(wù)提供資金來(lái)源,存款的增加可以提高銀行存貸款比例,降低銀行流動(dòng)性風(fēng)險(xiǎn),本文采用該地區(qū)的存款增長(zhǎng)率作為指標(biāo),預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)兩者呈現(xiàn)負(fù)相關(guān)關(guān)系。當(dāng)然從另一個(gè)角度來(lái)看,貸款的增加有助于銀行增加收入,從而提高銀行風(fēng)險(xiǎn)覆蓋力,故本文采用該地區(qū)的貸款增長(zhǎng)率作為指標(biāo),預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈現(xiàn)負(fù)相關(guān)。此外,銀行理財(cái)業(yè)務(wù)的發(fā)展也會(huì)對(duì)區(qū)域性金融產(chǎn)生影響,本文將銀行理財(cái)杠桿率作為指標(biāo),預(yù)期該指標(biāo)與商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)關(guān)系。不同區(qū)域經(jīng)濟(jì)有著不同的行業(yè)特色,某地區(qū)的失業(yè)率增加,可能意味著這個(gè)地區(qū)相應(yīng)行業(yè)的衰退,借貸中的實(shí)際還款能力變?nèi)?,增加區(qū)域性風(fēng)險(xiǎn),本文采用失業(yè)率指標(biāo),預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)關(guān)系。同時(shí),由于近年來(lái)房地產(chǎn)市場(chǎng)持續(xù)火爆,其價(jià)格指數(shù)影響著銀行房貸業(yè)務(wù),而房貸業(yè)務(wù)的風(fēng)控也是銀行資產(chǎn)業(yè)務(wù)的主要關(guān)注點(diǎn),本文采用該地區(qū)房地產(chǎn)價(jià)格指數(shù),預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)關(guān)系。

        第四:互聯(lián)網(wǎng)情緒

        從網(wǎng)絡(luò)信息來(lái)看,隨著網(wǎng)絡(luò)爬蟲(chóng)等領(lǐng)域的快速發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)的采集越來(lái)越方便,谷歌利用網(wǎng)絡(luò)流感類(lèi)的搜索量來(lái)探究美國(guó)的流感看診量之間的關(guān)系,阿里利用淘寶數(shù)據(jù)分析平臺(tái)來(lái)挖掘潛在消費(fèi)力,可見(jiàn)互聯(lián)網(wǎng)數(shù)據(jù)的價(jià)值越來(lái)越重要。

        互聯(lián)網(wǎng)情緒指標(biāo)需要基于互聯(lián)網(wǎng)真實(shí)行為數(shù)據(jù),包括官方評(píng)論、各大論壇、百度貼吧、微博等的文本數(shù)據(jù)作為研究對(duì)象,利用情緒傾向分析進(jìn)行文本挖掘構(gòu)造互聯(lián)網(wǎng)情緒指標(biāo)。

        (1)媒體導(dǎo)向:利用爬蟲(chóng)技術(shù)對(duì)各大權(quán)威性財(cái)經(jīng)類(lèi)官網(wǎng)(例如:21經(jīng)濟(jì)網(wǎng)、網(wǎng)易財(cái)經(jīng)、人民網(wǎng)等)爬取網(wǎng)絡(luò)信息,并利用人工和計(jì)算機(jī)算法(例如:KNN)對(duì)爬取數(shù)據(jù)進(jìn)行分類(lèi),例如:

        表1 具有代表性的媒體標(biāo)題分類(lèi)

        本文將t日媒體報(bào)道中情緒傾向?yàn)椤胺e極”的新聞數(shù)量記為 M·post,“消極”的新聞數(shù)量記為 M·negt,情緒指數(shù)變量sentiment的構(gòu)造規(guī)則如下(Antweiler and Frank,2004):

        sentiment=ln[(1+M·post)/(1+M·negt) (公式1)

        當(dāng)一天內(nèi)積極情緒的媒體報(bào)道累計(jì)數(shù)量等于消極的數(shù)量時(shí),情緒指標(biāo)為零;當(dāng)積極情緒的媒體報(bào)道數(shù)量大于消極情緒報(bào)道數(shù)量時(shí),情緒指標(biāo)值大于零;反之,則小于零。由于本文考慮的對(duì)象以月度數(shù)據(jù)為最小時(shí)間單位,即可對(duì)每日的情緒指數(shù)進(jìn)行求和。本文采用媒體導(dǎo)向的情緒指數(shù)作為指標(biāo),預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈負(fù)相關(guān)。

        (2)網(wǎng)民情緒:寬帶的基礎(chǔ)設(shè)施已經(jīng)完善,移動(dòng)互聯(lián)網(wǎng)在智能手機(jī)的普及下迅速進(jìn)度全面化階段,互聯(lián)網(wǎng)已經(jīng)與人們的生活有機(jī)融合。截止到2017年5月,中國(guó)擁有7.51億網(wǎng)民,這是一個(gè)非常巨大的基數(shù),也是我國(guó)金融發(fā)展過(guò)程中難得的人口紅利。而隨著博客、微博、論壇以及貼吧等互聯(lián)網(wǎng)產(chǎn)品的落地,網(wǎng)民們有更加多元的途徑對(duì)周邊事物或者一些熱點(diǎn)話題進(jìn)行評(píng)論。本文利用爬蟲(chóng)技術(shù)爬取網(wǎng)民評(píng)論的文本信息,并利用計(jì)算機(jī)方法或人為方法對(duì)其進(jìn)行分類(lèi)(例子見(jiàn)表2),從而間接地反映了網(wǎng)民的情緒(方法同媒體導(dǎo)向的情緒指數(shù))。本文采用網(wǎng)民情緒指標(biāo),預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈負(fù)相關(guān)關(guān)系。

        表2 具有代表性的帖子分類(lèi)

        (二)銀行內(nèi)部層面指標(biāo)

        從商業(yè)銀行內(nèi)部層面來(lái)看,指標(biāo)的選取具體從以下5個(gè)角度來(lái)分析:

        第一、業(yè)務(wù)發(fā)展

        對(duì)于單一銀行來(lái)說(shuō),貸款業(yè)務(wù)的增加,意味著盈利能力在提升,化解風(fēng)險(xiǎn)的能力在增加。本文選取貸款增長(zhǎng)率指標(biāo),衡量銀行業(yè)務(wù)發(fā)展?fàn)顩r,預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈負(fù)相關(guān)關(guān)系。貸款能否收回、貸款的質(zhì)量如何,直接關(guān)系到銀行信貸風(fēng)險(xiǎn),本文考慮逾期率指標(biāo),預(yù)期該指標(biāo)與商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)關(guān)系。

        第二、業(yè)務(wù)結(jié)構(gòu)

        業(yè)務(wù)結(jié)構(gòu)實(shí)指不同類(lèi)型業(yè)務(wù)所占的比重,能否形成合理的業(yè)務(wù)結(jié)構(gòu)會(huì)影響銀行風(fēng)險(xiǎn)。在我國(guó),中間業(yè)務(wù)的發(fā)展比例還不夠高,貸款仍然是各家銀行主要業(yè)務(wù)。所以存貸差產(chǎn)生的利息收入是銀行最主要的收入,本文選擇非利息收入比重和貸款資產(chǎn)比兩個(gè)指標(biāo),預(yù)期兩者與銀行區(qū)域性風(fēng)險(xiǎn)均呈正相關(guān)的關(guān)系。而隨著普惠金融的落地以及P2P行業(yè)發(fā)展帶來(lái)的影響,傳統(tǒng)商業(yè)銀行也逐漸放寬了小微貸的標(biāo)準(zhǔn),本文將小微經(jīng)營(yíng)貸款用戶數(shù)納入指標(biāo)體系,預(yù)期該指標(biāo)與郵儲(chǔ)銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)。同時(shí),部分地區(qū)推出了符合區(qū)域特色的理財(cái)產(chǎn)品,故本文將區(qū)域性理財(cái)產(chǎn)品銷(xiāo)售量在總量的占比納入指標(biāo)體系,預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈負(fù)相關(guān)。

        第三、風(fēng)險(xiǎn)抵補(bǔ)

        發(fā)生風(fēng)險(xiǎn)后,銀行自身抵補(bǔ)能力是化解風(fēng)險(xiǎn)的有效保障,銀行核心資本和附屬資本、損失準(zhǔn)備金是彌補(bǔ)損失的天然屏障。本文選擇銀行資本充足率、不良貸款撥備覆蓋率這兩個(gè)指標(biāo),預(yù)期與銀行區(qū)域性風(fēng)險(xiǎn)均呈負(fù)相關(guān)關(guān)系。

        第四、收入盈利

        盈利能力除了與收入有關(guān),還取決于成本,通過(guò)控制成本能提升銀行的盈利能力,增強(qiáng)銀行風(fēng)險(xiǎn)抵補(bǔ)能力。本文采取成本收入比和凈資產(chǎn)收益率這兩個(gè)指標(biāo),預(yù)期與銀行區(qū)域性風(fēng)險(xiǎn)均呈負(fù)相關(guān)關(guān)系。

        第五、APP移動(dòng)端

        隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展與創(chuàng)新,商業(yè)銀行將業(yè)務(wù)拓展重點(diǎn)推向移動(dòng)端,通過(guò)APP提供更加便捷的金融理財(cái)服務(wù),與傳統(tǒng)線下網(wǎng)點(diǎn)運(yùn)營(yíng)有很大差別,成為全新的增長(zhǎng)點(diǎn)。關(guān)于APP行為數(shù)據(jù),通過(guò)用戶的開(kāi)戶行對(duì)移動(dòng)端后臺(tái)的數(shù)據(jù)進(jìn)行劃分,從而突顯區(qū)域特征。首先,用戶與客戶還是有差別的,客戶量是維持銀行發(fā)展的生命線,新金融形勢(shì)下購(gòu)買(mǎi)移動(dòng)理財(cái)產(chǎn)品的客戶量,可以用用戶的開(kāi)戶行來(lái)劃分,篩選出移動(dòng)端參與互聯(lián)網(wǎng)投資理財(cái)人數(shù),預(yù)期該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈負(fù)相關(guān)關(guān)系。再者,利用同一個(gè)時(shí)間段內(nèi)同一個(gè)開(kāi)戶行不同用戶借貸所選擇的期限,可以得到一個(gè)綜合的平均期限,即移動(dòng)端平均借款期限,預(yù)期該指標(biāo)與商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)呈正相關(guān)。由于很多銀行APP中的客戶之聲的欄目中對(duì)留言類(lèi)型設(shè)置為建議、投訴、表?yè)P(yáng)以及咨詢這四類(lèi),其中表?yè)P(yáng)代表著客戶積極的情緒,投訴代表著客戶消極的情緒,本文將構(gòu)建客戶之聲情緒指數(shù)變量(具體構(gòu)建方式與互聯(lián)網(wǎng)情緒一致),預(yù)計(jì)該指標(biāo)與銀行區(qū)域性風(fēng)險(xiǎn)呈負(fù)相關(guān)。

        (三)指標(biāo)體系

        機(jī)器學(xué)習(xí)(Machine Learning,ML)是隨著數(shù)據(jù)量的劇增,新興發(fā)展起來(lái)的一門(mén)多領(lǐng)域交叉型學(xué)科,通過(guò)計(jì)算機(jī)強(qiáng)大的功能來(lái)模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,從而獲取新的知識(shí),重新組織已有的知識(shí)結(jié)構(gòu)和技術(shù)技能,不斷改善自身性能。本文基于表3的兩大類(lèi)共26個(gè)指標(biāo),使用機(jī)器學(xué)習(xí)理論,結(jié)合隨機(jī)森林模型(Random Forests,RF)和Logistic模型,構(gòu)建RF-L模型,生成了一系列具有區(qū)域性風(fēng)險(xiǎn)評(píng)估能力的基分類(lèi)器(子模型),然后通過(guò)XGboost模型對(duì)具有不同風(fēng)險(xiǎn)評(píng)估能力的子模型進(jìn)行集成,最終增強(qiáng)模型的評(píng)估效果。

        表3 商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)影響因素

        (四)被解釋變量的構(gòu)建

        防范金融系統(tǒng)性風(fēng)險(xiǎn),全面深化金融改革,股份制改革有序開(kāi)展,金融機(jī)構(gòu)市場(chǎng)化退出機(jī)制日趨健全,體制日益完善,如果銀行長(zhǎng)期處于經(jīng)濟(jì)破產(chǎn)邊緣,將會(huì)逐步被法律化進(jìn)行破產(chǎn)重組或者處置。本文將經(jīng)濟(jì)破產(chǎn)定義為虛擬變量,設(shè)定研究現(xiàn)象包括發(fā)生和不發(fā)生銀行區(qū)域性風(fēng)險(xiǎn)這兩種情況,為進(jìn)行回歸分析,將Yit設(shè)為虛擬變量,其中i代表著個(gè)體,t代表著時(shí)間,當(dāng)該現(xiàn)象發(fā)生時(shí),Yit取1,反之則取0。鑒于事件發(fā)生的概率在0-1之間,引進(jìn)一個(gè)不可觀測(cè)的變量Zit來(lái)代替Yit,當(dāng)Zit大于0時(shí),Yit取1,反之則取0。本文定義Zit為區(qū)域性銀行的權(quán)益資產(chǎn)比率,公式為(所有者權(quán)益-不良貸款)/總資產(chǎn),其中錢(qián)水土(2016)將所有者權(quán)益定義為:實(shí)收資本、資本公積、盈余公積、一般風(fēng)險(xiǎn)準(zhǔn)備以及未分配利潤(rùn)的總和與未彌補(bǔ)歷年虧損的差值,并且將銀行破產(chǎn)的臨界值設(shè)定為0。該指標(biāo)對(duì)于區(qū)域性中小銀行實(shí)用,如果需要研究全國(guó)性的股份制銀行,建議以不良貸款率與該銀行全國(guó)不良貸款比率的平均值對(duì)比,來(lái)分析區(qū)域性風(fēng)險(xiǎn)是否發(fā)生。

        四、基于XGboost集成學(xué)習(xí)的區(qū)域性風(fēng)險(xiǎn)評(píng)估模型

        (一)基于互聯(lián)網(wǎng)文本的情緒指標(biāo)構(gòu)建

        根據(jù)知識(shí)獲取方式的不同,文本可以分為兩種,一種基于KE(knowledge engineering)的分類(lèi)系統(tǒng),另一種基于ML(maching learing)的分類(lèi)系統(tǒng)。ML是基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的文本分類(lèi)方法,優(yōu)勢(shì)體現(xiàn)在準(zhǔn)確性和穩(wěn)健性,因此本文采用基于ML的方式,文本情緒傾向分析的過(guò)程可分為以下幾個(gè)步驟,具體見(jiàn)圖1:

        圖1 文本分類(lèi)

        本文涉及的互聯(lián)網(wǎng)文本信息可以分為三類(lèi),媒體導(dǎo)向情緒、網(wǎng)民情緒和用戶情緒,大數(shù)據(jù)指標(biāo)構(gòu)建方法如下:

        STEP1:數(shù)據(jù)清洗

        第一步是數(shù)據(jù)清洗,通過(guò)數(shù)據(jù)清洗的工作可以對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理,提取與研究相關(guān)的關(guān)鍵字段信息。網(wǎng)民的原始數(shù)據(jù)和媒體導(dǎo)向數(shù)據(jù)預(yù)估主要會(huì)包含URL、發(fā)布時(shí)間、用戶昵稱、導(dǎo)航信息等各類(lèi)雜質(zhì)數(shù)據(jù),需要進(jìn)一步提取其中的發(fā)布時(shí)間、新聞主標(biāo)題、摘要、帖子名稱等關(guān)鍵信息字段。

        STEP2:訓(xùn)練集提取

        從全體樣本數(shù)據(jù)集中,隨機(jī)抽取40%信息作為訓(xùn)練集,對(duì)文本信息的情感傾向基于情感詞典進(jìn)行分類(lèi)。媒體、網(wǎng)民和用戶的文本信息處理相同。

        STEP3:SVM文本分類(lèi)模型訓(xùn)練

        基于訓(xùn)練數(shù)據(jù)集,形成SVM文本分類(lèi)模型。

        STEP4:應(yīng)用測(cè)試集

        根據(jù)STEP3的基于訓(xùn)練集建立的情緒分類(lèi)SVM算法規(guī)則,用于剩余的測(cè)試樣本數(shù)據(jù),獲得媒體導(dǎo)向的每一條新聞報(bào)道情緒、網(wǎng)民的每一條文本情緒和APP用戶的情緒。

        STEP5:情緒指標(biāo)構(gòu)建

        對(duì)媒體導(dǎo)向信息、網(wǎng)民信息和用戶文本信息,基于前述公式1的情緒構(gòu)建規(guī)則,形成三者的每月情緒指標(biāo)。

        (二)RF-L基分類(lèi)器

        機(jī)器學(xué)習(xí)技術(shù)由于不受到變量分布假設(shè)的約束,擁有良好的魯棒性和泛化性,不足在于模型的邏輯復(fù)雜,不易于直觀展示和解釋變量的風(fēng)險(xiǎn)特性。在穩(wěn)定性和可解釋性方面,傳統(tǒng)的風(fēng)險(xiǎn)評(píng)估模型有獨(dú)特優(yōu)勢(shì),在各類(lèi)金融場(chǎng)景中已經(jīng)被廣泛使用。本文的基分類(lèi)器建??紤]將機(jī)器學(xué)習(xí)算法和傳統(tǒng)風(fēng)險(xiǎn)評(píng)估模型進(jìn)行適當(dāng)結(jié)合,構(gòu)建組合評(píng)估模型,發(fā)揮兩者的優(yōu)點(diǎn),得到適用于大數(shù)據(jù)環(huán)境下的、分類(lèi)精度高、穩(wěn)定性好、解釋力強(qiáng)的風(fēng)險(xiǎn)評(píng)估模型。

        基分類(lèi)器機(jī)器學(xué)習(xí)算法采用隨機(jī)森林模型,隨機(jī)森林的優(yōu)點(diǎn)是可處理的變量維度多、分類(lèi)精度高,由于單棵決策樹(shù)和隨機(jī)森林的生成過(guò)程是一個(gè)黑箱,建模指標(biāo)的可解釋性和易讀性不強(qiáng),不利于直接說(shuō)明變量的風(fēng)險(xiǎn)特性?;诖耍疚牟捎肔ogistic回歸模型,該模型相對(duì)比較穩(wěn)定。本文將兩者結(jié)合起來(lái),生成風(fēng)險(xiǎn)分類(lèi)評(píng)估子模型,稱之為RF-L模型。

        圖2 為RF-L風(fēng)險(xiǎn)評(píng)估模型的流程圖

        在進(jìn)行Logistic統(tǒng)計(jì)建模前,首先利用隨機(jī)森林模型中的決策樹(shù)對(duì)構(gòu)建的26項(xiàng)風(fēng)險(xiǎn)指標(biāo)進(jìn)行變量的選擇,根據(jù)森林樹(shù)修剪后的結(jié)果得到重要節(jié)點(diǎn)風(fēng)險(xiǎn)指標(biāo),將輸出的顯著量化指標(biāo)導(dǎo)入Logistic回歸模型中進(jìn)行統(tǒng)計(jì)建模,從而確定顯著風(fēng)險(xiǎn)因子的風(fēng)險(xiǎn)權(quán)重。RF-L克服了單獨(dú)使用隨機(jī)森林模型或Logistic模型的缺點(diǎn),發(fā)揮二者的優(yōu)勢(shì),建立一個(gè)適用于大數(shù)據(jù)環(huán)境下的RF-L風(fēng)險(xiǎn)評(píng)估模型。

        (三)XGboost集成學(xué)習(xí)框架

        集成學(xué)習(xí)是基于統(tǒng)計(jì)模型理論的機(jī)器學(xué)習(xí)方法,能極大提升分類(lèi)器的準(zhǔn)確率和算法的泛化能力。如圖3所示,其基本思想:先通過(guò)訓(xùn)練 個(gè)基分類(lèi)器,然后根據(jù)一定的組合策略,最后形成一個(gè)強(qiáng)學(xué)習(xí)器,達(dá)到所有優(yōu)勢(shì)的集中統(tǒng)一。

        圖3 集成學(xué)習(xí)流程圖

        Boosting、Bagging和 Random Forest是常見(jiàn)的集成學(xué)習(xí)方法,以同質(zhì)基學(xué)習(xí)器依賴關(guān)系是否成立,集成學(xué)習(xí)算法主要包括兩類(lèi):第一類(lèi)是一系列的基學(xué)習(xí)器之間存在依賴關(guān)系,需要串行生成,可以使用boosting系列算法;第二類(lèi)是基學(xué)習(xí)器之間不存在強(qiáng)依賴關(guān)系,需要通過(guò)并行生成,可以使用Bagging和Random Forest系列算法。

        本文擬采用XGboost集成學(xué)習(xí)算法,XGboost(eXtreme Gradient Boosting) 是在 GBDT(Gradient Boosting Decision Tree,梯度提升決策樹(shù))的基礎(chǔ)上對(duì)Boosting進(jìn)行改進(jìn)的一種算法。 Boosting模型具體可用公式2表示為:

        D為數(shù)據(jù)集,即影響商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)因素的指標(biāo)體系數(shù)據(jù)和風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果,n為樣本量,其中每棵樹(shù)都是一個(gè)樹(shù)模型,可用公式3表示為:

        q(x)代表的是研究單位x中樹(shù)模型葉子節(jié)點(diǎn)的映射關(guān)系。w是樹(shù)模型中用來(lái)擬合屬于各自葉子節(jié)點(diǎn)的樣本的預(yù)測(cè)值。基本邏輯思路是,首先,根據(jù)RE-L基學(xué)習(xí)器1的誤差率來(lái)調(diào)整更新訓(xùn)練樣本的權(quán)重,使弱學(xué)習(xí)器1中學(xué)習(xí)誤差率較高的訓(xùn)練樣本點(diǎn)的權(quán)重變高,在弱學(xué)習(xí)器2中更加重視這些誤差率高的點(diǎn);然后,基于調(diào)整權(quán)重后的訓(xùn)練集來(lái)繼續(xù)訓(xùn)練弱學(xué)習(xí)器2,并一直重復(fù)下去,直到弱學(xué)習(xí)器數(shù)與預(yù)先給定的數(shù)目一致;最終,將以上若干個(gè)弱學(xué)習(xí)器通過(guò)結(jié)合策略進(jìn)行不斷整合,得到評(píng)價(jià)商業(yè)銀行區(qū)域性風(fēng)險(xiǎn)的強(qiáng)學(xué)習(xí)器。

        與GBDT相比,XGBoost優(yōu)點(diǎn)是速度快、效果好、支持大規(guī)模數(shù)據(jù)處理等,近年來(lái)在大數(shù)據(jù)建模競(jìng)賽和應(yīng)用中得到廣泛使用。由于XGboost能利用CPU多線程并行構(gòu)建回歸樹(shù),因此其運(yùn)行速度比同類(lèi)算法快10倍以上。XGboost優(yōu)點(diǎn)還包括目標(biāo)函數(shù),為防止模型過(guò)渡擬合,XGboost的目標(biāo)函數(shù)由復(fù)雜度和損失函數(shù)兩部分組成,復(fù)雜度又由葉子數(shù)量和L2正則 組成,傳統(tǒng)的GBDT對(duì)損失函數(shù)只使用一階導(dǎo)數(shù)信息,而XGboost要進(jìn)行二階泰勒展開(kāi),使得算法更快收斂到全局最優(yōu)。

        (四)基于XGboost的集成學(xué)習(xí)算法流程

        本文采用RF-L作為XGboost集成學(xué)習(xí)的基分類(lèi)器,構(gòu)建基于RF-L模型的XGboost集成學(xué)習(xí)區(qū)域性風(fēng)險(xiǎn)評(píng)價(jià)模型,具體的算法設(shè)計(jì)流程如下:

        輸入:

        數(shù)據(jù)集:n個(gè)訓(xùn)練樣本的數(shù)據(jù)集,包含銀行區(qū)域性風(fēng)險(xiǎn)指標(biāo)體系數(shù)據(jù)和風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果。

        迭代次數(shù)設(shè)置為T(mén);

        學(xué)習(xí)效率參數(shù)為v;

        基分類(lèi)器C(RF-L),運(yùn)用隨機(jī)森林選擇影響區(qū)域風(fēng)險(xiǎn)的重要指標(biāo),導(dǎo)入Logistic模型進(jìn)行風(fēng)險(xiǎn)權(quán)重估計(jì)。

        算法:

        STEP1:利用ACROA算法在數(shù)據(jù)集D上求得XGboost模型的最優(yōu)參數(shù),包括shrinkage、min_child、wight;

        STEP2:利用求得的最優(yōu)參數(shù)構(gòu)建XGboost模型;

        STEP3:迭代求解RF-L的最優(yōu)解;

        STEP4:直到達(dá)到迭代上限,結(jié)束循環(huán)

        結(jié)果的應(yīng)用:(1)通過(guò)對(duì)模型自變量X的篩選,構(gòu)建適應(yīng)大數(shù)據(jù)時(shí)代數(shù)據(jù)生成和數(shù)據(jù)計(jì)算的自變量。

        (2)通過(guò)機(jī)器學(xué)習(xí),強(qiáng)化模型的學(xué)習(xí)能力,分析影響區(qū)域性風(fēng)險(xiǎn)的最關(guān)鍵因素,可以有針對(duì)性的開(kāi)展風(fēng)險(xiǎn)管理工作。

        (3)通過(guò)預(yù)測(cè)因變量,判斷區(qū)域性風(fēng)險(xiǎn)嚴(yán)重程度,為監(jiān)管部門(mén)非現(xiàn)場(chǎng)監(jiān)管提供技術(shù)支持。

        (4)樣本的范圍可以以省或者市來(lái)劃分,時(shí)間可按照月份或者更長(zhǎng)維度來(lái)劃分,以滿足具體需要。

        五、結(jié) 論

        本文主要基于大數(shù)據(jù)的視角,從理論上對(duì)銀行區(qū)域性風(fēng)險(xiǎn)的影響因素進(jìn)行了模型構(gòu)建的嘗試,并且為商業(yè)銀行預(yù)警區(qū)域性風(fēng)險(xiǎn)評(píng)價(jià)和預(yù)警提供參考思路。該理論模型的構(gòu)建重點(diǎn)兼顧適用性、科學(xué)性、前沿性和可操作性四大特點(diǎn),主要表現(xiàn)為:(1)考慮到“互聯(lián)網(wǎng)+”背景下,網(wǎng)絡(luò)信息的地位越來(lái)越重要,利用網(wǎng)絡(luò)爬蟲(chóng)、文本挖掘等技術(shù),去發(fā)現(xiàn)、分析以及利用網(wǎng)絡(luò)信息,本文提供了文本類(lèi)數(shù)據(jù)的爬取、清洗及量化,豐富了原有度量模型的指標(biāo)體系。(2)指標(biāo)從宏觀和微觀兩個(gè)角度,在原有傳統(tǒng)指標(biāo)優(yōu)化后,結(jié)合大數(shù)據(jù)時(shí)代的特征,充分考慮區(qū)域性、時(shí)效性、精確性,構(gòu)建涵蓋大數(shù)據(jù)源和大數(shù)據(jù)技術(shù)應(yīng)用的指標(biāo)體系,并利用基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的文本分類(lèi)方法,客觀量化互聯(lián)網(wǎng)情緒傾向等非結(jié)構(gòu)化數(shù)據(jù)。(3)以大數(shù)據(jù)技術(shù)建模,盡量通過(guò)先進(jìn)的信息技術(shù)手段來(lái)代替人為的主觀判斷,利用互聯(lián)網(wǎng)行業(yè)內(nèi)目前主流的集成算法提高模型的精確度,探索了機(jī)器學(xué)習(xí)主流的算法在風(fēng)險(xiǎn)度量中的應(yīng)用,具有較強(qiáng)的前瞻性。

        但是,在度量和評(píng)價(jià)區(qū)域性風(fēng)險(xiǎn)時(shí),對(duì)于全國(guó)性的商業(yè)銀行和區(qū)域性商業(yè)銀行來(lái)說(shuō),在功能、指標(biāo)設(shè)計(jì)、可采集指標(biāo)是有差異的,用于銀行自身經(jīng)營(yíng)還是政府監(jiān)管,需求點(diǎn)也存在一定差異。本文提供了一種探索、一種技術(shù)層面的應(yīng)用指導(dǎo),尚需要在實(shí)踐應(yīng)用過(guò)程中,不斷加強(qiáng)數(shù)據(jù)的獲取和數(shù)據(jù)的存儲(chǔ),加強(qiáng)模型的自我學(xué)習(xí)能力,在應(yīng)用的過(guò)程中逐步完善。

        猜你喜歡
        區(qū)域性銀行指標(biāo)
        最新引用指標(biāo)
        莫讓指標(biāo)改變初衷
        商周刊(2018年26期)2018-12-29 12:56:00
        引發(fā)四川盆地區(qū)域性暴雨的高原MCS 特征分析
        10Gb/s transmit equalizer using duobinary signaling over FR4 backplane①
        正確認(rèn)識(shí)區(qū)域性股權(quán)交易市場(chǎng)
        ??到拥貧獾摹巴零y行”
        透析新聞采訪的獨(dú)特視角與寫(xiě)作中的區(qū)域性特點(diǎn)
        新聞傳播(2016年23期)2016-10-18 00:54:07
        “存夢(mèng)銀行”破產(chǎn)記
        銀行激進(jìn)求變
        區(qū)域性綜合管理模式對(duì)妊娠期糖尿病的效果分析
        啦啦啦www在线观看免费视频| 国产一区二区三区蜜桃| 国产成人精品免费久久久久| 亚洲精品久久久中文字| 人妻少妇精品视频专区二区三区| 99久久亚洲精品日本无码| 一品二品三品中文字幕| 国产高清无码在线| 国产青青草自拍视频在线播放 | 一区二区三区人妻少妇| 国产精品福利自产拍在线观看| 亚洲国产精品线路久久| 亚洲一区二区精品在线看| 亚洲一区二区三区四区地址| 日本一卡2卡3卡4卡无卡免费网站| 日韩欧美区| 在线免费观看亚洲毛片| 国产91清纯白嫩初高中在线观看| 一品二品三品中文字幕| 97色偷偷色噜噜狠狠爱网站97| 美女被搞在线观看一区二区三区 | 亚洲国产精品嫩草影院久久 | 青青草免费在线视频导航 | 白色月光在线观看免费高清| 亚洲国产精品一区二区久久恐怖片| 久久精品黄aa片一区二区三区| a观看v视频网站入口免费| 国产无套粉嫩白浆内精| 丰满少妇高潮惨叫久久久| 少妇脱了内裤让我添| 国产91第一页| 青青草小视频在线观看| 日本老熟妇乱| 久久精品国产一区二区蜜芽 | 日韩精品欧美激情国产一区| 中文字幕一区二区综合| 亚洲国产精品无码专区影院| 国产精品成人午夜久久| 日本一二三区在线不卡| 日本丰满熟妇videossex一| 欧美精品黄页在线观看视频|