林自立 (廣東省農(nóng)村信用社聯(lián)合社 廣東廣州 515000)
信貸審計是商業(yè)銀行審計的重要內(nèi)容,目前,隨著大數(shù)據(jù)技術(shù)廣泛應(yīng)用于商業(yè)銀行個人客戶信息搜集、貸款資格核準(zhǔn)、授信額度審批等,個人信用貸款業(yè)務(wù)也逐漸向線上申請、線上審批、線上放款等方式轉(zhuǎn)變,且隨著信貸數(shù)據(jù)的量級增長,信貸審計方式也逐漸由現(xiàn)場審計為主向非現(xiàn)場審計為主轉(zhuǎn)變。商業(yè)銀行如果能夠依托大數(shù)據(jù)分析技術(shù),結(jié)合客戶歷史信用數(shù)據(jù),構(gòu)建審計分析模型,提高對個人信用評級異常數(shù)據(jù)的甄別分析能力,將有助于商業(yè)銀行在信貸審計中識別挖掘潛在的關(guān)鍵變量和關(guān)聯(lián)規(guī)則,進(jìn)而快速鎖定疑點客戶、提前預(yù)判客戶違約情況、發(fā)現(xiàn)信貸流程漏洞等,從而達(dá)到提高審計效率、加強(qiáng)信用風(fēng)險預(yù)警、完善信貸工作規(guī)范的目的。
關(guān)聯(lián)規(guī)則是一個基于規(guī)則的機(jī)器學(xué)習(xí)算法,可以通過設(shè)置支持度和置信度進(jìn)行關(guān)聯(lián)規(guī)則的篩選,從大量數(shù)據(jù)中挖掘出潛在的關(guān)聯(lián)關(guān)系,廣泛應(yīng)用于購物模式分析、推薦系統(tǒng)設(shè)計、交通事故因素探究、銀行客戶風(fēng)險分析、網(wǎng)絡(luò)入侵檢測技術(shù)等領(lǐng)域中。在銀行個人信貸分析中,若分析得知40%的信貸客戶以往具有違約記錄(用“X”標(biāo)記),這些客戶中的85%也在本次信貸中違約(用“Y”標(biāo)記),該規(guī)則可表示為“X→Y”的蘊(yùn)含式,其中X為前項,Y為后項。關(guān)聯(lián)規(guī)則的強(qiáng)度可以用支持度和置信度衡量。支持度表示關(guān)聯(lián)規(guī)則的前項在所有項集中出現(xiàn)的比例,用于衡量關(guān)聯(lián)規(guī)則的重要性,最小支持度用于衡量規(guī)則需要滿足的最低重要性;置信度表示在前項出現(xiàn)的情況下,后項同時出現(xiàn)的百分比,代表這條規(guī)則成立的概率,最小置信度表示關(guān)聯(lián)規(guī)則需要滿足的最低可靠性。在上述例子中,“X→Y”的規(guī)則支持度為40%,置信度為85%,如最小支持度為30%,最小置信度為60%,則上述規(guī)則為強(qiáng)關(guān)聯(lián)規(guī)則。
Apriori算法是最常見的關(guān)聯(lián)規(guī)則算法之一,于1993年由Agrawal和Srikant提出,為布爾關(guān)聯(lián)規(guī)則挖掘頻繁項集的原創(chuàng)性算法。使用頻繁項集的先驗知識,通過逐層搜索的迭代方法,運用k項集來生成k+1項集,不斷重復(fù)直至不再有新的頻繁項集產(chǎn)生為止,每找到一個k+1項集都需要掃描數(shù)據(jù)庫一次。
關(guān)聯(lián)規(guī)則挖掘過程,記錄的全體構(gòu)成了數(shù)據(jù)庫D,或稱記錄集D。交易集D中包含交易的個數(shù)記為|D|。支持度和置信度相關(guān)計算公式如下:
運用關(guān)聯(lián)規(guī)則挖掘方法,將商業(yè)銀行個人信貸客戶信用情況(是否違約)作為后項,將個人信貸客戶的眾多變量因素作為前項,可以挖掘潛藏在商業(yè)銀行個人客戶信貸行為模式中的關(guān)聯(lián)規(guī)則,一方面,有助于商業(yè)銀行內(nèi)部審計透過商業(yè)銀行個人客戶的基本信息,把握影響信貸違約的關(guān)鍵因素,從而有效判別可疑客戶,聚焦重點調(diào)查對象;另一方面,根據(jù)分析得出的關(guān)鍵因素,對照該銀行的個人信貸客戶評級方法,揭示個人信貸客戶評級系統(tǒng)存在的漏洞和不足,為進(jìn)一步完善個人信貸客戶評級提供建議。
本文用于進(jìn)行關(guān)聯(lián)分析的銀行個人信用數(shù)據(jù)來源于機(jī)器學(xué)習(xí)數(shù)據(jù)網(wǎng)站。該數(shù)據(jù)集包括某國某銀行信用數(shù)據(jù)庫中的1 000多條客戶信用記錄,涉及個人信貸客戶定性及定量指標(biāo),根據(jù)能夠按時還款涉及的風(fēng)險狀況的大小,將客戶信用情況分為“好”和“壞”(分別對應(yīng)信用情況編碼為1和2),而“好”和“壞”客戶的數(shù)據(jù)記錄分別約占總體數(shù)量的70%和30%。
由于關(guān)聯(lián)規(guī)則Apriori算法無法處理連續(xù)型數(shù)據(jù),結(jié)合各指標(biāo)的實際意義及數(shù)據(jù)特征,對部分指標(biāo)進(jìn)行統(tǒng)計學(xué)變換,最終選取其中16項指標(biāo),如表1所示。
表1 Apriori算法指標(biāo)分類說明
商業(yè)銀行一般在審核個人客戶申貸資料時,會綜合對該客戶多方面信息,包括基本身份信息、職業(yè)信息、財產(chǎn)信息、擔(dān)保信息等,通過個人客戶信用評級的方法,全面地評估該個人客戶信用狀況,從而為是否對該客戶授信提供決策依據(jù)。而從審計人員的角度來看,立足已發(fā)放貸款的客戶是否違約的結(jié)果,將該客戶的其他信息與該客戶違約傾向進(jìn)行關(guān)聯(lián)分析,有助于深入分析個人貸款客戶的行為特征。
在進(jìn)行關(guān)聯(lián)分析之前,運用Clementines軟件對因素進(jìn)行網(wǎng)絡(luò)圖分析,從而直觀地展現(xiàn)各因素之間的關(guān)聯(lián)程度,形成整體的感性認(rèn)識。根據(jù)軟件運行結(jié)果,通過設(shè)置顯示400、500、600條鏈接數(shù)量的范圍,從而直觀地理解不同因素鏈接程度的強(qiáng)弱。如下頁圖1所示。
圖1 網(wǎng)絡(luò)圖分析
從三種不同設(shè)置情況下的網(wǎng)絡(luò)圖可以看出,對個人客戶信用結(jié)果產(chǎn)生影響的因素存在強(qiáng)弱差異,梳理后如表2所示。由表2可知,對客戶信用情況影響程度最強(qiáng)的兩個因素為:是否有其他擔(dān)保人及是否國外工作者,其次是贍養(yǎng)人數(shù)及房屋情況,再次是工作情況、個人狀況及手機(jī)號碼狀況。
表2 對客戶信用情況影響的關(guān)鍵因素表
1.守約客戶的Apriori結(jié)果分析。在網(wǎng)絡(luò)圖分析的基礎(chǔ)上,運用Clementines軟件對數(shù)據(jù)進(jìn)行Apriori模型分析,選取數(shù)據(jù)庫中的個人客戶為“G”(信用“好”)的數(shù)據(jù)來建模,根據(jù)數(shù)據(jù)實際情況以及參考統(tǒng)計學(xué)原理,為了確保不會產(chǎn)生大量的無用關(guān)聯(lián)規(guī)則,也不遺漏重要關(guān)聯(lián)規(guī)則,經(jīng)過多次分析實踐,最終將最小支持度設(shè)置為min sup=10%,最小置信度設(shè)置為min conf=90%,其中部分關(guān)聯(lián)規(guī)則如表3所示。
表3 貸款客戶信用評估為“好”的Apriori結(jié)果參數(shù)表
下面對表3反映的相關(guān)規(guī)則進(jìn)行解釋:(1)當(dāng)貸款客戶的貸款用途是購置電視,沒有支票賬戶及沒有其他共同申請人的情況下,那么該客戶有 95% 的可能性會守約按時足額償還貸款;(2)當(dāng)貸款客戶的貸款用途是購置電視,沒有支票賬戶且贍養(yǎng)人數(shù)僅為1人時,那么該客戶有94.5% 的可能性會守約按時足額償還貸款;……(6)當(dāng)貸款客戶現(xiàn)有的其他信用不在這家銀行,沒有支票賬戶且工作職務(wù)是技術(shù)熟練的雇員時,那么該客戶有 94.12%的可能性會守約按時足額償還貸款;(7)當(dāng)貸款客戶沒有支票賬戶,本人為單身男性且工作職務(wù)是技術(shù)熟練的雇員時,那么該客戶有 92.05% 的可能性會守約按時足額償還貸款。
根據(jù)以上分析結(jié)果可知,客戶的貸款用途、是否有支票賬戶、信用歷史、工作職務(wù)、贍養(yǎng)人數(shù)、房產(chǎn)狀態(tài)、是否外國人、個人狀況與該客戶能否守約存在關(guān)聯(lián)關(guān)系,仔細(xì)分析各因素對客戶信用的影響,大致可以推斷:當(dāng)客戶貸款用途較為明確且金額較為可控(如購置電視等大型家用電器),客戶守約的概率較高。同理可知,當(dāng)客戶贍養(yǎng)人數(shù)較少,財務(wù)負(fù)擔(dān)相對較輕,客戶傾向于履約還款;當(dāng)客戶職務(wù)為技術(shù)熟練的雇員,勞動收入相對較高,也有利于客戶履約還款;當(dāng)客戶自己擁有房產(chǎn)時,財產(chǎn)擔(dān)保更有保障,有助于客戶兌現(xiàn)還款承諾等。
2.違約客戶的Apriori結(jié)果分析。在網(wǎng)絡(luò)圖分析的基礎(chǔ)上,運用Clementines軟件對數(shù)據(jù)進(jìn)行Apriori模型分析,選取數(shù)據(jù)庫中的個人客戶為“B”(信用“壞”)的數(shù)據(jù)來建模,根據(jù)數(shù)據(jù)實際情況以及參考統(tǒng)計學(xué)原理,為了確保不會產(chǎn)生大量的無用關(guān)聯(lián)規(guī)則,也不遺漏重要關(guān)聯(lián)規(guī)則,經(jīng)過多次分析實踐,最終將最小支持度設(shè)置為min sup=0.9%,最小置信度設(shè)置為min conf=80%,其中部分關(guān)聯(lián)規(guī)則如下頁表4所示。
表4 貸款客戶信用評估為“壞”的Apriori結(jié)果參數(shù)表
下面對表4反映的相關(guān)規(guī)則進(jìn)行解釋:(1)當(dāng)貸款客戶存在延遲還清記錄,支票賬戶小于100元且工作職務(wù)是技術(shù)熟練的雇員時,那么該客戶有 88.89% 的可能性會違約;(2)當(dāng)貸款客戶的貸款用途是經(jīng)商,住房狀態(tài)是租賃且存款余額小于100元時,那么該客戶有 88.89% 的可能性會違約;……(5)當(dāng)貸款客戶的貸款用途是經(jīng)商,從事當(dāng)前職業(yè)的時間大于4年且存款余額小于100元時,那么該客戶有 81.82%的可能性會違約。
根據(jù)對違約客戶分析結(jié)果可知,客戶的信用歷史、支票賬戶狀況、貸款用途、房產(chǎn)狀態(tài)、存款狀況、工作職務(wù)、工作年限與該客戶違約存在關(guān)聯(lián)關(guān)系,仔細(xì)分析各因素對客戶信用的影響,大致可以推斷:當(dāng)客戶存在違約記錄時,可以推測該客戶的守約意識不強(qiáng),因此該客戶再次違約的概率也相對更大;當(dāng)客戶支票賬戶余額較小時,也可能意味著該客戶所能得到銀行的授信額度比較少,因此該客戶資信可能較為一般,違約的概率也可能更大;當(dāng)客戶貸款用途為經(jīng)商時,可能意味著該筆貸款投放之后能否收回將面臨更大的不確定性,也會導(dǎo)致客戶產(chǎn)生違約的概率較高;該客戶住房狀態(tài)是租賃,可以推測該客戶缺乏房產(chǎn)等財產(chǎn)保障,因此貸款后違約的概率可能更大等。
1.商業(yè)銀行內(nèi)部審計可以通過關(guān)聯(lián)分析,把握影響個人客戶違約的關(guān)鍵因素和關(guān)聯(lián)規(guī)則,有效鎖定疑點客戶。研究發(fā)現(xiàn),在個人貸款客戶的各種特征因素中,某些特征因素與客戶信用情況具有緊密的關(guān)聯(lián)關(guān)系,且存在著影響客戶信用狀況的重要關(guān)聯(lián)規(guī)則。商業(yè)銀行內(nèi)部審計在開展信貸審計時,面對眾多的個人客戶和龐雜的個人客戶信息,往往因為信息過度繁雜難以發(fā)現(xiàn)疑點所在,而通過關(guān)聯(lián)分析找到影響個人客戶信用的關(guān)鍵因素和重要關(guān)聯(lián)規(guī)則,可以有效把握住重點,遵照分析得出的關(guān)聯(lián)規(guī)則,將按照關(guān)聯(lián)規(guī)則評估后信用為“差”但仍獲得授信的客戶列為疑點客戶,進(jìn)行重點審計,有助于提高信貸審計效率。
2.商業(yè)銀行內(nèi)部審計可以通過關(guān)聯(lián)分析,評估驗證該行個人信貸客戶評級方法的科學(xué)性。研究發(fā)現(xiàn),通過關(guān)聯(lián)分析找到與客戶守約、客戶違約存在緊密聯(lián)系的重要關(guān)鍵因素和關(guān)聯(lián)規(guī)則,商業(yè)銀行內(nèi)部審計人員能夠從整體去把握各個客戶的信用情況,從另一個角度驗證商業(yè)銀行個人信貸客戶評級系統(tǒng)是否準(zhǔn)確和科學(xué),如發(fā)現(xiàn)某些關(guān)鍵因素未納入個人信貸客戶評級系統(tǒng),或者該行個人信用客戶評級規(guī)則與研究得出的關(guān)聯(lián)規(guī)則存在沖突時,須進(jìn)行重點關(guān)注和辨析,從審計角度進(jìn)行研判。
3.商業(yè)銀行內(nèi)部審計可以對照發(fā)現(xiàn)的關(guān)聯(lián)規(guī)則,持續(xù)完善信貸流程和制度。研究發(fā)現(xiàn),通過關(guān)聯(lián)分析,商業(yè)銀行內(nèi)部審計人員可以找到影響個人信貸客戶違約的關(guān)鍵因素以及關(guān)聯(lián)規(guī)則,將分析得出的結(jié)論與該行信貸調(diào)查及審批流程和制度進(jìn)行比對,評估該行在落實信貸調(diào)查和審批中,貸前調(diào)查是否囊括了對客戶關(guān)鍵因素的分析,貸中審查是否符合關(guān)聯(lián)規(guī)則所揭示的規(guī)律,評估商業(yè)銀行的貸款調(diào)查及審批流程是否嚴(yán)謹(jǐn)、貸款調(diào)查及審批制度是否完善和科學(xué),從而驗證銀行信貸調(diào)查和審批的有效性和科學(xué)性,并為銀行持續(xù)完善信貸流程和制度提供方向。
1.積極運用大數(shù)據(jù)分析技術(shù),有效提升審計能力、審計效率和審計精度。商業(yè)銀行內(nèi)部審計人員應(yīng)當(dāng)廣泛運用關(guān)聯(lián)規(guī)則等大數(shù)據(jù)分析技術(shù),如,運用聚類分析判別銀行財務(wù)疑點數(shù)據(jù),解決成本費用審計問題;運用層次分析法對銀行績效數(shù)據(jù)進(jìn)行綜合評價,解決銀行績效審計問題;運用空間地理數(shù)據(jù)分析,解決網(wǎng)點效益與布局審計問題等,熟練掌握多種數(shù)據(jù)分析方法,提高處理不同審計問題的數(shù)據(jù)分析能力,全面提升審計效能。
2.加強(qiáng)對數(shù)據(jù)的挖掘分析與規(guī)律總結(jié),發(fā)揮審計的參謀作用,助力經(jīng)營管理提升。商業(yè)銀行內(nèi)部審計人員不僅要從防風(fēng)險的角度,在數(shù)據(jù)分析中關(guān)注風(fēng)險客戶如何判別、風(fēng)險行為如何避免、風(fēng)險苗頭如何干預(yù)等,而且要從促發(fā)展的角度,在數(shù)據(jù)分析中思考優(yōu)質(zhì)客戶具有什么特征、經(jīng)營效率如何提高、如何把控風(fēng)險與效益的平衡點等問題,將數(shù)據(jù)挖掘得出的規(guī)律進(jìn)行總結(jié)歸納,并與商業(yè)銀行的經(jīng)營理念、內(nèi)部管理運行的普遍規(guī)則、公司制度的整體設(shè)計進(jìn)行比對,從而起到啟發(fā)經(jīng)營思路、堵塞管理漏洞、促進(jìn)健康發(fā)展的作用。