(中國(guó)人民銀行西寧中心支行 青海西寧 810001)
金融科技的快速蓬勃發(fā)展,增強(qiáng)了我國(guó)金融服務(wù)的可獲得性,助推了普惠金融的有效實(shí)踐,提升了金融資源的配置效率,為金融市場(chǎng)的發(fā)展注入了生機(jī)和活力,但金融科技在極大地改變著金融市場(chǎng)格局的同時(shí),也對(duì)其“事中事后”產(chǎn)生的海量數(shù)據(jù)和異常行為監(jiān)管帶來(lái)新的挑戰(zhàn)。監(jiān)管科技是以數(shù)據(jù)為核心和驅(qū)動(dòng)的新金融監(jiān)管解決方案,金融大數(shù)據(jù)應(yīng)用普及并嵌入金融行為,可有效防范和化解金融風(fēng)險(xiǎn),提高金融監(jiān)管效率,穩(wěn)定金融市場(chǎng)秩序和維護(hù)金融體系安全。
從整體趨勢(shì)上來(lái)看,自2018年以來(lái),我國(guó)貿(mào)易融資總體規(guī)模呈現(xiàn)加速下降的態(tài)勢(shì),主要以國(guó)內(nèi)貿(mào)易融資為主。除1、3月出現(xiàn)明顯波峰外,其余月份貿(mào)易融資額基本趨于平穩(wěn),波動(dòng)主要系銀行業(yè)各金融機(jī)構(gòu)在年初集中完成信貸投放所致(圖1)。且國(guó)內(nèi)貿(mào)易融資以美元為主要融資幣種。
圖1 2018 年以來(lái)全國(guó)貿(mào)易融資規(guī)模走勢(shì) 單位:億美元
從相關(guān)性上來(lái)看,我國(guó)貿(mào)易融資規(guī)模與進(jìn)出口總量及離岸轉(zhuǎn)手買賣交易總量呈較大的正相關(guān)性。在2018年2月和2019年2月,我國(guó)進(jìn)出口總量和離岸轉(zhuǎn)手買賣總量急劇下降,貿(mào)易融資總量也隨之大幅下降,而隨著3月進(jìn)出口總量快速拉升,貿(mào)易融資也相對(duì)活躍(圖2)。
圖2 貿(mào)易融資、進(jìn)出口及轉(zhuǎn)口貿(mào)易總量情況 單位:億美元
從行業(yè)結(jié)構(gòu)來(lái)看,聚焦比例大幅提升的行業(yè)是數(shù)字經(jīng)濟(jì)與先進(jìn)制造業(yè)。貿(mào)易融資排名第一,緊隨其后的為批發(fā)業(yè)、電器機(jī)械與器材制造、化學(xué)原料制造等,而大幅下降的行業(yè)是房地產(chǎn)業(yè)、非金屬礦物制品業(yè)、黑色金屬冶煉和壓延加工,貿(mào)易融資同比平均下降44.2%(圖3)。
圖3 貿(mào)易融資行業(yè)分布情況 單位:億美元
從地域分布來(lái)看,貿(mào)易融資區(qū)域分布主要集中在我國(guó)的東部和沿海經(jīng)濟(jì)發(fā)達(dá)地區(qū),但中西部地區(qū)活躍度明顯增強(qiáng),有向中西部地區(qū)轉(zhuǎn)移趨勢(shì)(圖4)。
圖4 貿(mào)易融資區(qū)域分布情況 單位:億美元
從異常特征上來(lái)看,貿(mào)易融資企業(yè)是基于銀行提供的授信額度或通過(guò)承兌匯票質(zhì)押、信用擔(dān)保、質(zhì)押擔(dān)保方式,提高融資杠桿、增加融資期限,擴(kuò)大融資規(guī)模。虛假貿(mào)易融資存在以下幾個(gè)主要特征:一是融資期限較長(zhǎng)。虛假貿(mào)易融資期限多在180天以上,甚至出現(xiàn)多筆360天期限的貿(mào)易融資。二是多在異地銀行辦理貿(mào)易融資業(yè)務(wù),呈現(xiàn)頻率高、規(guī)模大、交易對(duì)手單一、交易時(shí)間集中的特點(diǎn)。據(jù)統(tǒng)計(jì),企業(yè)使用重復(fù)交易單證辦理的貿(mào)易融資中,異地銀行家數(shù)占比75%。三是貿(mào)易型公司為造假主力,由于此類公司沒(méi)有固定生產(chǎn)場(chǎng)所,僅在上下游企業(yè)間轉(zhuǎn)移貨物,易于躲避監(jiān)管部門的現(xiàn)場(chǎng)核查,又便于獲得出口獎(jiǎng)勵(lì)等政府臨時(shí)性補(bǔ)貼;四是融資資金用途與還款資金來(lái)源與進(jìn)出口貿(mào)易背景關(guān)聯(lián)度低,多是套取外匯資金結(jié)匯使用,再以企業(yè)間拆借資金償還為目的。
基于以上分析結(jié)論,在以大數(shù)據(jù)為基礎(chǔ)的新金融監(jiān)管中,利用大數(shù)據(jù)及人工智能技術(shù)對(duì)虛假貿(mào)易融資企業(yè)交易行為進(jìn)行分析研究,提煉交易特征并應(yīng)用到未來(lái)貿(mào)易融資企業(yè)的行為識(shí)別中具有重大實(shí)踐意義。
在機(jī)器學(xué)習(xí)中,區(qū)分貿(mào)易融資企業(yè)是正常或異常屬于人工智能中的分類問(wèn)題,對(duì)于分類問(wèn)題,可以應(yīng)用無(wú)監(jiān)督學(xué)習(xí)與有監(jiān)督學(xué)習(xí)方法開(kāi)展分析并根據(jù)測(cè)試結(jié)果和現(xiàn)場(chǎng)檢查確定其可行性。
該方法無(wú)外部學(xué)習(xí)指導(dǎo),具有探索未知性的優(yōu)點(diǎn),更易發(fā)現(xiàn)被忽略的新特征、新規(guī)律。把負(fù)面主體與目標(biāo)主體混合后,按照K-Means聚類算法(又叫K均值算法,在給定一個(gè)數(shù)據(jù)集和需要?jiǎng)澐值臄?shù)目k后,該算法可以根據(jù)某個(gè)距離函數(shù)反復(fù)把數(shù)據(jù)劃分到k個(gè)簇中,直到收斂為止)。其主要特點(diǎn)是能處理大數(shù)據(jù)集,且時(shí)間復(fù)雜度不能太高,同時(shí)能處理現(xiàn)實(shí)中不同類型的屬性。高維性、可解釋性、可用性強(qiáng)、成熟度較高,從時(shí)空維度分析交易屬性并進(jìn)行分類,使同一類別內(nèi)的個(gè)體具有盡可能高的同質(zhì)性,而不同類別之間則具有盡可能高的異質(zhì)性。
使用SAS統(tǒng)計(jì)分析系統(tǒng)搭建智能分析模型組合,如圖5所示,通過(guò)實(shí)驗(yàn)參數(shù)優(yōu)化,得出在所有目標(biāo)主體與負(fù)面主體混合的貿(mào)易融資企業(yè)分為30個(gè)類簇時(shí),聚類效果最好,類別最少,如表1所示。對(duì)表中占比大于70%以上的分類可以實(shí)施精準(zhǔn)判斷簇中存在的樣本有較大的虛假可能性。
圖5 無(wú)監(jiān)督的機(jī)器學(xué)習(xí)建模過(guò)程
表1 類簇分布情況
相較無(wú)監(jiān)督機(jī)器學(xué)習(xí),有監(jiān)督的學(xué)習(xí)更具主觀能動(dòng)性,通過(guò)給負(fù)面樣本與正面樣本打注標(biāo)簽,分別交與機(jī)器進(jìn)行數(shù)據(jù)特征學(xué)習(xí),并在學(xué)習(xí)過(guò)程中進(jìn)行教師糾正認(rèn)知,風(fēng)險(xiǎn)識(shí)別精準(zhǔn)度更高。
根據(jù)模型學(xué)習(xí)條件,將正面樣本和負(fù)面樣本集合進(jìn)行數(shù)據(jù)分集,并建立模型:
表2 數(shù)據(jù)分集
根據(jù)模型學(xué)習(xí)條件,按照7:3 的比例,將正面樣本和負(fù)面樣本集合進(jìn)行數(shù)據(jù)分集,如表2 所示,變量“biaoshi”代表分類對(duì)象,數(shù)值型值“0”代表正常企業(yè),“1”代表異常企業(yè)。
應(yīng)用多種有監(jiān)督的分類模型展開(kāi)實(shí)驗(yàn)(如圖6所示),再通過(guò)識(shí)別率等比較條件,選擇最優(yōu)模型進(jìn)行優(yōu)化調(diào)整。本部分使用了較成熟且良好的“決策樹(shù)”“boosting(同質(zhì)集成學(xué)習(xí)器)”“神經(jīng)網(wǎng)路”“l(fā)ogtic回歸”“HP神經(jīng)”等模型進(jìn)行學(xué)習(xí)。同時(shí)為增加學(xué)習(xí)的多樣性,增加了“集成”學(xué)習(xí)策略,即采用異質(zhì)的集成學(xué)習(xí)策略,進(jìn)行綜合評(píng)判。
由圖6所示,整個(gè)學(xué)習(xí)識(shí)別過(guò)程為:首先裝載數(shù)據(jù),其次進(jìn)行“數(shù)據(jù)分區(qū)”,然后分別應(yīng)用各類模型進(jìn)行學(xué)習(xí),并利用“模型比較”模塊對(duì)所有子模型的評(píng)價(jià)指標(biāo)綜合判定,最終推選出最優(yōu)模型。由表3可得,經(jīng)過(guò)上述模型學(xué)習(xí)比較,最終得出“HP神經(jīng)”模型為最優(yōu),應(yīng)用驗(yàn)證集測(cè)試,誤分類率低于5%,已完全滿足模型實(shí)際應(yīng)用的條件。
圖6 有監(jiān)督的機(jī)器學(xué)習(xí)建模過(guò)程
表3 最優(yōu)模型推選比較
優(yōu)化后的“HP神經(jīng)”網(wǎng)絡(luò)學(xué)習(xí)結(jié)構(gòu),如圖7所示,整體為三層網(wǎng)絡(luò)架構(gòu),輸入層輸入主體交易屬性指標(biāo),隱藏層是直連學(xué)習(xí)計(jì)算,輸出層判斷正常與異常,通過(guò)教師樣本進(jìn)行結(jié)果修正,反饋隱藏層神經(jīng)元,優(yōu)化神經(jīng)元激活函數(shù),增加學(xué)習(xí)動(dòng)量項(xiàng),加速學(xué)習(xí)效率,提升學(xué)習(xí)識(shí)別精準(zhǔn)度。
圖7 HP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
經(jīng)過(guò)學(xué)習(xí)優(yōu)化后,應(yīng)用驗(yàn)證樣本集,測(cè)試HP神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)成果。結(jié)果如表4所示,目標(biāo)為“0”(正常企業(yè)),結(jié)果為“0”,機(jī)器判斷結(jié)果一致;目標(biāo)為“0”,結(jié)果為“1”(負(fù)面企業(yè)),機(jī)器誤判結(jié)果;目標(biāo)為“1”,結(jié)果為“0”,機(jī)器漏判結(jié)果。對(duì)于整個(gè)樣本集,正確識(shí)別率達(dá)到95.8%。至此,完成整個(gè)訓(xùn)練。導(dǎo)入訓(xùn)練學(xué)習(xí)完成后的模型,機(jī)器自主甄別貿(mào)易融資型企業(yè),選擇分類結(jié)果是“1”,并且評(píng)分概率大于90%的企業(yè)作為可疑企業(yè),模型應(yīng)用效果良好。
表4 HP 神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率驗(yàn)證結(jié)果
跨境貿(mào)易融資某種程度上是當(dāng)前境內(nèi)外匯率和利差等原因造成的企業(yè)資金擺布行為,其中有利用真實(shí)貿(mào)易背景套利的行為,也有虛假的交易背景摻雜其中。隨著宏觀形勢(shì)不斷變化,積極運(yùn)用人工智能開(kāi)展對(duì)異常貿(mào)易融資的分析,是大數(shù)據(jù)時(shí)代的主要方向。通過(guò)應(yīng)用人工智能的數(shù)據(jù)分析方法,虛假貿(mào)易融資行為甄別的自動(dòng)性、時(shí)效性和成案率均得到有效提高。應(yīng)用無(wú)監(jiān)督機(jī)器學(xué)習(xí)與有監(jiān)督機(jī)器學(xué)習(xí)方法,在測(cè)試樣本中取得了高精準(zhǔn)識(shí)別率,在實(shí)際案件查處過(guò)程中得到了有效驗(yàn)證,具有良好的應(yīng)用前景。一方面可以解決貿(mào)易融資現(xiàn)場(chǎng)監(jiān)管耗時(shí)耗力且難以實(shí)現(xiàn)穿透性監(jiān)管的痛點(diǎn),最重要的也是在基于大數(shù)據(jù)為趨勢(shì)的貿(mào)易融資行為,改變現(xiàn)有的監(jiān)管模式,借助人工智能的手段進(jìn)行精準(zhǔn)識(shí)別和風(fēng)險(xiǎn)預(yù)警。另一方面可以改變過(guò)去傳統(tǒng)的以分業(yè)監(jiān)管和現(xiàn)場(chǎng)監(jiān)管為主的監(jiān)管手段和方式,利用監(jiān)管科技手段實(shí)現(xiàn)多角度、廣覆蓋的監(jiān)管,并實(shí)現(xiàn)以非現(xiàn)場(chǎng)混業(yè)監(jiān)管為主,現(xiàn)場(chǎng)監(jiān)管為輔的融合監(jiān)管,提升監(jiān)管的層次、深度和覆蓋面。
監(jiān)管科技依托于大數(shù)據(jù),目前受限于業(yè)務(wù)種類,部門的數(shù)據(jù)使用風(fēng)險(xiǎn)問(wèn)題,不具備共享性,易形成數(shù)據(jù)孤島,如果要突破這類問(wèn)題仍存在巨大障礙,雖然現(xiàn)有的數(shù)據(jù)體量很大,但數(shù)據(jù)孤島的數(shù)據(jù)無(wú)統(tǒng)一標(biāo)準(zhǔn),維度也不盡相同,因此無(wú)法進(jìn)行高效分析利用,進(jìn)而轉(zhuǎn)化為指導(dǎo)合規(guī)行為的決策和行動(dòng)能力,監(jiān)管科技的市場(chǎng)價(jià)值無(wú)法實(shí)現(xiàn),數(shù)據(jù)價(jià)值和共享信息安全之間仍然需要一個(gè)平衡點(diǎn),建立數(shù)據(jù)安全保障更是監(jiān)管科技面臨的挑戰(zhàn)。監(jiān)管科技以數(shù)據(jù)驅(qū)動(dòng)、數(shù)據(jù)聚合、數(shù)據(jù)處理、建模分析為基礎(chǔ),必須加強(qiáng)數(shù)據(jù)互通,打破數(shù)據(jù)孤島,構(gòu)建監(jiān)管部門與金融機(jī)構(gòu)之間的數(shù)據(jù)交換共享機(jī)制,整合現(xiàn)有的大數(shù)據(jù)平臺(tái),打造全行業(yè)數(shù)據(jù)集合。同時(shí)制定統(tǒng)一的數(shù)據(jù)采集標(biāo)準(zhǔn)口徑、數(shù)據(jù)交換標(biāo)準(zhǔn),加強(qiáng)數(shù)據(jù)綜合利用,并建立數(shù)據(jù)安全的等級(jí)保護(hù)機(jī)制,為數(shù)據(jù)共享保駕護(hù)航。
我國(guó)自2015年實(shí)施市場(chǎng)負(fù)面主體清單制度以來(lái),市場(chǎng)環(huán)境得到凈化,市場(chǎng)秩序得到維護(hù),在配置市場(chǎng)資源,規(guī)范市場(chǎng)化運(yùn)行中發(fā)揮了重要的作用,同時(shí)也為應(yīng)用新監(jiān)管科技奠定了良好的數(shù)據(jù)基礎(chǔ)。負(fù)面主體清單是各監(jiān)管部門在處置違法違規(guī)行為過(guò)程中收集的主體相關(guān)信息。通過(guò)數(shù)據(jù)層面提取負(fù)面主體的相關(guān)交易行為,應(yīng)用大數(shù)據(jù)與人工智能,分析異常特征規(guī)律,同時(shí)可以作為關(guān)系發(fā)現(xiàn)原點(diǎn),利用關(guān)系圖譜技術(shù),可以將與負(fù)面主體存在直接或間接關(guān)聯(lián)的主體都打上標(biāo)簽,建立關(guān)系規(guī)則,可以有效提高數(shù)據(jù)監(jiān)管效能,化被動(dòng)監(jiān)管為主動(dòng)出擊,在海量的數(shù)據(jù)中快速、精準(zhǔn)識(shí)別異常,提高篩查結(jié)果準(zhǔn)確率,使隱藏的違法違規(guī)行為完全暴露,同時(shí)也可以根據(jù)數(shù)據(jù)特征,為今后的政策制定和優(yōu)化提供重要的參考依據(jù)。對(duì)負(fù)面主體信息的采集較為單一,一是監(jiān)管部門收集的負(fù)面主體違規(guī)行為信息采集較為單一,不能完全還原違規(guī)行為發(fā)生的前因后果和行為動(dòng)機(jī)。二是未能有效采集負(fù)面主體的上下游信息,負(fù)面信息較為片面,沒(méi)有聯(lián)動(dòng)作用。三是負(fù)面主體的違規(guī)風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)仍為空白。針對(duì)以上存在的不足,可以通過(guò)建立信息系統(tǒng)進(jìn)行違規(guī)行為錄入過(guò)程中的采集自動(dòng)化,同時(shí)加強(qiáng)對(duì)上下游的主要信息進(jìn)行聯(lián)動(dòng)采集,從而可以形成對(duì)負(fù)面主體在監(jiān)管事項(xiàng)下的完整違規(guī)行為畫像,同時(shí)業(yè)務(wù)專家進(jìn)行風(fēng)險(xiǎn)評(píng)級(jí)設(shè)定,同時(shí)結(jié)合人工智能等方法進(jìn)行輔助量化,建立規(guī)范、合理的風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo),加強(qiáng)市場(chǎng)風(fēng)險(xiǎn)預(yù)警功能。
在上述應(yīng)用的有監(jiān)督學(xué)習(xí)模型中,雖然具有主觀能動(dòng)性,具備指導(dǎo)糾正學(xué)習(xí)能力,調(diào)整優(yōu)化的過(guò)程可干預(yù),識(shí)別異常的精準(zhǔn)度更高,適用性可判斷等優(yōu)點(diǎn),但是其缺陷也相對(duì)較為明顯,即特征不可解釋的“黑箱”原理,模型輸出結(jié)果主要服務(wù)于金融監(jiān)管的各項(xiàng)活動(dòng),但監(jiān)管部門不能僅僅依靠不可解釋的模型結(jié)論對(duì)市場(chǎng)主體進(jìn)行處置,還需要專家經(jīng)驗(yàn)和現(xiàn)場(chǎng)檢查佐證,才能最終查實(shí)。因此監(jiān)管制度對(duì)于模型可解釋性提出了極高的要求,使得涉及的“黑箱”原理的模型難以在業(yè)務(wù)場(chǎng)景中推廣落地。這需要在技術(shù)層面進(jìn)行突破,在無(wú)法了解數(shù)學(xué)根本原理的情況下,可以通過(guò)對(duì)識(shí)別其它結(jié)果輔助工具進(jìn)行二次分析,總結(jié)規(guī)律和經(jīng)驗(yàn),統(tǒng)計(jì)數(shù)值分布情況,從中發(fā)現(xiàn)應(yīng)用結(jié)果可跟蹤追溯與驗(yàn)證。
監(jiān)管科技是金融、監(jiān)管、技術(shù)的有機(jī)融合。從事監(jiān)管科技開(kāi)發(fā),運(yùn)營(yíng)的人才需要具備復(fù)合的背景知識(shí),既能夠把握金融市場(chǎng)的脈搏,熟悉監(jiān)管政策,還需要理解技術(shù)架構(gòu),當(dāng)前缺少此類領(lǐng)域的從業(yè)人才,這也使得監(jiān)管科技的發(fā)展有類似短板的木桶,無(wú)法符合監(jiān)管科技行業(yè)各方的利益訴求,在一定程度上造成實(shí)踐應(yīng)用的環(huán)境欠佳,制約監(jiān)管科技的發(fā)展。鼓勵(lì)科技創(chuàng)新是發(fā)展監(jiān)管科技的應(yīng)用之義,監(jiān)管部門應(yīng)用科技部門加強(qiáng)合作,共同研發(fā)基于人工智能,機(jī)器學(xué)習(xí)的監(jiān)管工具,提高金融監(jiān)管效率,注重對(duì)復(fù)合型人才的培養(yǎng)。