宋偉飛 盛京銀行
區(qū)域性金融風(fēng)險危害性較強[1-2],如果在區(qū)域性金融風(fēng)險爆發(fā)的初期及時加以監(jiān)控,避免風(fēng)險的加大,尤其根據(jù)金融活動異常數(shù)據(jù)在其未爆發(fā)前及時地進行預(yù)警,那么一場金融危機便可以“銷惡于未萌,彌禍于未形”?,F(xiàn)階段區(qū)域性金融風(fēng)險的預(yù)警難度極大,其主要原因在于金融活動一直伴隨著海量的數(shù)據(jù)信息?,F(xiàn)階段,網(wǎng)絡(luò)飛速發(fā)展、公眾輿論都可能引發(fā)一場小型的金融風(fēng)險,這些巨量的信息、實時變化的不確定性因素都對金融風(fēng)險的預(yù)警提出了極大的挑戰(zhàn)。如果單純地依靠普通的計算機程序進行數(shù)據(jù)統(tǒng)計,通過人力對金融活動進行監(jiān)管預(yù)測,是低效與不現(xiàn)實的。
而大數(shù)據(jù)時代正好彌補了這一缺點,大數(shù)據(jù)的優(yōu)勢在于通過數(shù)據(jù)互聯(lián),可以更加高效快速地收集數(shù)據(jù),不僅僅可以收集單一來源的數(shù)據(jù),對于多方面來源、不同類型的數(shù)據(jù)依然可以進行整合,并通過模型算法等手段迅速進行歸納分類,從中發(fā)現(xiàn)規(guī)律快速分析,即時性的輸出結(jié)論[3]。與此同時,大數(shù)據(jù)還兼具預(yù)測性,這使其具備了預(yù)測金融風(fēng)險的基本條件。大數(shù)據(jù)時代的來臨,將對整個金融活動帶來巨大的變革,現(xiàn)階段,大數(shù)據(jù)已經(jīng)廣泛應(yīng)用于客戶畫像、金融自動交易、運營流程精細(xì)化管理等諸多方向,將大數(shù)據(jù)引入到金融業(yè)中已然是眾望所歸,但是由于其算法制約、數(shù)據(jù)質(zhì)量等問題,對于風(fēng)險的預(yù)警能力亟待提高。
前文所述的現(xiàn)階段區(qū)域性金融安全面臨的挑戰(zhàn),對于大數(shù)據(jù)背景下的區(qū)域性金融預(yù)警系統(tǒng)提出了一定的設(shè)計原則。
覆蓋范圍廣。數(shù)據(jù)收集作為大數(shù)據(jù)的核心要素,最先要做好的就是數(shù)據(jù)整合工作,考慮到引發(fā)區(qū)域性金融風(fēng)險的因素眾多,其預(yù)警系統(tǒng)必須盡量做到涵蓋所在區(qū)域內(nèi)的所有金融活動,包括債券的發(fā)行,客戶的存款、借貸、消費,證券理財保險產(chǎn)品的發(fā)售,甚至是貨幣結(jié)算等金融活動不一而足[4]。預(yù)警系統(tǒng)的另外一個原則是監(jiān)視監(jiān)管,區(qū)域內(nèi)的金融活動參與者,銀行、證券公司、企業(yè)客戶、自然人客戶都應(yīng)當(dāng)納入預(yù)警系統(tǒng)的監(jiān)管體系中來,甚至監(jiān)管機構(gòu)本身也應(yīng)當(dāng)納入該體系中來。其監(jiān)管內(nèi)容不僅僅包括金融往來,還應(yīng)當(dāng)涵蓋輿論輿情、國家法規(guī)政策、大環(huán)境經(jīng)濟發(fā)展等??傊褪潜M量地擴展數(shù)據(jù)來源,全方位立體化的將金融活動及其活動對象納入監(jiān)管中來,其過程中產(chǎn)生的一系列數(shù)據(jù)都應(yīng)當(dāng)被大數(shù)據(jù)歸納整合,以便于進一步分析預(yù)測。
即時反饋預(yù)測。大數(shù)據(jù)與金融活動具有較高的匹配性,除了需處理的數(shù)據(jù)量巨大,來源廣外,金融活動的另一特點便是變化極快,瞬息萬變。因此,依托大數(shù)據(jù)支撐的區(qū)域性金融風(fēng)險預(yù)警預(yù)測系統(tǒng)必然要發(fā)揮大數(shù)據(jù)的優(yōu)勢,即時有效的整合數(shù)據(jù),分析其中的風(fēng)險因素,及時判別風(fēng)險,并分析出最佳的處理手段,將損失降至最低。
自我調(diào)整修復(fù)。隨著時間的流逝,金融活動是不斷迭代發(fā)展的,為了使預(yù)警系統(tǒng)越來越完善,該系統(tǒng)要不斷地更新迭代??梢詫ζ溥M行模塊化設(shè)計,保證其能跟上時代的發(fā)展,確保系統(tǒng)穩(wěn)定平穩(wěn)運行。模塊化設(shè)計的優(yōu)點在于,對于一部分量化指標(biāo),例如居民的存取款、借貸行為,可單獨作為一個模塊,僅需日常維護即可。而對于社會輿論輿情、突發(fā)性不穩(wěn)定因素等定性指標(biāo),亦可單獨作為一個模塊,有時甚至需要專人進行維護,將定性的指標(biāo)進行篩選判別,杜絕假消息、假新聞等對系統(tǒng)的影響,保證系統(tǒng)的可靠穩(wěn)定。
金融活動的參與者與影響者大多為人,人的思維情感較為復(fù)雜,在金融風(fēng)險中屬于不可控因素。一些影響金融體系的大事件往往都是由人引起的,面對利益、風(fēng)險等因素,人往往有趨利避害的心態(tài)[5]?,F(xiàn)階段,隨著網(wǎng)絡(luò)的不斷發(fā)展,人獲取信息的渠道也更加的方便,一些利好利空消息經(jīng)過網(wǎng)絡(luò)層面的放大,極容易失控,造成不可估量的影響。
因此,區(qū)域性金融風(fēng)險預(yù)警預(yù)測系統(tǒng)的關(guān)鍵在于對金融活動參與者的分析,以股票市場為例,參與用戶的年齡結(jié)構(gòu)、學(xué)歷結(jié)構(gòu)、家庭收入、消費水平及其偏好、獲取信息的來源、交易偏好與交易量等。這些數(shù)據(jù)需要建立起一個完整的評價指標(biāo)才能夠使用,用戶的數(shù)量、交易量可以作為一個定量指標(biāo)進行統(tǒng)計,然而一些定性的指標(biāo)如用戶行為,這些行為數(shù)據(jù)可以通過微博微信公眾號等社交平臺、搜索引擎、新聞門戶網(wǎng)站等途徑獲取,但是其數(shù)據(jù)來源錯綜復(fù)雜,需要建立起相應(yīng)的評估評價體系。經(jīng)過分析,初步建立起了區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)的用戶評價體系指標(biāo),如表1所示。
表1 區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)用戶評價體系指標(biāo)
評價體系指標(biāo)建立之后,需要對各項數(shù)據(jù)進行統(tǒng)計收集,可以考慮采用爬蟲技術(shù)進行深度收集。對于用戶數(shù)量、用戶的年齡性別等基礎(chǔ)信息的權(quán)重,完全可以由系統(tǒng)進行直接統(tǒng)計分析。而對于用戶行為等難以定量分析的指標(biāo)權(quán)重則可以通過專家進行評分的方式進行。
根據(jù)楊凱森[6]等學(xué)者給出的處理方法,通過對原始數(shù)據(jù)的處理,最終得到了區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)用戶評價體系的權(quán)重數(shù)值,其中用戶行為作為中介變量,其獲得的權(quán)重最高,高達0.86,其上一層變量中涵蓋了網(wǎng)絡(luò)行為0.32,操作行為0.28,用戶量級0.15,用戶結(jié)構(gòu)0.11,另外用戶指數(shù)與用戶行為成并列關(guān)系,其權(quán)重為0.14。
以此為基礎(chǔ),建立了大數(shù)據(jù)用戶參與模型,如圖1所示。該模型的目的是為了降低用戶行為對整個區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)的影響,降低用戶不理智行為、賭徒心態(tài)、抗風(fēng)險承壓能力的風(fēng)險。該系統(tǒng)通過用戶量級對體量的影響,用戶結(jié)構(gòu)對結(jié)構(gòu)數(shù)據(jù)的影響,用戶行為的影響,用戶指數(shù)對指數(shù)評估的影響等指標(biāo)進行數(shù)據(jù)分析,同時采用機器學(xué)習(xí)的手段完成了對成交量的預(yù)測、風(fēng)險的預(yù)測以及對異常行為的監(jiān)管。
圖1 大數(shù)據(jù)用戶參與模型
大數(shù)據(jù)背景下的區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)架構(gòu)應(yīng)當(dāng)從三個方面考慮:其應(yīng)涵蓋采集系統(tǒng),用于數(shù)據(jù)的采集錄入,還有數(shù)據(jù)庫系統(tǒng),用于數(shù)據(jù)的歸納分析,以及最關(guān)鍵的預(yù)警系統(tǒng),用于風(fēng)險的預(yù)測和監(jiān)察(見圖2)。
圖2 大數(shù)據(jù)背景下的區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)架構(gòu)圖
考慮到在信息采集時,除了傳統(tǒng)的交易量、用戶數(shù)量、用戶的年齡性別等基礎(chǔ)信息采集可以依賴計算機程序,例如結(jié)構(gòu)化數(shù)據(jù)采集、半結(jié)構(gòu)化WEB采集、宏觀數(shù)據(jù)收集等。而一些難以定量采集的數(shù)據(jù)如前文所述的用戶行為等數(shù)據(jù),采集較為困難,因此需要采用數(shù)據(jù)挖掘的手段,輔助以人工干預(yù)對數(shù)據(jù)進行采集整理,數(shù)據(jù)挖掘的方向可以包括爬蟲技術(shù)和掃描監(jiān)控技術(shù),例如風(fēng)險事件爬蟲、風(fēng)險指標(biāo)掃描監(jiān)測等。采集系統(tǒng)的架構(gòu)圖如圖3所示。
圖3 采集系統(tǒng)架構(gòu)圖
采集的數(shù)據(jù)數(shù)量龐大,來源廣泛,無法以統(tǒng)一的標(biāo)準(zhǔn)進行衡量,因此需要進一步的歸納總結(jié)分析。數(shù)據(jù)庫系統(tǒng)的作用便凸顯出來,采用機器學(xué)習(xí)的手段,通過大量的數(shù)據(jù)對預(yù)警模型進行訓(xùn)練,提高區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)的預(yù)警性。其系統(tǒng)架構(gòu)圖如圖4所示。
圖4 數(shù)據(jù)庫系統(tǒng)架構(gòu)圖
預(yù)警系統(tǒng)是整個區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)的外顯輸出部分,其涵蓋內(nèi)容應(yīng)包括風(fēng)險分析、預(yù)測分析與預(yù)警跟蹤等。考慮到預(yù)測結(jié)果與實際結(jié)果之間可能存在一定的偏差,因此需要引入機器學(xué)習(xí)等技術(shù)手段,將預(yù)測的結(jié)果與實際結(jié)果不斷地進行比對分析,通過大量的數(shù)據(jù)訓(xùn)練,使其結(jié)果不斷優(yōu)化,最終不斷地提高其預(yù)測結(jié)果,提高其結(jié)果的科學(xué)性與準(zhǔn)確性。考慮到金融活動突發(fā)性風(fēng)險因素較多,在必要的情況下需要依靠人力進行介入,而且,金融活動的變化極快,不斷地進行更新迭代,因此預(yù)警系統(tǒng)也應(yīng)附帶糾正算法,不斷地迭代升級,對系統(tǒng)進行優(yōu)化。預(yù)警系統(tǒng)架構(gòu)圖如圖5所示。
圖5 預(yù)警系統(tǒng)架構(gòu)圖
引發(fā)區(qū)域性金融風(fēng)險的因素較多,依靠傳統(tǒng)的人力、計算機將巨量的、來源廣泛的數(shù)據(jù)進行收集、整合、分析進而對風(fēng)險進行預(yù)測并不現(xiàn)實,其即時性與預(yù)測性也無法保證?,F(xiàn)階段只有以大數(shù)據(jù)的手段為支撐才能夠?qū)崿F(xiàn)對區(qū)域性金融風(fēng)險進行預(yù)警,設(shè)計一款大數(shù)據(jù)背景下的區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)勢在必行。本文對預(yù)警系統(tǒng)的設(shè)計原則進行了分析,該預(yù)警系統(tǒng)要滿足覆蓋范圍廣、即時反饋預(yù)測和自我調(diào)整修復(fù)等三個設(shè)計原則。同時通過對區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)用戶評價體系指標(biāo)進行權(quán)重計算,明確了用戶行為對區(qū)域性金融風(fēng)險預(yù)警系統(tǒng)的影響最大,以此為基礎(chǔ)設(shè)計了一款大數(shù)據(jù)背景下的區(qū)域性金融風(fēng)險預(yù)警系統(tǒng),為預(yù)防區(qū)域性金融風(fēng)險提供了一定的借鑒與參考。