劉恩猛 劉家鵬
摘 要 大數據的應用為金融風險管理提供了更多的決策信息,也對金融風險管理技術提出了更高的要求。本文討論了金融工程專業(yè)相關實踐課程中引入大數據風控相關內容的可能,意在提高學生風險管理意識和管理技術水平,適應社會人才的需要。
關鍵詞 大數據風控 金融風險管理 實踐教學
0引言
2008年全球金融危機后,我國經濟增速放緩,金融市場波動加大,風險控制與管理成為金融部門或企業(yè)工作內容不可或缺的一部分。然而,傳統金融風險管理主要是定性分析和一些傳統的(系統內數據)定量分析相結合來構建風險管理體系,這在應對當前金融市場的頻繁波動時顯的不夠靈敏。這些金融風控中的不足可以利用大數據風控加以改進,而這些改進所需知識和技術,可以融合在金融工程專業(yè)本科教學的一系列相關實踐課程中,比如應用統計學、金融計量學、金融數據挖掘、金融風險管理、保險學(保險精算)、量化投資、互聯網金融等,這對原有的金融實踐課程教學提出新的挑戰(zhàn)。
1大數據風控的特點
大數據的出現與應用讓金融風險控制方法和信息來源都有了質的飛越。大數據具有數據量大、信息豐富等優(yōu)點,但也存在數據結構復雜,處理難度大的問題。風險管理中若能用好大數據,可以增加信息來源,為多源信息融合提供有利條件,可以提高風險管理有效性。當前利用大數據做風險控制既有優(yōu)勢也有困難,優(yōu)勢是:覆蓋面廣、信息維度豐富、數據獲取及時;注重強相關信息,忽略弱相關信息;可以豐富數據的廣度和深度;困難是:隱私得不到保護,數據查得率不高,數據覆蓋率不高,匹配率不高,飽和度不高,鮮活度不高。隨著網絡信息監(jiān)管的加強,信息來源也會越來越規(guī)范,為提高大數據質量提供了有利條件。
2大數據風控在金融實踐教學中的應用
將大數據的理論與應用融入金融教學實踐中,可以增加學生獲取、利用大數據的技術手段,提高其風險管理的技術水平;開拓學生視野,提高金融風險管理的能力,加強學生利用大數據進行金融風險管理的意識。和傳統的風險控制理論相比,金融大數據的搜集(多種技術手段)和應用(傳統數據、商業(yè)數據庫大數據和網絡搜集的數據等多源信息的綜合利用)可以提高風險管理效率,在原有傳統的風險管理理論基礎上增加風險信息來源與決策模型的選擇,提高風險管理的有效性,適應社會人才需求。學生可以在不同的課程中學習大數據風控方法和技術,比如我們可以將其融入到下列課程中。
2.1在統計學、金融計量學、金融數據挖掘等課程中講解大數據統計理論
大數據的出現與應用,對傳統統計工作提出了挑戰(zhàn),原有的統計方法可能在面對大數據時會無能為力,需要提出新的統計方法才能解決現實問題,如高維變量的選擇、并行計算,利用文本挖掘等技術獲得數據等,這些可以在講解統計模型理論時提及,讓學生對大數據問題有所認識,在金融數據挖掘課程實驗中重點講解適合大數據風控的模型。
2.2在python語言、金融數據挖掘課程中講解相關獲取和利用大數據的技術
大數據信息可以由視頻、語音、圖片、文本、數字等形式表現,但這些信息中90%是以文本的形式體現的,所以信息的提取技術非常關鍵,常用的技術是網絡爬蟲和文本挖掘等,這些可以在python語言、金融數據挖掘等課程中講解相關技術。另外,大數據獲取后的清洗、整理與利用也非常關鍵。數據清洗是python的強項,處理與應用可以在金融計量(常用的是Eviews軟件)或金融數據挖掘(常用的r語音)中講解。
2.3在金融風險管理、互聯網金融課程中講解大數據風控的應用
利用網絡爬蟲、文本挖掘等方法獲得大數據,并將其利用在欺詐行為識別、貸前風險控制、運營風險管理等。如對P2P平臺借款者違約風險評估中,平臺能通過金融系統獲得一些傳統的征信數據,僅憑這些數據提供的決策信息有限,借款人可能有大量的信用相關信息散落在網絡上,這些信息重要但分散,需要利用相關數據挖掘技術查找并提煉,比如可以找出借款人經驗及能力信息、居住穩(wěn)定性信息、借款人及其家人健康信息和信用風險方面的信息(如不良信用記錄、拖欠稅費、電費等情況,還款能力問題等)。
2.4在信用評級課程中,利用大數據改善傳統評級方法中信息利用的局限
評級機構搜集被評級對象的公開信息與非公開信息,傳統的搜集方法容易遺漏,造成評級時的信息不充分。這里可以借助大數據,在網絡上搜集各類公開或非公開的文本信息進行提煉和加工,為劃定評級結果提供更多的信息。比如可以利用文本挖掘技術搜集有關被評級公司運營的情況,包括物流信息、與合作伙伴關系(如拖欠貨款、交貨逾期等)、消費者對其的評價等。
信用評級中的幾個難點可以利用大數據得到緩解,比如被評級主體的戰(zhàn)略風險和還款意愿的量化問題。這兩項在機構評級中往往作為調整項,無法真正量化,但兩項內容對應違約風險來說是非常關鍵的。我們可以利用文本挖掘,采集、挖掘公司相關信息,評估公司的還款意愿,評估戰(zhàn)略風險對違約風險的影響。比如在專利數據庫可以利用文本挖掘技術,發(fā)現企業(yè)主營產品的技術創(chuàng)新趨勢,和企業(yè)的創(chuàng)新戰(zhàn)略作對比,判斷企業(yè)戰(zhàn)略的合理性。在網絡信息中挖掘被評級對象的信用風險相關信息,確認其還款意愿的高低。
2.5保險(精算)學課程中,可利用大數據提高精算精度、甄別理賠欺詐等
現在保險行業(yè)對投保人或標的物的風險評估已經不再局限于歷史數據和行業(yè)數據。以車險為例,車載傳感器設備收集的駕駛員行為數據、二手車交易數據等大數據的獲取和利用,為風險特征描述和數據資源的獲取都帶來了便利。對保險精算師來講,充分利用大數據資源,可以建立更有效的模型,更精準的識別對象的潛在風險,提高精算準確度,幫助公司更準確的評估風險和計算準備金。
另外,通過保單數據、理賠記錄(不限于公司內)、社交網絡數據、犯罪記錄等多樣化的大數據源,輔之以有效的算法和模型可以識別投保人存在的欺詐風險、理賠中可能存在的騙保等欺詐行為,還可能挖掘出欺詐的方式等。
3可行性分析
以中國計量大學經濟與管理學院為例,分院建有金融工程實驗室,為大數據風控引入實踐教學提供了硬件基礎;分院還購買了wind、同花順等金融數據庫,再借助網絡爬蟲、文本挖掘等技術就構建多源信息的大數據,為風險控制與管理提供數據支持。本校的金融工程系學生(二年級及以上)具備了良好的經濟、金融知識和定量分析的基礎,對于學習大數據理論及模型應用奠定了堅實的基礎。有了獲得大數據的技術支持,相關教學中案例數據可以經常更新,讓學生接觸實際中大數據應用的需求,認識大數據的價值。
4總結
本文從金融實踐教學的角度討論了對大數據風控的引入,目的是使學生學會大數據統計思維,并學習大數據在金融風險管理方面應用的技術,為將來適應社會需求、從事風險控制工作做好準備。網絡時代帶來了信息爆炸,如何應用好海量信息是金融風險管理者需要思考的問題。我們認為從金融(工程)的本科教育就開始灌輸大數據統計思維,教授大數據技術是個不錯的嘗試。
參考文獻
[1] 陳曉華,曹國嶺.互聯網金融風險控制[M].人民郵電出版社,2016.
[2] 黃曉斌,趙超.文本挖掘在網絡輿情信息分析中的應用[J].情報科學,2009(01):96-101.
[3] 劉蘭,趙新力,李艷.基于文本挖掘和技術路線圖的技術創(chuàng)新機會發(fā)現[J].中國軟科學,2007(06):102-105.
[4] 王星等.大數據分析:方法與應用[M].北京:清華大學出版社,2013.
[5] 朱建平,謝邦昌,馬雙鴿,張德富,方匡南,潘璠.大數據統計理論、方法與應用[M].北京:北京大學出版社,2019.