亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自然語言技術的內部審計風險預警框架構建與應用

        2019-09-10 07:22:44李猛朱迎際莊軼
        中國內部審計 2019年6期

        李猛 朱迎際 莊軼

        [關鍵詞]自然語言 內部審計 非結構化數據 風險預警

        一、文獻綜述

        現今商業(yè)銀行面臨的風險,影響最大的是當前經濟下行周期形勢下,不斷頻發(fā)的信用風險以及對信用風險的控制及其穩(wěn)定情況的影響。因此,建立商業(yè)銀行授信風險預警機制是防范風險、避免爆發(fā)危機的重要措施之一。風險預警機制在商業(yè)銀行中的應用,分為宏觀層面和微觀層面,本文重點關注商業(yè)銀行審計風險預警機制的構建,即風險預警機制微觀層面模型方法的選擇。

        (一)自然語言處理技術

        自然語言處理(Natural Language Processing)是人工智能中最難解決的問題之一,是運用人類自然語言與計算機系統進行通信、交互等不可缺少的技術。借助人工智能的優(yōu)勢,該技術可以全面運用商業(yè)銀行內部生成的大數據,不斷訓練和調整風險預警模型,使風險預警模型通過自我學習適應商業(yè)銀行內外部環(huán)境的變化,提高風險預警的正確性和預測效率。自然語言處理技術在新時代下可運用于語義分析、信息抽取、文本挖掘、機器翻譯(PF Brown等,1993)、信息檢索、問答系統、對話系統(Su P H等,2016)等高新技術領域,并顯著提升工作效率,更早發(fā)現各類風險。

        自然語言處理被定義為一門研究人與人之間交流以及人與計算機交流中語言問題的基礎學科。Bill Manaris(1998)認為,自然語言處理要研究表示語言能力和語言應用的模型,建立計算機自動框架來實現特定的語言模型,提出對應方案,逐漸改進語言模型,根據語言模型設計各種應用系統并探討這些應用系統的測評技術。李生(2013)指出,自然語言處理的研發(fā)方法分為基于規(guī)則和基于統計兩種,前者是手動獲取語言規(guī)則,后者則是通過對海量語料庫的計量分析,對自然語言進行處理。自然語言處理的底層研究主要包括詞法、句法、語義、語用、語境與篇章等分析研究。林奕歐等(2017)指出,深度學習方法逐步在機器翻譯、機器問答、自動文摘、閱讀理解等自然語言理解領域發(fā)展,逐漸成為自然語言處理的主流工具?!胺植际教卣鞅硎尽笔巧疃葘W習與自然語言處理相結合的切入點,這些分布式特征是通過神經網絡語言模型學習得到的。

        自然語言處理的常見算法包括隱馬爾可夫模型、條件隨機場和神經網絡等。微軟亞洲研究院(2017)指出,自然語言處理技術的研究與應用主要包括以下方面:一是句法語義分析。對于給定的句子進行句法分析、語義角色解析和多義詞消歧等。二是信息抽取。從給定文本中抽取重要信息,涉及實體解析、時間抽取、因果關系抽取等關鍵技術。三是文本數據挖掘。包括文本聚類、分類、信息抽取等以及對挖掘信息和知識的可視化、交互式的表達界面等。四是機器翻譯。把輸入的源語言文本通過自動翻譯獲得另外一種語言的文本,可細分為文本翻譯、語音翻譯、圖形翻譯等。五是信息檢索。為大規(guī)模文檔中的詞匯建立索引,并對輸入的查詢表達式(如一個檢索詞或者一個句子)進行分析,然后在索引中查找匹配的候選文檔。六是問答系統。對自然語言表達的問題,由問答系統給出精準答案。七是對話系統。通過一系列的對話,同用戶進行聊天,完成某一項任務。

        (二)內部審計風險預警

        從模型方法選擇來看,風險預警的傳統模型有其自身固有的局限性,如一般依托于線性和結構化數據,難以處理復雜的非線性和非結構化數據形成的新模型,缺少自我訓練和自我調整商業(yè)銀行環(huán)境變化的能力。新常態(tài)下的金融背景加劇了商業(yè)銀行內外部環(huán)境的變化,促使商業(yè)銀行風險呈現出繁雜性和不穩(wěn)定性,因而傳統風險預警模型難以符合當前金融形勢下對內部審計提出的要求,亟待一種新技術的引入以進一步擴大審計范圍、優(yōu)化審計工具、提高審計效率,同時具有自我學習能力,適應不斷變化的現代業(yè)務模式。

        魯愛民等(2012)指出,審計預警系統的主要構成應該包括對商業(yè)銀行內外部經營環(huán)境的評測、對企業(yè)治理機制與貫徹執(zhí)行程度的審計、對關聯風險解析的審計以及數據分析與預警通知四大部分。生麗英(2017)認為,風險模型是在選擇具有一定特征樣本的基礎上,借助統計分析方法,在預警自變量指標與問題發(fā)生的概率性因變量指標之間,通過實際驗證分析建立間接或直接的函數性關系。一個實用的風險預警系統應包括四個部分:風險的檢查測試與分析、評價風險水平、傳送高效可靠的預警信息、確定風險應急處理機制。譚紅艷(2015)提出了金融內部審計預警系統構建的初步設想,即設定預警目標、設計預警標準、明確預警閥值、預警信息反饋等五個步驟。包商銀行股份有限公司審計部(2017)從建立預警監(jiān)測信息平臺、實現資源整合管理、完善預警監(jiān)測基本方法和工具三個方面構建了非現場審計預警監(jiān)測體系運作模式。武慕汐等(2017)認為政府審計預警系統應當由預警模塊、信息模塊、干預模塊及反饋調節(jié)模塊構成。中國建設銀行審計部(2017)運用非現場審計系統,整合銀行多個系統數據資源,定義相關指標,編制非現場模型群組,建立企業(yè)經營狀況定量分析、企業(yè)重大風險事項定性評價兩大核心模塊,再通過風險整合工具,形成對公授信客戶分類預警名單。

        (三)授信業(yè)務審計

        當前商業(yè)銀行授信業(yè)務工作中存在貸前風險防范意識淡薄、內部控制制度執(zhí)行不嚴、貸后檢查管理不到位、授信從業(yè)人員素質有待提高等問題。SC Chen等(2011)以某銀行的授信審計數據為例,構建了能夠有效識別授信業(yè)務規(guī)則的潛在關鍵因素的模型,最大限度地降低授信風險相關損失,從而有效提升銀行授信業(yè)務的穩(wěn)定性和盈利能力。李燁等(2013)通過分析新時期農商行授信風險的內容和授信管理的現狀,指出內部審計工作有助于識別授信風險領域,確定授信管理戰(zhàn)略目標,指導授信管理戰(zhàn)略調整。中國農業(yè)銀行審計局成都分局課題組(2013)根據各業(yè)務品種建立起貸款金額抽樣模型、風險要素抽樣模型和風險特征抽樣模型,對商業(yè)銀行授信業(yè)務審計中的抽樣問題進行了研究,使得抽取的樣本更集中于高風險領域。侯景波等(2015)對商業(yè)銀行集團授信業(yè)務中資金運用失控、多頭授信套利、放大信用風險等問題的審計檢查與監(jiān)督進行了探討。甘肅銀行股份有限公司(2017)在項目實施中引入群組化模型來完成數據整合、挖掘和分析,形成了一套較為系統的適用于城市商業(yè)銀行授信業(yè)務內部審計工作的方法體系,提高了內部審計質量。

        以上風險模型實際案例多基于傳統形式為線性范式的各類模型,而這些模型僅基于結構化數據才能實現,有一定的局限性。隨著大數據、人工智能技術的發(fā)展,基于人工智能技術的深度學習、自然語言處理技術的智能化模型逐步產生。大數據技術可以解析處理文本、圖片、音視頻等非結構化數據,機器的深度學習可以模仿人類的學習技巧不斷提高。最著名的案例是2017年戰(zhàn)勝世界排名第一圍棋手柯潔的阿爾法狗。2018年5月,谷歌公司發(fā)布的語音助手實現了機器向飯店、發(fā)廊打電話預約時間等,這些成就再次讓人感受到人工智能的魅力。

        二、框架構建

        隨著我國市場經濟的不斷發(fā)展,商業(yè)銀行授信業(yè)務已經成為主要的資產業(yè)務,授信業(yè)務的發(fā)展是商業(yè)銀行發(fā)展的重要基礎,也是商業(yè)銀行利益增長的重要途徑。其中的授信風險管理和控制就變得更加重要,如果授信風險管理和控制不到位很可能影響商業(yè)銀行自身的發(fā)展,甚至威脅市場經濟的穩(wěn)定。我國商業(yè)銀行授信風險管理過程中存在的問題包括不良貸款率較高、授信風險管理內部控制機制不健全等。新常態(tài)下加強對商業(yè)銀行授信風險的管理和控制,對我國商業(yè)銀行發(fā)展乃至經濟金融的穩(wěn)定都具有重要意義,商業(yè)銀行也可以利用對授信風險的合理控制,實現利益的增長,從而提高在市場經濟中的核心競爭力。

        當前,國內外尚無將自然語言處理技術成功用于授信業(yè)務內部審計風險預警、落實授信業(yè)務規(guī)定、防范授信業(yè)務風險的框架。基于自然語言處理技術的內部審計風險預警框架(如圖1所示)屬于商業(yè)銀行風險預警框架,目的是借助內部審計部門構建的自然語言處理項目,評估商業(yè)銀行授信業(yè)務相關風險水平,輸出商業(yè)銀行授信業(yè)務風險預警信息,明確授信風險來源,提供風險處理非現場監(jiān)控意見,從而達到降低甚至清除風險狀態(tài)或應對風險、降低風險損失的目標。

        本框架以授信業(yè)務中的審批意見或調查報告為數據基礎,應用自然語言技術解析與核驗后,輸出授信業(yè)務風險記錄,進一步進行風險預警。主要處理步驟如下。

        (一)資料準備

        通過跑批腳本從商業(yè)銀行大數據平臺批量自動提取來自授信業(yè)務系統各環(huán)節(jié)(評級、授信、授信調整、用信、放款等環(huán)節(jié))的非結構化數據(審批意見、調查報告等)和結構化數據等資料,實現數據的每日自動更新。

        (二)數據要素解析

        數據資料準備完成后,由計算機系統自動運用自然語言技術智能解析授信業(yè)務各環(huán)節(jié)非結構化數據中的業(yè)務要素和關注點,作為步驟3要素核驗的數據來源。

        (三)要素核驗

        由計算機系統自動將授信業(yè)務各環(huán)節(jié)非結構化數據解析出的要素與授信業(yè)務各環(huán)節(jié)內授信業(yè)務結構化數據進行核驗,某一環(huán)節(jié)解析出的要素與后續(xù)環(huán)節(jié)解析出的要素或授信業(yè)務結構化數據進行核驗,并基于相似度或概率算法判定授信業(yè)務各環(huán)節(jié)中的各要素是否存在不一致的情況,形成授信業(yè)務疑似風險線索清單。

        (四)數據輸出

        將步驟2數據要素解析中形成的非結構化數據要素解析結果、要素核驗步驟形成的結果等輸出,形成關系數據庫可存儲的二維化關系表,每日自動傳送至操作型數據存儲,并可在商業(yè)銀行審計系統中查看分析,作為審計模型編寫人員編制非現場核查審計模型的數據基礎。

        (五)非現場內部審計核實

        采用“初核—下發(fā)核實—復核”的作業(yè)流程,對于步驟4數據輸出中形成的授信業(yè)務疑似風險清單,經總部內部審計人員初次復核后,通過商業(yè)銀行審計系統的非現場監(jiān)控模塊下發(fā)給各分支機構,由各分支機構內部審計人員進行專人核實,并由總部內部審計人員進行再次復核。

        (六)風險預警

        對于非現場內部審計核實中已查證屬實的風險記錄,通過非現場監(jiān)控報告定期通報,并作進一步處理,作為今后現場審計發(fā)現問題的重要線索,充分發(fā)揮內部審計第三道防線的作用。

        三、框架解析算法與流程

        基于自然語言處理技術的內部審計風險預警框架,主要通過自然語言處理技術中的語義分析算法來實現解析授信業(yè)務系統非結構化數據的業(yè)務要素。

        (一)自然語言處理解析算法

        對非結構化數據進行有效處理,需要對其進行統一的描述。在技術層面,首先,采用自然語言處理技術中的語義分析算法來處理非結構化數據中的文本信息較為合適,引入中文核心語義庫,劃分出積極、中性、消極三個不同詞性的詞庫,然后解析句子結構并根據文字傾向性進行拆分,進而對整篇文檔進行語境解析,自動生成摘要并提取關鍵信息;其次,將多份相同類型的文檔進行橫向比較,從而挖掘出信息間的關聯關系;最后,對海量信息進行挖掘,解析出關注熱點,發(fā)掘潛在價值。非結構化數據主要挖掘流程如下:

        1. 詞語。語別與詞匯的意義。

        2. 句子。解析句子結構,解析文字傾向性。

        3. 篇章。解析篇章語境,自動生成摘要,提取關鍵信息。

        4. 多文檔。事件發(fā)現與跟蹤,解析信息關聯性。

        5. 海量信息。解析熱點,發(fā)掘價值。

        語義分析是在分解辨析句子的語法構成和詞義上,推演出可以反映該語句含義的形式化表達,從而使計算機解析出人類自然語言,并進行深層次的知識獲取,抽取出句子背后的語義信息,其處理流程如圖2所示。對于待處理的文本數據,通過語義分析技術解析出其中包含的語義信息,并建立索引;而對于使用者的查詢數據,采用相同的方法以備查詢所用。通過計算關鍵字和語義片段的相似度,將各個語義的相似程度進行融合,最終得到查詢語句的相似度,從數據源中找出對應文本信息。

        語義分析技術目前已廣泛運用于語義檢索和查詢結果優(yōu)化的研究中,審計底稿中絕大部分材料是非結構化的文字描述,有很多底稿還包含審計人員的主觀評價。因此,可以通過語義分析技術挖掘出文本中的主客觀性、觀點、審批意見等,對其情感傾向作出判斷。

        (二)解析算法實現流程

        自然語言處理解析算法實現語義信息提取的全流程,主要包括以下環(huán)節(jié):

        1. 語法處理。在傳統自然語言算法處理的基礎上,引入深度學習領域先進的算法,主要做法是對文本中的語句進行切分、詞性標注,并確定詞性間的語法關系,如主謂、動賓、定中等關系。

        2. 語句過濾。由于后一階段的需要,對于語法處理中某些無意義的信息或獲取不到正常語義信息的句子,本階段會將其過濾。

        3. 主干提取。通過分析主干句子的詞性來明確語句所屬的句型,如在語句中出現狀中關系和定中關系時,可以去掉其中表示狀語和定語的詞。

        4. 句型解析。通過提取的句子主干成分,分析詞性來明確該句子的句型,如某一語句結構為“代詞—動詞—名詞”時,即可明確該語句符合陳述句的句型。

        5. 修飾詞獲取。在最終確定語義信息之前,需要分析語句中的修飾詞,提取其中修飾性詞語包含的信息,如定語、補語等。

        6. 信息生成。根據上一階段的處理結果,提取出語義片段,通過結構化信息的形式表現出來。

        四、框架應用——以NJ銀行授信業(yè)務為例

        NJ銀行授信業(yè)務流程中產生了大量非結構化文本數據,比如各類審批意見和調查報告等,而現有的非現場監(jiān)控模型由人工基于結構化二維數據構建,缺少對審批意見等數據的分析應用。本文提出的基于自然語言處理技術的內部審計風險預警框架的目的,是結合實踐經驗,運用自然語言處理技術對此類非結構化文本信息進行解析和挖掘,將文本中的關鍵信息數據化,與傳統結構化數據結合分析,作出具有前瞻性、實用性的成果。利用大數據和人工智能與銀行業(yè)務相結合的應用,提高非現場審計中風險預警工作效率和業(yè)務洞察力。

        本項目需運用自然語言處理技術對客戶評級環(huán)節(jié)的審批意見、授信環(huán)節(jié)的審批意見和調查報告、授信環(huán)節(jié)額度或利率歷次調整(個別業(yè)務會有要素調整)的會簽意見和調查報告、用信環(huán)節(jié)的審批意見和調查報告進行解析,從而進一步落實審批意見。

        (一)業(yè)務需求

        1.授信審批意見和調查報告語義解析。解析NJ銀行授信業(yè)務流程,自動批量采集并展現NJ銀行尚未結清的所有授信業(yè)務每個環(huán)節(jié)的審批意見和調查報告等。運用自然語言處理技術解析客戶評級環(huán)節(jié)的審批意見、授信環(huán)節(jié)的審批意見和調查報告、授信環(huán)節(jié)額度或利率歷次調整的會簽意見和調查報告,用信環(huán)節(jié)的審批意見和調查報告,解析出業(yè)務要素等關注點(如業(yè)務品種、申請金額等),如表1所示。

        2.對比和核驗。利用豐富的語料庫,結合深度學習平臺,從NJ銀行存量及新增審批意見和調查報告中解析出重點關注點并進一步結構化,提供與授信業(yè)務中業(yè)務要素進行對比、核驗的依據,對比與核驗的要素主要包括業(yè)務品種、額度等。對比與核驗主要包括三部分:一是用信環(huán)節(jié)是否突破授信環(huán)節(jié)(如有授信額度的要素調整環(huán)節(jié),以調整后的為準)的限制。二是用信環(huán)節(jié)解析出的要素與信貸系統中記錄實際發(fā)生的放款環(huán)節(jié)結構化數據進行對比和核驗。三是客戶評級環(huán)節(jié)、授信環(huán)節(jié)、授信要素調整環(huán)節(jié)、用信環(huán)節(jié)等解析出的業(yè)務要素等關注點與各自環(huán)節(jié)內信貸系統存在的結構化數據進行對比和核驗。

        將上述解析出的業(yè)務要素等關注點,形成結構化數據,傳送至操作型數據存儲,輔助完成對審批意見和調查報告落實情況的檢查,進一步拓展應用范圍。通過整合NJ銀行內外部數據,構建支撐各類應用的語義實體庫,提供智能、靈活的交互式圖譜分析解決方案。在解析過程中,幫助NJ銀行完成授信業(yè)務語料庫(業(yè)務要素等關注點)的智能積累,實現系統深度學習,不斷調優(yōu),推動授信風險管理的智能化。

        (二)系統實現

        基于自然語言處理技術的內部審計風險預警框架所開發(fā)的應用系統采用B/S架構(即Browser/Server,瀏覽器/服務器),兼容性強。軟件方面采用主流語言和數據庫Java、Hadoop、ArangoDB、MySQL、Elastic Search等,硬件方面采用3臺數據庫服務器、1臺Web服務器、1臺自然語言解析與核驗服務器。系統每日從操作型數據存儲中提取數據,經自然語言處理要素解析與核驗后,形成授信業(yè)務風險記錄輸出,系統詳細架構如圖3所示。

        (三)應用成效

        NJ銀行運用基于自然語言處理技術,每日處理公司客戶約10,000戶,未結清授信業(yè)務約50,000筆,在授信環(huán)節(jié)核驗方面發(fā)現風險記錄約300條,在授信調整環(huán)節(jié)核驗方面發(fā)現風險記錄約50條,在用信環(huán)節(jié)核驗方面發(fā)現風險記錄約3500條,用信環(huán)節(jié)是否突存授信環(huán)節(jié)核驗方面發(fā)現風險記錄約830條,放款環(huán)節(jié)與用信環(huán)節(jié)核驗方面發(fā)現風險記錄約3600條,可見授信業(yè)務用信環(huán)節(jié)是內部審計需重點關注的方向,是貸后管理的重要參考。

        通過智能審計系統分發(fā)給各分行進行非現場審計核實查證,經內部審計人員比對授信業(yè)務系統中的審批意見與執(zhí)行信息,核實確認兩者不一致的風險記錄,發(fā)現了主要問題,充分發(fā)揮了運用自然語言處理技術進行內部審計風險預警的效果。

        (作者單位:南京銀行,郵政編碼:210008,電子郵箱:lim9@njcb.com.cn)

        主要參考文獻

        李生.自然語言處理的研究與發(fā)展[J].燕山大學學報, 2013(5):377-384

        林奕歐,雷航,李曉瑜等.自然語言處理中的深度學習:方法及應用[J].電子科技大學學報, 2017(6):913-919

        魯愛民,盂志青.審計預警系統的構建研究[J].會計之友, 2012(29):91-98

        生麗英.企業(yè)風險的內部審計預警機制研究:基于大數據與ANN模型的應用[J].中國內部審計, 2017(9):12-18

        武慕汐,馮淑霞.關于構建政府審計預警機制的思考[J].經濟師, 2017(8):160-161

        最近中文字幕视频高清| 日韩精品免费一区二区三区观看| 色婷婷五月综合激情中文字幕| 色八区人妻在线视频免费| 久久av无码精品人妻糸列| 中文字幕久久熟女人妻av免费| 极品粉嫩小仙女高潮喷水网站| 国产女人高潮叫床免费视频| 国产一国产一级新婚之夜| 免费的黄网站精品久久| 中文字幕女优av在线| 亚洲国产成人精品无码一区二区| 亚洲免费视频播放| 精品国产亚洲人成在线观看| 所有视频在线观看免费| 国产性生大片免费观看性| 久久久久久无码av成人影院| 国精品无码一区二区三区在线| 久热国产vs视频在线观看| 久久ri精品高清一区二区三区| 国产男女做爰猛烈视频网站| 日本午夜精品一区二区三区| 国产精品www夜色视频| 欧美日本国产三级在线| 国产精品很黄很色很爽的网站 | chinese国产在线视频| 亚洲偷自拍国综合第一页国模| 久久无码人妻丰满熟妇区毛片| 国产第一页屁屁影院| 美女被射视频在线观看91| 亚洲一区二区三区偷拍厕所| 少妇私密会所按摩到高潮呻吟| 中文字幕国产91| 麻豆av毛片在线观看| 亚洲成av人在线观看网址| 艳妇乳肉豪妇荡乳av无码福利| 高清av一区二区三区在线| 国产成人自拍高清在线| 亚洲国产无套无码av电影| 第九色区Aⅴ天堂| 中文字日产幕码三区国产|