孟繁星
[摘要]本文首先簡要說明什么是神經(jīng)動力學(xué),然后簡介神經(jīng)動力學(xué)模型中的BSB模型和多層感知器(MLP)模型,再說明如何將神經(jīng)動力學(xué)應(yīng)用于信用評級問題,最后對這種應(yīng)用做出評價。
[關(guān)鍵詞]神經(jīng)動力學(xué) 神經(jīng)網(wǎng)絡(luò) BSB模型 MLP模型信用評級
[中圖分類號]F224 [文獻標(biāo)識碼]A [文章編號]1009-5349(2016)22-0255-02
一、引言
神經(jīng)網(wǎng)絡(luò)在最近20年中得到了迅速的發(fā)展,有關(guān)的論文及著作已有許多,而神經(jīng)網(wǎng)絡(luò)與數(shù)學(xué)中動力學(xué)系統(tǒng)理論的交叉結(jié)合(稱之為神經(jīng)動力學(xué))雖也有所發(fā)展,但是在應(yīng)用上卻不是很廣泛。
自然界中的現(xiàn)象,我們都可以用數(shù)學(xué)模型去描述,大體上分為兩類,一類是確定性的數(shù)學(xué)模型,另一類是隨機性的數(shù)學(xué)模型。而動力學(xué)模型是最普遍的確定型的數(shù)學(xué)模型。
在信用風(fēng)險管理中,信用評級是其重要的組成部分。持續(xù)的評估可以幫助信用管理者監(jiān)測客戶的賬戶。對于現(xiàn)金充足的大公司來說,對銀行的評估有助于幫助他們決定分別應(yīng)在各家銀行存入多少錢。對于尋求貸款的企業(yè),幾個銀行的評估有時可以指導(dǎo)他們選擇合適的銀行來借款。
許多大的公司、銀行、政府及政府機構(gòu)現(xiàn)存的債務(wù)都有各自的信用評級。評級通常是由穆迪標(biāo)準(zhǔn)普爾和惠譽(IBCA)這樣的專業(yè)機構(gòu)完成的。根據(jù)企業(yè)評級結(jié)果,銀行可以決定對該企業(yè)的貸款使用何種等級的貸款利率。例如,一個信用等級較低的企業(yè)貸款利率會比較高。企業(yè)可以利用銀行評級來決定他們在銀行的存款額度。
本文著重說明神經(jīng)動力學(xué)模型能夠在信用風(fēng)險管理中得到應(yīng)用,試圖做到舉一反三,而不做實證分析,為推動神經(jīng)動力學(xué)在信用分析中的應(yīng)用提供一些參考意見。尤其是在信用評級分類中,神經(jīng)動力學(xué)模型對數(shù)據(jù)的要求沒有傳統(tǒng)的評級方法的要求那么高,且應(yīng)用較其他領(lǐng)域更直接一些,下面我就來介紹幾個比較典型的神經(jīng)動力學(xué)模型。
二、神經(jīng)動力學(xué)模型
(一)數(shù)學(xué)模型
一個神經(jīng)網(wǎng)絡(luò)包括n個處理單元,對于第i個單元,有三個相關(guān)的實數(shù):網(wǎng)絡(luò)的輸入信號,行為的狀態(tài)以及輸出。輸出是行為狀態(tài)變量的函數(shù),輸入是所有狀態(tài)和一個實參數(shù)矩陣——權(quán)重矩陣()的函數(shù)。一般假定 ,此處看成是從第j個神經(jīng)元到第i
個神經(jīng)元的傳送線路的強度。
為了完成對神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)描述,我們通過指定表達狀態(tài)隨時間改變的方式的一種規(guī)則,即一種動力學(xué)使神經(jīng)網(wǎng)絡(luò)置于一個動力系統(tǒng)之中。
1.離散的單層反饋形神經(jīng)網(wǎng)絡(luò)的動力學(xué)模型
N個神經(jīng)元排列成一個單層,如果它構(gòu)成全反饋的網(wǎng)絡(luò),這其中的每個神經(jīng)元的輸出都與其他神經(jīng)元的輸入相連,又整個網(wǎng)絡(luò)的輸入與輸出的神經(jīng)元數(shù)是相同的,都為N。如果假設(shè)第j個神經(jīng)元在時刻t的輸出為,那么在時刻t的N個神經(jīng)元的輸出向量可表示為,又假設(shè)第i個神經(jīng)元時刻t的內(nèi)部狀態(tài)為,即可得到時刻t的N個神經(jīng)元的內(nèi)部狀態(tài)為向量,若
其中f可以是最簡單的二值函數(shù)H,也可以S是形單調(diào)連續(xù)函數(shù),那么得到離散的單層反饋神經(jīng)網(wǎng)絡(luò)。下面介紹離散的Hopfield神經(jīng)網(wǎng)絡(luò)。
假定在(1)中的f取二值符號函數(shù),sgn形式,又第i個神經(jīng)元在時刻t的內(nèi)部狀態(tài)
其中是權(quán)重,是內(nèi)部狀態(tài)值。如果,那么,即第i個神經(jīng)元在t+1時刻興奮;如果 ,那么,即第i個神經(jīng)元在t+1時刻抑制。
我們的目的是先求出權(quán)重,然后求出,最后根據(jù) 的大小和權(quán)重對輸出進行分類。
2.BSB模型
①BSB模型
設(shè)W是對稱矩陣,且其最大的特征值有正的實部。記是模型的初始狀態(tài)向量,表示啟動一個輸入。假設(shè)模型由N個神經(jīng)元構(gòu)成,狀態(tài)向量的維數(shù)也為N,矩陣W是N×N陣,于是BSB模型的算法可以由以下方程完全給出:
其中β是小正常數(shù),稱之為反饋因子,是離散時間的狀態(tài)向量,W表示單層線性神經(jīng)網(wǎng)絡(luò)。函數(shù)φ是一個分段線性函數(shù)依賴于,
其中是的第j個分量。
②模型的應(yīng)用——分類
BSB模型的一項基本的應(yīng)用就是分類,這是由于作為吸引子的超立方體的頂點和相應(yīng)的定義完善的區(qū)域,于是BSB模型被用來作為一種無監(jiān)護的分類算法,而每一個不動點代表一組相關(guān)的數(shù)據(jù)構(gòu)成的分類,由正反饋產(chǎn)生的自我放大是分類方法的最重要的特征之一。
Anderson于1990年描述了利用BSB模型進行分類的方法,它可以從不同的放射射線中區(qū)分出輻射的信號。在這一應(yīng)用中,權(quán)矩陣是通過誤差糾正的線性相關(guān)的學(xué)習(xí)過程得到的。為了詳細(xì)說明,假設(shè)有K個訓(xùn)練的向量
隨機選擇向量,于是權(quán)矩陣可以根據(jù)偏差糾正算法得到
其中η是學(xué)習(xí)率參數(shù)。根據(jù)計算,輸入向量像其“老師”一樣表現(xiàn),因為線性結(jié)合會重新構(gòu)造輸入向量,而學(xué)習(xí)的目標(biāo)是使得
由式(6)給出的糾偏算法在最小均方意義下接近于理想的條件(7)。學(xué)習(xí)的過程是為了促使線性結(jié)合器給出一組特征向量,相應(yīng)的特征值等于1。為了模擬雷達分類,BSB模型應(yīng)用上述方法給出了權(quán)矩陣。
3.感知器模型
感知器是由F.Rosenblatt于1957年提出的。設(shè)為輸入量,y為輸出量,輸入與輸出之間滿足:
其中為權(quán)系數(shù),θ為閾值,函數(shù)為分段常數(shù)函數(shù),
令,那么
于是問題化為已知兩個樣本集分別為,要求權(quán)系數(shù)和閾值使得
如果A,B兩類樣本是線性可分的,即可用一根直線將兩類樣本分隔開來,而且有一段距離(參見圖1),那么形如(8)式的解有無數(shù)個。我們采用單層感知器來求解這個問題。
又如圖2所示的二維平面中,A類樣本分布在原點的附近,B類樣本分布在A類樣本的外部區(qū)域中,兩類樣本不能用直線分隔開來。
對于圖2的問題,就是尋找一個區(qū)域,使其內(nèi)部為A類樣本,其外部為B類樣本??梢栽诙S輸入空間中劃出三根直線,因為他們的權(quán)系數(shù)和閾值各不相同,因此3根直線的斜率與截距也不相同(如圖3所示)。將這三個單元所得到的直線作相應(yīng)的邏輯運算。
其中z為輸出單元,這樣得到一個封閉區(qū)域即可正確劃分兩類樣本。
(二)模型在信用分類評級上的應(yīng)用
從理論上講,以上兩類模型都能解決分類問題,前類神經(jīng)動力學(xué)模型是有導(dǎo)師學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),是一種具有聯(lián)想記憶功能的反饋動力學(xué)系統(tǒng),能較好地逼近f,而多層感知器最適合解決分類問題,因為分類問題可視為求解靜態(tài)的映射f,前向網(wǎng)絡(luò)通過簡單處理單元的復(fù)合可獲得較強的處理輸入輸出關(guān)系的能力,能更好地逼近f。
三、對神經(jīng)動力學(xué)模型在信用評級中應(yīng)用的評論
1.準(zhǔn)確性較高
在測試數(shù)據(jù)為線性關(guān)系可分時,則線性判別分析方法的準(zhǔn)確性和多層感知器相當(dāng)。但是在測試數(shù)據(jù)為非線性關(guān)系的情況下,準(zhǔn)確性比較高。比如,在信用分類中加入了行業(yè)分析、發(fā)展?jié)摿Φ纫蛩氐那闆r下,多層感知器分類的準(zhǔn)確性明顯地高于多元統(tǒng)計中的判別分析法。
2.適應(yīng)性強
多層感知器有較強的適應(yīng)訓(xùn)練樣本變化的能力,當(dāng)訓(xùn)練樣本增加新的數(shù)據(jù)時,多層感知器能記憶原有的知識,根據(jù)新增的數(shù)據(jù)作適當(dāng)?shù)恼{(diào)整,使之表示的映射關(guān)系能更好地刻畫新樣本所含的信息。這一點不僅使多層感知器具有較強的適應(yīng)樣本變化的能力,而且還使得它具有動態(tài)刻畫映射關(guān)系的能力,也克服了線性判別分析方法的靜態(tài)特點。
3.健壯性
多層感知器對樣本的分布、協(xié)方差等沒有要求,對樣本中存在的噪音數(shù)據(jù)、偏差數(shù)據(jù)不敏感。線性判別分析方法雖然對噪音數(shù)據(jù)不很敏感,但它對樣本分布和協(xié)方差均有很高的要求。
4.神經(jīng)網(wǎng)絡(luò)的主要缺點
(1)對樣本的依賴性過強,這就要求在選擇樣本時既要全面又要典型。因為它很少有人的主觀判斷的介入,所以它對樣本的選擇提出了很高的要求。
(2)解釋功能差。神經(jīng)網(wǎng)絡(luò)被稱為黑箱,即它僅能給出一個判斷結(jié)果,而不能告訴你為什么。為了解決這個缺點,就應(yīng)該將多層感知器和其他解釋功能較好的方法結(jié)合起來,形成雜和系統(tǒng),這樣既可以保持神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性高、適應(yīng)性強、健壯性的特點,同時也增加了它的解釋功能。
5.輸入特征變量的確定
首先,要從所有的可能的指標(biāo)中確定出關(guān)鍵指標(biāo),這同時也需要依賴于其他的統(tǒng)計方法。第二個問題是樣本分成多少個種類,即分成哪幾種信用等級比較合適。這些問題都是神經(jīng)網(wǎng)絡(luò)方法無法獨自解決的,要依賴于其他方法。
【參考文獻】
[1]阮炯,顧凡及,蔡志杰.神經(jīng)動力學(xué)模型方法和應(yīng)用[M].北京:科學(xué)出版社,2002.
[2]英國皇家銀行學(xué)會布來恩.科伊爾(著),周道,許關(guān)偉(譯).信用風(fēng)險管理[M].北京:中信出版社,2003.
[3]石曉軍,陳殿左.信用治理:文化、流程與工具[M].北京:機械工業(yè)出版社,2004.
[4]約翰.B.考埃特,愛德華.I.愛特曼,保羅.納拉亞南(著),石曉軍,張振霞(譯).演進著的信用風(fēng)險管理:金融領(lǐng)域面臨的巨大挑戰(zhàn)[M].北京:機械工業(yè)出版社,2001.
責(zé)任編輯:楊柳