摘要:由于企業(yè)信用評級具有小樣本、非線性、高維數(shù)等問題,傳統(tǒng)的評級方法并不能很好地適用。采用支持向量機方法來對評級指標體系進行特征選擇,建立上市企業(yè)信用評級模型,對上海證券交易所中813家上市企業(yè)進行實證研究,結(jié)果顯示,通過支持向量機進行特征選擇的支持向量機具有較高的預測準確度。
關(guān)鍵詞:支持向量機;信用評級
一、引言
我國企業(yè)長期面臨著嚴重的金融風險,而風險評估是否科學合理,關(guān)系著我國股市承擔的風險的大小。本文通過建立風險評估的指標體系,運用支持向量機構(gòu)建的評估模型對收集的355家金融風險樣本進行訓練和檢驗,建立起企業(yè)信用風險評級模型。基于支持向量機的企業(yè)信用風險評級模型,將有助于企業(yè)更好地評估其信用風險,從而采取更加有效的風險處理措施。
國外對支持向量機(SVM)的預測效果進行了大量的研究。CHEN運用不同的機器學習方法建立了商業(yè)銀行風險預警的模型,最終得到機器向量機模型的預測效果和準確率是最高的。國內(nèi)對支持向量機的應用主要體現(xiàn)在對銀行信貸風險的識別與分類上。而余晨曦等人在進行貸款違約判定中,用到了非線性的支持向量機,得到了較好的判定結(jié)果。
綜上,已有相關(guān)研究在對構(gòu)建完整的上市企業(yè)信用指標評價體系的研究缺乏系統(tǒng)的研究,而且相關(guān)研究缺乏實證支持。針對這一問題,本文以上市企業(yè)為對象,對其進行信用評級。作為一項實證研究,一方面,可以系統(tǒng)性地探討上市企業(yè)信用風險情況;另一方面,通過對研究方法進行改進和完善,可以實現(xiàn)系統(tǒng)考察上市企業(yè)所面臨的信用風險問題,為相關(guān)監(jiān)管部門等提供決策依據(jù)。
當前已經(jīng)有許多算法將SVM推廣到多類分類問題,可以將它們大致分為兩大類:間接法和直接法。由于直接法將參數(shù)求解合并到一個最優(yōu)化問題中,可以“一次性”地實現(xiàn)多類分類,應用起來十分簡潔,因此本文使用第二類方法。
二、模型概述
支持向量機(SVM)是統(tǒng)計學習理論核心算法,由前蘇聯(lián)學者Vapink于1974年提出。該方法是以VC維理論和風險最小化為基礎(chǔ)的,通過核函數(shù)技術(shù),來研究小樣本數(shù)據(jù)下機器學習的規(guī)律。
SVM方法是從線性可分情況下最優(yōu)分類面發(fā)展而來的。其主要思想是輸入樣本數(shù)據(jù)以某種非線性函數(shù)關(guān)系映射到一個特征空間中,在此特征空間中構(gòu)造最優(yōu)分類超平面,使兩類(多類)樣本在此特征空間中可分。
當前已經(jīng)有許多算法將SVM推廣到多類分類問題,可以將它們大致分為兩大類:間接法和直接法。由于直接法將參數(shù)求解合并到一個最優(yōu)化問題中,可以“一次性”地實現(xiàn)多類分類,應用起來十分簡潔,因此本文使用第二類方法。
三、指標構(gòu)建及數(shù)據(jù)說明
1、企業(yè)信用評級等級
企業(yè)的信用評級是根據(jù)萬得一致預測評級(截至指定交易日,各機構(gòu)對該證券投資評級的算術(shù)平均值),將其劃分到相應的信用等級。其中,“-1”表示上市企業(yè)信用低,違約風險高,投資價值低;“0”表示上市企業(yè)信用一般,違約風險一般,投資價值一般;“1”表示上市企業(yè)信用高,違約風險較低,有較高的投資價值。
2、金融風險評估指標體系構(gòu)建
確定全面合理的評估指標體系是信用風險評估的基礎(chǔ),因此,選擇科學有效的評估指標體系對于比較準確地評估信用風險是非常重要的。本文借鑒傳統(tǒng)風險評估的基本框架,在變量的選擇方面,從營運能力、盈利能力、償債能力、成長能力4個方面選取財務變量綜合度量上市公司財務狀況,包括以下指標:每股收益、每股凈資產(chǎn)、凈資產(chǎn)收益率、總資產(chǎn)凈利率、銷售凈利率、流動比率、速動比率、產(chǎn)權(quán)比率、權(quán)益乘數(shù)、長期債務與營運資金比率、存貨周轉(zhuǎn)率、應收帳款周轉(zhuǎn)率、流動資產(chǎn)周轉(zhuǎn)率、營運資本周轉(zhuǎn)率、總資產(chǎn)周轉(zhuǎn)率、基本每股收益(同比增長率)、凈利潤(同比增長率)、凈資產(chǎn)(同比增長率)、總資產(chǎn)(同比增長率)共計19個指標。
3、數(shù)據(jù)處理
將來自2017年上市企業(yè)年度數(shù)據(jù),剔除缺失值后的樣本總量為 813家企業(yè)。其中,各指標數(shù)據(jù)來源于wind金融數(shù)據(jù)庫。本文預計用到多個指標,其量綱和數(shù)量級不同,為了保證結(jié)果的可靠性,在建立SVM模型前,先對數(shù)據(jù)進行歸一化處理,將數(shù)據(jù)歸化至[0,1]之間。
其中,在具體數(shù)據(jù)處理中,由于企業(yè)預測評級分類代碼為“1”的數(shù)據(jù)樣本占大多數(shù),而企業(yè)預測評級分類代碼為“0”和“-1”的數(shù)據(jù)樣本比例較低。由于后兩個等級的樣本太少,難以收集充足的數(shù)據(jù),根據(jù)我國實際情況,本文將對原來的一些等級進行合并,最終得到本文中所采用的企業(yè)信用評級等級。同時,在財務指標選擇上,由于缺失值太多,刪除了2個指標。
四、實證研究及結(jié)果分析
根據(jù)評級指標體系,選取在上海和深圳證券上市交易企業(yè)的財務數(shù)據(jù)來建立上市企業(yè)信用評級模型。在建立評級模型前,要對數(shù)據(jù)進行預處理。通過篩選、刪除有特征值缺失的數(shù)據(jù)樣本后,共得到813家有效的企業(yè)債主體財務數(shù)據(jù)樣本,其中評級等級為1、0的分別占729家、44家,等級為-1的占39家。本文中的數(shù)據(jù)來源于wind金融數(shù)據(jù)庫。
利用R語言對SVM模型確定最優(yōu)參數(shù)。模型對數(shù)據(jù)集的評級分類準確率為89.8%。該數(shù)據(jù)集整體評級分類準確率較高,在“1”等級上,其分類性能取得了最好的效果;但在預測“-1”等級和“0”等級的樣本數(shù)據(jù)時分類性能較差,正確率均偏低,這降低了整體的預測正確率。其可能的原因是:一是由于金融數(shù)據(jù)一般是含有模糊、不確定性信息的,導致“1”等級與“-1”,“0”兩個等級的界限并不明顯,影響了分類正確性。二是由于在財務指標選取上,只是依據(jù)傳統(tǒng)的定性分析方法,沒有進行進一步處理,導致財務指標的一致性和穩(wěn)定性較差。
五、總結(jié)
作為風險管理與控制的手段,信用評級對證券市場的發(fā)展至關(guān)重要。支持向量機是一種被證明是優(yōu)良的新型算法,已被應用于多方面的分類與回歸問題。針對企業(yè)信用風險評估中面臨的小樣本、非線性、高維數(shù)等問題以及樣本數(shù)據(jù)指標多、噪聲復雜的特點,本文提出了一種基于支持向量機的企業(yè)信用評級模型。該方法利用財務指標,結(jié)合SVM建立評級模型,對數(shù)據(jù)進行分類。實驗結(jié)果表明,通過支持向量機進行特征選擇的支持向量機具有較高的預測準確度。
當然,本文針對直接法,通過求解該最優(yōu)化問題“一次性”地實現(xiàn)多類分類,盡管看起來簡潔,但是實際應用中,由于變量過多,訓練速度和分類精度都不是有很好的效果。
參考文獻:
[1].陳軍飛,張強.基于隨機森林-支持向量機的企業(yè)債主體信用評級研究[J].證券市場,2016,(3):80-84.
[2].沈沛龍,周浩.基于支持向量機理論的中小企業(yè)信用風險預測研究[J].國際金融研究,2010,(8):77-85.
[3].劉志剛,李德仁,秦前清,史文中.支持向量機在多類分類問題中的推廣[J].計算機工程與應用,2003,(7):10-13
[4].陳朝暉,胡玉芳.基于SVM的我國商業(yè)銀行風險預警研究[J].武漢理工大學學報(信息與管理工程版),2012,(4):504-508
作者簡介:
王星星(1992-),女,河北石家莊人,山西財經(jīng)大學2016(金融學)學術(shù)碩士研究生,研究方向:金融投資與風險管理.