楊 帆,談 飛,崔 祥
(河海大學(xué) 商學(xué)院,江蘇 南京 211100)
?
基于RS和SVM的建筑企業(yè)信用風(fēng)險(xiǎn)評(píng)估研究
楊帆,談飛,崔祥
(河海大學(xué) 商學(xué)院,江蘇 南京 211100)
摘要:建筑企業(yè)的信用缺失給投資者和行業(yè)發(fā)展帶來了巨大風(fēng)險(xiǎn),企業(yè)信用風(fēng)險(xiǎn)評(píng)估模型的建立及其應(yīng)用是防范信用風(fēng)險(xiǎn)的重要手段。利用粗糙集對(duì)數(shù)據(jù)進(jìn)行處理,并結(jié)合支持向量機(jī)的數(shù)據(jù)分類作用,構(gòu)造了基于粗糙集的支持向量機(jī)模型,將新的學(xué)習(xí)樣本通過支持向量機(jī)模型完成對(duì)施工企業(yè)信用風(fēng)險(xiǎn)的分類訓(xùn)練和評(píng)估,通過實(shí)例驗(yàn)證了RS-SVM模型用于建筑企業(yè)信用風(fēng)險(xiǎn)評(píng)估具有良好的分類性能,有助于實(shí)現(xiàn)對(duì)我國(guó)建筑企業(yè)信用風(fēng)險(xiǎn)的預(yù)警,增強(qiáng)投資者信用風(fēng)險(xiǎn)防范能力,提高建筑行業(yè)信用水平;有助于豐富和完善企業(yè)信用風(fēng)險(xiǎn)評(píng)估理論和方法。
關(guān)鍵詞:建筑企業(yè);信用風(fēng)險(xiǎn)評(píng)估;指標(biāo)體系;支持向量機(jī);粗糙集
企業(yè)信用風(fēng)險(xiǎn)評(píng)估模型的建立及其應(yīng)用是防范信用風(fēng)險(xiǎn)的重要手段。傳統(tǒng)的評(píng)估方法有5C要素分析法、財(cái)務(wù)比率分析方法等[1];后來又出現(xiàn)了統(tǒng)計(jì)分析方法,典型的有Probit回歸法、決策樹等;計(jì)算機(jī)技術(shù)推動(dòng)了企業(yè)信用風(fēng)險(xiǎn)量化評(píng)估模型的不斷創(chuàng)新,如專家系統(tǒng)法、神經(jīng)網(wǎng)絡(luò)法等人工智能方法。目前國(guó)內(nèi)信用評(píng)價(jià)研究較多的對(duì)象是商業(yè)銀行[2-3],對(duì)于建筑企業(yè)的信用風(fēng)險(xiǎn)評(píng)估目前尚未有一個(gè)公認(rèn)的可靠方法,因此,尋找一種可靠又易于操作的建筑企業(yè)信用評(píng)價(jià)方法是非常有必要的。
近年來,用粗糙集(rough sets,RS)或支持向量機(jī)理論(support vector machine,SVM)解決信用或風(fēng)險(xiǎn)評(píng)價(jià)問題的研究很多,如宋曉東等[4]構(gòu)建了中小企業(yè)信用評(píng)價(jià)的雙隸屬模糊支持向量機(jī)模型,在改進(jìn)支持向量機(jī)建模方法、最優(yōu)指標(biāo)組合遴選和信用評(píng)價(jià)分析視角拓寬方面均有所創(chuàng)新;李順國(guó)等[5]針對(duì)投標(biāo)過程中的不確定性和風(fēng)險(xiǎn)分析問題,運(yùn)用粗糙集和支持向量機(jī)理論對(duì)投標(biāo)風(fēng)險(xiǎn)進(jìn)行約簡(jiǎn)分類,為決策者對(duì)工程項(xiàng)目的投標(biāo)風(fēng)險(xiǎn)評(píng)估和決策提供依據(jù);杜婷[6]、李文娟[7]采用粗糙集與支持向量機(jī)相結(jié)合的方法評(píng)估個(gè)人信用,并用小樣本對(duì)個(gè)人信用評(píng)估模型分類預(yù)測(cè),其效果和穩(wěn)定性良好。
筆者利用了粗糙集對(duì)數(shù)據(jù)進(jìn)行處理,并結(jié)合支持向量機(jī)的數(shù)據(jù)分類作用,構(gòu)造了基于粗糙集的支持向量機(jī)模型,用以解決屬性關(guān)系簡(jiǎn)單、非線性分類、回歸或密度函數(shù)估計(jì)問題,將其應(yīng)用于施工企業(yè)信用風(fēng)險(xiǎn)評(píng)估。
1粗糙集和支持向量機(jī)理論
1.1粗糙集理論
粗糙集理論是通過對(duì)數(shù)據(jù)歸納、不完整性整理及其結(jié)論表達(dá)式進(jìn)行研究,實(shí)現(xiàn)對(duì)簡(jiǎn)約特征值的解釋和數(shù)據(jù)的提取。屬性約簡(jiǎn)是粗糙集理論的核心內(nèi)容,一個(gè)粗糙集的決策表S=(U,C∪D),其中U={u1,u2,…,u|U|}為論域,C={a1,a2,…,al}中的屬性為條件屬性,D中的屬性為決策屬性。一般情況下,屬性xi對(duì)C而言是必需的,若存在Ind(C)=Ind(C-xi),則屬性xi可以省略。若屬性集具有非獨(dú)立性,則可能的最小屬性子集、所有不可缺少的屬性集(核)和相等數(shù)量的整個(gè)屬性集的基本集(約簡(jiǎn))都能被找到。
1.2支持向量機(jī)理論
支持向量機(jī)是一種以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則,利用不斷求解極值來尋找全局最優(yōu)解的數(shù)學(xué)方法[8],其在線性可分情況下尋求能將樣本充分隔離且分離間距達(dá)到最大的最優(yōu)超平面。在線性非分類的情況下,引入非負(fù)變量ξi(i=1,2,…,l)。設(shè)已知訓(xùn)練樣本集T={(x1,y1),(x2,y2),…,(xi,yi)},其中xi∈X=RN(X為輸入空間,是N維向量)為輸入指標(biāo),yi∈{-1,1}或yi∈{1,2,…,k}為輸出指標(biāo)或決策屬性。當(dāng)yi∈{-1,1}時(shí)支持向量機(jī)為最簡(jiǎn)單的二類劃分,當(dāng)yi∈{1,2,…,k}時(shí)其為k類劃分。求解最優(yōu)超平面可表示為如下約束優(yōu)化問題:
(1)
式中ω為權(quán)向量。上述二次規(guī)劃問題存在唯一的極小點(diǎn),用Lagrange乘子法化成其對(duì)偶形式:
(2)
式中:C為懲罰項(xiàng)系數(shù);αi為L(zhǎng)agrange系數(shù)。如果αi>0,那么稱相應(yīng)的xi為支持向量,最優(yōu)分類超平面的決策函數(shù)為:
(3)
支持向量機(jī)基于Mercer核,通過非線性映射φ將樣本空間映射至一個(gè)更高維或無窮維的特征空間來解決非線性問題。Mercer核K(x,y)可以展開為一致收斂的函數(shù)項(xiàng)級(jí)數(shù):
其中φi(x),λi分別為核K(x,y)的特征向量和特征值。最后得到最優(yōu)分類超平面的決策函數(shù)為:
(4)
2RS-SVM施工企業(yè)信用風(fēng)險(xiǎn)評(píng)估建模
粗糙集的優(yōu)點(diǎn)是在缺乏經(jīng)驗(yàn)的基礎(chǔ)上能夠通過屬性關(guān)系的簡(jiǎn)約分析信息之間存在的關(guān)系,缺點(diǎn)是分析對(duì)象僅局限于離散數(shù)據(jù),容錯(cuò)能力和泛化能力不強(qiáng),支持向量機(jī)恰能克服粗糙集在該方面的弱勢(shì)。筆者將兩者結(jié)合建立了基于RS-SVM的施工企業(yè)信用風(fēng)險(xiǎn)評(píng)估模型,如圖1所示。對(duì)信用風(fēng)險(xiǎn)分類過程表述為:通過粗糙集在不影響分類效果的前提下對(duì)訓(xùn)練樣本進(jìn)行約簡(jiǎn),找到最小評(píng)估屬性集及對(duì)應(yīng)的學(xué)習(xí)樣本組成的新學(xué)習(xí)樣本,然后將新學(xué)習(xí)樣本通過支持向量機(jī)模型完成對(duì)施工企業(yè)信用風(fēng)險(xiǎn)的分類訓(xùn)練和評(píng)估。
圖1 基于RS-SVM的信用風(fēng)險(xiǎn)評(píng)估模型
3RS-SVM施工企業(yè)信用風(fēng)險(xiǎn)評(píng)估應(yīng)用
3.1指標(biāo)和樣本數(shù)據(jù)的選取
在進(jìn)行變量選取時(shí),結(jié)合國(guó)內(nèi)外學(xué)者的相關(guān)研究[9-11]和建筑施工企業(yè)特點(diǎn),對(duì)影響建筑施工企業(yè)信用因素進(jìn)行分析整合,選擇施工企業(yè)基本素質(zhì)、管理體系、經(jīng)營(yíng)效益等方面的32個(gè)指標(biāo)并分類,在定性與定量分析相結(jié)合的基礎(chǔ)上對(duì)建筑施工企業(yè)的信用等級(jí)進(jìn)行評(píng)價(jià)。
鑒于非財(cái)務(wù)指標(biāo)量化困難、獲取難度大的特點(diǎn),筆者盡可能地選擇可量化的定性指標(biāo)共計(jì)18個(gè)對(duì)企業(yè)信用進(jìn)行評(píng)價(jià),還選取了對(duì)企業(yè)信用解釋力度較大、表現(xiàn)能力強(qiáng)的14個(gè)財(cái)務(wù)指標(biāo)進(jìn)行專家打分,具體指標(biāo)內(nèi)容及分值分布如表1所示。
筆者選取8家上市建筑施工企業(yè)數(shù)據(jù)作為樣本數(shù)據(jù),信用分為AAA、AA、A、B這4個(gè)等級(jí),數(shù)據(jù)和信用評(píng)級(jí)結(jié)果皆來源于可靠的財(cái)經(jīng)網(wǎng)站。按照表1打分范圍,采用專家打分法確定各評(píng)價(jià)指標(biāo)值。決策屬性用樣本Y表示,評(píng)價(jià)集合為y={1,2,3,4},分別表示{“信用好”,“信用較好”,“信用一般”,“信用欠佳”}。表2所示為8個(gè)樣本企業(yè)屬性及其信用分類。
3.2指標(biāo)數(shù)據(jù)處理
筆者根據(jù)數(shù)據(jù)值是否大于均值作為標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行離散化處理,即若數(shù)據(jù)值大于均值則賦值為1,否則賦值為0,再利用粗糙集對(duì)離散后的數(shù)據(jù)進(jìn)行處理。采用Rosetta軟件,按偏離度大于90%的原則進(jìn)行評(píng)價(jià)指標(biāo)的約簡(jiǎn),具體約簡(jiǎn)屬性集為{X1,X2,X5,X6,X7,X9,X10,X11,X14,X15,X16,X17,X18,X21,X22,X25,X26,X28,X29,X30,X31},其中X15,X16,X17,X18,X21,X22,X25,X26,X28,X29,X30,X31為整個(gè)決策表中的核屬性。通過約簡(jiǎn)后發(fā)現(xiàn),主要約簡(jiǎn)對(duì)象是與企業(yè)信用不相關(guān)的指標(biāo),留下的財(cái)務(wù)指標(biāo)涵蓋了盈利能力、償債能力等方面,仍能正常反映公司的財(cái)務(wù)狀況。
表1 定性指標(biāo)內(nèi)容及分值分布
3.3SVM的分類預(yù)測(cè)與結(jié)果分析
筆者對(duì)建筑施工企業(yè)的信用評(píng)級(jí)是將企業(yè)的上述各項(xiàng)指標(biāo)得分作為分類屬性,也就是輸入數(shù)據(jù);將企業(yè)的信用狀況作為樣本的分類標(biāo)簽,形成新的訓(xùn)練樣本集T={(x1,y1),(x2,y2),…,(xi,yi)},xi∈X=R20,yi∈{1,2,3,4},其中SVM模型是通過LIBSVM 軟件包實(shí)現(xiàn)的。在評(píng)估過程中,采用交叉驗(yàn)證法[12]進(jìn)行最佳參數(shù)的選擇。首先運(yùn)用svmtrain 程序完成訓(xùn)練,設(shè)置支持向量機(jī)類型,選擇核函數(shù)并設(shè)定其參數(shù)。通過運(yùn)行,系統(tǒng)會(huì)給出一個(gè)包含模型參數(shù)信息和程序選擇的支持向量模型文件[13];然后程序svmpredict在獲得的模型基礎(chǔ)上完成測(cè)試與預(yù)測(cè)工作。將A、C、D、E、F、H企業(yè)的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)來訓(xùn)練模型,再利用學(xué)習(xí)好的支持向量機(jī)對(duì)B、G企業(yè)信用分類進(jìn)行預(yù)測(cè)。
表2 樣本企業(yè)屬性及其信用分類
(1)核函數(shù)的選擇。筆者選擇RBF函數(shù)作為核函數(shù),原因在于該函數(shù)收斂域相對(duì)較寬,且樣本維數(shù)高低和大小對(duì)RBF函數(shù)的適用性影響不大。RBF核可表示為:
(5)
式中,σ為函數(shù)的寬帶參數(shù)。
(2)參數(shù)的確定。根據(jù)已有的研究成果可知,支持向量機(jī)性能的優(yōu)劣在于核函數(shù)選擇的參數(shù)和懲罰系數(shù),而不是核函數(shù)類型。筆者選擇RBF核函數(shù)作為支持向量機(jī)模型的核函數(shù),這類支持向量機(jī)的性能主要是由參數(shù)C和σ決定,選取的參數(shù)值不同,得到的分類器也就不同。其中懲罰因子C的作用是實(shí)現(xiàn)回歸誤差與復(fù)雜性之間的折中。C過大或過小對(duì)機(jī)器的性能都會(huì)產(chǎn)生不利影響。徑向基核函數(shù)帶寬σ對(duì)模型的性能同樣有較大影響,對(duì)于訓(xùn)練樣本集,在σ選取適當(dāng)?shù)那闆r下,支持向量機(jī)一定可以對(duì)其進(jìn)行正確分類。對(duì)參數(shù)(C,σ)不斷賦值,共進(jìn)行10次訓(xùn)練測(cè)試,找到一個(gè)最佳的參數(shù)組合,得到的分類器性能也就更好,泛化能力更強(qiáng),準(zhǔn)確率更高。綜上,運(yùn)用LIBSVM工具箱確定學(xué)習(xí)參數(shù),得到最優(yōu)學(xué)習(xí)參數(shù)為:目標(biāo)函數(shù)的正則化參數(shù)C=75,損失函數(shù)中的ε=0.1,核函數(shù)中的σ=0.8。
(4)評(píng)估結(jié)果分析。SVM模型的具體判斷結(jié)果顯示:B企業(yè)信用屬于AAA級(jí),即信用好;G企業(yè)信用屬于A級(jí),信用一般,與實(shí)際信用等級(jí)符合,預(yù)測(cè)結(jié)果準(zhǔn)確,驗(yàn)證了采用支持向量機(jī)對(duì)企業(yè)信用等級(jí)的分類是有效的。
4結(jié)論
研究發(fā)現(xiàn)粗糙集與支持向量機(jī)的結(jié)合可較好地用于施工企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià),在保持支持向量機(jī)識(shí)別精度的前提下,通過使用粗糙集將數(shù)據(jù)進(jìn)行預(yù)處理實(shí)現(xiàn)評(píng)價(jià)時(shí)間的縮短。施工企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)具有復(fù)雜性的特點(diǎn),任何評(píng)價(jià)方法都存在各自的優(yōu)缺點(diǎn),筆者的研究為施工企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)提出了一種分析和解決問題的思路。
參考文獻(xiàn):
[1]柯孔林,周春喜.商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估方法研究述評(píng)[J].商業(yè)經(jīng)濟(jì)與管理,2005(6):55-56.
[2]陳珊珊.基于粗糙集和支持向量機(jī)的商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估模型[J].價(jià)值工程,2008,27(5):1-4.
[3]張晴.基于支持向量機(jī)的商業(yè)銀行信用風(fēng)險(xiǎn)研究[D].杭州:浙江大學(xué),2014.
[4]宋曉東,韓立巖.基于雙隸屬模糊支持向量機(jī)的中小企業(yè)信用評(píng)價(jià)[J].工業(yè)工程,2012,15(1):93-98.
[5]李順國(guó),盧新元.基于粗糙集和SVM的工程項(xiàng)目投標(biāo)風(fēng)險(xiǎn)研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(17):224-227.
[6]杜婷.基于粗糙集支持向量機(jī)的個(gè)人信用評(píng)估模型[J].統(tǒng)計(jì)與決策,2012(1):94-96.
[7]李文娟.基于粗糙集-支持向量機(jī)的個(gè)人信用評(píng)估[D].重慶:重慶大學(xué),2011.
[8]王巍.基于先驗(yàn)知識(shí)的支持向量機(jī)圖像分割算法研究[D].西安:西安工業(yè)大學(xué),2009.
[9]吳青.基于最優(yōu)化理論的支持向量機(jī)學(xué)習(xí)算法研究[D].西安:西安電子科技大學(xué),2009.
[10]任杰,劉振奎.施工企業(yè)信用評(píng)價(jià)體系分析[J].建筑管理現(xiàn)代化,2005(2):36-38.
[11]段嬋.建筑業(yè)企業(yè)信用評(píng)價(jià)研究[D].武漢:武漢理工大學(xué),2008.
[12]袁莉,李宏男,姜韶華.基于SVM的建筑企業(yè)信用評(píng)價(jià)研究[J].價(jià)值工程,2009,28(3):138-141.
[13]陳偉,王業(yè)球.基于支持向量機(jī)方法的中小企業(yè)信用評(píng)級(jí)優(yōu)化研究[J].云南財(cái)貿(mào)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2011(6):83-84.
YANG Fan:Postgraduate; School of Business, Hohai University,Nanjing,211100,China.
[編輯:王志全]
文章編號(hào):2095-3852(2016)01-0033-04
文獻(xiàn)標(biāo)志碼:A
收稿日期:2015-06-09.
作者簡(jiǎn)介:楊帆(1991-),女,黑龍江哈爾濱人,河海大學(xué)商學(xué)院碩士研究生.
中圖分類號(hào):F270.5
DOI:10.3963/j.issn.2095-3852.2016.01.007
Research on Credit Risk of Construction Enterprise Evaluation Based on Rough Sets and Support Vector Machine
YANG Fan,TAN Fei,CUI Xiang
Abstract:Lack of credit of building companies has brought great risk to investors and industry development,and establishment and application of corporate credit risk assessment model is an important means to prevent credit risks.In order to alert construction enterprise's credit risk fully,this paper combines the data processing effect of rough sets and the data classification action of support vector machine method to make the RS-SVM model,uses the rough set to reduce the sample data and formats the new learning sample,and then the new learning sample is made to complete the construction of enterprise credit risk classification training and evaluation by SVM model.The examples demonstrate the SVM model for building corporate credit risk assessment has good classification performance and helps to introduce to the practice of construction enterprise credit risk assessment,enrich the corporate credit risk assessment theory and methods,and enhance investor credit risk prevention capacity and improve the construction industry credit level.
Key words:construction enterprises; credit risk evaluation; index system; support vector machine; rough sets