錢(qián)吳永 張浩男
(江南大學(xué)商學(xué)院,無(wú)錫 214122)
新冠疫情的蔓延對(duì)全球供應(yīng)鏈、產(chǎn)業(yè)鏈產(chǎn)生了巨大的沖擊,在供應(yīng)鏈金融領(lǐng)域,我國(guó)中小微企業(yè)由于疫情所帶來(lái)的資金回流難、償貸能力下降等問(wèn)題導(dǎo)致其面臨更加嚴(yán)峻的融資困境,傳統(tǒng)供應(yīng)鏈金融業(yè)務(wù)的服務(wù)方式難以適應(yīng)當(dāng)前形勢(shì)下的金融活動(dòng)要求。隨著大數(shù)據(jù)、云計(jì)算和人工智能等技術(shù)的快速發(fā)展和5G網(wǎng)絡(luò)等基礎(chǔ)設(shè)施的持續(xù)完善,運(yùn)用新的數(shù)字算法理論和技術(shù)方法來(lái)提高供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)價(jià)的效果,成為解決我國(guó)中小微企業(yè)融資問(wèn)題、提升供應(yīng)鏈金融創(chuàng)新能力的一個(gè)重要方向。
近年來(lái),眾多學(xué)者基于決策樹(shù)(Decision Tree,DT)、 人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、 遺傳算法(Genetic Algorithms,GA)等機(jī)器學(xué)習(xí)的理論和方法構(gòu)建人工智能模型,并成功應(yīng)用于信用風(fēng)險(xiǎn)評(píng)價(jià)的工作中[1-3]。相較于傳統(tǒng)的Logistics回歸分析法易受樣本規(guī)模的限制和層次分析法(AHP)主觀性較強(qiáng)的問(wèn)題[4,5],人工智能的方法能夠有效處理高維度非線性樣本的評(píng)價(jià)問(wèn)題且不受指標(biāo)權(quán)重等主觀因素的影響。支持向量機(jī)(Support Vector Machine,SVM)[6]作為一種穩(wěn)定的分類(lèi)器,在信用風(fēng)險(xiǎn)評(píng)估中得到了大量的應(yīng)用,在處理高維數(shù)據(jù)時(shí)表現(xiàn)出了較優(yōu)的性能,SVM以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則,相較于其他的智能學(xué)習(xí)算法,具有更好的魯棒性。如胡海青等[7]通過(guò)將SVM與PCA和Logistic回歸方法建立的信用風(fēng)險(xiǎn)評(píng)價(jià)模型進(jìn)行對(duì)比,結(jié)果表明基于小樣本下SVM的信用評(píng)價(jià)模型具有更優(yōu)的穩(wěn)定性和準(zhǔn)確性。Shin等[8]以韓國(guó)中型制造業(yè)企業(yè)作為樣本,使用SVM建立了企業(yè)破產(chǎn)預(yù)警模型,對(duì)比總結(jié)了SVM相比于BPNN模型的優(yōu)點(diǎn),實(shí)驗(yàn)結(jié)果表明,隨著訓(xùn)練集樣本的減少,SVM在精度和泛化能力上優(yōu)于BPNN。胡海青等[9]運(yùn)用SVM和BP神經(jīng)網(wǎng)絡(luò)兩種算法建立信用風(fēng)險(xiǎn)評(píng)估模型并進(jìn)行實(shí)證對(duì)比,結(jié)果表明基于SVM的信用評(píng)估模型具有更優(yōu)的穩(wěn)定性和準(zhǔn)確性。此外,由于信用風(fēng)險(xiǎn)評(píng)價(jià)存在小樣本、多缺失值與奇異值等特點(diǎn),運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行信用風(fēng)險(xiǎn)評(píng)價(jià)時(shí)容易導(dǎo)致局部最優(yōu)解、過(guò)度擬合、泛化能力弱等問(wèn)題,而支持向量機(jī)能夠利用核函數(shù)實(shí)現(xiàn)低維空間分類(lèi)問(wèn)題向高維空間的轉(zhuǎn)化,具有較強(qiáng)的泛化能力和較優(yōu)的魯棒性,被多數(shù)學(xué)者所采用。淳偉德和肖楊[10]通過(guò)構(gòu)建不同核函數(shù)SVM模型、Logistic回歸模型、DDA以及BPNN模型來(lái)對(duì)供給側(cè)改革背景下的系統(tǒng)性金融風(fēng)險(xiǎn)進(jìn)行研究預(yù)警,對(duì)比分析的結(jié)果表明,使用多項(xiàng)式核函數(shù)的SVM預(yù)警模型具有優(yōu)越的預(yù)測(cè)性能。Fan和Palaniswami[11]將SVM模型的預(yù)測(cè)結(jié)果與MDA模型、多層感知器(Multi-Layer Precep?tion,MLP)神經(jīng)網(wǎng)絡(luò)模型和學(xué)習(xí)矢量化(Learning Vector Quantization,LVQ)神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果進(jìn)行比較,結(jié)果表明,SVM在預(yù)測(cè)準(zhǔn)確性上總高于其他3個(gè)模型。以上研究表明SVM在進(jìn)行信用風(fēng)險(xiǎn)評(píng)估方面相較于其他的機(jī)器學(xué)習(xí)模型具有天然的優(yōu)勢(shì),然而,由于SVM在選取核函數(shù)和分類(lèi)參數(shù)時(shí)要求較高,如何對(duì)SVM參數(shù)進(jìn)行優(yōu)化成為學(xué)者研究的重點(diǎn)。劉穎等[12]采用二進(jìn)制粒子群算法來(lái)優(yōu)化支持向量機(jī)(SVM)的懲罰系數(shù)和核參數(shù),結(jié)果表明,基于優(yōu)化算法的評(píng)價(jià)模型在解決供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)價(jià)問(wèn)題中具有很好的性能。此外,多位學(xué)者的研究表明,運(yùn)用集成學(xué)習(xí)的思想將多個(gè)弱學(xué)習(xí)器組合成一個(gè)強(qiáng)學(xué)習(xí)器能夠降低評(píng)價(jià)模型對(duì)參數(shù)選擇的依賴(lài)性。如陳舒期和梁雪春[13]使用AdaBoost算法對(duì)最優(yōu)SVM個(gè)體進(jìn)行非線性集成,建立了SSVM集成模型,進(jìn)一步提高了SVM的分類(lèi)識(shí)別性能;陳云等[14]基于混合集成策略,將隨機(jī)子集和AdaBoost兩種算法進(jìn)行合成,建立基于SVM的集成學(xué)習(xí)模型,提高了SVM預(yù)測(cè)準(zhǔn)確率。
基于上述分析,本文針對(duì)SVM參數(shù)選擇不準(zhǔn)確導(dǎo)致分類(lèi)精度較低的問(wèn)題,使用一種動(dòng)態(tài)變異的粒子群優(yōu)化算法(Dynamic Particle Swarm Opti?mization,DPSO)對(duì)SVM徑向基核函數(shù)中的參數(shù)進(jìn)行選擇,并用AdaBoost集成算法將優(yōu)化后的PSO-SVM基分類(lèi)器進(jìn)行加權(quán)組合成強(qiáng)分類(lèi)器,建立基于AdaBoost-PSO-SVM的評(píng)價(jià)模型,最后,將該模型應(yīng)用于我國(guó)新能源汽車(chē)行業(yè)的供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)價(jià)中,實(shí)驗(yàn)結(jié)果表明,所建立的模型大大提高了SVM的分類(lèi)準(zhǔn)確率,同時(shí)相比于其他評(píng)價(jià)模型也具有更優(yōu)秀的性能。
在傳統(tǒng)的融資模式下,銀行與申請(qǐng)融資的中小企業(yè)之間存在嚴(yán)重的信息不對(duì)稱(chēng),僅僅通過(guò)對(duì)融資企業(yè)自身的信用風(fēng)險(xiǎn)水平進(jìn)行評(píng)估很難使那些規(guī)模較小、財(cái)務(wù)制度不健全、自身不能滿(mǎn)足銀行擔(dān)?;蛸|(zhì)押資產(chǎn)要求的中小企業(yè)獲得授信。在供應(yīng)鏈金融模式下,評(píng)價(jià)指標(biāo)應(yīng)更多考慮中小企業(yè)與核心企業(yè)之間的關(guān)系以及供應(yīng)鏈全鏈條的整體情況,從而更全面、準(zhǔn)確地把握融資企業(yè)的資信情況。因此,本文基于供應(yīng)鏈的視角,考慮融資企業(yè)和核心企業(yè)的財(cái)務(wù)和非財(cái)務(wù)狀況以及供應(yīng)鏈整體的運(yùn)營(yíng)狀況,在現(xiàn)有文獻(xiàn)[15-19]對(duì)供應(yīng)鏈金融指標(biāo)體系研究的基礎(chǔ)上,將定性與定量指標(biāo)相結(jié)合,重新設(shè)計(jì)了反映全鏈條風(fēng)險(xiǎn)水平的信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系,如表1所示。
表1 信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)
續(xù) 表
假設(shè)n個(gè)樣本的訓(xùn)練樣本集表示輸入的第i個(gè)樣本,yi∈{1,-1},分類(lèi)超平面方程為wx+b=0(w是超平面的法向量,b是偏置)。
圖1 線性可分情況下最優(yōu)分類(lèi)超平面
建立Langrange函數(shù):
由于供應(yīng)鏈金融評(píng)價(jià)指標(biāo)具有高維、非線性、動(dòng)態(tài)等特點(diǎn),此時(shí)SVM需要引入核函數(shù)K(xi,xj)=Φ(xi)T·Φ(xj)來(lái)將高維空間中的非線性分類(lèi)問(wèn)題進(jìn)行轉(zhuǎn)化。徑向基(RBF)核函數(shù)相比于其他幾種SVM的核函數(shù),在線性和非線性的數(shù)據(jù)集都有較好的表現(xiàn)。因此,本文選用徑向基核函數(shù):K(x,輸入 SVM。
根據(jù)式 (1)和式 (2),將原始問(wèn)題轉(zhuǎn)化為L(zhǎng)angrange對(duì)偶問(wèn)題:
綜上,得到最優(yōu)的分類(lèi)判別函數(shù):
在標(biāo)準(zhǔn)粒子群算法中,通常將慣性權(quán)重ω設(shè)定為一個(gè)固定的值[20],難以滿(mǎn)足算法迭代前期全局搜索能力和后期局部搜索能力的動(dòng)態(tài)要求。本文在粒子群算法基本原理的基礎(chǔ)上兼顧算法的收斂精度和收斂速度,使用動(dòng)態(tài)變異的粒子群算法(DPSO)來(lái)優(yōu)化SVM的參數(shù),采用動(dòng)態(tài)權(quán)重如下:
借鑒遺傳算法變異的思想,將變異操作引入到粒子群算法中,使粒子跳出原來(lái)的區(qū)域進(jìn)入其他新的領(lǐng)域進(jìn)行搜索,以此來(lái)找到新的群體極值,循環(huán)變異操作,直到找到全局最優(yōu)解,具體做法如下:
設(shè)粒子群的群體適應(yīng)度方差為:
n為粒子群的粒子數(shù)目,σ2代表粒子的 “收斂”程度,隨著σ2變小,粒子群由隨機(jī)搜索狀態(tài)逐漸趨于收斂。f表示歸一化定標(biāo)因子,取值如下:
令粒子的聚集程度為α,則t代α的計(jì)算公式如下:
σmax和σmin分別代表全部粒子標(biāo)準(zhǔn)差的適應(yīng)度最大值和最小值。由種群聚集度的定義設(shè)置t+1代粒子變異概率公式如下:
Pt+1與粒子聚集度α成正比,λ∈[3,5]為固定常數(shù)的比例增益,N代表種群的規(guī)模,m表示優(yōu)化問(wèn)題的維數(shù)。
DPSO-SVM算法流程如圖2所示。
圖2 DPSO-SVM算法流程
AdaBoost(Adaptive Boosting)是一種通過(guò)對(duì)訓(xùn)練樣本的權(quán)值迭代來(lái)強(qiáng)化弱學(xué)習(xí)器的集成學(xué)習(xí)算法[21]。 本文采用 AdaBoost對(duì) DPSO-SVM 學(xué)習(xí)器進(jìn)行訓(xùn)練,算法實(shí)現(xiàn)步驟如下:
Step1:輸入N個(gè)初始學(xué)習(xí)訓(xùn)練樣本集D=是樣本空間的樣本特征,yi為類(lèi)別空間的類(lèi)別符號(hào),設(shè)定初始訓(xùn)練樣本的權(quán)值矩陣:W1=(ω11,ω12,…,ω1i,…,ω1N),假設(shè)每個(gè)訓(xùn)練樣本的權(quán)重都是相等的,即:ω1i=1/N,(i=1,2,…,N)。
Step2: 使用具有權(quán)值分布的Wt= (ωt1,ωt2,…,ω1i,…,ωtN)訓(xùn)練集數(shù)據(jù)學(xué)習(xí),將 DPSO-SVM作為基分類(lèi)器:
Step4:計(jì)算DPSO-SVM分類(lèi)器權(quán)重:設(shè)αt=更新訓(xùn)練樣本的權(quán)重:ωt+1為歸一化因子,返回 Step2 迭代。
本文選取我國(guó)供應(yīng)鏈金融業(yè)務(wù)發(fā)展相對(duì)成熟的新能源汽車(chē)供應(yīng)鏈為研究對(duì)象,以比亞迪、福田汽車(chē)、特斯拉、北汽集團(tuán)、長(zhǎng)安汽車(chē)五大新能源汽車(chē)整車(chē)制造廠為核心企業(yè),選取其供應(yīng)鏈上下游共54個(gè)國(guó)內(nèi)上市公司2017~2020年近4年的財(cái)務(wù)和其他相關(guān)數(shù)據(jù),共計(jì)216個(gè)樣本,剔除具有異常數(shù)據(jù)的樣本18個(gè),剩余198個(gè)可用樣本,并根據(jù)各年國(guó)資委發(fā)布的 《企業(yè)績(jī)效評(píng)價(jià)標(biāo)準(zhǔn)值》對(duì)比篩選出 “信用不良”的樣本38個(gè),將 “信用良好”的160個(gè)樣本作為初始數(shù)據(jù)。由于所建立的評(píng)價(jià)指標(biāo)體系變量較多,且各指標(biāo)間存在一定的相關(guān)性,為了在確保數(shù)據(jù)信息丟失最少的前提下簡(jiǎn)化輸入模型的數(shù)據(jù),本文采取主成分分析法(PCA)對(duì)搜集的數(shù)據(jù)進(jìn)行降維處理:
(1)數(shù)據(jù)z-score標(biāo)準(zhǔn)化處理:
(2)評(píng)價(jià)指標(biāo)的主成分提取
表2為主成分特征值及貢獻(xiàn)率。由表2可知,前12個(gè)主成分的累積貢獻(xiàn)率為86.665%,因此提取前12個(gè)主成分。
表2 主成分特征值及貢獻(xiàn)率
表3為原始數(shù)據(jù)198個(gè)樣本的46個(gè)供應(yīng)鏈金融風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)進(jìn)行主成分屬性約簡(jiǎn)后提取的12個(gè)線性無(wú)關(guān)的主成分,將降維后的數(shù)據(jù)輸入評(píng)價(jià)模型能夠大大提高運(yùn)算效率,同時(shí)也避免了支持向量機(jī)RBF核函數(shù)不擅長(zhǎng)處理量綱不統(tǒng)一數(shù)據(jù)集的問(wèn)題。
表3 原始數(shù)據(jù)樣本的主成分
以提取后的12個(gè)主成分為支持向量機(jī)的輸入變量,設(shè)置訓(xùn)練集樣本120個(gè),測(cè)試集樣本78個(gè),不良樣本的類(lèi)別標(biāo)簽為1,良好樣本的類(lèi)別標(biāo)簽為0。采用改進(jìn)后的的粒子群算法對(duì)徑向基(RBF)核函數(shù)的懲罰系數(shù)C和參數(shù)g進(jìn)行優(yōu)化,設(shè)定參數(shù)C1=1.5、C2=1.7,種群規(guī)模為20,最大迭代次數(shù)設(shè)置為200,SVM懲罰系數(shù)C和核參數(shù)g的取值范圍設(shè)置為[0.001,10],粒子的位置Xi∈[-6,6],粒子速度V∈[-10,10]。 經(jīng)過(guò)最優(yōu)化選擇,SVM核函數(shù)的參數(shù)篩選得到C=2.8284、g=0.088388,以此作為模型的基本參數(shù)。將DP?SO-SVM作為基分類(lèi)器,使用AdaBoost集成DP?SO-SVM,得到的分類(lèi)結(jié)果與單一分類(lèi)器SVM和PSO-SVM以及BP-AdaBoost進(jìn)行對(duì)比。各模型不同指標(biāo)間的分類(lèi)結(jié)果對(duì)比如表4所示。
表4 模型結(jié)果對(duì)比 單位:%
Accuracy反映了分類(lèi)器對(duì)整體樣本的分類(lèi)判別能力,即模型能夠正確識(shí)別出良好樣本和不良樣本的能力。在信用評(píng)估中,將一個(gè)信用好的企業(yè)評(píng)估為信用差的企業(yè),對(duì)于信貸機(jī)構(gòu)來(lái)說(shuō),只是客戶(hù)未來(lái)的貸款利息的損失,如果將一個(gè)信用差的企業(yè)評(píng)估為信用好的企業(yè),則面臨借款者違約的風(fēng)險(xiǎn),對(duì)信貸機(jī)構(gòu)造成無(wú)法收回本金和利息的損失。因此,相較于Recall指標(biāo)表示標(biāo)簽為正樣本的實(shí)例中的預(yù)測(cè)正確率,本文更加注重Spe?cificity指標(biāo)的大小,反映標(biāo)簽為負(fù)樣本的實(shí)例中的預(yù)測(cè)正確率。由于在特定的樣本數(shù)據(jù)下,支持向量機(jī)對(duì)測(cè)試集的預(yù)測(cè)值為單一數(shù)值,ROC曲線發(fā)生退化,此時(shí)AUC指標(biāo)不能全面地反映分類(lèi)器的性能,因此本文使用F1-Score、G-means以及Ac?curacy等指標(biāo)作為主要評(píng)價(jià)指標(biāo),AUC作為輔助性評(píng)價(jià)指標(biāo)。
結(jié)果表明,所有模型均能對(duì)本文搜集的數(shù)據(jù)進(jìn)行有效地分類(lèi),分類(lèi)準(zhǔn)確率最低為87.19%。同時(shí)可以看出負(fù)類(lèi)樣本的識(shí)別誤差總高于正類(lèi)樣本的識(shí)別誤差,因此在今后的研究中,應(yīng)更加重視對(duì)不良樣本的誤分類(lèi)率。比較不同的模型,PSOSVM模型性能在SVM的基礎(chǔ)上有了明顯改善。采用自適應(yīng)變異的粒子群算法對(duì)SVM進(jìn)行優(yōu)化得到DPSO-SVM比標(biāo)準(zhǔn)的PSO-SVM分類(lèi)效果更好,測(cè)試集樣本的準(zhǔn)確率由92.31%提升到了93.59%。采用AdaBoost算法集成后的AdaBoost-DPSO-SVM模型在各個(gè)指標(biāo)上都有較大提升,模型準(zhǔn)確率(Ac?curacy)達(dá)到了最高的96.15%,對(duì)比BP-AdaBoost模型,其分類(lèi)性能更優(yōu)。AdaBoost-DPSO-SVM模型的Specificity指標(biāo)在5個(gè)模型中最高,表明其將信用不良企業(yè)識(shí)別為信用好的企業(yè)的錯(cuò)誤率最低,且綜合反映模型輸出效果的G-means和F1-Score指標(biāo)值最高,分別為97.63%和97.60%,說(shuō)明本文所提出的AdaBoost-DPSO-SVM模型能夠更好地應(yīng)用于供應(yīng)鏈金融信用風(fēng)險(xiǎn)的評(píng)估。
本文基于我國(guó)新能源電動(dòng)汽車(chē)產(chǎn)業(yè)上市公司的財(cái)務(wù)數(shù)據(jù)和供應(yīng)鏈數(shù)據(jù),構(gòu)建了供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系,運(yùn)用PCA對(duì)數(shù)據(jù)樣本進(jìn)行預(yù)處理,作為支持向量機(jī)的輸入數(shù)據(jù),有效地解決了供應(yīng)鏈金融存在高維數(shù)據(jù)的問(wèn)題。通過(guò)對(duì)粒子群算法的慣性權(quán)重進(jìn)行改進(jìn)和引入變異操作,提出了一種動(dòng)態(tài)變異的粒子群優(yōu)化算法,避免了粒子在尋優(yōu)的過(guò)程中陷入局部極小值的問(wèn)題。最后將改進(jìn)后的優(yōu)化算法對(duì)SVM參數(shù)進(jìn)行優(yōu)化并作為一種弱分類(lèi)器輸入AdaBoost集成,構(gòu)建了一種在多方面都具有較好性能的AdaBoost-DPSO-SVM模型,并成功應(yīng)用于我國(guó)新能源汽車(chē)供應(yīng)鏈金融的信用風(fēng)險(xiǎn)評(píng)估工作中,為加快推進(jìn)我國(guó)金融領(lǐng)域的供給側(cè)結(jié)構(gòu)性改革,使金融更好地服務(wù)于實(shí)體經(jīng)濟(jì),實(shí)現(xiàn)經(jīng)濟(jì)高質(zhì)量發(fā)展提供了一個(gè)新視角。
供應(yīng)鏈金融包含的業(yè)務(wù)關(guān)系復(fù)雜多樣,存在大量動(dòng)態(tài)的、非結(jié)構(gòu)化的金融數(shù)據(jù),如何在海量復(fù)雜的數(shù)據(jù)中獲得一種更為高效、準(zhǔn)確、適用性強(qiáng)、動(dòng)態(tài)化的信用評(píng)價(jià)的指標(biāo)體系和方法,是未來(lái)繼續(xù)研究的方向。此外,由于SVM本身對(duì)于核函數(shù)的高維映射解釋力不強(qiáng),對(duì)于評(píng)價(jià)結(jié)果中信用不好的企業(yè)無(wú)法給出較為準(zhǔn)確的指導(dǎo)建議,給評(píng)價(jià)模型分類(lèi)結(jié)果的分析帶來(lái)一定難度。如何在本文所提出模型的基礎(chǔ)上融合其他具有較強(qiáng)記憶性的機(jī)器學(xué)習(xí)算法(如決策樹(shù)等)來(lái)提高模型的可解釋性也是未來(lái)重點(diǎn)研究的方向。
工業(yè)技術(shù)經(jīng)濟(jì)2022年3期