陳 艷,葉 翀,蔣偉杰
(1.福州大學(xué)至誠學(xué)院 經(jīng)濟(jì)管理系,福建 福州 350002;2.福州大學(xué)經(jīng)濟(jì)與管理學(xué)院,福建 福州 350108;3.福州大學(xué)計(jì)算機(jī)與大數(shù)據(jù)學(xué)院,福建 福州 350108)
根據(jù)2021年9月商務(wù)部電子商務(wù)和信息化司發(fā)布的《中國電子商務(wù)報(bào)告2020》顯示,2020年中國電子商務(wù)交易總額37.21萬億元(人民幣),同比增長4.5%,電子商務(wù)的從業(yè)人員達(dá)6015.33萬人,同比增長17%[1],在疫情常態(tài)化背景下國內(nèi)電子商務(wù)呈快速發(fā)展態(tài)勢,在拉動(dòng)經(jīng)濟(jì)、增加就業(yè)方面發(fā)揮著重要的作用。同時(shí)報(bào)告也指出,雖然電子商務(wù)信用體系建設(shè)取得明顯成效,但是新型網(wǎng)絡(luò)營銷方式也帶來信用治理難題,涉及商品質(zhì)量、刷單、信用造假、虛假宣傳、價(jià)格欺詐等問題;報(bào)告要求電子商務(wù)行業(yè)及信用服務(wù)行業(yè)需要立足行業(yè)自身,利用專業(yè)優(yōu)勢進(jìn)一步加強(qiáng)誠信建設(shè),推動(dòng)信用評價(jià)、信用監(jiān)測以及信用管理等多項(xiàng)信用服務(wù),促進(jìn)電子商務(wù)經(jīng)濟(jì)的規(guī)范健康發(fā)展。
電子商務(wù)中交易主體的信用風(fēng)險(xiǎn)評估是電子商務(wù)信用體系中的基本環(huán)節(jié)之一,有效的信用風(fēng)險(xiǎn)評估可以規(guī)避電子商務(wù)平臺(tái)中的“檸檬問題”,降低可能發(fā)生的交易風(fēng)險(xiǎn)和交易主體的損失。信用風(fēng)險(xiǎn)等級與交易主體的各項(xiàng)指標(biāo)之間往往存在著復(fù)雜的非線性關(guān)系,依據(jù)人工經(jīng)驗(yàn)判斷難以發(fā)現(xiàn)其中的規(guī)律,傳統(tǒng)基于統(tǒng)計(jì)決策的方法僅適用于低維數(shù)據(jù)的情況,在高維數(shù)據(jù)下的表現(xiàn)不盡如人意。因此依托現(xiàn)有的機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘技術(shù)從交易主體的各項(xiàng)指標(biāo)數(shù)據(jù)中快速有效的評估信用風(fēng)險(xiǎn)等級對降低信用分析成本,加快電子商務(wù)信用體系的建設(shè)具有重要的現(xiàn)實(shí)意義。
國內(nèi)外已有不少研究利用機(jī)器學(xué)習(xí)技術(shù)根據(jù)企業(yè)數(shù)據(jù)實(shí)現(xiàn)信用評估,按照評估結(jié)果為企業(yè)信用得分和信用風(fēng)險(xiǎn)等級兩種形式分別構(gòu)建回歸模型[2-5]和分類模型[6-13];按照模型的學(xué)習(xí)過程可以分為“端到端”的一站式學(xué)習(xí)[2,9,11-13]和兩階段式[3-8,10]的學(xué)習(xí)。一站式的學(xué)習(xí)方式中模型從原始數(shù)據(jù)所有維度的特征中直接進(jìn)行學(xué)習(xí);而兩階段式的學(xué)習(xí)方式中,首先對原始數(shù)據(jù)進(jìn)行特征選擇降低數(shù)據(jù)的維度,其次在降維后的數(shù)據(jù)中進(jìn)行學(xué)習(xí)。在回歸模型的構(gòu)建過程中,余樂安提出了最小二乘近似支持向量回歸(LS-PSVR)模型,其構(gòu)建的企業(yè)信用風(fēng)險(xiǎn)預(yù)警模型按照企業(yè)指標(biāo)給出風(fēng)險(xiǎn)評估分?jǐn)?shù),根據(jù)分?jǐn)?shù)可以進(jìn)一步劃分風(fēng)險(xiǎn)等級進(jìn)行預(yù)警[2],在此基礎(chǔ)上,有些研究結(jié)合粗糙集或大數(shù)據(jù)分析技術(shù)進(jìn)一步提升了模型的風(fēng)險(xiǎn)預(yù)警性能;另外有研究使用了基于主成分分析(PCA)的方法,首先使用PCA提取出主要指標(biāo)后通過核支持向量機(jī)回歸(KSVR)得到風(fēng)險(xiǎn)評估分?jǐn)?shù),KSVR中的超參數(shù)懲罰因子C和徑向基核寬度σ由粒子群優(yōu)化算法來選擇[4];其后,一些研究在此基礎(chǔ)上進(jìn)一步使用核主成分分析(KPCA)來提取主要指標(biāo),接下來風(fēng)險(xiǎn)評估分?jǐn)?shù)由改進(jìn)的粒子群算法(PSO)結(jié)合神經(jīng)網(wǎng)絡(luò)計(jì)算而得[5]。在信用風(fēng)險(xiǎn)預(yù)警等級分類模型的學(xué)習(xí)中,王新輝先是利用PCA等技術(shù)從多個(gè)調(diào)研的企業(yè)數(shù)據(jù)中提取出主要指標(biāo),再利用反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)從這些指標(biāo)中學(xué)習(xí)得到能夠?qū)ζ髽I(yè)信用進(jìn)行分類的風(fēng)險(xiǎn)預(yù)警分類模型[6];其后李兵同樣使用了KPCA進(jìn)行特征選擇,然后在高斯先驗(yàn)假設(shè)的基礎(chǔ)上應(yīng)用樸素貝葉斯設(shè)計(jì)了分類模型,模型能夠根據(jù)主要指標(biāo)輸出風(fēng)險(xiǎn)預(yù)警等級[7];還有些研究是以支持向量機(jī)(SVM)為基分類器,通過bagging集成方式增強(qiáng)了模型的泛化能力,其中周可瀅在自行調(diào)研的企業(yè)數(shù)據(jù)集上獲得了良好的效果[8],陳云等在UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫的兩組公共信用數(shù)據(jù)集上得到了驗(yàn)證[9];Xu YZ研究了決策樹(DT)分別與邏輯回歸(LR)、動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBN)及神經(jīng)網(wǎng)絡(luò)相結(jié)合的模型性能,在淘寶賣家信用案例上驗(yàn)證的結(jié)果表明,決策樹-神經(jīng)網(wǎng)絡(luò)的組合達(dá)到了最高的準(zhǔn)確率[10]。Chang YC提出了一種基于決策樹的信用風(fēng)險(xiǎn)評估模型,通過在訓(xùn)練模型的過程中將自助聚合和少數(shù)抽樣技術(shù)相結(jié)合,提高了決策樹的穩(wěn)定性和非平衡數(shù)據(jù)的性能[11];Zhang X基于粒子群優(yōu)化遺傳算法(PSO-GA)的神經(jīng)網(wǎng)絡(luò),研究了跨境電子商務(wù)信用風(fēng)險(xiǎn)評估模型,提出了信用風(fēng)險(xiǎn)評估模型構(gòu)建過程,并驗(yàn)證上述模型能夠有效滿足跨境電子商務(wù)信用風(fēng)險(xiǎn)評估的要求[12];Huang XB則系統(tǒng)地研究了BPNN,徑向基函數(shù)(RBF),廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)及概率神經(jīng)網(wǎng)絡(luò)(PNN)等不同類型的神經(jīng)網(wǎng)絡(luò)在信用風(fēng)險(xiǎn)預(yù)警等級分類上的表現(xiàn)[13],在公開的信用數(shù)據(jù)集上測試表明,PNN在二分類問題的準(zhǔn)確率,ROC曲線下面積(AUROC)等度量上具有最佳的性能和魯棒性。
現(xiàn)有的信用風(fēng)險(xiǎn)評估模型加快和推動(dòng)了信用風(fēng)險(xiǎn)評估體系的發(fā)展,但在實(shí)際使用過程中還存在著不足,主要體現(xiàn)在以下兩點(diǎn)。第一點(diǎn)是基于SVM、DT、LR等模型的方法難以直接擬合高維數(shù)據(jù),往往需要使用特征選擇手段先對數(shù)據(jù)進(jìn)行降維操作。在樣本數(shù)量有限的情況下,數(shù)據(jù)降維的過程無法判斷和選擇出真正有效的特征屬性,因此會(huì)造成有效信息量的丟失,影響模型的性能和效果;第二點(diǎn)是近期越來越多的研究使用神經(jīng)網(wǎng)絡(luò)進(jìn)行模型的回歸和分類,神經(jīng)網(wǎng)絡(luò)在低維和高維數(shù)據(jù)上都體現(xiàn)出了優(yōu)越的性能,但是神經(jīng)網(wǎng)絡(luò)的參數(shù)量大大超過其它模型,容易出現(xiàn)過擬合的問題。針對以上的問題,本文提出了基于類別平衡校正的集成極限學(xué)習(xí)機(jī)(EELM)企業(yè)信用風(fēng)險(xiǎn)預(yù)警等級預(yù)測模型。該模型通過樣本過采樣進(jìn)行類別平衡校正,以解決少樣本數(shù)據(jù)集中的類別不平衡問題;其次模型中的極限學(xué)習(xí)機(jī)(ELM)能夠?qū)⒏呔S數(shù)據(jù)進(jìn)行隨機(jī)投影后再優(yōu)化求解,可以增加模型的泛化能力,避免過擬合,然后以ELM為基學(xué)習(xí)器進(jìn)行投票集成,進(jìn)一步降低ELM隨機(jī)投影過程中造成的預(yù)測偏差,為信用風(fēng)險(xiǎn)評估體系提供穩(wěn)定有效的結(jié)果。
根據(jù)以上的分析,本文主要的貢獻(xiàn)和創(chuàng)新點(diǎn)如下:
一是研究了ELM模型在信用風(fēng)險(xiǎn)等級預(yù)警分類中的應(yīng)用,并通過集成進(jìn)一步提升了模型的效果。
二是提出了通過樣本過采樣來解決企業(yè)指標(biāo)數(shù)據(jù)集上的樣本類別不平衡問題。
三是在實(shí)際數(shù)據(jù)集上進(jìn)行了驗(yàn)證,與基于BPNN、SVM的集成學(xué)習(xí)算法相比較,本文所提出的模型展示出更好的性能和效果。
假設(shè)要學(xué)習(xí)的任務(wù)為分類任務(wù),訓(xùn)練數(shù)據(jù)集(X,Y)={(xi,yi)|i={1,…,N}},其 中xi∈Rd,yi∈ {0,1}k,,即yi為k分類任務(wù)的one-hot編碼。ELM為黃廣斌[14]提出的屬于單隱層的前饋神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)如圖1所示。
圖1 極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)結(jié)構(gòu)
輸入層為d個(gè)結(jié)點(diǎn),對應(yīng)輸入數(shù)據(jù)x的d維數(shù)據(jù);隱藏層共h個(gè)結(jié)點(diǎn),h為極限學(xué)習(xí)的超參,根據(jù)具體的應(yīng)用進(jìn)行設(shè)置,g(·)為激活函數(shù),為極限學(xué)習(xí)機(jī)提供非線性映射的能力;輸出層共k個(gè)結(jié)點(diǎn),對應(yīng)于k分類。模型中的共有三組參數(shù),W[d,h]和B[h]是輸入層到隱藏層的線性映射權(quán)重及其偏置;β[h,k]是隱藏層的輸出到最終輸出的線性映射權(quán)重。模型中輸入數(shù)據(jù)X和輸出預(yù)測值之間關(guān)系如公式1所示。
在極限學(xué)習(xí)機(jī)中,學(xué)習(xí)的目標(biāo)函數(shù)為min||Y-||,這里的參數(shù)W[d,h]和B[h]在隨機(jī)初始化便不再改變,要學(xué)習(xí)的參數(shù)僅有β[h,k],即要求解的問題如公式2所示:
這里根據(jù)公式2可以得到β的解析表達(dá)式:
其中,g(WTX+B)-1可以使用矩陣廣義逆來近似求解。
ELM將樣本X以非線性的方式隨機(jī)投影到不同的特征空間,然后在新的特征空間中進(jìn)行學(xué)習(xí)。由于投影的參數(shù)W,B在初始化的過程中隨機(jī)生成并不再改變,投影的過程在樣本數(shù)量有限的情況下不可避免地造成原始信息偏歧,最終得到的模型效果容易受到初始投影參數(shù)的影響。集成學(xué)習(xí)要求基分類器具備“好而不同”的特點(diǎn),使用ELM作為基分類器,其隨機(jī)投影保證了基分類器之間的差異性,而其后的近似解析表達(dá)可以為效果提供保障。使用集成學(xué)習(xí)結(jié)合多個(gè)ELM基分類器,相當(dāng)于以不同的方式對原始數(shù)據(jù)進(jìn)行投影后再學(xué)習(xí),可以通過不同的“角度”充分地利用原始數(shù)據(jù)信息,有效的降低偏差,獲得更準(zhǔn)確和穩(wěn)定的預(yù)測結(jié)果。對多個(gè)基分類器的結(jié)果使用相對多數(shù)投票法的結(jié)合策略,即預(yù)測為得票最多的類別,若同時(shí)有類別票數(shù)相同,則隨機(jī)選取一個(gè)。
在現(xiàn)實(shí)的電子商務(wù)過程中,需要預(yù)警的企業(yè)遠(yuǎn)少于正常的企業(yè)數(shù)量,這將在數(shù)據(jù)集中造成類別不平衡問題,會(huì)降低模型的性能和預(yù)測效果。為了使數(shù)據(jù)集中的類別達(dá)到平衡狀態(tài),一般可以通過少數(shù)類樣本的過采樣技術(shù)和多數(shù)類樣本的欠采樣來緩解類別不平衡的問題。在企業(yè)信用風(fēng)險(xiǎn)預(yù)警數(shù)據(jù)樣本量有限的情況,使用對多數(shù)類的欠采樣會(huì)進(jìn)一步減少樣本的數(shù)量,往往比基于少數(shù)類的過采樣造成更嚴(yán)重的分類器過擬合問題。因此在本文中采用對少數(shù)類的樣本隨機(jī)過采樣的方法來使數(shù)據(jù)集的類別達(dá)到平衡狀態(tài)。
根據(jù)上述的步驟,基于類別平衡校正的EELM模型的訓(xùn)練過程如算法1所示:
算法1基于類別平衡校正的集成極限學(xué)習(xí)機(jī)模型訓(xùn)練算法輸入:訓(xùn)練數(shù)據(jù)集D={X,Y),模型集成的數(shù)量M,ELM的激活函數(shù)g(·),隱藏結(jié)點(diǎn)數(shù)h過程:1:i=0 2:repeat 3:對D中的少數(shù)類樣本進(jìn)行隨機(jī)過采樣以達(dá)到類別平衡4:隨機(jī)初始化ELM的分類器Fi權(quán)重W和B 5:根據(jù)公式3計(jì)算出分類器Fi的權(quán)重β 6:i=i+1 7:util i==M輸出:M個(gè)ELM分類器{F1,F2,…,FM}
基于類別平衡校正的EELM模型算法的推斷過程如算法2所示:
算法2基于類別平衡校正的集成極限學(xué)習(xí)機(jī)模型推斷算法輸入:測試數(shù)據(jù)X,M個(gè)ELM分類器{F1,F2,…,FM}過程:1:i=0 2:foreach Fi 3:根據(jù)公式1計(jì)算 Y?i=Fi(X)4:根據(jù){ ⌒Y1,⌒Y2,… ,⌒YM}的結(jié)果使用相對多數(shù)投票法計(jì)算得到最終預(yù)測結(jié)果 Y?輸出:最終預(yù)測結(jié)果Y?
電子商務(wù)信用風(fēng)險(xiǎn)數(shù)據(jù)樣本的采集首先要建立其對應(yīng)的指標(biāo)體系,本文采用王新輝的指標(biāo)體系及其調(diào)研的18家企業(yè)數(shù)據(jù)[6]。由于電子商務(wù)信用風(fēng)險(xiǎn)的復(fù)雜性,因此使用指標(biāo)體系中全部的19個(gè)指標(biāo),指標(biāo)及其計(jì)算方法如表1所示。
表1 電子商務(wù)企業(yè)信用風(fēng)險(xiǎn)預(yù)警指標(biāo)體系
王新輝在論文中對18家企業(yè)的信用風(fēng)險(xiǎn)等級評定由不同崗位的專家組對企業(yè)進(jìn)行綜合評定打分后,再由不同的分?jǐn)?shù)確定其風(fēng)險(xiǎn)等級[6]。本文根據(jù)其論文中提供的分值范圍、綜合得分分布以及信用風(fēng)險(xiǎn)的經(jīng)驗(yàn)等級劃分,按照得分情況將風(fēng)險(xiǎn)等級劃分為三類,對應(yīng)的預(yù)警等級和分值范圍為:無風(fēng)險(xiǎn)預(yù)警A(70-100)、低風(fēng)險(xiǎn)預(yù)警B(40-69)、高風(fēng)險(xiǎn)預(yù)警C(0-39)。原始數(shù)據(jù)中的18家企業(yè)信用風(fēng)險(xiǎn)分值和風(fēng)險(xiǎn)預(yù)警等級如表2所示。
表2 18家企業(yè)信用風(fēng)險(xiǎn)分值及其風(fēng)險(xiǎn)預(yù)警等級
根據(jù)表2,本文實(shí)驗(yàn)取前13家企業(yè)為訓(xùn)練樣本,后5家為測試樣本。在訓(xùn)練樣本中,共有5個(gè)A類樣本,5個(gè)B類樣本,3個(gè)C類樣本。在實(shí)驗(yàn)中,本文將對C類樣本進(jìn)行過采樣以達(dá)到和其它類別一致的5個(gè)樣本。為了對比其實(shí)驗(yàn)效果,過采樣后的訓(xùn)練數(shù)據(jù)集記為校正數(shù)據(jù)集,未校正的數(shù)據(jù)集記為原始數(shù)據(jù)集。
在ELM中最重要的和需要設(shè)置的參數(shù)為隱層結(jié)點(diǎn)的數(shù)量,隱層結(jié)點(diǎn)的數(shù)量決定隨機(jī)投影的維度,合適的維度可以有效的緩解ELM在學(xué)習(xí)過程中過擬合和欠擬合的情況。在實(shí)驗(yàn)中使用ELM最常用的Sigmoid激活函數(shù),在基分類器數(shù)量為100個(gè)的情況下,隱層結(jié)點(diǎn)數(shù)量從3個(gè)到10個(gè)模型的各運(yùn)行10次的平均準(zhǔn)確率如圖4所示。
準(zhǔn)確率包括在原始數(shù)據(jù)集上的訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率,校正后的數(shù)據(jù)集上的訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率??梢园l(fā)現(xiàn),隨著隱層結(jié)點(diǎn)數(shù)量的增加,原始訓(xùn)練準(zhǔn)確率和校正訓(xùn)練準(zhǔn)確率都在上升,但是在原始測試準(zhǔn)確率和校正測試準(zhǔn)確率先上升再下降,這個(gè)現(xiàn)象說明當(dāng)隱層結(jié)點(diǎn)數(shù)量超過一定數(shù)量時(shí)造成了模型的過擬合現(xiàn)象。根據(jù)圖4所顯示的結(jié)果,ELM的隱層結(jié)點(diǎn)數(shù)量選擇為7個(gè)結(jié)點(diǎn)。
在EELM中的參數(shù)還涉及到基分類器數(shù)量選擇。如圖5所示,可以觀測到兩個(gè)現(xiàn)象:一是隨著基分類器數(shù)量的增加,無論是訓(xùn)練準(zhǔn)確率還是測試準(zhǔn)確率校正后的數(shù)據(jù)集都明顯高于原始數(shù)據(jù)集,說明校正后的類別平衡有助于提高模型的性能;二是隨著基分類器數(shù)量增加,校正測試準(zhǔn)確率先呈上升趨勢,隨后在一定水平線上波動(dòng),說明在當(dāng)前基分類器參數(shù)下模型性能具有較小的偏差。根據(jù)圖5所顯示的結(jié)果,將EELM的基分類器數(shù)量設(shè)置為1000。
首先驗(yàn)證集成學(xué)習(xí)對應(yīng)單個(gè)基分類器的效果,在7個(gè)隱層結(jié)點(diǎn),1000個(gè)基分類器的情況下,運(yùn)行模型10次取準(zhǔn)確率均值,與所有基分類器的準(zhǔn)確率均值比較如圖6所示。
圖6 集成模型與基分類器準(zhǔn)確率對比
根據(jù)圖6展示的結(jié)果,可以發(fā)現(xiàn)集成模型的準(zhǔn)確率明顯高于基分類器的準(zhǔn)確率,在測試數(shù)據(jù)集上體現(xiàn)得更加顯著。
為了驗(yàn)證ELM相對于其它分類器的有效性,本文選取在信用風(fēng)險(xiǎn)評估中常用的BPNN、SVM模型作為比較算法,對BPNN和SVM同樣使用相對多數(shù)的投票法進(jìn)行集成。這三個(gè)算法基分類器的數(shù)量都設(shè)置為1000,其它兩個(gè)算法具體的參數(shù)如下:為方便比較,BPNN使用和ELM相同的單隱層結(jié)構(gòu),使用10個(gè)隱層結(jié)點(diǎn),激活函數(shù)采用同ELM一樣的Sigmoid函數(shù),使用基于L-BFGS的梯度下降優(yōu)化算法,迭代至200次或誤差小于0.001時(shí)停止;SVM選擇核支持向量機(jī),核函數(shù)選擇為RBF函數(shù),為了進(jìn)一步增大SVM基分類器之間的差異性,懲罰因子C以及RBF函數(shù)的核寬度參數(shù)從(0,1)的高斯分布中采樣,迭代至誤差小于0.001時(shí)停止。另外為了比較模型的計(jì)算效率,還將給出模型在相同環(huán)境下的運(yùn)行時(shí)間,運(yùn)行環(huán)境為:windows10操作系統(tǒng),Intel Xeon E5型號的CPU,32G內(nèi)存。在不同的基分類器下的準(zhǔn)確率和運(yùn)行時(shí)間如表3所示。
表3 不同基分類器性能對比
根據(jù)表3所展示的結(jié)果,基于ELM的集成模型在測試準(zhǔn)確率上明顯優(yōu)于基于BPNN和SVM的集成模型,同時(shí)可以看出基于解析求解的SVM和ELM在計(jì)算速度上遠(yuǎn)遠(yuǎn)超過基于迭代優(yōu)化的BPNN模型。在校正的數(shù)據(jù)集上所有模型的訓(xùn)練準(zhǔn)確率都高于原始數(shù)據(jù)集,說明類別平衡校正有助于模型更容易地尋找分類邊界;在校正的數(shù)據(jù)集上ELM和BPNN的測試準(zhǔn)確率高于原始數(shù)據(jù)集,說明類別平衡校正能夠進(jìn)一步提高模型的泛化能力,值得注意的是BPNN的訓(xùn)練準(zhǔn)確率達(dá)到了100%,遠(yuǎn)超測試準(zhǔn)確率,說明基于梯度下降的BPNN容易在少樣本數(shù)據(jù)集上造成過擬合現(xiàn)象;但是SVM在校正的測試數(shù)據(jù)集上取出現(xiàn)了性能下滑,造成這個(gè)現(xiàn)象的原因過采樣的樣本干擾了SVM支持向量的選擇,導(dǎo)致SVM模型產(chǎn)生了過擬合現(xiàn)象。
在電子商務(wù)活動(dòng)中,有效準(zhǔn)確的企業(yè)信用風(fēng)險(xiǎn)預(yù)警等級評估是健全電子商務(wù)信用體系的重要環(huán)節(jié),能夠積極推動(dòng)電子商務(wù)的進(jìn)一步發(fā)展,本文根據(jù)當(dāng)前電子商務(wù)企業(yè)數(shù)據(jù)樣本數(shù)量少且類別不平衡的特點(diǎn),提出了基于過采樣的類別平衡校正集成極限學(xué)習(xí)(EELM)模型,與現(xiàn)有的研究相比較具有泛化能力強(qiáng)、求解速度快,適用于高維的少樣本數(shù)據(jù)集。EELM模型在18家電子商務(wù)企業(yè)數(shù)據(jù)的全部19個(gè)指標(biāo)上進(jìn)行了實(shí)證分析,EELM能夠有效的預(yù)測企業(yè)信用風(fēng)險(xiǎn)預(yù)警等級,且在性能和效果上優(yōu)于基于BPNN和SVM的集成模型,較好解決了電子商務(wù)企業(yè)信用評價(jià)數(shù)據(jù)樣本少且類別不平衡的問題。由于企業(yè)信用數(shù)據(jù)采集存在一定的困難性,本文所提出來的模型有效性還有待在更多的企業(yè)信用數(shù)據(jù)上進(jìn)行驗(yàn)證。
針對三類風(fēng)險(xiǎn)等級界定,建議如下:
第一,處于A級無風(fēng)險(xiǎn)預(yù)警的企業(yè),信用風(fēng)險(xiǎn)較小,有較好的抗風(fēng)險(xiǎn)能力,可繼續(xù)深度合作,加強(qiáng)信用評級信息收集,優(yōu)化風(fēng)險(xiǎn)調(diào)控結(jié)構(gòu),提升企業(yè)信用。
第二,處于B級低風(fēng)險(xiǎn)預(yù)警的企業(yè),有一定的信用風(fēng)險(xiǎn)發(fā)生的可能性,要加強(qiáng)對企業(yè)產(chǎn)生信用風(fēng)險(xiǎn)的潛在因素進(jìn)行分析,加強(qiáng)溝通和管理,改進(jìn)工作,督促提高信用,防止信用風(fēng)險(xiǎn)的發(fā)生。
第三,處于C級高風(fēng)險(xiǎn)預(yù)警的企業(yè),處于預(yù)警狀態(tài),有較大信用風(fēng)險(xiǎn)發(fā)生的可能性,建議進(jìn)入風(fēng)險(xiǎn)預(yù)案程序,暫停合作,督促加強(qiáng)各項(xiàng)工作,提升信用風(fēng)險(xiǎn)防范意識(shí),避免出現(xiàn)慘重?fù)p失。
閩南師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)2022年2期