亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向特征因果分析的CFW-Boost企業(yè)財務(wù)風(fēng)險預(yù)警模型

        2022-04-07 01:24:20趙雪峰吳偉偉吳德林時輝凝
        系統(tǒng)管理學(xué)報 2022年2期
        關(guān)鍵詞:維特分類器預(yù)警

        趙雪峰 ,吳偉偉 ,吳德林 ,國 旭 ,時輝凝

        (1.哈爾濱工業(yè)大學(xué)(深圳)經(jīng)濟管理學(xué)院,廣東 深圳 518006;2.哈爾濱工業(yè)大學(xué) 經(jīng)濟與管理學(xué)院,哈爾濱 150001;3.華為技術(shù)有限公司財經(jīng)財務(wù)管理部,廣東 深圳 523808;4.中國工商銀行集約運營中心,廣東 佛山 528010)

        十三屆全國人大三次會議中,李克強總理指出,伴隨疫情爆發(fā),我國近6 億人民月收入不足千元。可見,在疫情導(dǎo)致經(jīng)濟面臨較大下行壓力的背景下,一方面需采取紓困政策保障基本民生,另一方面需穩(wěn)住市場,防止惡性事件沖擊市場帶來經(jīng)濟驟速下滑[1-2]。其中,惡性事件以公司危機而進行財務(wù)造假為突出代表,由于財務(wù)造假不僅給債權(quán)人、投資人帶來巨大投資風(fēng)險[3-5],而且會發(fā)生多米諾骨牌效應(yīng),造成我國經(jīng)濟雪上加霜[6-7]。因此,及時有效地對財務(wù)危機進行預(yù)警預(yù)測,可為扭轉(zhuǎn)財務(wù)危機局面的公司提供充足的操作空間[8],降低破產(chǎn)可能性,也可及時規(guī)避投資風(fēng)險,保護各利益相關(guān)方權(quán)益[9]。另外,在我國乃至全球經(jīng)濟下滑的環(huán)境中,對重塑人民信心也起到積極作用[10-11]。

        目前,國內(nèi)外涌現(xiàn)出很多以財務(wù)特征為基礎(chǔ)構(gòu)建的財務(wù)風(fēng)險預(yù)測模型,有效地推動了財務(wù)危機的智能預(yù)警,且每個學(xué)者的研究側(cè)重點也不盡相同,但可主要分為模型構(gòu)建及特征選取兩個方面。

        從模型構(gòu)建上而言,逐漸從傳統(tǒng)機器學(xué)習(xí)延伸至深度學(xué)習(xí)及集成學(xué)習(xí)中。在以傳統(tǒng)機器學(xué)習(xí)為基礎(chǔ)的構(gòu)建中,Altman 等[12]構(gòu)建優(yōu)化Zeta 評判模型,提高了財務(wù)風(fēng)險預(yù)測的準確率。Beaver[13]基于控制變量原則,利用單變量方法預(yù)測企業(yè)財務(wù)危機。張茂軍等[14]基于Aalen可加模型,實證分析出上市公司違約概率與財務(wù)預(yù)警指標間的關(guān)系,結(jié)果表明,總資產(chǎn)規(guī)模、營業(yè)利潤率、運營資金/資產(chǎn)總金額以及留存收益/資產(chǎn)總金額4個指標均影響上市公司陷入財務(wù)困境的強度。鮑新中等[15]構(gòu)建了基于面板Logit模型的財務(wù)困境預(yù)警模型,并分別檢驗了非財務(wù)指標對財務(wù)預(yù)警模型的影響、行業(yè)差異對財務(wù)預(yù)警模型的影響以及預(yù)警臨界點的選擇對模型的影響。顧曉安等[16]將應(yīng)計盈余管理變量與真實盈余管理變量引入至Logistic財務(wù)預(yù)警模型中,并對由盈余管理行為導(dǎo)致的財務(wù)信息偏差進行糾正,減少了因財務(wù)信息失真造成的預(yù)警模型誤判。鮑新中等[17]從32個財務(wù)與非財務(wù)指標中選取11個指標作為財務(wù)預(yù)警典型指標,在此基礎(chǔ)上,建立COX 比例風(fēng)險模型。Kumar等[18]利用Logistic回歸、隨機森林和支持向量機,可對不均衡預(yù)警財務(wù)數(shù)據(jù)進行修正。黃超等[19]基于雙正交小波在非線性信號處理方面的良好性能,構(gòu)造基于雙正交小波混合核函數(shù)的KPCA-SVM 財務(wù)危機預(yù)警模型。王威[20]將Lasso和Logistic兩種模型進行結(jié)合,提高財務(wù)風(fēng)險預(yù)測的魯棒性。石先兵[21]結(jié)合降維算法和支持向量機的優(yōu)勢,創(chuàng)建PCA-SVM 預(yù)警模型,有效提高模型泛化能力。

        在以深度學(xué)習(xí)及集成學(xué)習(xí)為基礎(chǔ)的構(gòu)建中,王玉冬等[22]采用果蠅算法和粒子群算法構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)警模型,解決了財務(wù)危機預(yù)警時收斂速度慢,易導(dǎo)致局部最優(yōu)解無解的缺陷。Niu 等[23]提出一種基于兩階段特征選擇的深度學(xué)習(xí)模型,在有效地捕捉多元金融時間序列非線性的同時,采用誤差修正模型對預(yù)測結(jié)果進行校正,提高了模型泛化性及預(yù)測準確率。吳沖等[24]利用可動態(tài)調(diào)整參數(shù)的粒子群算法,優(yōu)化概率神經(jīng)網(wǎng)絡(luò)的平滑參數(shù),進而解決概率神經(jīng)網(wǎng)絡(luò)平滑參數(shù)確定及空間結(jié)構(gòu)復(fù)雜的問題。肖毅等[25]集成文本挖掘和深度學(xué)習(xí)構(gòu)建企業(yè)財務(wù)風(fēng)險預(yù)警模型,提出融合卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)的財務(wù)風(fēng)險預(yù)警動態(tài)建模方法,并以中國信息服務(wù)業(yè)上市公司為樣本開展實證研究。劉小萌等[26]分別利用傳統(tǒng)多變量區(qū)別分析方法及基因類神經(jīng)網(wǎng)絡(luò)建立預(yù)測模型,以檢驗兩者中何者具有更高的預(yù)測能力,表示基因類神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果有更佳的一般性,更能讓外部關(guān)系人將模型應(yīng)用于樣本外的企業(yè)風(fēng)險預(yù)測。

        從特征選擇上而言,從影響公司財務(wù)狀況的角度,可將特征分為財務(wù)特征和非財務(wù)特征,不同研究人員對于特征研究的側(cè)重點也不同。李江宇等[27]從證券公司對上市公司財務(wù)指標的預(yù)期差角度分析,定量考察財務(wù)數(shù)據(jù)預(yù)期差的價值發(fā)現(xiàn)能力,分析驗證了財務(wù)預(yù)期差因子對于超額收益的解釋力度。Huang等[28]選取加權(quán)平均利率、全國房地產(chǎn)繁榮指數(shù)、貨幣供應(yīng)量M2、宣布有效匯率、深圳成分指數(shù)等18個替代指標,建立金融狀況指數(shù),分析表明,利率、房地產(chǎn)價格、貨幣供應(yīng)量、匯率和股票價格,可有效地反映我國實際金融狀況,同時證明在財政緊縮時,可通過金融指標的變化實現(xiàn)預(yù)警。王昱等[29]從經(jīng)營效率、財務(wù)效率、融資效率和人力資本效率4個維度的效率特征出發(fā),分別提出相對應(yīng)的投入產(chǎn)出指標體系,并采用數(shù)據(jù)包絡(luò)法評價上市公司對各個維度的相對有效性,并在此基礎(chǔ)上,將得到的多維效率指標與財務(wù)指標相融合。Yan等[30]利用無約束分布滯后模型和支持向量機(SVM),引入3~5個周期滯后的財務(wù)比率和宏觀經(jīng)濟因素,從而檢測出公司內(nèi)外部的早期變化對其財務(wù)狀況的影響。王蓮喬等[31]發(fā)現(xiàn),融資強度對PPP 項目財務(wù)風(fēng)險有正向影響,私營部門投資比例負向調(diào)節(jié)了這一影響,且該調(diào)節(jié)作用依賴于國家宏觀環(huán)境的財務(wù)風(fēng)險結(jié)論。尹建華等[32]發(fā)現(xiàn),重污染企業(yè)往往選擇犧牲環(huán)境績效來提高財務(wù)績效,企業(yè)規(guī)模越大,環(huán)境績效對財務(wù)績效的負向影響越小,而企業(yè)所有制形式對兩者關(guān)系的調(diào)節(jié)效應(yīng)不顯著,另外也發(fā)現(xiàn),企業(yè)客觀特征對環(huán)境績效和財務(wù)績效之間的調(diào)節(jié)作用還依賴于積極的環(huán)境信息披露。劉端等[33]研究得出客戶關(guān)系越集中,重要程度越大,則企業(yè)的財務(wù)績效水平越高,客戶關(guān)系集中度對存貨資源效率、營銷資源效率以及應(yīng)收賬款資源效率具有顯著的正向影響,企業(yè)的這三大有形資源效率是客戶關(guān)系集中度作用于企業(yè)財務(wù)績效。

        根據(jù)文獻內(nèi)容綜合分析,相比于深度學(xué)習(xí)預(yù)警模型而言,傳統(tǒng)機器學(xué)習(xí)預(yù)警模型主要圍繞控制特征或修正特征偏差等作為研究切入點,如通過控制變量原則,研究單變量下的企業(yè)財務(wù)危機[13]、將盈余管理變量引入至Logistic財務(wù)預(yù)警模型中,并對由盈余管理行為導(dǎo)致的財務(wù)信息偏差進行糾正,減少預(yù)警模型誤判[16]等。而深度學(xué)習(xí)預(yù)警模型相比于傳統(tǒng)機器學(xué)習(xí)預(yù)警模型,由于深度學(xué)習(xí)內(nèi)部參數(shù)眾多、結(jié)構(gòu)更復(fù)雜,故更傾向于研究模型組合及模型結(jié)構(gòu)優(yōu)化,如將卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)融合[25]、利用可動態(tài)調(diào)整參數(shù)的粒子群算法,優(yōu)化概率預(yù)警神經(jīng)網(wǎng)絡(luò)的平滑參數(shù)[24]等。但通常而言,傳統(tǒng)機器學(xué)習(xí)預(yù)警模型受限于結(jié)構(gòu)較為簡單,難以適應(yīng)復(fù)雜企業(yè)場景下的預(yù)警分析,同時,通過特征控制、修正等方案也可能存在主觀因素,因而在一般情況下預(yù)警表現(xiàn)不如深度學(xué)習(xí)預(yù)警模型。但深度學(xué)習(xí)預(yù)警模型也因結(jié)構(gòu)復(fù)雜、內(nèi)部參數(shù)多等因素,在預(yù)警分析之前,需在訓(xùn)練階段利用大量準確無誤的訓(xùn)練數(shù)據(jù)集調(diào)整優(yōu)化內(nèi)部參數(shù),一方面,收集大量準確無誤的訓(xùn)練數(shù)據(jù)集難度高;另一方面,當訓(xùn)練數(shù)據(jù)集數(shù)量或純潔度不滿足模型要求時,又容易出現(xiàn)預(yù)警表現(xiàn)差的現(xiàn)象[41]。因此,為了解決因模型結(jié)構(gòu)簡單或訓(xùn)練數(shù)據(jù)集缺失而導(dǎo)致的傳統(tǒng)機器學(xué)習(xí)或深度學(xué)習(xí)預(yù)警表現(xiàn)下滑問題,本文在CART 樹對訓(xùn)練數(shù)據(jù)集不敏感的前提下,集成多棵CART 樹得到集成分類器,從而達到提高模型復(fù)雜度的同時,規(guī)避訓(xùn)練數(shù)據(jù)集缺失的問題,從而整體優(yōu)化預(yù)警表現(xiàn)。

        在影響企業(yè)財務(wù)危機的特征研究中,目前多數(shù)僅以某一類特征為前提,分析該類特征對財務(wù)造假的影響,由于考慮特征單一,而實際企業(yè)財務(wù)出現(xiàn)危機,也歸咎于眾多因素的綜合影響,從而導(dǎo)致該方法運用至實際場景有限;少數(shù)研究方法雖綜合多種可能影響企業(yè)財務(wù)危機的特征因素,但缺乏對不同特征之間的因果關(guān)系分析,從而造成企業(yè)預(yù)警分析時,因特征維度過大,造成特征冗余現(xiàn)象,又因特征冗余容易造成模型過擬合,導(dǎo)致模型預(yù)警表現(xiàn)下滑的現(xiàn)象[27]。因此,為了解決因特征單一導(dǎo)致財務(wù)預(yù)警應(yīng)用場景受限,或因特征維度過大造成模型過擬合的問題,本文對所收集的高維特征執(zhí)行因果分析,從而優(yōu)化出合理維度范圍的特征集合,并基于上述集成分類器和已優(yōu)化的特征集合完成企業(yè)預(yù)警,從而有效規(guī)避因財務(wù)特征影響預(yù)警表現(xiàn)的現(xiàn)象。

        目前預(yù)警模型構(gòu)建及預(yù)警特征選擇相對獨立,從模型構(gòu)建角度而言,機器學(xué)習(xí)多以變量控制法,深度學(xué)習(xí)多以訓(xùn)練調(diào)參法預(yù)測企業(yè)財務(wù)危機,并沒有考慮不同企業(yè)特征對預(yù)警模型的影響;從預(yù)警特征選擇角度而言,利用特征選擇法實現(xiàn)特征選擇,并通過實證數(shù)據(jù)研究特征選擇法的有效性。可見,在企業(yè)財務(wù)預(yù)警研究中,特征選擇與模型構(gòu)建相對獨立且割裂,缺乏一種可有效從海量特征中選擇出價值特征,并直接實現(xiàn)企業(yè)預(yù)警的端到端方法。

        除此之外,關(guān)于預(yù)警模型的應(yīng)用價值,主流方向還是通過實證數(shù)據(jù)或仿真數(shù)據(jù),驗證其預(yù)警準確率,客觀而言,準確率確實在某種程度上可衡量出模型實用價值,但不同預(yù)警模型在不同特征維度范圍內(nèi),其預(yù)警效果是否也各不相同? 即不同財務(wù)預(yù)警模型可能具有不同的特征最優(yōu)維度,當在特征最優(yōu)維度下,其預(yù)警表現(xiàn)最優(yōu)。然而,目前研究中,缺乏對預(yù)警模型與特征維度的實證探討,從而無法得到更具指導(dǎo)意義的研究價值。

        綜上所述,本文結(jié)合現(xiàn)有研究成果,以克服機器學(xué)習(xí)及深度學(xué)習(xí)構(gòu)建預(yù)警模型的弊端、特征維度造成預(yù)警場景受限、預(yù)警表現(xiàn)不佳為目的,構(gòu)建出以特征因果關(guān)系分析為基礎(chǔ)的集成財務(wù)預(yù)警模型(An boosted model of corporate financial early warning based on characteristic causality analysis,簡稱CFW-Boost模型),從而完成特征優(yōu)化與企業(yè)預(yù)警端到端的實現(xiàn),并通過中國A 股上市公司實證數(shù)據(jù)訓(xùn)練CFW-Boost后,進一步探究CFW-Boost模型與其他預(yù)警模型在不同特征維度的預(yù)警表現(xiàn),在確定存在特征最優(yōu)維度的結(jié)論下,對比分析與其他模型的異同點,進一步體現(xiàn)CFW-Boost的優(yōu)勢性,進而得出管理結(jié)論。

        1 企業(yè)財務(wù)風(fēng)險預(yù)警的CFW-Boost模型構(gòu)建

        1.1 面向特征因果分析的模型架構(gòu)

        根據(jù)財務(wù)預(yù)警要求和CFW-Boost模型特征,財務(wù)預(yù)警中的CFW-Boost模型分為3個模塊,分別為平穩(wěn)性檢驗、特征因果分析及集成分類器預(yù)測,3個模塊的主要構(gòu)建過程如圖1所示。

        其中,CFW-Boost模型的核心在于特征因果分析及集成分類器預(yù)測,其中特征因果分析主要基于高維特征集X與低維特征集的映射關(guān)系,將高維特征集X降維至低維特征集,進而利用集成分類器,構(gòu)建低維特征集的目標函數(shù),并優(yōu)化目標函數(shù)得到財務(wù)預(yù)警結(jié)果。

        1.2 參量定義

        X——高維特征集,且X=,…,表示公司在t時刻下可能影響公司財務(wù)狀況的第i個特征

        ——低維特征集,利用X求解得到的,,且n≥m,T≥R

        q——高維特征集的樣本總量

        p——低維特征集的樣本總量,且p≤q

        ——表示低維特征集中第j樣本對應(yīng)的公司財務(wù)真實標簽,j=1,2,…,p

        ——表示低維特征集中第j樣本對應(yīng)的公司財務(wù)預(yù)測標簽,j=1,2,…,p

        fk)——表示編號為k的CART樹根據(jù)第j個樣本生成的目標函數(shù),k=1,2,…,K

        1.3 模型構(gòu)建過程

        Tun?[34]指出,公司財務(wù)狀況應(yīng)綜合多個維度多個指標進行分析,故本文所述的高維特征集的特征數(shù)量不少于上百個,但如何從上百個特征中選擇與公司財務(wù)狀況息息相關(guān)的特征,是CFW-Boost模型首先需要做的工作。

        一般情況下,影響公司財務(wù)特征均是平穩(wěn)隨機過程生成的時間序列數(shù)據(jù),根據(jù)Song等[35]所述,以平穩(wěn)時間序列數(shù)據(jù)為基礎(chǔ)的經(jīng)濟分析具有有效性,故先構(gòu)建平穩(wěn)性檢驗方程,檢查高維特征集的平穩(wěn)性,且僅保留具有平穩(wěn)性的特征。平穩(wěn)性檢驗方程為

        當利用平穩(wěn)性剔除部分高維特征后,進一步利用高維特征集構(gòu)建映射到低維特征集的期望函數(shù),并最優(yōu)化期望函數(shù)的參數(shù)值,反向求解得到低維特征集。

        綜上可知,首先構(gòu)建高維特征集X映射到低維特征集的映射關(guān)系:

        在式(2)中,Λ是變化矩陣,維度為n×m,在低維特征集的每個特征,均滿足標準正態(tài)分布(0,I)的假設(shè)下,變化矩陣的作用是將的維度從m變?yōu)閚,將的均值由0變?yōu)棣?同樣地,噪點ò滿足高斯分布ò~N(0,φ)。根據(jù)多元高斯分布求解式(2)的聯(lián)合分布為

        根據(jù)協(xié)方差公式分別計算式(4)的方差:

        結(jié)合式(6)~(10),得出方差為

        進一步,當最優(yōu)化出參數(shù)μ,Λ,φ,即可計算出。根據(jù)最大似然估計法與p的概率分布,構(gòu)建包括μ、Λ、φ的似然函數(shù):

        由Jensen不等式知,若函數(shù)f(x)為凸函數(shù),則f(x)的期望函數(shù)大于或等于函數(shù)的期望,對應(yīng)的數(shù)學(xué)表達式為f(E[x])≤E[f(x)],因此,似然函數(shù)為

        當Jensen不等式等號成立時,當且僅當x為常量時,f(E[x])=E[f(x)],故式(13)的值為

        在式(2)中,在假設(shè)每個特征均滿足標準正態(tài)分布(0,I)時,聯(lián)立式(12)、(14)得出:

        結(jié)合式(11)、(15)和式(16),分別求得μ、Λ、φ、原始樣本X和低維特征集的關(guān)系表達式為:

        進一步,迭代出μ、Λ、φ參數(shù)的最優(yōu)解,并聯(lián)立μ、Λ、φ的最優(yōu)解和式(2),求解得到低維特征集,從而將高維特征集中n個特征降低至低維特征集的m個特征。

        當完成降維操作后,根據(jù)集成分類器可處理多種特征,并依然保持較高準確度的優(yōu)點[36],將CART 決策樹作為集成分類器中的最小單元,并在不同的企業(yè)預(yù)警場景中,集成不同數(shù)量的CART 決策樹,當利用低維特征集集成多棵CART 樹得到集成分類器時,假設(shè)集成分類器生成公司財務(wù)預(yù)測標簽的分類函數(shù)為

        當集成K棵CART 樹的分類函數(shù)為

        集成CART 樹的數(shù)量K與分類準確度并非是正比關(guān)系,即并非K值越大,預(yù)測標簽越接近真實標簽[37],因此,在集成每棵CART 樹時,需要利用目標函數(shù)衡量集成后的分類器,是否比集成前的分類器在分類效果上更優(yōu)異。其中,目標函數(shù)為

        式中:objectK為集成了K棵CART 樹時的目標函數(shù);為公司財務(wù)真實標簽與預(yù)測標簽的誤差函數(shù)。

        進一步,在集成分類函數(shù)中引入正則化項Ω(fk),當在集成CART 樹過程時,正則化項會依賴CART 樹葉子節(jié)點個數(shù)、每個葉子節(jié)點的輸出值,從而防止集成分類器在預(yù)警過程中特征過擬合現(xiàn)象的發(fā)生。另外,本文在構(gòu)建集成分類器時,不同CART 樹的不同葉子節(jié)點對應(yīng)不同的權(quán)重系數(shù),從而規(guī)避僅依賴于單棵或少部分CART 樹時,造成預(yù)警泛化能力差的問題。進一步,懲罰項Ω(fk)為

        式中:S為CART 樹的葉子結(jié)點數(shù);ωj為CART 樹葉子結(jié)點的權(quán)重,結(jié)合式(22)、(23),得到目標函數(shù):

        constant表示常數(shù)項,基于泰勒展開法則進一步展開目標函數(shù),得到

        式中,gj、hj分別為的一階和二階偏導(dǎo):

        聯(lián)立式(25)~(27)得

        進一步求解權(quán)重的一階偏導(dǎo),可得

        結(jié)合式(30)、(31),可得最終的目標函數(shù)為

        進一步,利用基尼指數(shù)衡量每次增加CART 樹后的集成分類器,比未增加CART 樹時的分類器,在預(yù)測標簽上的表現(xiàn)是否更優(yōu)異,直至增加CART樹后的集成分類器,無法比未增加時的分類器表現(xiàn)得更優(yōu)異,則得到適用于企業(yè)財務(wù)風(fēng)險預(yù)警的多層CART 數(shù)集成模型,即CFW-Boost模型。

        2 數(shù)值分析實驗

        2.1 實證研究步驟

        利用國泰安證數(shù)據(jù)庫、各類企業(yè)網(wǎng)站等,獲取上市公司對應(yīng)的特征集,并根據(jù)CFW-Boost模型的理論構(gòu)建過程,將研究分為訓(xùn)練階段和測試階段,其中訓(xùn)練階段流程如圖2所示。

        步驟1從公開數(shù)據(jù)庫、各類企業(yè)網(wǎng)站等爬取企業(yè)特征數(shù)據(jù)集及對應(yīng)的公司財務(wù)真實標簽集,將企業(yè)特征數(shù)據(jù)集分為模型訓(xùn)練集和模型測試集。進一步,參照王昱等[29]以經(jīng)營、財務(wù)、融資和人力資本等維度拆分指標,以及葛興浪等[38]所研究出的企業(yè)信息指標體系,將模型訓(xùn)練集劃分為非財務(wù)高維特征集和財務(wù)高維特征集,利用CFW-Boost對非財務(wù)高維特征集和財務(wù)高維特征集進行平穩(wěn)性檢驗,剔除少量非平穩(wěn)性數(shù)據(jù)得到平穩(wěn)性的高維特征集。

        另外,本文所述公開數(shù)據(jù)包括國泰安等數(shù)據(jù)庫,而爬蟲手段主要是構(gòu)建爬蟲程序進入佰騰網(wǎng)(https://www.baiten.cn/),并搜索目標公司的專利申請,并獲取對應(yīng)的專利指標,特別是公司專利申請的申請類別(發(fā)明、實用新型和外觀設(shè)計)、專利所涉及的技術(shù)領(lǐng)域及主要核心技術(shù)三部分指標。

        步驟2構(gòu)建μ、Λ、φ與高維特征集的關(guān)系表達式及最優(yōu)化關(guān)系表達式,將高維特征集降維成低維特征集,其中,低維特征集包括非財務(wù)低維特征集及財務(wù)低維特征集。

        步驟3利用低維特征集訓(xùn)練集成分類器,得到公司財務(wù)預(yù)測標簽集。

        步驟4利用公司財務(wù)預(yù)測標簽集和步驟1中的公司財務(wù)真實標簽集,計算出預(yù)測準確率,若預(yù)測準確率小于預(yù)設(shè)的準確率閾值,調(diào)整集成分類器的內(nèi)部參數(shù)并返回步驟3,重新計算公司財務(wù)預(yù)測標簽集,直至預(yù)測準確率大于或等于預(yù)設(shè)的準確率閾值時,組合平穩(wěn)性檢驗、降維及集成分類器,得到CFW-Boost模型。

        步驟5利用步驟1 中的模型測試集測試CFW-Boost模型的準確率,從而得到相關(guān)結(jié)論。

        2.2 數(shù)據(jù)采集及整理

        從國泰安等數(shù)據(jù)庫中提取2000~2020 年共3 812份上市公司的企業(yè)數(shù)據(jù)集,在數(shù)據(jù)清洗后,以是否處于ST(特別處理,Special Treatment)狀態(tài)劃分企業(yè)數(shù)據(jù)集,得到472份ST 企業(yè)數(shù)據(jù)集及3 167份正常企業(yè)數(shù)據(jù)集。另外,根據(jù)數(shù)據(jù)集中所記錄的公司信息,整理出以財務(wù)特征及非財務(wù)特征為分類原則的高維特征集。

        根據(jù)表1知,本文以財務(wù)指標和非財務(wù)指標劃分企業(yè)特征,并基于經(jīng)營能力、盈利能力、成長能力以及管理層結(jié)構(gòu)進行多級劃分,從而得到訓(xùn)練集和測試集。

        表1 高維特征部分展示

        2.3 特征因果分析

        在ST 企業(yè)數(shù)據(jù)集中,假設(shè)公司在本文研究時間范圍內(nèi)屢次被ST,則以首次被ST 的時間線為準,并根據(jù)首次被ST 的時間線或正常數(shù)據(jù)集中所記錄的時間線,對ST 數(shù)據(jù)集及正常數(shù)據(jù)集進行平穩(wěn)性檢驗,當完成平穩(wěn)性檢驗后,按照CFW-Boost的降維步驟構(gòu)建代碼,迭代訓(xùn)練得到與高維特征表對應(yīng)的低維特征集。

        2.4 集成分類器訓(xùn)練

        按照圖2將低維特征集(包括非財務(wù)低維特征集、財務(wù)低維特征集)作為第一訓(xùn)練數(shù)據(jù)集訓(xùn)練集成分類器,通過監(jiān)視目標函數(shù)的函數(shù)值objectK,構(gòu)建出函數(shù)值與訓(xùn)練次數(shù)的曲線圖。同時,為了對比低維特征相比于高維特征集,在集成分類器訓(xùn)練過程中的優(yōu)異性,將高維特征集(包括非財務(wù)高維特征集、財務(wù)高維特征集)作為第二訓(xùn)練數(shù)據(jù)集,訓(xùn)練集成分類器,得到低維特征集與高維特征集在集成分類器的訓(xùn)練對比圖(見圖3)。

        根據(jù)圖3可得出,利用低維特征集訓(xùn)練集成分類器時,當訓(xùn)練次數(shù)達到700次后,目標值變化幅度趨于穩(wěn)定,目標值的平均值為0.051 9,集成分類器訓(xùn)練完成。利用高維特征集訓(xùn)練集成分類器時,在訓(xùn)練次數(shù)達到900次后,目標值變化幅度才趨于穩(wěn)定,且目標值的平均值為0.063 6??梢?利用CFW-Boost模型中的特征因果分析后得到的低維特征集,不管從訓(xùn)練次數(shù)還是目標值大小及穩(wěn)定性上,都更有利于集成分類器的訓(xùn)練。

        進一步,Lasso 和Logistic 結(jié)合得到Lasso-Logistic[20],與利用降維算法和支持向量機創(chuàng)建得到的PCA-SVM[21]都是較為典型的具有特征分析及財務(wù)預(yù)警作用的模型。為了探究CFW-Boost相比于Lasso-Logistic、PCA-SVM 的優(yōu)劣勢,對上述第二訓(xùn)練數(shù)據(jù)集進行數(shù)據(jù)豐富得到第三訓(xùn)練數(shù)據(jù)集,依次訓(xùn)練CFW-Boost、Lasso-Logistic及PCASVM,得到對比圖(見圖4)。

        根據(jù)圖4 可得出,在訓(xùn)練周期上,CFW-Boost周期最長,需達到1 500次左右目標函數(shù)值才趨于穩(wěn)定,PCA-SVM 次之,目標函數(shù)值趨于穩(wěn)定需約1 000次訓(xùn)練,Lasso-Logistic最少僅需1 000次;在目標函數(shù)值上,當各模型訓(xùn)練完成后,CFW-Boost的目標函數(shù)值最小,平均值0.055,PCA-SVM 目標函數(shù)值均值為0.081,Lasso-Logistic為0.067??梢?CFW-Boost對第三訓(xùn)練數(shù)據(jù)集的適應(yīng)力最好,預(yù)警準確率最高。

        2.5 各財務(wù)預(yù)警模型對比分析

        當CFW-Boost訓(xùn)練完成后,參照2.1所述測試階段,本文以機器學(xué)習(xí)及深度學(xué)習(xí)為劃分依據(jù)選擇對比模型,其中,機器學(xué)習(xí)模型,依次選擇模型結(jié)構(gòu)簡單、訓(xùn)練速度較快的Logistic,添加平穩(wěn)性檢驗以提高模型魯棒性的Lasso-Logistic,低維特征集下表現(xiàn)優(yōu)異的支持向量機(SVN)、添加降維操作的PCA-SVM、高維特征集下表現(xiàn)優(yōu)異的隨機森林;而深度學(xué)習(xí)模型選擇典型代表的卷積神經(jīng)網(wǎng)絡(luò)及長短期記憶網(wǎng)絡(luò),進一步評估CFW-Boost的實際預(yù)警表現(xiàn)。

        首先將包括83個維度的測試數(shù)據(jù)集平均分為3組,利用各模型分別測試在每組的準確率,如表2所示。

        表2 各模型測試準確率

        結(jié)合表2各模型表現(xiàn),以機器學(xué)習(xí)和深度學(xué)習(xí)區(qū)別點的角度:①深度學(xué)習(xí)相比于機器學(xué)習(xí),雖然在圖像及自然語言方向具有較為明顯的優(yōu)勢[39-40],但在公司財務(wù)預(yù)警方向上,以機器學(xué)習(xí)為基礎(chǔ)構(gòu)建的預(yù)警模型,預(yù)警表現(xiàn)并不一定比深度學(xué)習(xí)差,如PCA-SVM,其訓(xùn)練準確率及測試準確率,都明顯優(yōu)異于卷積神經(jīng)網(wǎng)絡(luò)及長短期記憶網(wǎng)絡(luò);②單個機器學(xué)習(xí)算法構(gòu)建的預(yù)警模型,一般不具有特征篩選功能,如Logistic、支持向量機等,但可通過組合模型的方式,克服不具有特征篩選的缺點,如Lasso-Logistic、PCA-SVM 等,且組合后的模型,預(yù)警表現(xiàn)一般可進一步提高。

        結(jié)合①、②所述,在公司財務(wù)預(yù)警上,相比于深度學(xué)習(xí)模型,合適的組合多個機器學(xué)習(xí)會得到更優(yōu)異的預(yù)警表現(xiàn)。因此,本文以該思想,集成多棵CART 得到CFW-Boost。

        從每個模型具體表現(xiàn)的角度看,8組模型都可實現(xiàn)財務(wù)預(yù)警的作用,但CFW-Boost模型相比于其他7組模型,準確率更高,在本文設(shè)定每組模型均訓(xùn)練2 000次的前提下,CFW-Boost訓(xùn)練準確率達到最高的95.77%,優(yōu)異于表現(xiàn)次好的PCA-SVM。另外,CFW-Boost也具有更優(yōu)秀的特征篩選能力,與卷積神經(jīng)網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)、PCA-SVM 以及Lasso-Logistic等,同樣具有特征篩選的其他模型對比,CFW-Boost測試準確率領(lǐng)先于其他組模型,達到85.56%。因此,綜合來講,CFW-Boost具備較強的特征篩選能力,且有效提高公司財務(wù)預(yù)警準確率。

        為了進一步探究企業(yè)數(shù)據(jù)集中,特征維度變化對CFW-Boost預(yù)警表現(xiàn)的影響,通過按比例去除特征的原則,對上述測試數(shù)據(jù)集共83組特征執(zhí)行去除操作,如依次去除測試數(shù)據(jù)集中25%特征、50%特征及75%特征,分別得到25%測試數(shù)據(jù)集、50%測試數(shù)據(jù)集和75%測試數(shù)據(jù)集,對應(yīng)的原測試數(shù)據(jù)集簡稱0%測試數(shù)據(jù)集,表示未執(zhí)行特征去除操作。之后依次用0%、25%、50%及75%共4組測試數(shù)據(jù)集,評估上述8組模型的預(yù)警表現(xiàn),如表3所示。

        表3 比例去除特征下各模型測試準確率

        可見,隨著測試數(shù)據(jù)集中特征維度的不斷變少,不同模型的準確率變化幅度也有較大差異。其中,特征維度變化對PCA-SVM 及Lasso-Logistic的測試準確率影響最小,變化幅度值不大于2.5%,對CFW-Boost、卷積神經(jīng)網(wǎng)絡(luò)及長短期記憶網(wǎng)絡(luò)的準確率影響最大,且隨著特征維度的不斷變少,卷積神經(jīng)網(wǎng)絡(luò)及長短期記憶網(wǎng)絡(luò)的準確率不斷降低。

        為進一步探究特征維度變化對CFW-Boost預(yù)警表現(xiàn)的影響,按照每組測試數(shù)據(jù)集依次遞減5%的方法,得到0%,5%,10%,…,80%,85%,共18組測試數(shù)據(jù)集。其中,0%測試數(shù)據(jù)集依然表示未剔除特征,85%測試數(shù)據(jù)集表示已剔除85%特征數(shù)后的數(shù)據(jù)集。

        匯總每個模型在上述18組測試數(shù)據(jù)集的準確率,構(gòu)建得到準確率與特征去除比例的點線圖(見圖5)。

        進一步,利用4階多項式擬合圖5中每條點線,得到準確率與特征去除比例的擬合曲線圖(見圖6)。

        由圖6 各擬合曲線的總體表現(xiàn)可見,CFWBoost及Logistic、PCA-SVM、隨機森林等機器學(xué)習(xí)類模型,在伴隨企業(yè)特征維度減少時,準確率會呈現(xiàn)小范圍內(nèi)波動,總體趨于平緩下降的現(xiàn)象;而以深度學(xué)習(xí)為代表的長短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),準確率則會出現(xiàn)無波動的急劇下降現(xiàn)象。因此,CFW-Boost及機器學(xué)習(xí)類模型,相比于長短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),具有更強的模型穩(wěn)定性和魯棒性。

        重要地,每組模型都對應(yīng)特征最優(yōu)維度,即相比于模型在非最優(yōu)維度的表現(xiàn)來看,在最優(yōu)維度數(shù)下的預(yù)警表現(xiàn)往往最好。其中,CFW-Boost的特征最優(yōu)維度約為[63,82](對應(yīng)圖6中X軸[0,23]),此時測試準確率高達87.26%,明顯優(yōu)于其他模型;而當特征數(shù)去除比例大于23%后,CFW-Boost的預(yù)警表現(xiàn)逐漸下滑,在[47,63]區(qū)間內(nèi)(對應(yīng)圖6中X軸[23,42]),CFW-Boost的預(yù)警表現(xiàn)被PCA-SVM反超,即[47,63]變?yōu)镻CA-SVM 的特征最優(yōu)維度。換言之,CFW-Boost相比于其他模型,其特征最優(yōu)維度較大(如本文所給定的測試數(shù)據(jù)集,其財務(wù)特征最優(yōu)維度數(shù)為[63,82]),進而得到CFW-Boost對低維特征的財務(wù)預(yù)警表現(xiàn)力一般,但在高維特征中具有明顯優(yōu)勢,預(yù)警準確率較大幅度高于其他模型。

        3 結(jié)論

        本文在多數(shù)模型執(zhí)行企業(yè)財務(wù)預(yù)警時,由于考慮特征維度單一,進而影響預(yù)警準確率的背景下,以分析特征因果關(guān)系為基礎(chǔ),集成多棵CART 樹構(gòu)建得到CFW-Boost,并利用實證數(shù)據(jù)進行訓(xùn)練,進一步分析CFW-Boost相比于其他預(yù)警模型在實證數(shù)據(jù)中的預(yù)警表現(xiàn),進而得出:

        (1)企業(yè)財務(wù)受多種因素影響,因此,根據(jù)財務(wù)指標及非財務(wù)指標識別出多類財務(wù)特征,并通過特征因果分析降低多類財務(wù)特征的特征維度后,基于CFW-Boost內(nèi)的CART 樹分析每種財務(wù)特征對企業(yè)風(fēng)險的影響,構(gòu)建面向特征因果分析的CFWBoost企業(yè)財務(wù)風(fēng)險預(yù)警模型。經(jīng)過數(shù)值分析及與其他財務(wù)預(yù)警模型的對比分析發(fā)現(xiàn),本文構(gòu)建的模型在提高預(yù)警準確率的同時,通過特征因果分析可有效降低多類特征的特征維度,避免因特征維度過高產(chǎn)生特征冗余,造成CFW-Boost過擬合,模型魯棒性下降的現(xiàn)象。

        (2)通過集成多棵CART 樹得到的CFWBoost,在與其他組合模型及深度學(xué)習(xí)模型對比中發(fā)現(xiàn),CFW-Boost雖需更高的訓(xùn)練周期,但無論在訓(xùn)練階段還是測試階段,其預(yù)警準確率更高、預(yù)警表現(xiàn)也更穩(wěn)定;同時,特征維度的變化會影響CFWBoost的預(yù)警準確率,在特征從高維降為低維的過程中,CFW-Boost的準確率會呈現(xiàn)局部范圍內(nèi)波動,總體平緩下降的現(xiàn)象。因此,在高維特征時選擇CFW-Boost進行企業(yè)預(yù)警時效果更優(yōu)。

        (3)各財務(wù)預(yù)警模型均具有各自對應(yīng)的特征最優(yōu)維度,在特征最優(yōu)維度下,對應(yīng)的財務(wù)預(yù)警模型的預(yù)警表現(xiàn)最優(yōu)。其中,CFW-Boost的特征最優(yōu)維度相比于其他預(yù)警而言,其維度數(shù)值最大,表示CFWBoost相比于其他預(yù)警模型,在高維特征中預(yù)警準確率更高,優(yōu)異性更強。

        基于本文研究結(jié)論,可對企業(yè)及市場監(jiān)督部門提出如下建議:由于不同模型的預(yù)警準確率及穩(wěn)定性上均具有差異性,每組模型一般都對應(yīng)特征最優(yōu)維度,故在應(yīng)用模型對企業(yè)進行財務(wù)預(yù)警時,需實際結(jié)合企業(yè)性質(zhì),選擇出最適合企業(yè)的預(yù)警模型。其中重要地,可依賴所實際結(jié)合的企業(yè)性質(zhì),確定企業(yè)的特征最優(yōu)維度,在最優(yōu)維度內(nèi)可選擇出企業(yè)所對應(yīng)的最優(yōu)預(yù)警模型。進一步,當特征最優(yōu)維度的數(shù)值較大時,CFW-Boost的預(yù)警表現(xiàn)優(yōu)異于其他模型,實際應(yīng)用價值更高,因而合理選擇CFW-Boost進行企業(yè)財務(wù)預(yù)警,可有效提高預(yù)警準確率,避免因模型的錯誤預(yù)測,給予企業(yè)及市場造成經(jīng)濟風(fēng)險。

        猜你喜歡
        維特分類器預(yù)警
        詩意街頭
        中外文摘(2022年8期)2022-05-17 09:13:36
        法國發(fā)布高溫預(yù)警 嚴陣以待備戰(zhàn)“史上最熱周”
        BP-GA光照分類器在車道線識別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        園林有害生物預(yù)警與可持續(xù)控制
        長安鈴木維特拉
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
        機載預(yù)警雷達對IFF 的干擾分析
        改變!拉力賽版維特拉
        越玩越野(2015年2期)2015-08-29 01:05:06
        預(yù)警個啥
        小說月刊(2014年11期)2014-04-18 14:12:28
        久久久久久久综合综合狠狠| 亚洲国产av精品一区二| 中文字幕一区二区综合| 日日摸天天碰中文字幕你懂的| 亚洲欧美日韩中文在线制服| 久99久精品视频免费观看v| 国产精品亚洲最新地址| 亚洲精品国产第一综合色吧| 久久久国产精品黄毛片| 国产免费资源| 国产精品久久熟女吞精| 亚洲欧洲av综合色无码| 国产亚洲av无码专区a∨麻豆| 国产短视频精品区第一页| 色综合久久人妻精品日韩| 日韩人妻中文无码一区二区| 国产全肉乱妇杂乱视频| 中日韩欧美高清在线播放| 国产在线观看一区二区三区av| 美国少妇性xxxx另类| 18禁无遮挡羞羞污污污污网站| 欧洲国产成人精品91铁牛tv| 国产成人精品一区二区不卡| 挺进邻居丰满少妇的身体| 无码毛片aaa在线| av在线免费播放网站| 国产精品一区二区av麻豆日韩| 老妇女性较大毛片| 97SE亚洲国产综合自在线不卡| 视频一区精品中文字幕| 人人做人人爽人人爱| 国产精品亚洲一区二区无码 | 手机看片自拍偷拍福利| 最近中文字幕视频完整版在线看| 亚洲三级香港三级久久| 久久人妻少妇嫩草av蜜桃| 国产三级av在线播放| 日日人人爽人人爽人人片av | 国产欧美另类精品久久久| 男女搞基视频免费网站| 18禁成人黄网站免费观看|