亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        批發(fā)零售業(yè)上市公司財務(wù)困境預(yù)警

        2024-06-21 13:57:13李莉孫榮
        金融經(jīng)濟 2024年3期
        關(guān)鍵詞:特征選擇鯨魚預(yù)警

        李莉 孫榮

        摘要:本文從國泰安數(shù)據(jù)庫(CSMAR)選取2019—2022年度A股主板被ST或被*ST的33家批發(fā)零售業(yè)上市公司作為研究樣本,選取20個財務(wù)指標(biāo)和9個非財務(wù)指標(biāo),構(gòu)建了預(yù)警指標(biāo)體系。為消除非關(guān)鍵特征指標(biāo)的影響,采用隨機森林算法(RF)進行特征值篩選,將篩選的數(shù)據(jù)集應(yīng)用于經(jīng)過優(yōu)化的LSSVM(最小二乘支持向量機)進行財務(wù)預(yù)測和預(yù)警。實驗結(jié)果顯示,相較于傳統(tǒng)的PSO(粒子群優(yōu)化算法)、GA(遺傳算法)以及WOA(鯨魚優(yōu)化算法),采用VNWOA優(yōu)化算法的分類精度分別提高了2.9個百分點、2.9個百分點以及4.35個百分點。綜合應(yīng)用了隨機森林和VNWOA優(yōu)化算法的RF-VNWOA-LSSVM模型在分類精度上相較于RF-費希爾判別法和BP神經(jīng)網(wǎng)絡(luò)分別提高了18.75個百分點、8.45個百分點。實驗結(jié)果表明本文提出的RF-VNWOA-LSSVM預(yù)警模型可以對財務(wù)風(fēng)險進行有效識別。

        關(guān)鍵詞:批發(fā)零售業(yè)上市公司;財務(wù)預(yù)警模型;隨機森林特征值篩選;RF-VNWOA-LSSVM預(yù)警模型;數(shù)據(jù)挖掘;機器學(xué)習(xí)

        中圖分類號:F832.51;F275? ? ?文獻標(biāo)識碼:A? ? ? 文章編號:1007-0753(2024)03-0060-11

        一、引言

        批發(fā)零售業(yè)作為經(jīng)濟發(fā)展的重要組成部分,其財務(wù)風(fēng)險管理對企業(yè)和整個行業(yè)的穩(wěn)定發(fā)展至關(guān)重要。財務(wù)危機預(yù)警模型的研究經(jīng)過了兩個發(fā)展階段:傳統(tǒng)計量模型階段和人工智能模型階段。傳統(tǒng)計量模型包括單變量判別模型(Fitzpatrick,1932;Beaver,1966)、多元回歸模型(Altman,1968)、生存分析模型(Honjo,2000;李世垚,2016)等。盡管這些傳統(tǒng)計量模型在一定程度上能夠解釋數(shù)據(jù)間的關(guān)系,但其建模能力受到限制,特別是在處理非線性關(guān)系、大規(guī)模數(shù)據(jù)和異常值缺失方面表現(xiàn)不佳。

        隨著機器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)的迅速發(fā)展,研究人員開始探索如何利用這些先進技術(shù)構(gòu)建更準(zhǔn)確、及時的財務(wù)預(yù)警模型。由于人工智能在應(yīng)對復(fù)雜的非線性系統(tǒng)問題上有著顯著的優(yōu)越性,因而得到了越來越多學(xué)者的青睞 ( Kar 和 Melody,1990;Koh和Tan,1999) 。相較于傳統(tǒng)的統(tǒng)計學(xué)方法,人工智能模型能更好地處理復(fù)雜的非線性關(guān)系,從而為財務(wù)風(fēng)險管理提供更有效的工具和方法。

        最小二乘支持向量機算法(LSSVM)是一種常用的人工智能算法,在處理大規(guī)模數(shù)據(jù)和非線性問題時預(yù)測準(zhǔn)確性優(yōu)于神經(jīng)網(wǎng)絡(luò)預(yù)測,具有更好的計算和泛化性能(Xin和Gu,2008)。然而,傳統(tǒng)的LSSVM存在參數(shù)選擇困難、容易陷入局部最優(yōu)等限制,并且在處理大規(guī)模數(shù)據(jù)和高維特征時面臨挑戰(zhàn),不同參數(shù)訓(xùn)練下的模型差異顯著。因此,選擇最優(yōu)參數(shù)至關(guān)重要。

        鯨魚優(yōu)化算法(WOA)作為一種元啟發(fā)式算法備受關(guān)注,其對于參數(shù)優(yōu)化的高效性能已經(jīng)得到廣泛認(rèn)可。WOA由Mirjalili和Lewis(2016)首次提出,靈感來源于鯨魚覓食行為,其在機器學(xué)習(xí)、數(shù)據(jù)挖掘和圖像處理等領(lǐng)域得到廣泛應(yīng)用。盡管WOA在參數(shù)優(yōu)化方面表現(xiàn)出了高效性,但精度和收斂速度方面仍存在改進空間。為了進一步提升WOA的性能,一些研究人員開始對其進行改進。例如提出利用反饋精英WOA和LSSVM結(jié)合算法(左智科等,2019;鄭威迪等,2019),以及基于馮·諾依曼結(jié)構(gòu)優(yōu)化的WOA(萬曉靜等,2020;康明月等,2023)。這些改進方法在解決分類問題和提高診斷準(zhǔn)確度方面取得了一定的成效,有望克服各自算法的局限性,提高模型的準(zhǔn)確性和穩(wěn)定性。

        為了進一步改善模型性能、降低模型訓(xùn)練成本以及過擬合風(fēng)險,Hao和Xie(2022)、余欣然和郭婷(2022)采用隨機森林算法(Random Forest,RF)來提取特征指標(biāo)進行特征降維,并結(jié)合費希爾判別模型進行計算。相比于單獨使用費希爾判別模型,模型函數(shù)的準(zhǔn)確率有所提高。這表明隨機森林算法在特征篩選和降維方面表現(xiàn)良好,能夠有效識別和評估特征的重要性,從而提高模型的泛化能力。此外,賀立敏等(2017)、王少華等(2022)在解決分類問題時,通過結(jié)合隨機森林算法的特征值篩選功能移除相關(guān)性低和冗余的指標(biāo)特征,顯著提高了支持向量機算法的預(yù)測精度。袁曉龍等(2014)認(rèn)為隨機森林算法的特征值篩選機制能夠自動識別和評估特征的重要性,有針對性地選擇對分類識別貢獻較大的特征,從而有效降低噪聲干擾,提升模型性能。

        基于以上背景,本文通過引入機器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)構(gòu)建財務(wù)預(yù)警模型,采用基于馮·諾依曼結(jié)構(gòu)優(yōu)化的WOA與LSSVM相結(jié)合,用于處理大規(guī)模數(shù)據(jù)和非線性問題;同時,利用隨機森林算法進行特征選擇以實現(xiàn)降維和降低噪聲干擾的目的,從而提高模型的準(zhǔn)確性和穩(wěn)定性。

        二、相關(guān)算法理論與模型構(gòu)建

        (一)隨機森林算法

        隨機森林算法(RF)利用集成學(xué)習(xí)的思想整合多個決策樹模型的預(yù)測結(jié)果,以提高整體預(yù)測準(zhǔn)確性。在RF中,特征選擇是一個重要步驟,其目的是識別出對模型輸出具有顯著影響的輸入特征。RF通常利用基于袋外(Out-of-Bag,OOB)誤差的方法來執(zhí)行這一過程,幫助優(yōu)化模型并減少預(yù)測誤差。RF的特征選擇和模型建立過程可以概括為以下幾個步驟:

        1.建立基于隨機森林的訓(xùn)練分類器。初始誤判率設(shè)為1,通過迭代調(diào)整特征數(shù)量(mtry參數(shù))。

        2.計算特征的重要性度量值。

        3.利用OOB誤差評估模型性能。對于每棵決策樹,計算其在未選擇樣本上的預(yù)測誤差,并計算不同mtry參數(shù)值下的OOB誤差均值,以確定最佳特征數(shù)量。

        4.根據(jù)得到的最佳特征數(shù)量,選擇重要度排名在該數(shù)量之前的特征組合形成最佳特征子集。

        (二)最小二乘支持向量機

        LSSVM是由Suykens和Vandewalle(1999)提出的一種基于統(tǒng)計學(xué)習(xí)理論的改進型支持向量機算法。相比傳統(tǒng)支持向量機,LSSVM具有更完備的理論體系,可以將二次優(yōu)化問題的求解轉(zhuǎn)化為線性方程組的求解,降低了問題的復(fù)雜度。該算法在模式識別、圖像處理、生物信息學(xué)和金融預(yù)測等領(lǐng)域應(yīng)用廣泛,在處理非線性數(shù)據(jù)分類和回歸問題方面表現(xiàn)出色,能有效處理高維數(shù)據(jù)和復(fù)雜數(shù)據(jù)的關(guān)系。將LSSVM應(yīng)用于財務(wù)預(yù)警模型,利用其處理財務(wù)數(shù)據(jù),進行數(shù)據(jù)分類和回歸分析,可實現(xiàn)更精確和穩(wěn)定的財務(wù)預(yù)測和預(yù)警功能。通過LSSVM能有效處理財務(wù)數(shù)據(jù)的非線性關(guān)系,提升模型性能,更好地滿足金融領(lǐng)域的需求。其工作原理可以分為以下步驟:

        1.優(yōu)化目標(biāo)函數(shù)和約束條件。

        當(dāng)存在n個d維的樣本{xk , yk}, yk∈{-1 , 1}, xk∈Rd , k =1,2,3,…,n,其中xk = (xk1, xk2,…,xkd)T是d維的輸入向量,yk是相應(yīng)的輸出數(shù)據(jù),n是訓(xùn)練數(shù)據(jù)的總數(shù)。LSSVM的優(yōu)化目標(biāo)函數(shù)和約束條件為:

        式(1)中,γ為預(yù)測誤差的懲罰因子,ek表示輸出的實際值和預(yù)測值之間的回歸誤差,b1是偏置常數(shù)。

        LSSVM的目標(biāo)是最小化γ下的回歸誤差。為了找到函數(shù)的最小值,引入拉格朗日乘子αk ,構(gòu)造拉格朗日函數(shù)L:

        2.線性方程組求解。

        對式(2)中的變量ω、b1、ek、αk分別求偏導(dǎo)并令導(dǎo)數(shù)等于零,進而得到一組線性方程,通過解這個線性方程組得到LSSVM分類表達式[見式(3)],從而確定超平面來劃分不同類別的數(shù)據(jù)點。

        3.徑向基核函數(shù)的應(yīng)用。

        LSSVM通常采用徑向基核函數(shù)(RBF),該核函數(shù)能實現(xiàn)非線性映射,通過調(diào)整參數(shù)σ,可以影響模型的性能和準(zhǔn)確性。其表達式為:

        其中 σ為RBF核函數(shù)參數(shù)。兩個超參數(shù)γ以及σ,是對LSSVM模型的性能有很大影響的參數(shù),需要仔細測算。

        (三)鯨魚優(yōu)化算法

        鯨魚優(yōu)化算法(WOA)模擬了座頭鯨的搜索和圍捕機制,通過迭代優(yōu)化搜索空間來尋找最優(yōu)解。算法包括包圍捕食階段、螺旋氣泡捕食階段和搜索獵物階段。本文使用WOA優(yōu)化LSSVM,將LSSVM的超參數(shù)γ以及σ作為WOA的尋優(yōu)目標(biāo)。

        1.包圍捕食階段。

        在包圍捕食階段,鯨魚個體通過靠攏適應(yīng)度最優(yōu)的個體來更新位置,以實現(xiàn)對獵物的包圍。在包圍捕食階段,鯨魚個體的位置更新公式如下:

        式(5)中,參數(shù)t表示當(dāng)前迭代次數(shù);A、C為系數(shù);X*(t) 是當(dāng)前最優(yōu)的位置向量;X(t) 是鯨魚當(dāng)前位置向量;參數(shù)a為控制參數(shù),隨著迭代次數(shù)從2線性減少到0;r是[0,1]中的隨機數(shù)。

        2.螺旋氣泡捕食階段。

        在螺旋氣泡捕食階段,鯨魚個體通過螺旋游動的方式更新位置,以搜索并抓取局部范圍內(nèi)的獵物。以下是螺旋氣泡捕食的更新公式:

        式(6)中,D'(t)為當(dāng)前搜索個體與最優(yōu)解的距離,b2為螺旋形狀參數(shù),l是范圍在[-1,1]的隨機數(shù)。為了適應(yīng)不同的捕食情景,WOA通過引入隨機概率p來靈活選擇螺旋氣泡或收縮包圍的捕食行為,并相應(yīng)地更新個體的位置。位置更新公式如下:

        3.搜索獵物階段。

        搜索獵物階段則是通過鯨魚之間距離的位置更新來實現(xiàn)隨機搜索的目標(biāo)。當(dāng)搜索個體的絕對值大于1( >1)時,鯨魚位置通過隨機選擇來更新。公式如下:

        其中,Xrand(t)為當(dāng)前隨機鯨魚的位置。

        (四)馮·諾依曼結(jié)構(gòu)改進WOA(VNWOA)

        馮·諾依曼拓撲結(jié)構(gòu)是馮·諾依曼和其他人提出的電子計算機通用架構(gòu)。為了提高WOA的搜索效率和避免陷入局部最優(yōu)解的困境,引入類似于馮·諾依曼拓撲結(jié)構(gòu)的結(jié)構(gòu)來模擬鄰居關(guān)系。通過在每個鯨魚個體周圍構(gòu)建一個二維網(wǎng)狀結(jié)構(gòu),每個鯨魚個體都有四個鄰居。這種鄰居關(guān)系模擬促進了信息交流和協(xié)作,使得鯨魚能夠更充分地利用周圍環(huán)境信息,更好地跳出局部最優(yōu)解并朝著全局最優(yōu)解方向搜索,從而提高算法的搜索效率和收斂性。馮·諾依曼結(jié)構(gòu)優(yōu)化WOA的步驟如下:

        1.構(gòu)建二維網(wǎng)狀結(jié)構(gòu):為每個鯨魚個體構(gòu)建一個獨立的V-N拓撲結(jié)構(gòu),即在每個鯨魚個體的前、后、左、右加入四個鄰居,形成二維網(wǎng)格狀結(jié)構(gòu)。

        2.影響范圍限制:限制每個鯨魚個體(當(dāng)前最優(yōu)解)的影響范圍,僅允許其影響周圍四個鄰域的鯨魚個體。

        3.鯨魚搜索代理更新:每個鯨魚搜索代理通過尋找所有鄰域中鯨魚個體的最優(yōu)解來更新整個鯨魚群體的搜索位置。

        VNWOA通過限制每個個體的影響范圍和利用鄰域最優(yōu)解的信息來更新整個群體的搜索位置,可以提高算法的收斂速度,并降低陷入局部最優(yōu)的風(fēng)險。

        (五)RF-VNWOA-LSSVM改進算法流程(見圖1)

        RF-VNWOA-LSSVM是一個組合了隨機森林、VNWOA以及LSSVM的改進算法。其建模過程包括以下步驟:

        1.數(shù)據(jù)預(yù)處理:對輸入數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,并按7∶3的比例劃分為訓(xùn)練集和測試集。

        2.隨機森林特征選擇:使用隨機森林算法對數(shù)據(jù)集進行特征選擇。通過繪制模型誤判率均值的散點圖和計算特征的重要性指標(biāo),選擇重要度排名在該數(shù)量之前的特征組合形成最佳特征子集。

        3. 初始種群生成和網(wǎng)絡(luò)拓撲結(jié)構(gòu)確定:利用WOA來初始化種群,并根據(jù)當(dāng)前最優(yōu)個體的位置信息構(gòu)建馮·諾依曼拓撲結(jié)構(gòu),這一結(jié)構(gòu)能夠促進鯨魚個體之間的信息交流,優(yōu)化搜索過程,從而增強全局搜索能力。

        4. 適應(yīng)度更新和迭代:在每輪迭代中,根據(jù)鯨魚個體位置重新計算適應(yīng)度并繼續(xù)優(yōu)化位置。同時檢測是否達到預(yù)定的停止條件,如果達到,則跳轉(zhuǎn)到下一步,否則繼續(xù)優(yōu)化。通過持續(xù)的迭代優(yōu)化,不斷更新鯨魚個體的位置和適應(yīng)度,直到算法收斂為止。

        5.預(yù)測模型構(gòu)建:根據(jù)最優(yōu)個體的位置信息,獲得超參數(shù)γ、σ的最優(yōu)值,用于構(gòu)建預(yù)測模型。

        6.預(yù)測結(jié)果:采用最優(yōu)參數(shù)對模型進行訓(xùn)練并使用構(gòu)建好的預(yù)測模型進行預(yù)測,并生成最終的預(yù)測結(jié)果。

        RF-VNWOA-LSSVM可以找尋并刪除數(shù)據(jù)集中的冗余特征,刪除這些冗余特征后,模型能夠更好地捕捉數(shù)據(jù)中的有用信息,從而提高分類效率。與基本模型相比,RF-VNWOA-LSSVM在數(shù)據(jù)預(yù)處理、特征選擇、優(yōu)化搜索和模型構(gòu)建等方面進行了改進,提升了模型的性能和結(jié)果的準(zhǔn)確性。

        (六)其他算法理論與模型參數(shù)設(shè)置

        實驗采用MATLAB R2023a編程,為了驗證RF與LSSVM結(jié)合的優(yōu)化方法的有效性,本文引入幾種算法作對比。在本文的實驗中,相關(guān)算法和相關(guān)參數(shù)設(shè)置如下:

        1.粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)。

        PSO是一種基于群體智能的優(yōu)化算法,模擬鳥群或魚群的行為。在PSO中,每個個體(粒子)通過不斷調(diào)整自身位置和速度,以尋找最優(yōu)解。PSO的正規(guī)化參數(shù)γ和核參數(shù)σ的取值范圍為[0,1 000]。

        對于慣性權(quán)重系數(shù),根據(jù)式(9),將慣性權(quán)重的最大值和最小值設(shè)為ωmax = 0.9和ωmin = 0.9。式(9)中,t、tmax分別為當(dāng)前進化代數(shù)和最大進化代數(shù)。

        學(xué)習(xí)因子的取值范圍:Cmax = 0.9,Cmin = 0.5。

        2.遺傳算法(Genetic Algorithm,GA)。

        GA是一種基于生物進化過程的優(yōu)化算法,通過模擬自然界的選擇、繁殖和變異機制來搜索問題的最優(yōu)解。在GA中,個體通過遺傳操作不斷進化,以適應(yīng)環(huán)境。GA的正規(guī)化參數(shù)γ和核參數(shù)σ的取值范圍為[0,1 000]。

        交叉概率pcross:0.8。

        變異概率pmutation:0.05。

        3.鯨魚優(yōu)化算法(Whale Optimization Algorithm,WOA)

        鯨魚優(yōu)化算法是受鯨魚群體遷徙行為啟發(fā)的一種啟發(fā)式優(yōu)化算法,通過模擬鯨魚的行為方式解決優(yōu)化問題。VNWOA是WOA的一種改進。對于WOA-LSSVM和VNWOA-LSSVM,將正規(guī)化參數(shù)γ和核參數(shù)σ的取值范圍設(shè)為[0,800]。算法中的種群數(shù)量N設(shè)為5,最大迭代次數(shù)G設(shè)為10。此外,WOA-LSSVM中的權(quán)重ω設(shè)為0.5,VNWOA-LSSVM中的權(quán)重ω通過式(10)計算得到。這是一種自適應(yīng)權(quán)重,隨著迭代的進行,可以加速利用馮·諾依曼結(jié)構(gòu)中的局部最優(yōu)與當(dāng)前迭代次數(shù)對應(yīng)的全局最優(yōu)進行更新。隨著迭代的進行,局部最優(yōu)逐漸與全局最優(yōu)重合。

        ω = 1- e1-t? ,? ? ? ? ? t∈[1,10]? ? ? ? ? ? ? ? ? ? ? ? (10)

        4.費希爾判別法。

        費希爾判別法是一種經(jīng)典的線性判別分析方法,用于在多維空間中找到最佳的線性判別函數(shù),以最大程度地區(qū)分不同類別的樣本。

        5.BP神經(jīng)網(wǎng)絡(luò)。

        BP神經(jīng)網(wǎng)絡(luò)是一種常見的人工神經(jīng)網(wǎng)絡(luò),通過前向傳播和反向傳播算法來訓(xùn)練網(wǎng)絡(luò),以學(xué)習(xí)輸入與輸出之間的映射關(guān)系。在實驗中對數(shù)據(jù)進行洗牌以增加模型泛化能力,使用了5折交叉驗證評估模型性能,激活函數(shù)采用了identity(恒等函數(shù)),求解器選擇lbfg。學(xué)習(xí)率為0.1,L2正則化參數(shù)為1,迭代次數(shù)為1 000,隱藏層神經(jīng)元數(shù)量為100。

        三、批發(fā)零售業(yè)公司研究樣本的選擇和指標(biāo)體系的確定

        (一)研究樣本的選擇與數(shù)據(jù)來源

        公司出現(xiàn)重大損失是其財務(wù)困難的表現(xiàn)之一,將上市公司因財務(wù)狀況異常而被特別處理(ST)作為公司陷入財務(wù)困境的標(biāo)志是符合我國實際情況的(曾繁榮和徐旭,2007;魏守智和許保國,2008;范雍禎,2019)。因此,本文以公司是否為ST(*ST)公司作為界定公司是否處于財務(wù)危機的標(biāo)準(zhǔn),選擇了我國A股批發(fā)零售業(yè)上市公司作為研究樣本,將樣本分為財務(wù)正常組(非ST公司)和財務(wù)危機組(ST公司)。

        根據(jù)中國證券監(jiān)督管理委員會的規(guī)定,當(dāng)一家公司在T年度被標(biāo)記為“ST”時,將會披露一份新的財務(wù)報告。若該公司在過去兩年內(nèi)存在財務(wù)風(fēng)險,則新報告將基于T-3年至T-2年的財務(wù)數(shù)據(jù)。此外,若該公司在T-3年度出現(xiàn)虧損,通常會進行經(jīng)營戰(zhàn)略調(diào)整。因此,選擇T-3年的樣本數(shù)據(jù)更具科學(xué)性。本文選擇2019—2022 年間被證監(jiān)會冠以“ST”特別處理的批發(fā)零售業(yè)上市公司作為研究對象,相應(yīng)地選取了2016—2019 年的財務(wù)報表數(shù)據(jù)作為樣本。經(jīng)過數(shù)據(jù)清洗并剔除數(shù)據(jù)不全及新上市的公司后,有財務(wù)風(fēng)險的樣本共有33個,其中2019年5家、2020年12家、2021年9家、2022年7家。為了配對比較,選擇了資產(chǎn)規(guī)模與行業(yè)相近的非ST公司,按照1∶2的比例選取了相應(yīng)的財務(wù)健康上市公司,最終獲得的樣本總數(shù)為99家。本文使用的財務(wù)數(shù)據(jù)均來自國泰安(CSMAR)數(shù)據(jù)庫。

        (二)財務(wù)預(yù)警指標(biāo)初步選取

        在財務(wù)風(fēng)險預(yù)警研究中,張艷麗等(2016)、楊貴軍等(2019)從現(xiàn)金流量、償債能力、盈利能力、市場價值和營運能力等五個方面建立了財務(wù)風(fēng)險預(yù)警指標(biāo)體系,并發(fā)現(xiàn)該財務(wù)風(fēng)險預(yù)警指標(biāo)體系有較好的預(yù)測效果。姜秀華和孫錚(2001)、黃善東和楊淑娥(2007)等研究了股權(quán)結(jié)構(gòu)、公司治理對財務(wù)危機的影響,并強調(diào)了非財務(wù)因素在預(yù)警模型中的作用。同時,戴紅軍和吳國強(2010)構(gòu)建了包含公司治理和外部審計信息等非財務(wù)指標(biāo)的預(yù)警模型,以提高預(yù)測準(zhǔn)確率。因此,本文結(jié)合我國批發(fā)零售業(yè)的行業(yè)特點,綜合已有研究,選取包括現(xiàn)金流量指標(biāo)、償債能力指標(biāo)、營運能力指標(biāo)、發(fā)展能力指標(biāo)和盈利能力指標(biāo)在內(nèi)的20個財務(wù)指標(biāo),并引入了公司治理、股權(quán)集中度、股權(quán)制衡度、監(jiān)事總規(guī)模和審計治理等9個非財務(wù)指標(biāo),初步構(gòu)建了適用于我國批發(fā)零售業(yè)的財務(wù)預(yù)警指標(biāo)體系。具體指標(biāo)情況如表1所示。

        (三)隨機森林選擇

        本文采用了隨機森林算法進行特征選擇,并結(jié)合LSSVM以提高預(yù)測的準(zhǔn)確性和穩(wěn)定性。在隨機森林算法中,采用了OOB誤差作為評估變量重要性的指標(biāo),以便更準(zhǔn)確地衡量每個變量對于預(yù)測結(jié)果的貢獻程度。

        利用基于隨機森林算法的分類器進行特征選擇。隨機抽取70%的數(shù)據(jù)作為訓(xùn)練集,剩余30%作為測試集。首先,對特征重要性進行排序,通過循環(huán)迭代隨機選取不同的特征數(shù)量(mtry參數(shù)),計算每個特征數(shù)量下基于OOB誤差的模型誤判率均值,根據(jù)不同特征選取值情況下的模型誤判率均值繪制散點圖,具體如圖2所示。觀察發(fā)現(xiàn),當(dāng)特征值選取為22個時,模型的OOB誤差誤判率均值最小。這意味著選取22個特征時,模型對于是否會被ST的預(yù)測表現(xiàn)最佳。故本文后續(xù)選取22個特征來構(gòu)建最終的模型。接下來,通過設(shè)置相關(guān)參數(shù)并使用importance()函數(shù)計算平均最小基尼指數(shù)以衡量各個特征的重要性。通過計算得到每個指標(biāo)的平均最小基尼系數(shù),并使用圖像的方式對指標(biāo)的重要性進行可視化(見圖3)。根據(jù)圖3的結(jié)果,選擇了變量重要程度前22的變量,剔除了X4、X9、X16、X17、X18、Y6、Y7這7個重要程度排名最低的變量。最終,選擇X1、X2、X6、X7、X8、Y1、Y5、Y8等作為財務(wù)預(yù)警模型的輸入變量。

        從上述結(jié)果可以看出,上市公司陷入財務(wù)困境與公司償債能力、營運能力、發(fā)展能力、盈利能力、股權(quán)集中度、股權(quán)制衡度、監(jiān)管層前三名薪酬總額、審計治理等方面有關(guān)。

        四、模型對比分析

        (一)不同尋優(yōu)算法對比分析

        RF-VNWOA-LSSVM模型預(yù)測效果可以使用精確率(Precision)、召回率(Recall)和F1值來評估。在測試集中,預(yù)測結(jié)果將為ST公司或正常公司,可能的情況在表2中列出。

        精確率表示在訓(xùn)練集中實際是 ST公司的樣本所占的百分比:精確率= TP÷(TP+ FP)。召回率表示在實際的 ST公司中,準(zhǔn)確地預(yù)測出在測試集中的 ST公司所占的比重:召回率= TP÷(TP+ FN)。F1值綜合考慮了精確率和召回率這兩項指標(biāo),計算公式為F1值=2(精確率×召回率)÷(精確率+召回率)。該方法有助于評價模型的預(yù)測精確率及相關(guān)性,進而更好地了解模型的表現(xiàn)。

        表3顯示了使用不同優(yōu)化算法的LSSVM(包括PSO-LSSVM模型、GA-LSSVM模型、WOA-LSSVM模型、VNWOA-LSSVM模型、RF-WOA-LSSVM模型和RF-VNWOA-LSSVM模型)在中國批發(fā)零售業(yè)上市公司數(shù)據(jù)上的預(yù)測效果對比。表3第2列表示各種優(yōu)化算法下超參數(shù)γ、σ的最優(yōu)值。第3列中Z表示公司被分為哪一類,Z=1時,公司為正常公司即本文正例樣本,Z=-1時,公司為ST公司即本文負例樣本。第5列表示訓(xùn)練集測試集分類精度,表3第6—8列分別表示的是在Z=1或Z=-1的情況下的精確率、召回率和F1值。訓(xùn)練集共73個公司樣本(70%左右),測試集共有26個公司樣本。

        將未經(jīng)過特征選擇的數(shù)據(jù)集代入預(yù)警模型,驗證優(yōu)化算法的有效性。首先對比VNWOA-LSSVM模型與其他三個模型(PSO-LSSVM模型、GA-LSSVM模型、WOA-LSSVM模型)在訓(xùn)練集的分類精度和在

        不同Z值下精確率、召回率、F1值。VNWOA-LSSVM模型在訓(xùn)練集上的分類精度達到95.65%, PSO-LSSVM模型、GA-LSSVM模型、WOA-LSSVM模型的分類精度分別為92.75%、92.75%、91.30%。采用VNWOA優(yōu)化算法后,分類精度分別提高了2.9個百分點、2.9個百分點和4.35個百分點。對于Z=1的情況來說,VNWOA-LSSVM模型的精確率為96.00%,召回率為92.31%,F(xiàn)1值為94.00%;Z=-1時,

        VNWOA-LSSVM模型的精確率為95.45%,召回率為97.67%,F(xiàn)1值為97.00%。綜合表現(xiàn)來看,在不同Z值下,VNWOA-LSSVM模型在精確率、召回率和F1值方面均優(yōu)于其他三個模型,顯示出更強地識別ST公司的能力。這表明在尋優(yōu)算法中,VNWOA在參數(shù)優(yōu)化方面具備卓越潛力,能夠有效提升模型的分類精度。

        進一步地,經(jīng)過隨機森林算法進行特征值篩選后,將篩選后的數(shù)據(jù)集代入預(yù)警模型以驗證隨機森林算法對模型性能的提升作用。通過對比分析RF-VNWOA-LSSVM模型與VNWOA-LSSVM模型、WOA-LSSVM模型、RF-WOA-LSSVM模型在訓(xùn)練集和測試集的分類精度。從表3可知,在訓(xùn)練集上RF-VNWOA-LSSVM模型的分類精度達到98.44%,明顯高于WOA-LSSVM模型(91.30%)、VNWOA-LSSVM模型(95.65%)和RF-WOA-LSSVM模型(95.31%)。在測試集上,RF-VNWOA-LSSVM模型的分類精度為71%,略低于WOA-LSSVM模型(77%)和RF-WOA-LSSVM模型(77%),但明顯優(yōu)于VNWOA-LSSVM模型(67%)。針對不同Z值的情況,RF-VNWOA-LSSVM模型在精確率、召回率和F1值上均表現(xiàn)出色,特別是在Z=1和Z=-1的情況下,RF-VNWOA-LSSVM模型均優(yōu)于其他模型。這表明經(jīng)過隨機森林算法進行特征值篩選后,RF-VNWOA-LSSVM模型在VNWOA-LSSVM模型的基礎(chǔ)上進一步提升了分類精度,在不同Z值下展現(xiàn)出優(yōu)越性能。

        綜上所述,VNWOA算法優(yōu)于其他尋優(yōu)算法,而RF-VNWOA-LSSVM模型在不同Z值下的精確率、召回率和F1值綜合比較下也優(yōu)于其他模型。這可能是由于RF-VNWOA-LSSVM模型結(jié)合了隨機森林算法和VNWOA-LSSVM模型的優(yōu)勢。隨機森林算法提供了集成學(xué)習(xí)和特征選擇的能力,從而提升了模型的性能和魯棒性。通過結(jié)合隨機森林算法和VNWOA-LSSVM模型,RF-VNWOA-LSSVM模型能夠更好地提取特征并實現(xiàn)更準(zhǔn)確的預(yù)測。

        (二)不同模型算法對比分析

        表4顯示了RF-VNWOA-LSSVM與RF-費希爾判別法、BP神經(jīng)網(wǎng)絡(luò)在Z=-1(*ST公司)情況下的分類精度、精確率、召回率和F1值。首先,在訓(xùn)練集上,RF-VNWOA-LSSVM的分類精度達到98.44%,遠高于 RF-費希爾判別法(79.69%)和 BP神經(jīng)網(wǎng)絡(luò)(89.90%),分別提高了18.75個百分點和8.45個百分點。在測試集上,RF-VNWOA-LSSVM 的分類精度為 71%,略高于BP神經(jīng)網(wǎng)絡(luò)(70%),稍低于 RF-費希爾判別法(74%)。盡管在測試集上稍低于 RF-費希爾判別法,但綜合考慮 RF-VNWOA-LSSVM 模型相對于其他模型在分類精度上表現(xiàn)更優(yōu)秀。

        其次,通過比較 RF-VNWOA-LSSVM 模型在不同 Z 值下的精確率、召回率和 F1 值。根據(jù)表4中的數(shù)據(jù),在 Z=-1(*ST公司)的情況下,RF-VNWOA-LSSVM 在訓(xùn)練集的精確率、召回率和 F1 值分別為100.00%、97.67%、99.00%,說明RF-VNWOA-LSSVM 模型能夠準(zhǔn)確地預(yù)測負例樣本并有效分類,相較于其他模型,性能更為出色。此外,RF-VNWOA-LSSVM在訓(xùn)練集和測試集上的F1值分別為99%和79%,明顯高于RF-費希爾判別法(70%、47%)和BP神經(jīng)網(wǎng)絡(luò)(89.7%、70.40%)。表明RF-VNWOA-LSSVM在平衡精確率和召回率方面表現(xiàn)優(yōu)異,既能有效識別負例樣本(高召回率),又能保持較高的準(zhǔn)確性(高精確率)。相比之下,其他模型可能在這兩個指標(biāo)之間存在某種折衷,導(dǎo)致F1值較低。

        綜上所述,可以得出:RF-VNWOA-LSSVM 模型在精確率、召回率和 F1 值上表現(xiàn)出色,優(yōu)于RF-費希爾判別法和BP神經(jīng)網(wǎng)絡(luò)。

        五、結(jié)論

        本文選取2019—2022年度A股主板被ST或被*ST的33家批發(fā)零售業(yè)上市公司作為研究樣本,以優(yōu)化LSSVM為基礎(chǔ),結(jié)合隨機森林算法篩選特征值對財務(wù)預(yù)警模型進行改進優(yōu)化得到以下結(jié)論。

        首先,在針對中國批發(fā)零售業(yè)上市公司數(shù)據(jù)的財務(wù)預(yù)測任務(wù)中,VNWOA-LSSVM模型相比其他優(yōu)化算法模型(PSO-LSSVM模型、GA-LSSVM模型、WOA-LSSVM模型),其分類精度分別提高了

        2.9個百分點、2.9個百分點以及4.35個百分點,且該模型在不同Z值下的精確率、召回率和F1值均表現(xiàn)更好,體現(xiàn)出較高的性能,說明VNWOA能夠為模型提供更好的參數(shù)優(yōu)化,從而提高分類精度和預(yù)測準(zhǔn)確率。

        其次,隨機森林算法在特征選擇方面的運用對模型表現(xiàn)具有積極的影響。篩選出的重要特征變量能夠降低非關(guān)鍵特征值對模型預(yù)測的影響,從而提高模型的準(zhǔn)確性和穩(wěn)定性。在RF-VNWOA-LSSVM模型中,結(jié)合了隨機森林和VNWOA-LSSVM模型的優(yōu)勢,使得該模型在訓(xùn)練集上的分類精度和預(yù)測準(zhǔn)確率相較于RF-費希爾判別法和BP神經(jīng)網(wǎng)絡(luò)分別提高了18.75個百分點、8.54個百分點。同時,在不同Z值下,RF-VNWOA-LSSVM模型在精確率、召回率和F1值上均呈現(xiàn)更強的性能。

        綜上所述,本文通過在財務(wù)預(yù)警模型中運用特征選擇和優(yōu)化算法的組合,以及結(jié)合隨機森林篩選重要特征變量,取得了較好的分類性能和預(yù)測準(zhǔn)確率。這些研究結(jié)果對企業(yè)進行財務(wù)風(fēng)險預(yù)警和決策具有重要的實際應(yīng)用價值。然而,未來的研究仍需關(guān)注數(shù)據(jù)收集和模型優(yōu)化方面,以滿足實際應(yīng)用需求和適應(yīng)變化的市場環(huán)境。同時,可以進一步探索更多的特征選擇方法和優(yōu)化算法,從而進一步提升財務(wù)預(yù)警模型的性能和應(yīng)用范圍,為企業(yè)提供更可靠、更準(zhǔn)確的財務(wù)預(yù)警服務(wù),幫助它們更好地應(yīng)對挑戰(zhàn)和機遇,實現(xiàn)可持續(xù)發(fā)展。

        參考文獻:

        [1] FITZPATRICK P J. A Comparison of the ratios of successful industrial enterprises with those of failed companies[J]. Certified Public Accountant,1932(10): 598-605.

        [2] BEAVER W. Financial ratios as predictors of failures[J]. Journal of Accounting Research,1966(04):71-111.

        [3] ALTMAN E I. Financial ratios, discriminant analysis and the prediction of corporate bankruptcy[J].The Journal of Finance,1968,23(04):589-609.

        [4] HONJO Y. Business failure of new firms: An empirical analysis using a multiplicative hazards model[J].International Journal of Industrial Organization, 2000, 18(04):557-574.

        [5]李世垚.基于生存分析的上市公司財務(wù)風(fēng)險預(yù)警研究——以工業(yè)類上市公司為例[J].時代金融,2016(15): 146-147.

        [6] KAR Y T, MELODY K. Predicting bank failures: A neural network approach[J]. Applied Artificial Intelligence, 1990, 4(04): 265-282.

        [7] KOH H, TAN S. A neural network approach to the prediction of going concern status[J]. Accounting and Business Research, 1999, 29(03): 211-216.

        [8] XIN Z Y , GU M .Complicated financial data time series forecasting analysis based on least square support vector machine[J]. Journal of Tsinghua University(Science and Technology), 2008, 48(07):1147-1149.

        [9]MIRJALILI S,LEWIS A. The whale optimization algorithm[J]. Advances in Engineering Software,2016,95(05):51-67.

        [10]左智科,陳國彬,劉超,等.反饋精英鯨魚優(yōu)化算法優(yōu)化LSSVM的熱耗率軟測量建模[J].計量學(xué)報,2019,40(02):259-265.

        [11]鄭威迪,李志剛,賈涵中,等.基于改進型鯨魚優(yōu)化算法和最小二乘支持向量機的煉鋼終點預(yù)測模型研究[J].電子學(xué)報,2019,47(03):700-706.

        [12]萬曉靜,孫文磊,陳坤.基于CEEMD能量熵特征提取和VNWOA-LSSVM的風(fēng)力機軸承故障診斷方法研究[J].機電工程,2020,37(10):1186-1191.

        [13]康明月,王成,孫鴻雁,等.基于改進的WOA-LSSVM櫻桃番茄內(nèi)部品質(zhì)檢測方法研究[J].光譜學(xué)與光譜分析,2023,43(11):3541-3550.

        [14] HAO D,XIE Y. Research on financial risk early warning in the online game industry based on random forest and fisher discriminant method[J]. Academic Journal of Business & Management,2022,4(07):93-98.

        [15]余欣然,郭婷.基于隨機森林與費希爾判別法的區(qū)塊鏈企業(yè)財務(wù)預(yù)警模型研究[J].梧州學(xué)院學(xué)報, 2022, 32(03):40-46.

        [16]賀立敏,王峴昕,韓冰.基于隨機森林和支持向量機的船舶柴油機故障診斷[J].中國航海,2017,40(02):29-33.

        [17]王少華,樊其鋒,張健,等.基于隨機森林和支持向量機混合模型的空調(diào)故障檢測[J].家電科技, 2022(S1):774-777.

        [18]袁曉龍,梅雪,黃嘉爽,等.基于隨機森林算法的特征選擇及在fMRI數(shù)據(jù)中的應(yīng)用[J].微電子學(xué)與計算機,2014,31(08):132-135.

        [19]STROBL C, BOULESTEIX A-L , ZEILEIS A, et al. Bias in random forest variable importance measures: Illustrations, sources and a solution [J]. BMC Bioinformatics, 2007, 8(01): 25-46.

        [20] SUYKENS J A K, VANDEWALLE J .Least squares support vector machine classifiers[J].Neural Processing Letters, 1999, 9(03):293-300.

        [21]曾繁榮, 徐旭. 上市公司典型財務(wù)危機預(yù)警模型比較研究[J]. 會計之友·下旬刊, 2007(02):89-90.

        [22]魏守智,許保國.淺談上市公司財務(wù)困境的概念及成因[J].中國農(nóng)業(yè)會計,2008(10):85-87.

        [23]范雍禎.中小企業(yè)財務(wù)危機預(yù)警模型比較研究——基于PCA-Cox模型與BP_Adaboost模型的對比[J].產(chǎn)業(yè)創(chuàng)新研究,2019(11):204-209.

        [24]高燕,杜玥,曾森.基于BP神經(jīng)網(wǎng)絡(luò)的制造企業(yè)財務(wù)風(fēng)險預(yù)警研究[J].會計之友,2023(01):62-70.

        [25]張艷麗,尤曉琳,強薇,等.基于LASSO的企業(yè)財務(wù)危機預(yù)警與關(guān)鍵指標(biāo)選擇[J].河南師范大學(xué)學(xué)報(自然科學(xué)版),2016,44(03):160-165.

        [26]楊貴軍,周亞夢,孫玲莉,等.基于Benford律的Logistic模型及其在財務(wù)舞弊識別中的應(yīng)用[J].統(tǒng)計與信息論壇,2019,34(08):50-56.

        [27]姜秀華,孫錚.治理弱化與財務(wù)危機:一個預(yù)測模型[J].南開管理評論,2001(05):19-25.

        [28]黃善東,楊淑娥. 公司治理與財務(wù)困境預(yù)測[J].預(yù)測,2007,26(02):63-67.

        [29]戴紅軍,吳國強.公司治理、外部審計信息與財務(wù)危機預(yù)警[J].大連民族學(xué)院學(xué)報,2010,12(02):157-161+165.

        Financial Distress Warning of Listed Wholesale and Retail Companies:

        Based on RF-VNWOA-LSSVM Model

        Abstract: This study selected 33 A-share main board companies listed from 2019 to 2022 in the Guotaian CSMAR database, which were either ST or *ST during this period, focusing on the wholesale and retail industry. Based on the characteristics of listed companies in the wholesale and retail industry and a review of previous literature, 20 financial indicators and 9 non-financial indicators were selected to construct an early warning index system. To eliminate the impact of non-key feature indicators, the random forest algorithm was employed for feature selection, and the selected dataset was applied to an optimized LSSVM model for financial prediction and early warning.The experimental results showed that compared to PSO (Particle Swarm Optimization), GA (Genetic Algorithm), and WOA (Whale Optimization Algorithm), the VNWOA optimization algorithm improved prediction accuracy by 2.9%, 2.9%, and 4.35%, respectively. The RF-VNWOA-LSSVM model, which combined random forest and VNWOA optimization algorithms, achieved an 18.75% and 8.45% increase in prediction accuracy compared to RF-Fisher discriminant analysis and BP neural network, respectively. The experimental results demonstrate that the proposed RF-VNWOA-LSSVM early warning model can effectively identify financial risks.

        Keywords: Listed wholesale and retail companies; Financial warning model; Random forest feature selection; RF-VNWOA-LSSVM early warning model;Data mining; Machine learning

        猜你喜歡
        特征選擇鯨魚預(yù)警
        小鯨魚
        幼兒100(2022年41期)2022-11-24 03:20:20
        迷途鯨魚
        鯨魚
        法國發(fā)布高溫預(yù)警 嚴(yán)陣以待備戰(zhàn)“史上最熱周”
        鯨魚島——拖延癥
        動漫星空(2018年4期)2018-10-26 02:11:54
        園林有害生物預(yù)警與可持續(xù)控制
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        機載預(yù)警雷達對IFF 的干擾分析
        聯(lián)合互信息水下目標(biāo)特征選擇算法
        預(yù)警個啥
        小說月刊(2014年11期)2014-04-18 14:12:28
        国产一级黄色录像| 国产乱人对白| 天天躁日日躁狠狠很躁 | 综合图区亚洲另类偷窥| 欧美精品一区二区蜜臀亚洲| 人妻丰满熟妇av无码区hd| 国产一区二区三区影片| 不卡一区二区视频日本| 亚洲欧美日韩在线不卡| 91手机视频在线| 亚洲性码不卡视频在线| 日韩精品在线视频一二三| 午夜毛片不卡免费观看视频| 五月婷一本到五月天| 午夜国产小视频在线观看黄| 中文乱码字幕精品高清国产| 欧美黑人xxxx又粗又长| 中文字幕在线日韩| 亚洲精品一区二区三区日韩| 欧美最猛性xxxx| 7777奇米四色成人眼影| 白色橄榄树在线免费观看| 看国产亚洲美女黄色一级片| 精品国产偷窥一区二区| 人人妻人人爽人人做夜欢视频九色 | 久久精品国产亚洲AV高清y w| 五月激情四射开心久久久| 国产日韩av在线播放| 18禁美女裸体网站无遮挡| 青青青草国产熟女大香蕉| 日本护士口爆吞精视频| 777亚洲精品乱码久久久久久 | 欧洲一区在线观看| 久久精品国产自产对白一区| 看全色黄大色黄大片 视频| 在教室伦流澡到高潮hnp视频| 最大色网男人的av天堂| 日本在线精品一区二区三区| 免费国产黄网站在线观看| 国产成人亚洲合集青青草原精品| 男女动态91白浆视频|