胡傳勝 周志國
摘要:目前對企業(yè)進行量化評估的研究主要基于企業(yè)特征維度進行分析。通過對企業(yè)財務(wù)、營運等特征進行建模,利用各種算法進行統(tǒng)計分析,從而達到對企業(yè)量化評估的目的。這些研究大都基于全量樣本數(shù)據(jù)進行評估,但這種做法忽略了生命周期對企業(yè)的影響。在不同生命周期階段,企業(yè)具有不同的財務(wù)、營運等特征數(shù)據(jù),將這些企業(yè)進行無差別評估,會降低企業(yè)量化評估的準(zhǔn)確性和科學(xué)性?;诖耍恼峦瞥鲆环N基于生命周期的企業(yè)特征量化評估模型,首先對企業(yè)的生命周期進行分類,然后分別對不同生命周期階段的企業(yè)進行特征量化評估的方法。這種方法解決了傳統(tǒng)評估方法對不同生命周期階段內(nèi)企業(yè)由于實際業(yè)務(wù)數(shù)據(jù)差異而帶來的影響和偏差。
關(guān)鍵詞:企業(yè)生命周期;企業(yè)特征量化評估;XGBoost算法;TOPSIS算法
中圖分類號:TP181? ? ? 文獻標(biāo)識碼:A
文章編號:1009-3044(2024)09-0086-03
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
0 引言
企業(yè)生命周期理論廣泛應(yīng)用于企業(yè)管理和規(guī)劃領(lǐng)域,它描述了企業(yè)在不同發(fā)展階段所面臨的挑戰(zhàn)和機遇。在當(dāng)今競爭激烈的市場環(huán)境中,正確評估企業(yè)現(xiàn)狀、制定匹配決策方案,對企業(yè)的成功發(fā)展至關(guān)重要。然而,目前現(xiàn)有的企業(yè)評估模型大都忽視企業(yè)生命周期因素的影響,導(dǎo)致評估結(jié)果的科學(xué)性和準(zhǔn)確性受到一定的限制[1]。
本研究旨在研發(fā)一種基于生命周期[2]的企業(yè)特征量化評估模型[3],該模型將通過結(jié)合生命周期理論和特征量化評估方法,首先對企業(yè)進行生命周期分類,然后利用特征量化評估模型對企業(yè)進行評估分類,實現(xiàn)精準(zhǔn)、全面的分析企業(yè)現(xiàn)狀,為企業(yè)管理者和決策者提供更具針對性的管理建議和決策支持。
本方案利用大數(shù)據(jù)AI算法,收集并分析企業(yè)全量數(shù)據(jù),構(gòu)建基于生命周期的企業(yè)特征量化評估模型。本方案采用XGBoost算法構(gòu)建企業(yè)生命周期模型,結(jié)合熵權(quán)法和TOPSIS算法實現(xiàn)對企業(yè)的量化評估。此外,本文還結(jié)合實例,驗證模型在實踐中的準(zhǔn)確性和有效性。
本研究的創(chuàng)新之處在于將企業(yè)生命周期理論與企業(yè)評估方法相結(jié)合,提供了一種更加全面、準(zhǔn)確的企業(yè)評估模型。該模型不僅可以幫助企業(yè)管理者深入了解企業(yè)現(xiàn)狀,還可以為決策者提供具有針對性的決策支持。此外,該模型還具有廣泛的應(yīng)用價值,如企業(yè)投融資管理、市場決策分析等。
1 基于生命周期的企業(yè)特征量化評估模型
生命周期理論認(rèn)為,生命周期貫穿于企業(yè)生產(chǎn)經(jīng)營全過程。研究表明企業(yè)生命周期主要由初創(chuàng)期、成長期、成熟期和衰退期四個階段組成,每個階段都有其獨特的特征和需求。本文從模型特征篩選、生命周期分類、特征量化評估3個方面展開企業(yè)經(jīng)營特征評估,提出了一種基于企業(yè)生命周期的特征量化評估模型,將企業(yè)先按生命周期分類,規(guī)避由特征數(shù)據(jù)全距過大而引起的差異,再利用特征量化評估模型對企業(yè)進行評估,以提升企業(yè)評估算法的準(zhǔn)確性和科學(xué)性,為管理者制定精準(zhǔn)決策服務(wù)方案,提供堅強數(shù)據(jù)支撐。
1.1 模型特征篩選
評估模型涉及生命周期分類與企業(yè)量化評估兩部分,模型數(shù)據(jù)來源包括工商、司法、電力等多類數(shù)據(jù)源,根據(jù)當(dāng)前主流的生命周期與特征量化評估研究成果,特征集選取主要從企業(yè)財務(wù)、信用等幾個方面進行選取。模型特征經(jīng)過數(shù)據(jù)探查處理后,最終形成模型特征集23個,如表1所示。
1.2 算法原理
分類模型中常用的算法有隨機森林、SVM、邏輯回歸、XGBoost等算法,本文中企業(yè)生命周期模型采用XGBoost算法進行分類預(yù)測,同時將隨機森林、SVM兩種算法與XGBoost算法的預(yù)測分類結(jié)果進行比較。XGBoost算法是一種基于Boosting的集成學(xué)習(xí)模型,由多個弱學(xué)習(xí)器集合而成一個強學(xué)習(xí)器,通過對目標(biāo)函數(shù)進行二階泰勒展開,使模型結(jié)果更加逼近真實情況,在分類與回歸問題上較其他型模型具有更高的精度。
XGBoost模型表達式如公式(1)所示:
[yi=k=1Kfk(xi),fk∈F ]? ? ? ? (1)
上式中[yi]表示預(yù)測值;K表示回歸樹數(shù)量;xi表示第i個輸入的特征向量;F是回歸樹集合空間;fk是集合R上的一個函數(shù),表示基學(xué)習(xí)器的輸出。
對yi進行k次疊加計算后,得到XGBoost的目標(biāo)函數(shù)如公式(2)所示:
[obj(t)=i=1nl(yi,yi(t)) + i=1tΩ(fi)]
[=i=1nl(yi,yi(t-1)+ft(xi))+Ω(ft)]+constant? ? (2)
上式中[l(yi,yi(t-1)+ft(xi))]是損失函數(shù),用來計算真實值與預(yù)測值之間的誤差;[Ω(ft)]是正則化項,constant是常數(shù)項。
對上述公式進行二階泰勒式展開并簡化計算,最終得到如公式(3)所示:
[obj*=-12j=1TG2jHj+λ+γT]? ? ? ?(3)
上式中T為 k 次迭代后樹中葉子結(jié)點個數(shù);Gj表示當(dāng)前葉子結(jié)點所有樣本一階導(dǎo)數(shù)和;Hj表示當(dāng)前樣本所有二階導(dǎo)數(shù)和;γ為懲罰函數(shù)系數(shù);λ為正則化懲罰項系數(shù)。
1.3 企業(yè)生命周期分類
根據(jù)生命周期理論,雖然企業(yè)在不同生命周期表現(xiàn)出來不同的特征,但在相同周期內(nèi)具有某些共性。因此利用這些共性可以實現(xiàn)企業(yè)生命周期分類。研究表明,初創(chuàng)期企業(yè)具有企業(yè)市場占比小、成本高、利潤低、現(xiàn)金流轉(zhuǎn)少、組織結(jié)構(gòu)簡單等特點;成長期企業(yè)具有融資能力和償債能力較強、營收和利潤增速快等特點;成熟期具有市場占有率穩(wěn)定、營收和利潤均穩(wěn)定、現(xiàn)金流較為充裕、很強的償債能力、組織結(jié)構(gòu)復(fù)雜等特點;衰退期具有營收和利潤均逐年下降、企業(yè)市場份額占比越來越小、組織結(jié)構(gòu)混亂等特點。
企業(yè)生命周期模型采用XGBoost算法,模型特征集涉及財務(wù)、信用等幾個方面。模型數(shù)據(jù)經(jīng)過ETL處理,去除異常值與缺失值過多的企業(yè)。為了提高模型的訓(xùn)練效率和泛化能力,本文對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,使其近似滿足0-1分布。XGBoost 模型訓(xùn)練時,采用gridsearch網(wǎng)格搜索法進行參數(shù)粗調(diào),利用Stratified KFold進行10折交叉驗證,減少模型評估誤差,提高模型評估的準(zhǔn)確性和泛化能力。經(jīng)過粗調(diào)后,采用控制變量法精調(diào)模型,得到最佳模型參數(shù)。
XGBoost模型評估標(biāo)準(zhǔn)采用F1值,F(xiàn)1值由準(zhǔn)確率(Precision) 和召回率(Recall) 調(diào)合平均組成。F1的公式如公式(4)所示:
[F1=2×Precision×RecalPrecision+Recal]? ? ? ? ?(4)
為了驗證模型的準(zhǔn)確性,預(yù)測結(jié)果與SVM算法和隨機森林算法進行實驗對比,從表2實驗結(jié)果可以看出本文提出的XGBoost預(yù)測模型F1值為0.9618,與SVM和隨機森林相比,整體評估預(yù)測結(jié)果均有顯著提升,表明XGBoost模型算法適用于本數(shù)據(jù)集。
1.4 企業(yè)特征量化評估
企業(yè)特征量化評估模型[4]通過量化企業(yè)特征對企業(yè)進行評估,能夠全面、客觀了解企業(yè)實際情況,指導(dǎo)管理者制定準(zhǔn)確的決策分析方案,幫助決策者策劃清晰可持續(xù)差異化服務(wù)決策。本文采用熵權(quán)法結(jié)合TOPSIS算法對企業(yè)進行評估。熵權(quán)法不需要對指標(biāo)進行主觀賦值,具有計算簡單、易于實現(xiàn)等優(yōu)點。TOPSIS算法能夠充分利用原始數(shù)據(jù)信息,對企業(yè)經(jīng)營現(xiàn)狀進行全面評估,最大程度避免人為主觀性,精準(zhǔn)刻畫特征指標(biāo)。熵權(quán)法負責(zé)計算特征權(quán)重系數(shù),TOPSIS算法負責(zé)計算企業(yè)特征量化綜合評估得分。模型特征集涵蓋財務(wù)、信用等幾個方面。
由于企業(yè)特征數(shù)據(jù)存在分布、尺度方面的差異,所以模型數(shù)據(jù)需要進行同向歸一化處理,本文采用最大最小歸一化方法進行處理。根據(jù)數(shù)據(jù)特征,對于負向數(shù)據(jù),如違法、失信、資產(chǎn)負債率等,采用如公式(5)方法進行處理:
[xi=max(xi) - ximax(xi)-min(xi)]? ? ? (5)
對于正向數(shù)據(jù),如銷售利潤率、總資產(chǎn)收益率、專利數(shù)量等,采用如公式(6)方法進行處理:
[xij=xij-min(xij)max(xij)-min(xij)]? ? ? ?(6)
同向歸一化后,利用熵權(quán)法計算模型中每個特征所占樣本的比重[Pi],如公式(7)所示:
[Pij=Xiji=1mXij]? ? (7)
然后利用比重[Pij]計算第j個特征的熵值[E][j]和特征差異系數(shù)[Gj],如公式(8)和(9)所示:
[Ej=1lnmi=1mPijlnPij]? ? ? ?(8)
[Gj=1 - Ej? ]? ? ?(9)
上式中m為樣本總數(shù)。
根據(jù)特征差異系數(shù)[Gj],最終得出每個特征的權(quán)重系數(shù),如公式(10)所示:
[Wj=Gji=1nGj]? ? ? ? (10)
TOPSIS算法中,同樣需要對數(shù)據(jù)進行同向化與歸一化處理,采用方法同上述熵權(quán)法中最大最小化公式。然后構(gòu)造企業(yè)的n維特征空間正、負理想解(各指標(biāo)的最優(yōu)解(z+)和最劣解(z-)),如公式(11)和(12)所示:
[? ?z+ = max{z11,z21,...,zn1 },max{z12,z22,...,zn2 },...,]
[max{z1m,z2m,...,znm } =Z+1,Z+2,...,Z+m]? ? ? ?(11)
[z- =min{z11,z21,...,zn1 },min{z12,z22,...,zn2 },...,]
[min{z1m,z2m,...,znm }=Z-1,Z-2,...,Z-m]? ? ? ?(12)
在得到企業(yè)特征最優(yōu)解和最劣解后,計算每個企業(yè)到正負理想解的距離,如公式(13)所示:
[D+i=j=1mωj(Z+j-zij)2,? D-i=j=1mωj(Z-j-zij)2? ]? ?(13)
到此可以結(jié)合[ D+i]和[D-i]計算每個企業(yè)的綜合得分,利用公式(14)對企業(yè)進行評估,判定其綜合優(yōu)劣。
[Ci = D-iD+i+D-i]? ? ? (14)
1.5 模型架構(gòu)
基于生命周期的企業(yè)特征量化模型包括數(shù)據(jù)源、數(shù)據(jù)存儲、模型計算和模型輸出四個部分,邏輯架構(gòu)如圖1所示:
數(shù)據(jù)源提供模型所需的各種數(shù)據(jù),如工商、稅務(wù)、司法、電力等數(shù)據(jù),通過數(shù)據(jù)接入層傳輸數(shù)據(jù)。數(shù)據(jù)存儲層處理模型原始數(shù)據(jù),生成入模特征數(shù)據(jù)。其中,ETL實現(xiàn)多數(shù)據(jù)融合、異常值處理等功能。模型計算層中,企業(yè)生命周期模型實現(xiàn)企業(yè)生命周期計算與分類;企業(yè)特征量化模型中,熵權(quán)法計算模型特征權(quán)重,TOPSIS算法負責(zé)實現(xiàn)量化、計算各個生命周期內(nèi)的企業(yè)評估得分。模型輸出包括企業(yè)生命周期分類、綜合量化評估得分和排名、綜合評估報告等相關(guān)內(nèi)容組成。
2 應(yīng)用案例
基于生命周期的企業(yè)特征量化評估模型在某大型國企集團內(nèi)部進行應(yīng)用。模型所需數(shù)據(jù)由企業(yè)內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)組成,形成基本條件、科研能力、信用情況、財務(wù)狀況4個維度,共計23個模型特征。數(shù)據(jù)經(jīng)過企業(yè)生命周期模型預(yù)測后,待評估企業(yè)中,初創(chuàng)期共有19家,成長期共有564家,成熟期共有606家,衰退期共有86家。分別對這四類企業(yè)進行評估預(yù)測,最終得出這四類企業(yè)的綜合得分。企業(yè)綜合評估后,需要對企業(yè)進行數(shù)據(jù)融合定位,由于預(yù)測企業(yè)屬于同一個集團,數(shù)據(jù)來源一致,評估方法一致,所以可以直接利用企業(yè)綜合得分進行統(tǒng)一排序,最終得到所有企業(yè)的綜合評估排名。
本模型在集團內(nèi)部對企業(yè)進行量化評估驗證,評估結(jié)果得到集團業(yè)務(wù)人員的高度認(rèn)可,一致表明基于生命周期的企業(yè)特征量化模型評估結(jié)果真實可靠,符合集團內(nèi)部企業(yè)實際分布情況,模型評估準(zhǔn)確度得到驗證。
3 結(jié)論
本文提出一種基于生命周期的企業(yè)特征量化的評估模型,旨在減少由于生命周期不同而導(dǎo)致企業(yè)在財務(wù)、科研等方面特征數(shù)據(jù)差異而帶來的評估誤差,提高企業(yè)評估的準(zhǔn)確性和科學(xué)性。通過模型的應(yīng)用與實踐,驗證了模型的正確性和有效性,為企業(yè)評估模型方面的研究提出了一種切實可行的方案。
另外本文創(chuàng)新性地將電力數(shù)據(jù)融入企業(yè)特征量化評估模型中,增加新的特征維度,使模型預(yù)測準(zhǔn)確度得到了提升。本模型可廣泛應(yīng)用于企業(yè)投融資管理、差異化服務(wù)定制、市場決策分析等業(yè)務(wù)場景,為提升企業(yè)整體競爭力提供底層數(shù)據(jù)支撐。
參考文獻:
[1] 王士偉.中小型科技創(chuàng)新企業(yè)生命周期各階段的特征及融資政策分析[J].科技進步與對策,2011,28(10):88-91.
[2] 陳志存.基于生命周期理論的企業(yè)財務(wù)戰(zhàn)略[J].納稅,2023,17(23):79-81.
[3] 奚夢緣.中小企業(yè)信用指標(biāo)體系構(gòu)建及評估模型的最優(yōu)化[D].南京:南京大學(xué),2018.
[4] 朱宗元,蘇為華,王秋霞.新三板融資環(huán)境下中小企業(yè)信用風(fēng)險評估[J].統(tǒng)計與信息論壇,2018,33(10):107-113.
【通聯(lián)編輯:王 力】