趙寶福,康馨元
(遼寧工程技術大學 工商管理學院,遼寧 葫蘆島 125105)
中國經濟實力穩(wěn)步前進,高新技術企業(yè)尤其是中小型高新技術企業(yè)不斷增加,2019年已經超過18萬家。高新技術企業(yè)能否健康成長成為影響我國經濟發(fā)展和科技創(chuàng)新的關鍵因素。高新技術企業(yè)高人力資源價值、高研發(fā)費用、高無形資產比重卻伴隨著資本流動性差等傳統(tǒng)企業(yè)不存在的獨特性,高新技術企業(yè)發(fā)展面臨眾多風險。結合高新技術企業(yè)特點建立能給企業(yè)投資者和管理者警示的財務危機預警模型,對高新技術企業(yè)實現可持續(xù)健康發(fā)展具有重要意義。
財務危機預測研究主要包括預測模型構建和預測指標設定。國內外許多學者提出了不少財務預測方法:一類是基于統(tǒng)計理論設計方法,一類是以人工智能為代表的機器學習法。
FITZPATRICK是第一位提出單一指標財務危機預警模型的學者,其研究結果表明了在許多財務指標中最具有衡量財務危機價值的指標為產權比率和權益凈利率。而后MARTIN[1]用Logistic回歸分析法對企業(yè)的財務情況進行預測。以統(tǒng)計為基礎的模型對樣本的要求較高,在樣本數量較大時可能出現預測效果差,泛化能力弱等情況,由此便失去了預測意義。周首華等學者成功構造出F評分財務預警模型并且在預警指標中引入現金流量指標。肖振紅和楊華松[2]構造L1/2正則化的Logistic回歸模型避免了財務指標之間多重共線性干擾敏感性的缺陷,提高了財務危機預警精度和模型的泛化能力。財務危機預警領域的學者在研究方法上開始引入機器學習法。LAPEDES和FARBER[3]針對銀行的信用危機問題選擇用神經網絡法進行預警研究。李曉峰等學者基于BP財務危機預警模型可以有效衡量上市企業(yè)質量與經營業(yè)績的同時給予上市企業(yè)財務危機警示。王小燕和姚佳含用聚類分析對財務指標相關性進行分組,用Group Bridge方法選擇重要的風險指標,構造Logistic回歸提出聚類Group Bridge模型。吳慶賀等[4]構建Twin-SVM模型對我國創(chuàng)業(yè)板上市公司不同財務狀況構成的非均衡樣本特性進行財務危機預警研究。周穎和張舒明[5]利用改進的等截距變換雷達圖評價模型對3家*ST公司進行退市風險預警研究。張茂軍等[6]研究中國制造業(yè)上市公司違約概率與財務預警指標間的關系,建立Aalen可加模型預測財務困境。鄭立[7]提出針對制造業(yè)上市公司粗糙集理論融合最小二乘支持向量機的財務預警方法。周憶和張友棠用卡爾曼濾波算法構建僵尸企業(yè)財務危機動態(tài)預警模型,根據僵尸企業(yè)財務狀況動態(tài)變化的特點設計了4段式僵尸企業(yè)財務危機警度判定區(qū)間。楊貴軍等提出利用Benford律檢驗財務數據質量,建造Benford因子變量并與財務指標變量結合建造Benford-Logistic財務危機預警模型。朱發(fā)根等針對高新技術企業(yè)財務危機采用非線性SVM的方法進行預警。張曉琦運用SVM方法構建了非上市高新技術企業(yè)財務危機預警模型,證明其模型在對非上市高新技術企業(yè)財務危機預警精確度很高。耿東等構造了Logistic-BP神經網絡財務預警模型,面板數據的動態(tài)預警模型不但能提高長期縱向預警能力還能多段實時預警并且其模型的預警效果良好。從這些研究中可以發(fā)現,以人工智能為代表的機器學習方法的財務危機預警模型已得到廣泛關注,但目前對于財務危機預測指標的選取主要停留在純財務指標上,非傳統(tǒng)財務信息沒有得到足夠重視。針對高新技術企業(yè)財務危機預警的研究在財務指標選取上還未能完全體現出高新技術企業(yè)特點。在財務危機預警研究領域中,多數研究采用的是模糊綜合評價法、Logistic回歸法和BP神經網絡法,但這些模型的學習時間長,學習精度不夠準確,影響預測效果。
基于此,本研究在預警模型上進行了新的探索,將極限學習機(ELM)模型應用于財務危機預警中。ELM存在權值和閾值的參數隨機性影響預警效果的問題,而粒子群算法(PSO)能通過尋找出最佳粒子位置來彌補ELM模型中隨機解的缺陷,從而提高預警模型的精度。
極限學習機(ELM),是由HUANG[8]提出對單隱層神經網絡求解的快速學習方法。ELM算法的輸入權重和偏置被隨機賦予初始值,并且可以得出與之對應的輸出權重,通過解方程組方式一次性確定。在解決訓練速度慢,泛化能力差的問題上極限學習機算法具有卓越的表現,但由于輸入層與中間隱含層之間映射函數的系數是隨機給定的,可能會出現兩個系數均為0的情況,即部分隱含層無用的情況。如果為了確保參數的合理性就需要增加隱含層節(jié)點的個數,這就導致了“過擬合”現象。為了彌補隨機性的缺陷將粒子群算法優(yōu)化理論對極限學習機模型進行優(yōu)化。因為粒子群優(yōu)化算法簡單容易并且不需要做很多的參數調整,提高了算法本身的準確度。所以粒子群算法給予極限學習機更大的優(yōu)勢,使優(yōu)化后的智能學習模型更加適合高新技術企業(yè)財務危機預警。
粒子群算法(PSO)通常用來尋找函數的最優(yōu)值問題。主要是把需要優(yōu)化問題的潛在解看作是P維搜索空間中的粒子。粒子均有一個v來判定飛行的距離和方向。在不停地迭代過程中,粒子們就追隨個體極值Pbest和全局極值Gbest更新位置。如公式(1)-(3)。
其中,ω為慣性權重,c1和c2為加速常數,Rand()稱隨機函數,取值范圍[0,1]。
ELM算法與傳統(tǒng)神經網絡算法不同點在于輸入層與隱層間權值矩陣ω和隱層偏置b的處理。在傳統(tǒng)神經網絡中,國內外大多數學者通過梯度下降方法來不斷地對其進行調整更新。ELM算法在眾多研究領域里被廣泛應用的原因之一就是它與傳統(tǒng)神經網絡相比具有“學習時間短”的獨特性。因為ELM算法不需要更新ω和b,只需要在初始算法時,任意給定ω和b的值,進而計算出公式里的H。ELM模型如圖1。
圖1 單隱層神經網路模型圖Fig.1 single hidden layer neural network model diagram
設I為隱含層個數,m為輸出層神經元個數,ω是輸入層與隱層間連接權值
設隱層與輸出層間連接權值β為:
設隱層神經元閾值b為:
樣本數據集合為:
Ω={(xi,ti)|xi∈Rn,ti∈Rm,i=1,2,…,q},Xi=[Xi1,Xi2,…,Xin]T∈Rn表示樣本具體的輸入數據,期望輸出結果用ti= [ti1,ti2,…,tin]T∈Rm表示。如果該網絡模型的輸入端數據為n,中間隱含層和輸出層分別用1和m表示,則ELM的輸出可以表示為:
其中,
那么(7)式就可以寫成:
如果模型輸出與期望結果誤差為0,即:
式(9)中,H是隱含層節(jié)點輸出矩陣,T是期望輸出矩陣。
公式(11)里,H是H+的廣義逆。用正交法求得的解唯一并且最小。
目前極限學習(ELM)應用于眾多領域中,比如景甜甜和洪潔[9]將PCA與ELM相結合的方法有著更高的手腕動作識別率。吳莉莉等提出的基于極限學習機的EPG波形分類識別方法具有較高的識別性能,為研發(fā)EPG波形自動識別分析系統(tǒng)奠定了理論基礎。陸榮秀等建造GA-ELM多組含量預測方法,以此來解決稀土萃取液中有顏色特征和無顏色特征的離子共存狀況下組分含量難以快速檢測的問題。但目前為止,還沒有將ELM算法運用到財務危機預警中,尤其是符合高新技術企業(yè)特點的財務危機預警領域中。
ELM算法之所以訓練快是因為其隱含層的權重和隱含層神經元的偏置具備隨機性。若此種算法直接應用到高新技術企業(yè)財務預警研究領域中,則不利于預警的精度。因此用粒子群算法來尋找最優(yōu)的權值和偏差,再結合訓練速度快的極限學習機(ELM)來預警高新技術企業(yè)特點的財務危機。預警流程如圖2。
圖2 粒子群優(yōu)化極限學習機流程Fig.2 particle swarm optimization for extreme learning machine process
模型構建步驟如下:
指標選?。阂载攧瘴C預警為基礎全面構建符合高新技術企業(yè)特點的預警指標體系。
樣本的選擇:選取成功在2018年或2019年被評為高新技術的企業(yè)作為樣本,并查找相關財務數據。
數據處理:將數據被PSO-ELM模型訓練之前,選用數據歸一化方法mapminimax,將數據變成[0,1]。量值差因此被消除,確保PSO-ELM模型效果。
建立粒子群優(yōu)化算法:隨機給定每一個粒子的起始速度和位置,隨機給定種群規(guī)模,將均方誤差函數作為適應功能函數:。其中,N是數據個數,yreal期望輸出值,yi模型實際預測值。多輪更新后,模型輸出的值就是問題最優(yōu)解。
得到最佳值:所有粒子自身經歷的最佳值是根據其各自適應函數值,并從這些最佳值中確定總體最佳值。
若Present<Pbest,Pbest=Present,Pbest=xi,否則,Pbest不變。
若Present<gbest,gbest=Present,gbest=xi,否則,gbest。
訓練ELM:優(yōu)化后的連接權值和閾值就為這個問題的最優(yōu)解,優(yōu)化完的ELM的模型即可進行訓練。
將高新技術企業(yè)是否被“ST”為標簽來衡量是否具有財務危機。選取2018年和2019年A股主板市場高新技術企業(yè),確保所選取樣本具有一致性和可比性,剔除在2018年和2019年間退市的高新技術企業(yè)和交易狀態(tài)為PT的企業(yè),共計80個高新技術企業(yè)樣本,依據 Beaver方法,采取 1:3的配對方式,即被“ST”20家,非被“ST”60家。數據來源國泰安數據庫和CCER經濟金融研究數據庫。財務危機并非在一個時間點形成的,而是一個動態(tài)的形成過程,在t年公布被特別處理的ST企業(yè)是由其t-1年的財務數據決定的,將t-2年度作為高新技術企業(yè)的財務預警年度。
在參考國內外學者財務危機預警研究成果的基礎上,結合了我國高新技術企業(yè)無形資產比重大、研發(fā)能力強等特點,從多個方面來評判高新技術企業(yè)的財務危機。在財務指標選取方面盡可能做到可靠和全面,加入了R&D投入強度、研發(fā)人員占比、新產品銷售增長率等作為評判企業(yè)是否達到高新技術標準的關鍵指標。除了傳統(tǒng)企業(yè)普遍適用的5大財務分析能力外還引入了股權結構和EVA,并從這7個方面初步預選出38個指標。運用SPSS中的K-S 檢驗和Mann-Whitney-U檢驗進行財務指標篩選,最終選擇26個財務指標,見表1。
表1 篩選后的財務指標Tab.1 filtered financial indicators
選取80家高新技術企業(yè)財務數據,隨機選取60個樣本作為訓練集建模,實驗結果如圖3和圖4。從對比中可以明顯看出,PSO-ELM預警模型不管是訓練樣本還是測試樣本精確率都比ELM模型更高,并且隨著隱含層節(jié)點數逐漸增加PSO-ELM模型比ELM模型準確率變化幅度小,逐漸趨于穩(wěn)定后精確度并無降低趨勢。由此說明,在關于隱含層節(jié)點數變化方面PSO-ELM模型比ELM模型敏感性要好。PSO-ELM模型精度隨著隱含層數的增加準確率逐漸增高達到100%,測試樣本在隱含層節(jié)點數達到16左右,精度達到最高并且開始穩(wěn)定。但ELM模型隱含層節(jié)點數為24時訓練精度為80%,而且訓練樣本準確率與測試樣本的準確率差距較大。對比可以看出,ELM模型比優(yōu)化后的PSO-ELM穩(wěn)健性差。因此,經過PSO算法優(yōu)化的ELM財務危機預警模型不但能給高新技術企業(yè)自身提供風險評估還能給予投資人價值型參考依據。
圖3 PSO-ELM模型精度Fig.3 PSO-ELM model accuracy
圖4 ELM模型精度Fig.4 ELM model accuracy
鑒于目前大多數國內學者在財務危機預警領域中,所選取的人工智能方法為BP神經網絡法,所以將上述相同的實驗數據帶入PSO-ELM模型、ELM模型和BP神經網絡模型做對比實驗。實驗結果如表2。
表2 預測結果對比表Tab.2 comparison table of forecast results
BP神經網絡、ELM模型與PSO-ELM模型的對比預測正確率分別為70%、80%和95%。PSO-ELM模型無論在訓練集還是測試集,無論是否被ST的測試結果均高于BP和ELM;而未被優(yōu)化過的ELM模型的正確率80%也同樣高于BP神經網絡模型的70%。高新技術企業(yè)可針對自身預警結果及時調整財務發(fā)展戰(zhàn)略,也為投資者或者監(jiān)管部門提供具有價值性的參考依據。
高新技術企業(yè)是我國目前重點扶持關注的企業(yè),研究其財務危機預警問題具有重要的現實意義。在歸納總結國內外學者有關財務危機預警研究方法和高新技術企業(yè)發(fā)展狀況、國家政策的基礎上,構造出滿足高新技術企業(yè)獨特性的財務危機智能預警模型。將高新技術企業(yè)是否被ST作為衡量財務危機的標準,結合高新技術企業(yè)特點,利用PSO對ELM模型進行優(yōu)化,構建了PSO-ELM財務危機預警模型。由檢測結果可知,在完全一致的訓練樣本的情況下,將PSO-ELM、ELM和BP三種分類模型的預測分類結果進行對比實證后發(fā)現,使用PSO-ELM模型不但預測效果較好還避免了BP神經網絡出現的過度學習問題和ELM對隱含層個數的敏感性問題,凸顯出PSO-ELM的穩(wěn)健性和精準性。因此,粒子群優(yōu)化極限學習機算法是結合高新技術企業(yè)特點評價高新技術企業(yè)財務危機的有效方法,同時PSO-ELM研究方法在其他領域中也具有一定的推廣價值。