石 峰
(湖南工程學(xué)院 管理學(xué)院,湖南 湘潭411104)
新冠病毒疫情爆發(fā)以來,大量企業(yè)陷入財務(wù)困境。對于投資者和其他利益相關(guān)者而言,預(yù)測上市公司的上市狀態(tài)至關(guān)重要。“特別處理”(即Special Treatment,ST)是我國證券市場特有的一項旨在保護投資者利益的政策。具體而言,當(dāng)某上市公司出現(xiàn)財務(wù)狀況或其他狀況異常,導(dǎo)致投資者難以判斷該公司前景,且投資者利益可能受到損害時,交易所要對該公司股票交易實行特別處理。特別處理的股票,除了漲跌幅度受到限制以外,其股票名稱之前還需注釋為“ST”。如果該ST 公司仍然持續(xù)虧損,那么它將有被退市的風(fēng)險。
針對我國上市公司的ST 分類預(yù)測研究,國內(nèi)已有大量研究成果。陳瑜選取滬深A(yù) 股和B 股58 家ST 公司和58 家非ST 公司為研究樣本,基于流動比率、資產(chǎn)負債率、總資產(chǎn)周轉(zhuǎn)率、總資產(chǎn)收益率、權(quán)益報酬率和凈利潤率等6 個財務(wù)指標(biāo)數(shù)據(jù),運用判別分析法對ST 公司進行分類,準確率達75%左右。[1]姜國華和王漢生選取滬深股市33 家ST 公司和778家非ST 公司的7 個財務(wù)指標(biāo)數(shù)據(jù)(主營業(yè)務(wù)利潤、資產(chǎn)周轉(zhuǎn)率、債務(wù)資產(chǎn)比率、主營業(yè)務(wù)收入增長率、第一大股東持股比例、資產(chǎn)總額和營業(yè)外收支凈額),運用邏輯回歸方法對ST 公司進行分類預(yù)測,預(yù)測準確率大約為64%。[2]吳曼琪基于43 家ST 公司的4 個財務(wù)指標(biāo)數(shù)據(jù)(每股收益、每股凈資產(chǎn)、每股現(xiàn)金流量和每股資本公積金),運用K 均值聚類法對ST 股票進行分類,預(yù)測分類準確率為66.7%。[3]時建中基于RS-Bag 分類器集成技術(shù)對我國ST 公司進行分類預(yù)測,預(yù)測準確率達到80%左右。[4]張茂軍選取2001—2015 年我國制造業(yè)157 家ST 公司和200 家非ST 公司的9 個財務(wù)指標(biāo)數(shù)據(jù)(流動比率、資產(chǎn)負債率、資產(chǎn)報酬率、營業(yè)利潤率、銷售現(xiàn)金比率、固定資產(chǎn)增長率、應(yīng)收賬款周轉(zhuǎn)率、產(chǎn)權(quán)比率和總資產(chǎn)規(guī)模),運用生存分析法分析發(fā)現(xiàn):總資產(chǎn)規(guī)模越大,被ST 可能性越小。[5]
綜上,國內(nèi)針對ST 公司的分類預(yù)測研究,主要運用傳統(tǒng)的分類預(yù)測方法(判別分析法、聚類分析法、邏輯回歸法和生存分析法)。這些預(yù)測方法的應(yīng)用通常需要某些假設(shè),比如,邏輯回歸中要求logit(p)和自變量之間存在線性關(guān)系;判別分析中要求各變量相互獨立,且服從多元正態(tài)分布。因此,當(dāng)自變量的數(shù)量逐漸增多且高度相關(guān)時,這些方法的缺點更加明顯。同時,以往的研究在指標(biāo)選擇上,主要選取償債能力、營運能力、盈利能力、成長能力、現(xiàn)金流量和資產(chǎn)結(jié)構(gòu)等方面的少量財務(wù)指標(biāo),具有一定主觀性。另外,以往的研究在樣本選取上,主要根據(jù)1∶1配對的原則,即根據(jù)ST 公司的數(shù)量來選取“非ST”公司的數(shù)量。但GMDH 神經(jīng)網(wǎng)絡(luò)法應(yīng)用于分類預(yù)測研究不會受到如此嚴格的限制。然而需要指出的是,GMDH 神經(jīng)網(wǎng)絡(luò)法應(yīng)用于我國中小板上市公司ST 分類的預(yù)測研究還很難看到。
分組數(shù)據(jù)處理方法(Group Method of Data Handing,GMDH)型神經(jīng)網(wǎng)絡(luò)法是用于對復(fù)雜系統(tǒng)進行建模的自組織算法,被廣泛應(yīng)用于回歸、分類、聚類和預(yù)測等研究領(lǐng)域。由此,首次將GMDH 神經(jīng)網(wǎng)絡(luò)法應(yīng)用于我國中小板上市公司的ST 分類預(yù)測中,構(gòu)建全面涵蓋償債能力、營運能力、盈利能力、成長能力、現(xiàn)金流量和資產(chǎn)結(jié)構(gòu)等六大方面的86 個財務(wù)指標(biāo)的GMDH 神經(jīng)網(wǎng)絡(luò)分類預(yù)測模型,并評價其預(yù)測效果。
GMDH 神經(jīng)網(wǎng)絡(luò)法是一種研究變量之間關(guān)系的啟發(fā)式自組織方法。GMDH 神經(jīng)網(wǎng)絡(luò)法可以自動查找數(shù)據(jù)中的相互關(guān)系、選擇模型或網(wǎng)絡(luò)的最佳結(jié)構(gòu),并提高現(xiàn)有算法的準確性。Ivakhnenko 為更好地預(yù)測河流中的魚類種群,創(chuàng)造了分組數(shù)據(jù)處理方法(GMDH),使神經(jīng)元成為具有多項式傳遞函數(shù)的更復(fù)雜的單元,并簡化了神經(jīng)元之間的互聯(lián),同時開發(fā)了用于結(jié)構(gòu)設(shè)計和權(quán)重調(diào)整的自動算法。[6]43-55Ivakhnenko 構(gòu)造的多項式為:
上式(1)也稱為Ivakhnenko 多項式。其中,m 表示每個神經(jīng)元進入回歸模型的變量數(shù)量;a,b,c…是多項式中變量的權(quán)重;y是響應(yīng)變量;xi和xj是探索性變量。在研究中,上述模型僅包含主要影響,由此可表示為:
在模型建立和評估過程中,數(shù)據(jù)被分為三組:訓(xùn)練集(60%)、驗證集(20%)和測試集(20%)。訓(xùn)練集包含在模型構(gòu)建中,驗證集則用于對神經(jīng)元的選擇;測試集是用于考察評估模型在未觀察數(shù)據(jù)上的性能。GMDH 神經(jīng)網(wǎng)絡(luò)法是由神經(jīng)元構(gòu)成的層次系統(tǒng)。每層中對應(yīng)神經(jīng)元的數(shù)量取決于輸入的數(shù)量。假設(shè)進入某一層的輸入數(shù)量等于p,則該層中的神經(jīng)元數(shù)量變?yōu)椋?/p>
圖1 GMDH 神經(jīng)網(wǎng)絡(luò)法的體系結(jié)構(gòu)
上式(3)考慮了所有成對的輸入組合,但這并不意味著所有層都包括h 個神經(jīng)元。例如,輸入層中的輸入數(shù)量僅定義第一層中的神經(jīng)元數(shù)量。在第一層中選擇的神經(jīng)元數(shù)量決定第二層中的神經(jīng)元數(shù)量。該算法自行組織架構(gòu),當(dāng)存在三個層次和四個輸入時,GMDH 神經(jīng)網(wǎng)絡(luò)法的體系結(jié)構(gòu)如圖1 所示。
實證數(shù)據(jù)來源于巨潮資訊網(wǎng)公布的中小板上市公司的財務(wù)指標(biāo)數(shù)據(jù)。數(shù)據(jù)日期為2019 年1 月1 日至3 月31 日,即2019 年第一季度財務(wù)報告數(shù)據(jù)。中小板上市公司總共有940 家,且每家公司的財務(wù)指標(biāo)共計122 個,其中有35 家“*ST”公司和9 家ST 公司。研究目的是運用GMDH 神經(jīng)網(wǎng)絡(luò)法對中小板上市公司是否是ST 公司和非ST 公司做出正確預(yù)測分類。因此,進一步對數(shù)據(jù)進行篩選,以滿足GMDH 神經(jīng)網(wǎng)絡(luò)法對數(shù)據(jù)的要求。首先,在這122 個財務(wù)指標(biāo)數(shù)據(jù)中,刪除有缺失值的指標(biāo)和樣本;其次,刪除財務(wù)指標(biāo)數(shù)據(jù)為0 的樣本。由此得到86 個財務(wù)指標(biāo)的116 家公司樣本,其中“*ST”公司34 家,ST公司9 家。最后,將“*ST”公司和ST 公司都歸類為ST 公司,共計43 家ST 公司,占116 家公司樣本的37.1%;73 家非ST 公司占116 家公司樣本的62.9%。運用于分類預(yù)測的86 個財務(wù)指標(biāo)全面涵蓋了償債能力、營運能力、盈利能力、成長能力、現(xiàn)金流量和資產(chǎn)結(jié)構(gòu)等六大方面內(nèi)容(見表一)。
表一 中小板上市公司財務(wù)指標(biāo)體系
續(xù)表一
運用GMDH 神經(jīng)網(wǎng)絡(luò)法對中小板上市公司的財務(wù)指標(biāo)數(shù)據(jù)進行特征選擇和分類預(yù)測,同時參考Osman 和Yozgatligil 開發(fā)的R 軟件程序包GMDH 進行計算[7],并使用Osman 和Erdem 最新開發(fā)的GMDH2 函數(shù)進行分類預(yù)測[8]。二進制分類是一項任務(wù),其中可以將二進制目標(biāo)標(biāo)簽分配給每個觀察值,從而通過分組數(shù)據(jù)處理(GMDH)算法對兩標(biāo)簽輸出進行分類。GMDH 神經(jīng)網(wǎng)絡(luò)法適用于復(fù)雜的非結(jié)構(gòu)化系統(tǒng),并且比高階回歸具有優(yōu)勢。通過GMDH神經(jīng)網(wǎng)絡(luò)法執(zhí)行二進制分類存在兩種主要算法:GMDH 神經(jīng)網(wǎng)絡(luò)法和基于各種分類器集合的GMDH(dce-GMDH)神經(jīng)網(wǎng)絡(luò)法。
首先,我們將數(shù)據(jù)隨機分為訓(xùn)練集、驗證集和測試集,然后調(diào)用GMDH()函數(shù)。
運行GMDH()函數(shù)得到的結(jié)果如表二所示。由表二看到,中小板上市公司ST 分類預(yù)測的算法結(jié)構(gòu)包括層、神經(jīng)元、被選中神經(jīng)元和最小均方誤差。該算法結(jié)構(gòu)共計5 層,每層神經(jīng)元的數(shù)量分別為3655、105、66、105 和105;每層被選中的神經(jīng)元分別為15、12、15、15 和1。計算神經(jīng)元的外部標(biāo)準為最小均方誤差。
當(dāng)層數(shù)為5時,最小均方誤差達到最小值0.081 52。該算法從86 個變量中選擇了8 個變量(X2,X3,X9,X15,X17,X25,X26,X57),即基本每股收益、稀釋每股收益、營業(yè)稅金率、成本費用利潤率、應(yīng)收賬款周轉(zhuǎn)率、貨幣資金比率、固定資產(chǎn)比率和年化期間費用毛利比。
在模型構(gòu)建完成后對測試集進行預(yù)測,測試集共有23 個觀測值,預(yù)測結(jié)果如表三所示。
從表三看出,GMDH 神經(jīng)網(wǎng)絡(luò)法預(yù)測第1 家公司為“ST”和“非ST”的概率分別為0.29 和0.71,由于第1 家公司為“非ST”的概率大于為“ST”的概率,因此第1 家公司歸類為非ST 公司。因此,在23 家測試樣本中,歸類為ST 公司的有4、6、8、9、11、13、15、19 和23;歸類為非ST 公司的有1、2、3、5、7、10、12、14、16、17、18、20、21 和22。
隨后,利用R 軟件中的confMat()函數(shù)為二進制響應(yīng)生成一個混淆矩陣,并返回一些相關(guān)的統(tǒng)計信息。GMDH 神經(jīng)網(wǎng)絡(luò)法的分類預(yù)測正確率為0.7826。這說明該算法將78.26%的公司分類為正確的類別,即23 家公司中有18 家公司分類正確,其中8家ST 公司分類正確,1 家ST 公司分類錯誤;10 家非ST 公司分類正確,4 家非ST 公司分類錯誤。與此同時,可以計算出敏感性值和特異性值分別為0.6667 和0.9091。這表明該算法將66.67%的ST 公司和90.91%的非ST 公司正確分類,即在分類預(yù)測結(jié)果中,12 家ST 公司有8 家ST 公司分類正確;11家非ST 公司有10 家非ST 公司分類正確。
運用GMDH 神經(jīng)網(wǎng)絡(luò)法得到的分類預(yù)測結(jié)果,與以往研究相比,預(yù)測正確率大幅提高。進一步采用1:1 配對原則(43 家ST 公司和43 家“非ST”公司)對中小板上市公司進行ST 分類預(yù)測。首先,對兩類上市公司的86 家樣本進行分組,即分成訓(xùn)練集(60%)、驗證集(20%)和測試集(20%)。其中,43 家“非ST”公司樣本從73 家“非ST”公司隨機選取。1∶1 配對下的ST 分類預(yù)測算法結(jié)構(gòu)輸出結(jié)果見表四所示。
表四 1∶1 配對下的ST 分類預(yù)測算法結(jié)構(gòu)輸出結(jié)果
從表四看到,GMDH 神經(jīng)網(wǎng)絡(luò)法在每個相應(yīng)層的驗證集上給出了最小外部標(biāo)準值(均方誤差)。當(dāng)層數(shù)為10 時,最小均方誤差達到最小值0.089 05。該算法從86 個變量中選擇了8 個變量(X5,X25,X32,X34,X42,X43,X44,X57),即每股未分配利潤、貨幣資金比率、現(xiàn)金比率、流動負債比率、每股經(jīng)營現(xiàn)金流量、每股經(jīng)營現(xiàn)金流量經(jīng)營凈現(xiàn)金比率(短期債務(wù))、經(jīng)營凈現(xiàn)金比率(全部債務(wù))和年化期間費用毛利比。
在模型構(gòu)建完成后對測試集的17 個觀測值進行預(yù)測。1∶1 配對下GMDH 神經(jīng)網(wǎng)絡(luò)法的分類預(yù)測正確率為0.8824。這說明該算法將88.24%的公司分類為正確的類別,即17 家公司中,有15 家公司分類正確;其中7 家ST 公司分類正確,1 家ST 公司分類錯誤;8 家非ST 公司分類正確,1 家非ST 公司分類錯誤。同樣地,計算得到的敏感性值和特異性值分別為0.8750 和0.8889。這表明該算法將87.50%的ST公司和88.89%的非ST 公司正確分類,即在分類預(yù)測結(jié)果中,8 家ST 公司有7 家ST 公司分類正確;9家非ST 公司有8 家非ST 公司分類正確。
運用GMDH 神經(jīng)網(wǎng)絡(luò)法對具有86 個財務(wù)指標(biāo)的116 家ST 公司(43 家)和非ST 公司(73 家)進行分類預(yù)測,預(yù)測正確率為78.26%,敏感性值和特異性值分別為0.6667 和0.9091,即將66.67%的ST 公司和90.91%的非ST 公司正確分類。隨后,進一步以1∶1配對原則對43 家ST 公司和43 家非ST 公司進行分類預(yù)測,預(yù)測正確率達到88.24%,敏感性值和特異性值分別為0.8750 和0.8889,即將87.50%的ST 公司和88.89%的非ST 公司正確分類。
基于GMDH 神經(jīng)網(wǎng)絡(luò)法對我國中小板43 家ST公司和73 家非ST 公司的分類預(yù)測有助于為中小板上市公司的財務(wù)預(yù)警和監(jiān)測發(fā)揮作用,與此同時也可進一步在我國主板市場進行推廣和應(yīng)用。
需要指出的是,GMDH 神經(jīng)網(wǎng)絡(luò)法是基于對逐漸復(fù)雜的模型進行分類,并通過最小化外部準則特征來選擇最佳解決方案。GMDH 神經(jīng)網(wǎng)絡(luò)法找到了模型結(jié)構(gòu)的最佳復(fù)雜性,足以滿足樣本數(shù)據(jù)中的噪聲水平。其中,隱藏層中的層數(shù)和神經(jīng)元數(shù)量以及模型結(jié)構(gòu)和其他最佳神經(jīng)網(wǎng)絡(luò)參數(shù)自動確定。由于輸入變量使用可影響輸出變量的非線性函數(shù),它會自動在數(shù)據(jù)中找到可解釋的關(guān)系,并選擇有效的輸入變量。因此,GMDH 神經(jīng)網(wǎng)絡(luò)法可以使用兩個多層神經(jīng)網(wǎng)絡(luò)來提高另一種建模算法的準確性。