曹 強(qiáng) 方扶星
(安徽財經(jīng)大學(xué),安徽 蚌埠233030)
隨著經(jīng)濟(jì)全球化的高速發(fā)展以及市場環(huán)境的變化多端,上市公司外部發(fā)展環(huán)境的不確定性急劇增加。面對這樣的不確定性,上市公司如何及時發(fā)現(xiàn)并規(guī)避退市風(fēng)險將直接影響著公司的可持續(xù)發(fā)展,而退市風(fēng)險預(yù)警系統(tǒng)作為證券市場退市機(jī)制的核心內(nèi)容,一直以來引起了學(xué)者們的廣泛研究和關(guān)注。Xie等[1]通過比較支持向量機(jī)(SVM)和數(shù)據(jù)包絡(luò)分析(MDA)對于上市公司的財務(wù)困境預(yù)測,實(shí)證結(jié)果表明支持向量機(jī)的預(yù)測結(jié)果較好;Mselmi等[2]結(jié)合偏最小二乘法提出了支持向量機(jī)混合模型,發(fā)現(xiàn)債償能力對于納斯達(dá)克上市公司的退市風(fēng)險影響最大。雖然偏最小二乘法能夠通過最小平方和尋找數(shù)據(jù)的最佳函數(shù)匹配,但該方法只能進(jìn)行線性估計,應(yīng)用于非線性的財務(wù)數(shù)據(jù)會產(chǎn)生一定的數(shù)學(xué)偏差。主成分分析法借助于正交變換,將財務(wù)變量相關(guān)的原隨機(jī)向量轉(zhuǎn)化成其分量不相關(guān)的新隨機(jī)變量,然后對多為變量系統(tǒng)進(jìn)行降維處理,能夠顯著降低非線性財務(wù)數(shù)據(jù)的降維損失。另外,基于非線性核函數(shù)(Nonlinear kernel)的支持向量機(jī)分類器能夠避開局部極小值的干擾,從而減少模型的系統(tǒng)偏差。因此,本文通過構(gòu)建基于主成分分析的支持向量機(jī)模型預(yù)測我國上市公司的退市風(fēng)險,對完善中國證券市場的退市風(fēng)險預(yù)警機(jī)制具有重要意義[3]。
本文研究的上市公司源自于我國A股市場,其中被交易所處以退市風(fēng)險警示(ST)的公司139家,非ST公司239家。同時本文所搜集的數(shù)據(jù)來自于樣本378家上市公司2018年第四季度財務(wù)報表,并將ST和非ST公司的數(shù)據(jù)隨機(jī)分為兩個子集:70%的數(shù)據(jù)用于擬合支持向量機(jī)模型,余下30%的數(shù)據(jù)對模型進(jìn)行交叉驗(yàn)證。由于描述公司財務(wù)狀況的指標(biāo)繁多,本文參照鮑新中和楊宜[4]的經(jīng)驗(yàn)選取了退市風(fēng)險預(yù)警實(shí)證研究中較為常用(引用頻次超過50)的21項(xiàng)指標(biāo),這些指標(biāo)分別從債償能力、盈利能力、發(fā)展能力和每股指標(biāo)四個方面較為全面的反映了我國A股上市公司的發(fā)展?fàn)顩r,預(yù)警指標(biāo)如表1所示。
由于初步確定的21項(xiàng)指標(biāo)較多,部分指標(biāo)可能不夠顯著并且存在著交叉重復(fù)。本文通過顯著性檢驗(yàn)進(jìn)行指標(biāo)分辨能力篩選,并利用主成分分析對剩余指標(biāo)進(jìn)行降維處理,將多個指標(biāo)合并成幾個主成分,確保財務(wù)指標(biāo)的顯著性以及預(yù)警指標(biāo)的簡潔性。
表1 財務(wù)指標(biāo)體系
K-S正態(tài)性檢驗(yàn)是常用的多元正態(tài)性檢驗(yàn)方法,能夠?qū)?shù)據(jù)進(jìn)行定量檢驗(yàn),因此本文采用K-S正態(tài)性檢驗(yàn)來驗(yàn)證各財務(wù)指標(biāo)是否服從正態(tài)分布[5]。由表2結(jié)果可知,各變量指標(biāo)的顯著性水平均小于0.05,此時各財務(wù)指標(biāo)均不服從正態(tài)分布。表2為KS正態(tài)性檢驗(yàn)結(jié)果及顯著性水平。
表2 K-S正態(tài)性檢驗(yàn)
對K-S正態(tài)性檢驗(yàn)中不服從正態(tài)分布的財務(wù)指標(biāo)需要進(jìn)行非參數(shù)檢驗(yàn)。SPSS25.0提供的方法多種多樣,其中最為常用的是Kruskal-Wallis(H檢驗(yàn)),用來檢驗(yàn)多個獨(dú)立樣本是否具有顯著性差異。因此,對不服從正態(tài)分布的財務(wù)指標(biāo)進(jìn)行K-W非參數(shù)檢驗(yàn)驗(yàn)證其是否存在顯著性差異。檢驗(yàn)結(jié)果如表3所示。
由表3中的結(jié)果可知,只有財務(wù)指標(biāo)X7、X20的漸近顯著性大于0.05,表明其對ST公司和非ST公司的區(qū)分不顯著。綜合K-S正態(tài)性檢驗(yàn)和K-W非參數(shù)檢驗(yàn)結(jié)果可知,財務(wù)指標(biāo)X 1-X6、X8-X19和X21具有顯著性特征并且能夠顯著區(qū)分ST公司和非ST公司。
經(jīng)過顯著性檢驗(yàn)后的財務(wù)指標(biāo)雖然保證了較高的分辨能力,但如果直接用來擬合支持向量分類器會導(dǎo)致系統(tǒng)信息冗余,而且輸入變量過多會導(dǎo)致擬合支持向量分類器時產(chǎn)生維度災(zāi)難問題[6]。鑒于此,本文對上述19項(xiàng)財務(wù)指標(biāo)進(jìn)行主成分分析,相關(guān)系數(shù)矩陣的前六個特征根及其貢獻(xiàn)率如表4所示。
可以看出前5個特征根的貢獻(xiàn)率均為10%以上,累計貢獻(xiàn)率達(dá)到了71%,主成分分析效果較好。因此本文選取前5個主成分構(gòu)建預(yù)警指標(biāo)體系,前5個主成分對應(yīng)的特征向量如表5所示,從主成分的系數(shù)可以看出,第一主成分(CR)主要反映了上市公司的盈利能力;第二主成分(NA)主要反映了上市公司的債償能力;第三主成分(OM)主要反映了上市公司每股指標(biāo);第四主成分(NIROS)主要反映了上市公司的利息保障倍數(shù)和資本累計率;第五主成分(ROTA)主要反映了上市公司的營業(yè)利潤率和資本保值增值率。
支持向量機(jī)(Support Vector Machine,SVM)是一種能夠同時用于分類和回歸的統(tǒng)計方法。SVM的原理是將低維特征空間投影到高維中,從而在高維特征空間中實(shí)現(xiàn)線性可分[7]。在分類問題上,它通過尋求將特征空間的最優(yōu)超平面來將其一分為二。本文隨機(jī)選取70%的樣本數(shù)據(jù)擬合支持向量分類器,并且基于線性核函數(shù)和非線性核函數(shù)分別找出特征空間的最優(yōu)超平面,建立最優(yōu)支持向量分類器并使用剩余30%的樣本進(jìn)行交叉驗(yàn)證。
表3 Kruskal-Wallis(H檢驗(yàn))
表4 主成分分析結(jié)果
表5 5個主成分對應(yīng)的特征向量
首先將區(qū)分上市公司是否被ST的5個主成分作為支持向量機(jī)分類器的預(yù)測變量,設(shè)定觀測樣為[ai,yi](i=1,2,…,378),其中ai∈R5,yi=1,為無退市風(fēng)險,yi=0有退市風(fēng)險,即公司股票被處以退市風(fēng)險警示的企業(yè)。我們將觀測樣本的70%用作訓(xùn)練集,剩余樣本用作測試集。擬合支持向量分類器就是要找一個最優(yōu)分類面(最優(yōu)超平面)(ω*x)+b=0,其中x=[x1,x2,x3,x4,x5]T,ω∈R5,b∈R,ω,b待定,滿足如下條件:
即有yi[(ω*ai)-b]≥1,i=1,2,…,378,其中,滿足方程(ω*ai)+b±1的樣本為支持向量。要使兩類總體到分類面的距離最大,則有
基于此建立SVM預(yù)測模型:
這是一個凸線性規(guī)劃問題,可以求得最優(yōu)值對應(yīng)的ω*,b*,得到分類函數(shù)
引入線性核函數(shù)(ai*x)得到最終的分類函數(shù)表達(dá)式如下:
實(shí)際上,非線性核函數(shù)可以將原樣本空間線性不可分的向量轉(zhuǎn)化到高維特征空間中線性可分的向量,所以將線性核函數(shù)(ai*x)換成一般的核函數(shù)K(x,y),可得到一般分類函數(shù)的表達(dá)式為
1.數(shù)據(jù)預(yù)處理
第i(i=1,2,…,378)個樣本的第j(j=1,2,3,4,5)個主成分的取值記為aij。對于給定的378個訓(xùn)練樣本,首先計算它們的均值向量μ=[μ1,μ2,μ3,μ4,μ5]和標(biāo)準(zhǔn)差向量σ=[σ1,σ2,σ3,σ4,σ5],對于所有樣本點(diǎn)數(shù)據(jù)利用如下公式進(jìn)行標(biāo)準(zhǔn)化處理:
對應(yīng)地,稱
2.核函數(shù)的選取
核函數(shù)(kernel)的一般形式為K(x,y)=<f(x),f(y)>,其中x,y為n維,f為n維到m維的映射,<f(x),f(y)>表示內(nèi)積在用SVM處理問題時,如果數(shù)據(jù)線性不可分,希望通過將輸入空間內(nèi)線性不可分的數(shù)據(jù)映射到一個高維的特征空間內(nèi),使數(shù)據(jù)在特征空間內(nèi)是線性可分的,這個映射記作。接下來的優(yōu)化問題中就會有內(nèi)積,這個內(nèi)積的計算維度會非常大,而核函數(shù)可以幫我們很快地做一些計算,否則需要在高維空間中進(jìn)行計算。常用的核函數(shù)有線性核函數(shù)(Linear kernel)和非線性核函數(shù)(Radial kernel)接下來便選取這兩種核函數(shù)擬合支持向量分類器[8]。
首先選取線性核函數(shù)(Linear kernel)擬合支持向量分類器,設(shè)置一系列cost值,cost值的取值范圍為[0.01,0.1,0.5,1,5,10],通過交叉驗(yàn)證法選擇最優(yōu)的cost。結(jié)果顯示,在cost=1時,交叉驗(yàn)證的錯誤率最低,模型的擬合效果最佳。同時使用命令plot畫出一對變量的決策邊界,如圖1所示。
圖1 線性支持向量分類器
主成分CR與主成分OM分別反映了上市公司的盈利能力和每股指標(biāo),此時使用最優(yōu)線性模型對測試集進(jìn)行測試,結(jié)果顯示,分類錯誤率為0.1348。本文預(yù)警指標(biāo)體系選取的4項(xiàng)每股指標(biāo)均為正向指標(biāo),當(dāng)每股指標(biāo)的標(biāo)準(zhǔn)化數(shù)值越大,每股指標(biāo)的實(shí)際數(shù)值也就越大,從而上市公司的盈利能力也就越好,面臨退市風(fēng)險警示的概率可能性就越低。圖二的最優(yōu)超平面恰好將數(shù)據(jù)集分為左下角和右上角兩個部分,與實(shí)際情況相吻合,右上角的上市公司很少被除以退市風(fēng)險警示,而左下角的上市公司大部分都被處以了退市風(fēng)險警示。
接下來選取非線性核函數(shù)(Non-linear kernel)擬合支持向量分類器,設(shè)置一系列cost值和gamma值,同樣通過交叉驗(yàn)證法選擇最合適的cost,進(jìn)而用最優(yōu)模型對測試集進(jìn)行預(yù)測。結(jié)果顯示,在cost=10,gamma=2時,交叉驗(yàn)證的錯誤率最低,模型的擬合效果最佳。同時可以使用命令plot畫出一對變量的決策邊界,如圖2所示。
圖2 非線性支持向量分類器
此時使用最優(yōu)模型對測試集進(jìn)行測試,結(jié)果顯示,分類錯誤率為0.115,0,非線性核函數(shù)擬合支持向量分類器的預(yù)測效果要優(yōu)于線性核函數(shù)擬合的支持向量分類器,正確分類率達(dá)到了89.50%。這是因?yàn)楦鱾€經(jīng)濟(jì)指標(biāo)之間不是單純的線性關(guān)系,還受到邊際遞減效應(yīng)的影響,隨著每股指標(biāo)按單位數(shù)值逐漸增加時,盈利能力的增加會越來越小。因此,非線性支持向量分類器的最優(yōu)超平面呈單支雙曲線狀,預(yù)測效果相較于線性支持向量分類器會更好。
圖3 為Logit模型、線性判別分析模型(LDA)、二次判別分析模型(QDA)和樸素貝葉斯模型(Naive Bayes)的ROC曲線圖[9]。通過對比圖1和圖2可知,非線性支持向量機(jī)預(yù)測模型的分類效果明顯優(yōu)于傳統(tǒng)的Logistic回歸模型,對上市公司退市風(fēng)險預(yù)警的準(zhǔn)確性提高了5.29%。
圖3 4種模型的ROC曲線
上市公司的資產(chǎn)質(zhì)量是衡量一個企業(yè)能否穩(wěn)定運(yùn)營發(fā)展的重要指標(biāo),良好的資產(chǎn)質(zhì)量可以使企業(yè)保持生機(jī)活力并擁有廣闊的發(fā)展空間,在市場調(diào)研的基礎(chǔ)上,企業(yè)有針對性地根據(jù)客戶群體的消費(fèi)習(xí)慣,提供更優(yōu)質(zhì)的售后服務(wù)。與此同時,加強(qiáng)企業(yè)的成本管理,有利于提高上市公司產(chǎn)品的市場占有率和企業(yè)利潤率,保證資金的良性循環(huán),提高企業(yè)的抗風(fēng)險能力。
對上市公司內(nèi)部控制的管理,首要任務(wù)是為全體員工樹立退市風(fēng)險防范意識,形成退市風(fēng)險管理文化。同時積極執(zhí)行全面預(yù)算控制,將企業(yè)經(jīng)營收益最大化作為發(fā)展的戰(zhàn)略目標(biāo),調(diào)整資源統(tǒng)籌全局對企業(yè)的各項(xiàng)經(jīng)營活動預(yù)算進(jìn)行成本-效益分析管理,提高資金的利用率以及時間價值,幫助上市公司管理層掌控企業(yè)發(fā)展動向,真正實(shí)現(xiàn)經(jīng)營收益最大化和有效控制退市風(fēng)險的目標(biāo)。
退市風(fēng)險預(yù)警是一種運(yùn)用科學(xué)統(tǒng)計方法,幫助企業(yè)管理者了解內(nèi)部經(jīng)營狀況和風(fēng)險狀態(tài)的管理手段。通過對企業(yè)內(nèi)部財務(wù)數(shù)據(jù)收集整理,對其退市風(fēng)險狀態(tài)進(jìn)行實(shí)時監(jiān)督,便于管理層采取針對性的風(fēng)險控制措施。本文通過構(gòu)建非線性支持向量機(jī)模型和Logistic回歸模型對我國上市公司的退市風(fēng)險進(jìn)行實(shí)證分析,即使在不考慮多元正態(tài)性檢驗(yàn)的前提下,非線性支持向量機(jī)模型的性能仍然普遍優(yōu)于傳統(tǒng)的Logistic回歸分析[10]??傊?,合理的退市風(fēng)險預(yù)警具有較強(qiáng)的監(jiān)督作用,有助于企業(yè)找到退市風(fēng)險發(fā)生的根本原因,從而采取相應(yīng)的對策和措施,在風(fēng)險進(jìn)一步惡化之前及時解決問題。