王威 劉芬
【關(guān)鍵詞】 模糊間隔孿生支持向量機(jī); 財(cái)務(wù)危機(jī); 預(yù)警模型
【中圖分類號(hào)】 F275? 【文獻(xiàn)標(biāo)識(shí)碼】 A? 【文章編號(hào)】 1004-5937(2021)22-0079-08
一、引言
財(cái)務(wù)危機(jī)是指企業(yè)無力償還到期債務(wù)或支付經(jīng)營費(fèi)用而面臨破產(chǎn)的一種現(xiàn)象[ 1 ]。面對(duì)日益復(fù)雜的市場(chǎng)環(huán)境,許多看似財(cái)務(wù)健康的企業(yè)往往會(huì)突然陷入困境,這一方面嚴(yán)重影響了企業(yè)的正常經(jīng)營,另一方面也給企業(yè)股東和利益相關(guān)者帶來極大的損失。因此,在財(cái)務(wù)危機(jī)發(fā)生之前發(fā)出預(yù)警,提醒企業(yè)規(guī)避可能發(fā)生的財(cái)務(wù)風(fēng)險(xiǎn),對(duì)企業(yè)經(jīng)營管理來說具有重要的意義。但從我國證券市場(chǎng)的歷史來看,在財(cái)務(wù)危機(jī)出現(xiàn)之前,一般很難從企業(yè)經(jīng)營過程中發(fā)現(xiàn)直接的證據(jù)。如何根據(jù)企業(yè)的內(nèi)外部影響因素合理構(gòu)建預(yù)警模型,有效地發(fā)現(xiàn)和防范可能出現(xiàn)的企業(yè)財(cái)務(wù)危機(jī)成為學(xué)術(shù)界研究的一個(gè)熱點(diǎn)問題。
從本質(zhì)上來說,企業(yè)財(cái)務(wù)危機(jī)預(yù)警屬于典型的二分類問題,現(xiàn)有的預(yù)警方法主要包括兩大門類:統(tǒng)計(jì)學(xué)分析方法和機(jī)器學(xué)習(xí)方法。傳統(tǒng)的財(cái)務(wù)危機(jī)預(yù)警模型主要是基于統(tǒng)計(jì)學(xué)分析方法,其中應(yīng)用較為廣泛的是Logistic模型。其主要優(yōu)點(diǎn)是計(jì)算比較簡(jiǎn)單,同時(shí)模型具有較好的解釋性。Ohlson[ 2 ]使用Logistic模型對(duì)企業(yè)財(cái)務(wù)危機(jī)預(yù)警進(jìn)行研究,證明了其有效性;方匡南等[ 3 ]考慮企業(yè)財(cái)務(wù)指標(biāo)間的網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系,構(gòu)建了基于網(wǎng)絡(luò)結(jié)構(gòu)的Logistic模型;肖振紅和楊華松[ 4 ]針對(duì)財(cái)務(wù)危機(jī)預(yù)警模型中指標(biāo)信息冗余及Logistic模型預(yù)測(cè)精度問題,提出了基于L1/2正則化Logistic回歸的上市企業(yè)財(cái)務(wù)危機(jī)預(yù)警模型;楊貴軍等[ 5 ]針對(duì)財(cái)務(wù)數(shù)據(jù)質(zhì)量檢測(cè)問題,提出基于Benford-Logistic企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型等。但Logistic模型在企業(yè)財(cái)務(wù)危機(jī)預(yù)警中仍存在一些難以克服的缺陷:一是基于線性模型,難以處理財(cái)務(wù)危機(jī)預(yù)警這種非線性問題;二是對(duì)樣本數(shù)量要求比較高,實(shí)踐中難以獲取大量合適的樣本來滿足模型要求;三是難以解決解釋變量的多重共線性對(duì)預(yù)警性能的影響等。這都嚴(yán)重限制了Logistic模型在財(cái)務(wù)危機(jī)預(yù)警中的應(yīng)用范圍。
隨著人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)方法在財(cái)務(wù)危機(jī)預(yù)警領(lǐng)域獲得了迅速發(fā)展。其中最具代表性的是支持向量機(jī)(Support Vector Machine,SVM),主要思想是VC維和結(jié)構(gòu)風(fēng)險(xiǎn)最小化。SVM在處理財(cái)務(wù)危機(jī)預(yù)警這種小樣本、非線性和高維數(shù)據(jù)分類問題中體現(xiàn)出特有優(yōu)勢(shì)。Shin等[ 6 ]分別使用SVM和神經(jīng)網(wǎng)絡(luò)方法進(jìn)行了財(cái)務(wù)危機(jī)預(yù)警研究,結(jié)果證明對(duì)于此類小樣本問題,SVM有更好的效果;Gestel等[ 7 ]根據(jù)荷蘭企業(yè)的財(cái)務(wù)數(shù)據(jù),使用SVM模型進(jìn)行了財(cái)務(wù)危機(jī)預(yù)警;王妹禧[ 8 ]利用雙正交混合核函數(shù)修正SVM進(jìn)行財(cái)務(wù)危機(jī)預(yù)警;石先兵[ 9 ]綜合主成分分析法與SVM構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型,以滬深A(yù)股主板t-3年的制造業(yè)上市企業(yè)財(cái)務(wù)數(shù)據(jù)為研究樣本展開預(yù)測(cè)等。這些研究都證明SVM在財(cái)務(wù)危機(jī)預(yù)警中的良好效果。然而,SVM在實(shí)際應(yīng)用中也遇到了一些難點(diǎn),首先是樣本的數(shù)據(jù)不平衡問題。財(cái)務(wù)危機(jī)的定義很多,考慮到國內(nèi)上市企業(yè)所處經(jīng)濟(jì)與監(jiān)管的環(huán)境,本文將發(fā)生財(cái)務(wù)危機(jī)的企業(yè)定義為因?yàn)樨?cái)務(wù)狀況和其他財(cái)務(wù)狀況異常被滬深證券交易所進(jìn)行特別處理(Special Treatment,ST)的上市企業(yè),并由此展開研究。根據(jù)中國證監(jiān)會(huì)截至2019年12月的數(shù)據(jù),中國歷年上市企業(yè)ST的比例只占總數(shù)約1%,因此樣本數(shù)據(jù)的類別分布極不均衡。在這種情況下,如使用隨機(jī)抽樣,SVM方法分類的結(jié)果會(huì)偏向多數(shù)類樣本,忽略了更為重要的少數(shù)類樣本。因此,在以往大多數(shù)研究中,通常會(huì)使用一一配對(duì)的非隨機(jī)抽樣解決這個(gè)問題,但這樣又會(huì)高估模型的預(yù)警性能。其次是“異常”樣本的影響。受到人為或市場(chǎng)的影響,財(cái)務(wù)危機(jī)樣本數(shù)據(jù)中會(huì)出現(xiàn)一些無法完全剔除的野值和隨機(jī)噪聲的影響,由于SVM是通過同等對(duì)待所有樣本數(shù)據(jù)來構(gòu)造決策超平面,這些野值和噪聲造成的擬合現(xiàn)象,也會(huì)對(duì)分類的精度和穩(wěn)健性產(chǎn)生較大影響。
隨著科學(xué)技術(shù)的進(jìn)步,各種SVM的改進(jìn)方法紛紛被提出。Jayadeva等[ 10 ]提出了孿生支持向量機(jī)(Twin Support Vector Machine,TSVM),其將原有的SVM問題轉(zhuǎn)化為兩個(gè)較小的凸規(guī)劃問題,構(gòu)建兩個(gè)相互不平行的超平面,有效地減少了計(jì)算的復(fù)雜度。在此基礎(chǔ)上,為減弱噪聲數(shù)據(jù)的影響,Gao等[ 11 ]將模糊隸屬度的概念與孿生支持向量機(jī)相結(jié)合,并在其中引入間隔以使結(jié)構(gòu)風(fēng)險(xiǎn)最小化,提出了模糊間隔孿生支持向量機(jī)(Fuzzy Margin Twin Support Vector Machine,F(xiàn)MTSVM),為SVM的應(yīng)用提供了新工具。
因此,為解決SVM在財(cái)務(wù)危機(jī)預(yù)警應(yīng)用中存在的問題,本文提出將FMTSVM引入企業(yè)財(cái)務(wù)危機(jī)預(yù)警領(lǐng)域展開研究。目的主要包括三點(diǎn):一是利用其雙決策超平面的特性,通過對(duì)不同類型樣本數(shù)據(jù)設(shè)置不同的懲罰系數(shù)來減少財(cái)務(wù)危機(jī)預(yù)警中樣本數(shù)據(jù)不平衡對(duì)預(yù)警精度造成的影響;二是根據(jù)樣本數(shù)據(jù)特征,考慮不同類型中各樣本點(diǎn)作用的差異,通過給單個(gè)樣本設(shè)置不同的模糊隸屬度來消除財(cái)務(wù)危機(jī)預(yù)警中野值和噪聲等異常樣本數(shù)據(jù)對(duì)預(yù)警結(jié)果的影響;三是通過把原有SVM預(yù)警模型中的二次規(guī)劃問題轉(zhuǎn)換為兩個(gè)凸規(guī)劃問題進(jìn)行求解,提高預(yù)警模型的學(xué)習(xí)效率,有效地縮短分類時(shí)間。從已掌握研究文獻(xiàn)來看,現(xiàn)有對(duì)FMTSVM模型的研究還是以對(duì)算法的改進(jìn)和優(yōu)化為主,未發(fā)現(xiàn)有文獻(xiàn)運(yùn)用該模型對(duì)企業(yè)財(cái)務(wù)危機(jī)預(yù)警問題展開研究,本文的研究具有一定的創(chuàng)新性。
二、模型與方法
(一)FMTSVM模型
給定(xj,yj)為財(cái)務(wù)危機(jī)預(yù)警樣本數(shù)據(jù)的集合,j=1,…,m。其中yj∈{-1,1}為預(yù)警變量,用來表示企業(yè)在短時(shí)間(1—3年)內(nèi)發(fā)生財(cái)務(wù)危機(jī)的情況;xj∈Rn為解釋變量,用來表示企業(yè)相應(yīng)的財(cái)務(wù)和非財(cái)務(wù)指標(biāo);m個(gè)樣本數(shù)據(jù)中包含m1個(gè)yj=1的正樣本(財(cái)務(wù)危機(jī)企業(yè))和m2個(gè)yj=-1的負(fù)樣本(正常企業(yè))。由此,正樣本數(shù)據(jù)點(diǎn)的集合可用矩陣A∈Rm ×n來表示,負(fù)樣本數(shù)據(jù)點(diǎn)的集合可用矩陣B∈Rm ×n來表示。同時(shí)在樣本集中引入一個(gè)模糊變量sj,0