王曉華 馬悅 邢東森
摘? 要:醫(yī)藥制造業(yè)是國家重點(diǎn)產(chǎn)業(yè)之一,具有高投入、高產(chǎn)出、高風(fēng)險(xiǎn)的特點(diǎn)。2019年新型冠狀病毒(2019-nCoV)疫情暴發(fā),醫(yī)藥制造業(yè)迎來了加速發(fā)展的良好契機(jī),同時(shí)更容易誘發(fā)財(cái)務(wù)危機(jī)。規(guī)避財(cái)務(wù)風(fēng)險(xiǎn),促進(jìn)行業(yè)健康發(fā)展至關(guān)重要。文章構(gòu)建了基于主成分分析法和卷積神經(jīng)網(wǎng)絡(luò)(CNN)相結(jié)合的財(cái)務(wù)危機(jī)預(yù)警模型,對(duì)73家醫(yī)藥公司2015—2020年的財(cái)務(wù)指標(biāo)進(jìn)行分析,以期為醫(yī)藥行業(yè)的發(fā)展提供借鑒,合理預(yù)測財(cái)務(wù)危機(jī)。這對(duì)促進(jìn)醫(yī)藥行業(yè)健康發(fā)展,保障民生安全意義重大。
關(guān)鍵詞:醫(yī)藥制造企業(yè);卷積神經(jīng)網(wǎng)絡(luò);財(cái)務(wù)危機(jī)預(yù)警;主成分分析法
中圖分類號(hào):TP39;F275? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2023)04-0014-04
Research on Financial Crisis Warning of Pharmaceutical Manufacturing Industry Based on CNN
WANG Xiaohua, MA Yue, XING Dongsen
(School of Management Engineering and Business, Hebei University of Engineering, Handan? 056038, China)
Abstract: Pharmaceutical manufacturing industry is one of the key industries in the country with the characteristics of high input, high output and high risk. The outbreak of the new Corona Virus in 2019 (2019-nCoV) has ushered in a good opportunity for the pharmaceutical manufacturing industry to accelerate its development. At the same time, it is more likely to induce financial crisis. It is crucial to avoid financial risks and promote the healthy development of the industry. In this paper, a financial crisis warning model based on the combination of Principal Component Analysis and Convolutional Neural Network (CNN) is constructed, and the financial indicators of 73 pharmaceutical companies from 2015 to 2020 are analyzed, so as to provide reference for the development of the pharmaceutical industry and reasonably predict the financial crisis. This is of great significance to promoting the healthy development of the pharmaceutical industry and ensuring the safety of people's livelihood.
Keywords: pharmaceutical manufacturing enterprise; CNN; financial crisis warning; Principal Component Analysis
0? 引? 言
醫(yī)藥行業(yè)與人民的生活息息相關(guān),在國民經(jīng)濟(jì)中有著至關(guān)重要的地位。隨著國民需求的不斷增強(qiáng)與全球醫(yī)藥行業(yè)市場擴(kuò)張,以及疫情暴發(fā)以來國家在政策上對(duì)健康產(chǎn)業(yè)的大力支持,與人民對(duì)健康關(guān)注度的不斷提高,醫(yī)藥行業(yè)已逐漸成為增長最快的行業(yè)之一[1],2020年中國醫(yī)藥制造業(yè)共有規(guī)模以上企業(yè)7 665個(gè),較2019年增加了283個(gè),同比增加3.8%。2020年,醫(yī)藥制造業(yè)的營業(yè)收入達(dá)24 857.3億元,較2019年增加了973.14億元,同比增長4.07%。2020年以來,新冠疫情在全球范圍內(nèi)爆發(fā)并蔓延直至今日,這種全球性的傳播引發(fā)了各界對(duì)醫(yī)藥行業(yè)的關(guān)注,同時(shí)使行業(yè)面臨更大的競爭壓力。醫(yī)藥制造業(yè)是典型的“三高”行業(yè),行業(yè)財(cái)務(wù)風(fēng)險(xiǎn)遠(yuǎn)高于平均水平,而且我國醫(yī)藥制造行業(yè)處于向高質(zhì)量轉(zhuǎn)型階段,國際同質(zhì)化競爭加劇、創(chuàng)新研發(fā)能力嚴(yán)重不足等使無數(shù)醫(yī)藥制造企業(yè)更容易遭受財(cái)務(wù)危機(jī),利用CNN對(duì)醫(yī)藥制造業(yè)進(jìn)行財(cái)務(wù)危機(jī)預(yù)警,有利于提高企業(yè)資金利用率,對(duì)防范和化解制藥企業(yè)財(cái)務(wù)風(fēng)險(xiǎn),保持企業(yè)健康、穩(wěn)定和快速發(fā)展,具有極為重要的現(xiàn)實(shí)意義。
自20世紀(jì)30年代,學(xué)者們主要采用趨勢(shì)分析法進(jìn)行財(cái)務(wù)危機(jī)預(yù)警,即研究發(fā)生財(cái)務(wù)困境的公司和財(cái)務(wù)狀況健康的公司關(guān)鍵財(cái)務(wù)指標(biāo)的變化趨勢(shì)[2]。之后漸漸發(fā)展出包括單變量分析方法[3]和多變量分析方法等的判別分析模型。但不管是Logistic模型[4]還是多元判別分析[5]等統(tǒng)計(jì)學(xué)方法,其識(shí)別和評(píng)價(jià)效果受統(tǒng)計(jì)假設(shè)的限制;層次分析這類的風(fēng)險(xiǎn)評(píng)價(jià)方法效果會(huì)受到主觀賦權(quán)法的影響;TOPSIS[6]等具有客觀賦權(quán)的特點(diǎn),在變量指標(biāo)少的時(shí)候有較好的評(píng)價(jià)效果;上述所提到的模型與方法均無法有效的處理大數(shù)據(jù)下的海量財(cái)務(wù)數(shù)據(jù),并且大多數(shù)僅能用于短期預(yù)測,無法滿足醫(yī)藥制造上市公司長期持續(xù)發(fā)展需求。因此,針對(duì)醫(yī)藥制造業(yè)高投入、高產(chǎn)出、高風(fēng)險(xiǎn)、高技術(shù)密集型的特點(diǎn),本文提出構(gòu)建基于CNN(卷積神經(jīng)網(wǎng)絡(luò))在處理大數(shù)據(jù)尤其是非線性數(shù)據(jù)上具有很高的準(zhǔn)確率,利用CNN可以快速識(shí)別數(shù)據(jù)并從中提取特征?;贑NN優(yōu)秀的特征識(shí)別和評(píng)價(jià)分類性能,并結(jié)合主成分分析法對(duì)指標(biāo)進(jìn)行選取,以減少CNN模型的輸入?yún)?shù),降低輸入因子間的相關(guān)性。探索在財(cái)務(wù)危機(jī)管理領(lǐng)域的運(yùn)用,對(duì)彌補(bǔ)傳統(tǒng)方法的缺陷,提高財(cái)務(wù)風(fēng)險(xiǎn)管理的效率。
本文的目的是構(gòu)建基于CNN的醫(yī)藥制造業(yè)財(cái)務(wù)危機(jī)預(yù)警模型,結(jié)合主成分分析法提高模型準(zhǔn)確率,以期能幫助醫(yī)藥制造業(yè)企業(yè)合理預(yù)測財(cái)務(wù)危機(jī),制定相應(yīng)對(duì)策,規(guī)避財(cái)務(wù)危機(jī),并為CNN在財(cái)務(wù)危機(jī)預(yù)警方面的應(yīng)用提供新的思路。
1? 樣本及指標(biāo)的選取
本研究選取了73家2015—2020年中國滬深A(yù)股醫(yī)藥行業(yè)上市公司,以企業(yè)是否被ST作為劃分企業(yè)是否發(fā)展財(cái)務(wù)危機(jī)的標(biāo)準(zhǔn),將企業(yè)連續(xù)兩年凈利潤小于0而被實(shí)施ST的企業(yè)視為財(cái)務(wù)危機(jī)企業(yè),將非ST的企業(yè)視為財(cái)務(wù)健康企業(yè)[7]。
本研究采用企業(yè)(t-2)年的財(cái)務(wù)數(shù)據(jù)作為樣本預(yù)測企業(yè)是否在第t年會(huì)被ST。樣本具體包括2015—2020年被ST的10家企業(yè),并按照1:6的比率,選取了63家資產(chǎn)規(guī)模與ST企業(yè)相似的非ST企業(yè)作為財(cái)務(wù)健康的對(duì)比樣本,合計(jì)為73家企業(yè)數(shù)據(jù)作為樣本,并安裝1:5的比例提取測試集與訓(xùn)練集。在訓(xùn)練中,將判斷為ST的企業(yè)輸出的結(jié)果記為0,非ST企業(yè)記為1,最后將結(jié)果與企業(yè)實(shí)際數(shù)據(jù)進(jìn)行對(duì)比,計(jì)算模型預(yù)測準(zhǔn)確率。
本研究的數(shù)據(jù)來源于CSMAR數(shù)據(jù)庫中的“財(cái)務(wù)指標(biāo)分析版塊”。結(jié)合其他學(xué)者研究成果的基礎(chǔ)上,進(jìn)行指標(biāo)的選取。最終確定6個(gè)一級(jí)財(cái)務(wù)指標(biāo)為:盈利能力、營運(yùn)能力、發(fā)展能力、償債能力、現(xiàn)金流量狀況、比率結(jié)構(gòu)。并在此基礎(chǔ)上,選取33個(gè)二級(jí)財(cái)務(wù)指標(biāo),如表1所示。
2? 基于主成分分析對(duì)指標(biāo)體系的優(yōu)化
考慮到選取出來的33個(gè)二級(jí)財(cái)務(wù)指標(biāo)之間或許會(huì)有著一定的相關(guān)性,為了提高財(cái)務(wù)預(yù)警模型中指標(biāo)的代表性,運(yùn)用主成分分析法剔除交叉負(fù)載較高的因子,篩選出其中代表性較強(qiáng)的主成分指標(biāo)。
如表2所示。KMO統(tǒng)計(jì)量為0.624,大于0.5,Bartlett球形度檢驗(yàn)的顯著性小于0.05,結(jié)果表明各因子之間存在著較強(qiáng)的相關(guān)性,可以進(jìn)行后續(xù)主成分分析。
運(yùn)用SPSS軟件對(duì)上述73家醫(yī)藥制造上市公司的33個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行主成分分析,將存在較高相關(guān)性的因子剔除,篩選出具有代表性的主成分因子,從而對(duì)數(shù)據(jù)進(jìn)行降維和簡化處理[8]。經(jīng)過第一輪主成分分析,根據(jù)旋轉(zhuǎn)后的結(jié)果反映交叉負(fù)載較高的因子為F6、F7、F12、F13、F30、F31,需要剔除上述六個(gè)因子后進(jìn)行第二輪主成分分析。由第二輪主成分分析法旋轉(zhuǎn)后的成分矩陣可知,F(xiàn)27因子交叉負(fù)載較高,仍需要剔除F27因子后進(jìn)行第三輪主成分分析。
因子分析中,對(duì)變量的貢獻(xiàn)率達(dá)到70%即可作為主成分因子。本次輸出結(jié)果中,8個(gè)主成分因子的初始特征值大于1,且累計(jì)特征值達(dá)到89.968%,可以將前8位因子作為主成分。
由表4可看出8個(gè)中公因子各不相關(guān),主成分X1由F19、F20、F21、F23、F24、F25、F26解釋,主成分X2由F10、F15、F22、F32解釋。主成分X3由F1、F2、F3解釋,主成分X4由F4、F5、F18解釋,主成分X5由F11、F29、F33解釋,主成分X6由F16、F17解釋,主成分X7由F8、F14解釋,主成分X8由F9、F28解釋,通過得分系數(shù)矩陣可得出X1~X8的表達(dá)式為
X1=-0.015F1-0.009F2-0.013F3+0.043F4+0.043F5+
0.01F8-0.061F9-0.021F10+0.017F11-0.003F14+0.023F15-0.066F16-0.037F17+0.028F18+0.167F19+0.161F20+0.17F21+
0.017F22+0.104F23+0.163F24+0.152F25+0.172F26+0.034F28-0.017F29+0.065F32-0.038F33
X2=-0.012F1-0.016F2-0.037F3+0.004F4+0.01F5-0.053F8-0.016F9+0.238F10+0.036F11-0.045F14-0.285F15+0.016F16-0.017F17+0.019F18-0.027F19-0.033F20-0.048F21+0.288F22-0.013F23-0.006F24+0.005F25-0.058F26+0.011F28-0.017F29-0.342F32-0.028F23
X3=0.34F1+0.343F2+0.353F3-0.09F4+0.08F5+0.028F8+
0.075F9-0.008F10-0.014F11+0.001F14+0.022F15-0.009F16+
0.042F17+0.104F18+0.009F19+0.019F20-0.018F21-0.014F22-0.066F23-0.023F24-0.045F25+0.049F26+0.006F28+0.037F29+
0.03F32+0.046F33
X4=0.069F1+0.078F2+0.096F3+0.27F4+0.385F5-0.035F8+0.035F9-0.103F10+0.135F11-0.02F14-0.023F15-0.034F16+0.012F17+0.373F18+0.061F19+0.036F20+0.007F21+
0.057F22-0.119F23+0.04F24+0.019F25+0.108F26+0.021F28-0.049F29-0.03F32-0.034F33
X5=0.022F1+0.027F2+0.036F3+0.02F4+0.003F5-0.03F8+0.054F9-0.057F10+0.32F11+0.006F14-0.008F15-0.017F16+0.02F17-0.024F18+0.003F19-0.001F20-0.01F21+0.008F22-0.022F23+0F24-0.022F25+0.007F26-0.065F28+0.411F29-0.01F32+0.432F33
X6=0.02F1+0.007F2-0.019F3-0.059F4-0.061F5-0.16F8-
0.124F9+0.094F10-0.053F11+0.114F14+0.19F15+0.57F16+
0.371F17+0.073F18-0.031F19-0.026F20-0.101F21+0.042F22+
0.012F23-0.027F24-0.003F25-0.158F26+0.02F28-0.03F29-0.062F32+0.03F33
X7=0.035F1+0.029F2+0.041F3-0.147F4-0.007F5+0.577F8+0.056F9-0.02F10-0.146F11+0.384F14-0.048F15-0.154F16+0.221F17+0.028F18+0.009F19+0.021F20+0.058F21-0.121F22-0.08F23+0.002F24-0.077F25+0.058F26-0.135F28+0.024F29+0.116F32+0.061F33
X8=0.025F1+0.035F2+0.084F3+0.045F4-0.059F5-0.156F8+0.497F9-0.005F10+0.047F11+0.148F14+0.003F15-0.106F16+0.065F17+0.095F18-0.051F19-0.051F20-0.013F21-
0.014F22+0.15F23-0.113F24+0.053F25+0.02F26+0.554F28-0.019F29-0.003F32-0.063F33
3? 構(gòu)建財(cái)務(wù)預(yù)警模型
3.1? 卷積神經(jīng)網(wǎng)絡(luò)模型的生成
CNN(卷積神經(jīng)網(wǎng)絡(luò))相較于早期的BP神經(jīng)網(wǎng)絡(luò),“參數(shù)共享”與“局部感知”是它最重要的兩個(gè)優(yōu)點(diǎn),它的權(quán)值共享這特點(diǎn)能夠極大程度的減少權(quán)值的數(shù)量并將整個(gè)網(wǎng)絡(luò)模型的復(fù)雜程度最小化。卷積神經(jīng)網(wǎng)絡(luò)的成功之處在于利用空間關(guān)系減少需要學(xué)習(xí)的參數(shù)數(shù)目。在一定程度上提高前向算法的性能。在卷積神經(jīng)網(wǎng)絡(luò)中,層級(jí)結(jié)構(gòu)的最低層輸入一般為局部感受區(qū)域,再逐層向下傳送到其他層,每層都有數(shù)字濾波器,通過它們進(jìn)行數(shù)據(jù)特征的提取。假設(shè)第i層為卷積層,第i+1層為子采樣層,則第i層第j個(gè)特征值的計(jì)算公式為[9]:
上面的*號(hào)實(shí)質(zhì)是讓卷積核k在第i-1層所有關(guān)聯(lián)的特征集上做卷積運(yùn)算,然后求和,再加上一個(gè)偏置參數(shù),取sigmoid得到最終激勵(lì)值的過程。b為第i層的預(yù)設(shè)值, 為第j個(gè)輸入樣本所對(duì)應(yīng)的偏向參數(shù)。f ()為sigmoid函數(shù),計(jì)算方式為:
對(duì)訓(xùn)練例(xm, ym),假定輸出為 ,則網(wǎng)絡(luò)在(xm, ym)上的均方誤差為:
3.2? 卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)處理流程圖
卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)處理流程如圖1所示。
4? 結(jié)果與精度驗(yàn)證
本文構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)模型用于訓(xùn)練的數(shù)據(jù)量為584條,訓(xùn)練集與測試集比例為4:1,即訓(xùn)練集467條數(shù)據(jù),測試集117條數(shù)據(jù)。首次構(gòu)建模型卷積層選用卷積核大小為5×5,深度為6。迭代下降速率初始為1,在訓(xùn)練過程中可設(shè)置隨迭代次數(shù)逐漸減少。批處理樣本數(shù)量為2。輸入數(shù)據(jù)矩陣大小為41×710,其中每條數(shù)據(jù)包含33項(xiàng)指標(biāo)數(shù)據(jù)和5項(xiàng)標(biāo)簽數(shù)據(jù)。每次進(jìn)行訓(xùn)練的訓(xùn)練集為隨機(jī)選取467條數(shù)據(jù),余下數(shù)據(jù)作為測試集。
將測試集數(shù)據(jù)輸入模型中,以檢驗(yàn)該CNN模型訓(xùn)練的效果,并對(duì)檢驗(yàn)結(jié)果進(jìn)行測算。檢驗(yàn)結(jié)果如圖2所示,訓(xùn)練后的模型,最終測試結(jié)果模型的損失值最終達(dá)到0.143,模型測試集準(zhǔn)確率達(dá)到100%。
對(duì)于神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,損失值過大會(huì)對(duì)檢測造成影響,過小容易導(dǎo)致過度擬合。該結(jié)果顯示測試集的準(zhǔn)確率相較于訓(xùn)練集上的準(zhǔn)確率有小幅度提升,證明該模型具備較好的泛化能力。輸出結(jié)果代碼為:
Total params:698
Trainable params:698
Non-trainable params:0
Test loss:0.14269129931926727
Test accuracy:1.0
predict_label:[1,1,1,1,1,1,1,1,1,1,1,1,1,0,0]
True_label:[1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,0.0,0.0]
Process finished with exit code 0
5? 結(jié)? 論
本研究通過對(duì)我國滬深A(yù)股醫(yī)藥制造上市公司進(jìn)行財(cái)務(wù)危機(jī)預(yù)測。結(jié)合醫(yī)藥行業(yè)特點(diǎn)對(duì)行業(yè)財(cái)務(wù)指標(biāo)進(jìn)行深度分析,運(yùn)用主成分分析法對(duì)財(cái)務(wù)指標(biāo)進(jìn)行篩選,并輸出對(duì)企業(yè)是否發(fā)生財(cái)務(wù)危機(jī)有顯著影響的指標(biāo)作為主成分因子,完成基于主成分分析法的行業(yè)財(cái)務(wù)危機(jī)預(yù)警指標(biāo)體系的優(yōu)化,然后構(gòu)建基于深度學(xué)習(xí)理論的構(gòu)建基于CNN的醫(yī)藥制造業(yè)財(cái)務(wù)危機(jī)預(yù)警模型,預(yù)測企業(yè)是否存在被ST的風(fēng)險(xiǎn).研究發(fā)現(xiàn),采用主成分法對(duì)企業(yè)預(yù)警數(shù)據(jù)進(jìn)行預(yù)處理可以剔除干擾指標(biāo)信息,大幅度提高模型的訓(xùn)練率.研究建立的模型測試集的準(zhǔn)確度達(dá)到100%,有較高的準(zhǔn)確率,在識(shí)別健康公司與財(cái)務(wù)危機(jī)公司上有較好的效果。且所構(gòu)建的模型能夠幫助醫(yī)藥制造業(yè)企業(yè)合理預(yù)測財(cái)務(wù)危機(jī),規(guī)避財(cái)務(wù)危機(jī),這對(duì)促進(jìn)醫(yī)藥行業(yè)健康發(fā)展,保障民生安全意義重大。
本文構(gòu)建的模型還有很多需要改進(jìn)的地方,比如模型的數(shù)據(jù)量較少,目前只研究了醫(yī)藥制造行業(yè),沒有研究其他行業(yè)的樣本數(shù)據(jù),對(duì)于卷積神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建還可嘗試其他的激活函數(shù)與池化方法。
參考文獻(xiàn):
[1] 曾錚.中國醫(yī)藥產(chǎn)業(yè)發(fā)展概況及其趨勢(shì)研究 [J].經(jīng)濟(jì)研究參考,2014(32):4-38.
[2] 宋歌,馬濤.基于深度學(xué)習(xí)的上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型研究 [J].價(jià)值工程,2019,38(1):53-56.
[3] FITZPATRICK P J. A Comparison of the Ration of Successful Industrial Enterprises with Those of Failed Companies [J].Certified Public Accountant,1932,3:656-662.
[4] 張靜瑜,林娟,王玲.基于Logistic的信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警模型構(gòu)建 [J].財(cái)會(huì)通訊,2017(32):100-104+129.
[5] 馬若微,張微.基于Logistic與Fisher的上市公司財(cái)務(wù)困境判別模型比較研究 [J].北京工商大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2014,29(2):88-95.
[6] 尹夏楠,鮑新中.基于熵權(quán)TOPSIS方法的高新技術(shù)企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)評(píng)價(jià)——以生物制藥行業(yè)為例 [J].會(huì)計(jì)之友,2017(4):70-74.
[7] 譚媛元,陳建英,孫健.基于CNN的上市公司財(cái)務(wù)危機(jī)預(yù)警研究 [J].西南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2021,46(5):73-80.
[8] 程寅驍.基于因子分析法的城投公司財(cái)務(wù)預(yù)警體系研究 [J].全國流通經(jīng)濟(jì),2021(3):60-62.
[9] 周志華.機(jī)器學(xué)習(xí) [M].北京:清華大學(xué)出版社,2016.
作者簡介:王曉華(1974—),女,漢族,河北保定人,副教授,碩士學(xué)位,研究方向:會(huì)計(jì)理論與實(shí)務(wù)、財(cái)務(wù)分析;馬悅(1996—),女,漢族,湖北潛江人,碩士研究生在讀,研究方向:財(cái)務(wù)危機(jī)預(yù)警;邢東森(1997—),男,漢族,河北石家莊人,碩士研究生在讀,研究方向:財(cái)務(wù)管理、財(cái)務(wù)預(yù)警分析。
收稿日期:2022-10-11
基金項(xiàng)目:2022年度河北省社會(huì)科學(xué)發(fā)展研究課題(20220202106)