譚明亮
(川北醫(yī)學院,四川 南充 637100)
大數(shù)據(jù)、云計算、數(shù)據(jù)挖掘、機器學習、語義分析、深度學習和人工智能等現(xiàn)代化信息技術(shù)手段應用于金融領(lǐng)域,對于驅(qū)動金融創(chuàng)新發(fā)展、推動金融轉(zhuǎn)型升級、化解系統(tǒng)性金融風險、創(chuàng)新金融產(chǎn)品和服務、優(yōu)化業(yè)務流程有著非常重要的意義,融入前沿科技手段的金融科技(Fintech)和監(jiān)管科技(RegTech)已成為當前學術(shù)界和產(chǎn)業(yè)界所共同關(guān)注的熱點。當前國內(nèi)外的研究者們將支持向量機、人工神經(jīng)網(wǎng)絡、自組織映射網(wǎng)絡和隨機森林等多種機器學習與人工智能技術(shù)運用于上市公司的破產(chǎn)預測、財務危機預測、信用風險預測等上市公司風險識別場景中,并在算法模型的準確率上取得了不錯的效果。近年來,自然語言處理和文本分析技術(shù)的快速發(fā)展也為非結(jié)構(gòu)化的金融文本數(shù)據(jù)的語義理解和挖掘創(chuàng)造了條件。HDFS、MapReduce、Spark和Hadoop等大數(shù)據(jù)的存儲、計算、管理技術(shù),以及分布式計算技術(shù)、虛擬化技術(shù)、集群技術(shù)和云平臺管理等云計算技術(shù)的基本成熟也為海量金融數(shù)據(jù)的分析和處理奠定了基礎(chǔ)。決策支持系統(tǒng)技術(shù)逐步走向成熟,并被成功地應用于醫(yī)療輔助診斷、機器故障檢測以及突發(fā)事件應急管理等領(lǐng)域中。
作為新一輪產(chǎn)業(yè)變革和科技革命核心驅(qū)動力的機器學習、數(shù)據(jù)挖掘和人工智能技術(shù)的研究也取得了巨大進展,有著非常廣闊的應用前景,推動著經(jīng)濟社會各領(lǐng)域向智能化加速躍升,這也為大數(shù)據(jù)環(huán)境下的多源異構(gòu)的金融數(shù)據(jù)資源的分析和挖掘提供了堅實的技術(shù)基礎(chǔ)。大數(shù)據(jù)時代,如何運用數(shù)據(jù)挖掘、機器學習、深度學習、自然語言處理、文本分析、知識組織、決策支持系統(tǒng)和人工智能等技術(shù)來對海量多源異構(gòu)的金融數(shù)據(jù)資源進行分析挖掘,及時有效地識別上市公司的風險,并以多種知識服務形式為投資者、債權(quán)人、銀行、基金管理公司、證券公司和政府監(jiān)管部門等主體的管理決策提供智能化的決策支持,成了計算機科學、管理科學與工程、金融學、情報學等學科的研究者所共同面臨的重要問題。
綜合國內(nèi)外的專家學者、政府部門和相關(guān)組織機構(gòu)對風險、企業(yè)風險的相關(guān)定義,文章將上市公司風險定義為:上市公司在生產(chǎn)經(jīng)營的過程中,由于各種不確定因素和發(fā)生不利事件,從而有遭受損失的可能性。作為一個特殊的企業(yè)群體,上市公司除了面臨著一般企業(yè)所面臨的破產(chǎn)風險、信用風險、財務風險、政策風險、運營風險、管理風險、市場風險、人力資源風險、技術(shù)風險和戰(zhàn)略風險等共性風險以外,還面臨著強制退市風險、信息披露違規(guī)風險和股價暴跌風險等上市公司所特有的風險。與此同時,不同行業(yè)、不同規(guī)模、不同商業(yè)模式、不同業(yè)務性質(zhì)、不同發(fā)展階段、不同股權(quán)結(jié)構(gòu)、不同財務狀況和不同經(jīng)營管理水平的上市公司所面臨的風險也不盡相同。
傳統(tǒng)的上市公司風險識別主要是通過領(lǐng)域?qū)<液颓閳蠓治鋈藛T運用專家分析法、財務比率分析法、SWOT分析法、KMV模型等方法來識別和分析上市公司的風險。專家分析法主要根據(jù)專家的智慧和個人經(jīng)驗來識別上市公司的風險,例如5C專家分析法通過對目標對象的道德品質(zhì)(character)、償付能力(capacity)、資本實力(capital)、擔保抵押(collateral)和經(jīng)營環(huán)境條件(condition)五個方面進行綜合分析來識別其信用風險。當前專家分析法依然是標普、穆迪等國際信用評級機構(gòu)所使用的主流方法之一。財務比率分析法主要根據(jù)上市公司財務報表(資產(chǎn)負債表、利潤表和現(xiàn)金流量表等)中的財務數(shù)據(jù)來計算相應的財務比值,從而從財務角度實現(xiàn)上市公司風險識別,典型的財務比率分析法包括杜邦財務分析體系和沃爾比重評分法。SWOT分析法通過對上市公司的優(yōu)勢、劣勢、機會和威脅進行綜合分析,做出系統(tǒng)的評估從而識別其風險。KMV模型將Black-Scholes期權(quán)定價理論和Merton的公司債務定價理論作為模型的理論依據(jù),基于上市公司的財務數(shù)據(jù)和股票價格數(shù)據(jù)來度量和識別公司的信用風險。
隨著企業(yè)所面臨的市場競爭日益加劇以及經(jīng)營環(huán)境變得更加不穩(wěn)定,風險識別對于決策者的作用愈加重要。Baumann等[1]分析了頭腦風暴法、訪談法和SWOT分析等被頻繁使用的風險識別方法的優(yōu)缺點,并指出需要將多種方法進行有機結(jié)合以更好地識別企業(yè)的風險。蔣彧等[2]修正了KMV模型中的參數(shù)計算(估計)與設定方法,以更好地適用中國的市場環(huán)境,并將修正后的KMV模型應用于識別中國上市公司的信用風險。吳驍遠等[3]運用文獻調(diào)查法和案例分析等方法來對上市光伏企業(yè)的風險進行識別。趙鑫[4]運用PEST分析法、SWOT分析法、波特五力模型和財務比率分析等方法來識別其選取的一家發(fā)動機制造行業(yè)的上市公司的風險。
國內(nèi)外的研究者們還將統(tǒng)計方法引入上市公司風險識別中,使用的統(tǒng)計方法主要包括單變量判別分析法(UDA)、多元線性判別分析法(MDA)、多元邏輯回歸分析法(Logit)和多元概率比回歸分析法(Probit)等。單變量判別分析法是指通過單一的財務指標來識別上市公司的風險。多元線性判別分析法則是通過在多個財務指標的基礎(chǔ)上構(gòu)造多元線性判別函數(shù)來實現(xiàn)上市公司風險的識別。多元邏輯回歸分析法與多元概率比回歸分析法非常相似,都是將因變量(上市公司是否發(fā)生破產(chǎn)、財務危機等)和自變量(上市公司的財務指標等)之間的關(guān)系轉(zhuǎn)化為概率求解問題;不同的是,前者通過線性回歸的方法求解,而后者則是通過極大似然函數(shù)的方法求解。此外,多元概率比回歸分析對于樣本數(shù)據(jù)的分布要求嚴格,要求樣本數(shù)據(jù)服從高斯分布假設,且模型計算過程相對復雜。
利用統(tǒng)計方法來實現(xiàn)上市公司風險識別提高了數(shù)據(jù)分析的效率,并且在很大程度上能夠克服專家分析法和SWOT分析法等方法的主觀性,統(tǒng)計方法與統(tǒng)計模型成了標普、穆迪和惠譽等著名國際評級機構(gòu)最流行的工具之一。但是統(tǒng)計方法與統(tǒng)計模型存在著諸多的限制性假設,例如變量的線性假設、正態(tài)性假設和獨立性假設等;由于上市公司的財務數(shù)據(jù)等經(jīng)常會違背這些假設,因此統(tǒng)計假設的固有缺陷在一定程度上限制了統(tǒng)計方法與統(tǒng)計模型在上市公司風險識別中的應用和效果。
人工智能方法相較于傳統(tǒng)的統(tǒng)計方法和統(tǒng)計模型,不需要對數(shù)據(jù)的分布進行假設,并且能夠識別和表示數(shù)據(jù)集上的非線性和非參數(shù)關(guān)系。自20世紀90年代以來,國內(nèi)外的研究者們已經(jīng)成功地將人工神經(jīng)網(wǎng)絡、支持向量機、隨機森林、樸素貝葉斯、基于案例的推理、粗糙集和遺傳算法等多種人工智能方法應用于上市公司的破產(chǎn)預測、財務危機預測、信用風險預測和退市風險預測等上市公司風險識別場景中。
Olson等[5]將邏輯回歸、神經(jīng)網(wǎng)絡、支持向量機和決策樹等方法應用于上市公司的破產(chǎn)預測中,并分析和比較了這些方法存在的優(yōu)缺點。Lee等[6]將反向傳播神經(jīng)網(wǎng)絡模型應用于韓國的建筑業(yè)、零售業(yè)和制造業(yè)上市公司的破產(chǎn)預測中,發(fā)現(xiàn)反向傳播神經(jīng)網(wǎng)絡能夠更好地識別變量與破產(chǎn)之間的非線性關(guān)系,在破產(chǎn)預測上的準確性要優(yōu)于多元判別分析方法;與此同時,實驗結(jié)果還表明針對特定行業(yè)建立的破產(chǎn)預測模型的預測精度要高于通用的破產(chǎn)預測模型。Serrano-Cinca等[7]將偏最小二乘判別分析法(PLS-DA)應用于美國銀行的破產(chǎn)預測中,并將其與線性判別分析、邏輯回歸、多層感知器、K最近鄰、樸素貝葉斯、支持向量機和集成學習等破產(chǎn)預測中廣泛使用的方法進行了對比分析。Barboza等[8]將支持向量機、集成學習和隨機森林等機器學習方法與判別分析、邏輯回歸等傳統(tǒng)的統(tǒng)計模型在破產(chǎn)預測上進行了對比,發(fā)現(xiàn)機器學習模型的破產(chǎn)預測準確率要比傳統(tǒng)的統(tǒng)計模型平均高出10%左右。
Huang等[9]比較了支持向量機(SVM)、混合聯(lián)想記憶神經(jīng)網(wǎng)絡模型(HACT)、混合遺傳模糊聚類(hybrid GA-fuzzy clustering)和極端梯度提升模型(XGBoost)等有監(jiān)督機器學習方法以及深度信念網(wǎng)絡(DBN)和混合DBN-SVM模型在上市公司財務危機預測上的性能,發(fā)現(xiàn)在四種有監(jiān)督機器學習方法中,XGBoost具有最高的預測準確率;與單獨的SVM或DBN相比,混合DBN-SVM模型具有更優(yōu)的預測能力。梁明江等[10]將集成學習方法應用于預測A 股制造業(yè)上市公司的財務危機,發(fā)現(xiàn)該方法能夠比單個的基分類器取得更高的預測準確率。陳瀟瀾[11]將BP神經(jīng)網(wǎng)絡、支持向量機和隨機森林用于預測上市公司的信用風險,發(fā)現(xiàn)隨機森林有著最高的分類準確率。
國內(nèi)外的研究者們還將多種人工智能算法模型進行融合和集成以更好地識別上市公司的風險。Iturriaga等[12]將多層感知器網(wǎng)絡(MLP)和自組織映射網(wǎng)絡(SOM)相結(jié)合,建立了一個混合神經(jīng)網(wǎng)絡模型來預測美國銀行的破產(chǎn)。趙智繁等[13]將數(shù)據(jù)包絡分析(DEA)和關(guān)聯(lián)規(guī)則、決策樹等數(shù)據(jù)挖掘技術(shù)相結(jié)合以實現(xiàn)上市公司財務危機程度的預測。王魯?shù)萚14]將模糊集與自組織映射網(wǎng)絡相結(jié)合,提升了財務危機預測模型的預測性能。劉玉敏等[15]綜合運用主成分分析、粒子群優(yōu)化算法和支持向量機等方法來提高上市公司財務危機預測的準確率。鄭立[16]將粗糙集與最小二乘支持向量機方法進行融合,并將其應用于制造業(yè)上市公司的財務危機預測中,提高了預測的準確率。
近年來,深度學習技術(shù)發(fā)展迅速,目前已經(jīng)被成功應用于機器翻譯、圖像識別、自動駕駛、語音識別、文本生成、智能機器人、計算機視覺、問答系統(tǒng)和商品推薦等領(lǐng)域中。國內(nèi)外的研究者們也嘗試將深度學習技術(shù)應用于上市公司的風險識別中。Hosaka[17]將日本上市公司的財務指標數(shù)據(jù)以圖像的形式進行表示,并利用卷積神經(jīng)網(wǎng)絡(CNN)對其進行分類來實現(xiàn)破產(chǎn)預測,發(fā)現(xiàn)該方法要優(yōu)于傳統(tǒng)的CART決策樹、線性判別分析(LDA)、支持向量機(SVM)、AdaBoost集成學習算法和多層感知器(MLP)等方法。劉雪林[18]將堆棧式去噪自編碼器(SDAE)深度學習網(wǎng)絡應用于上市公司的財務危機預測中,發(fā)現(xiàn)其預測準確率要優(yōu)于Logistic回歸模型。孫琦[19]運用卷積神經(jīng)網(wǎng)絡來對上市公司的信用風險進行預測,并將其與多變量線性模型、Logistic回歸模型和BP神經(jīng)網(wǎng)絡模型的預測效果進行了對比,發(fā)現(xiàn)卷積神經(jīng)網(wǎng)絡模型的預測準確率最高。
當前上市公司風險識別研究主要關(guān)注于如何運用新興的機器學習和人工智能技術(shù)或者改進現(xiàn)有技術(shù)來構(gòu)建具有更高準確率和更低錯誤率的上市公司風險智能識別模型,而對于模型的實用性、透明性和可解釋性的重視程度則明顯不夠。這導致了當前研究文獻提出的上市公司風險識別智能模型大多是缺乏可解釋性和透明性的黑箱模型,這些黑箱模型對于模型的輸入數(shù)據(jù)和輸出結(jié)果之間的交互和關(guān)系難以給出投資者、債權(quán)人和政府監(jiān)管者等決策者所易于理解的解釋,不能為管理決策提供模型透明化的分析過程以及模型得出結(jié)論的直觀解釋;這不僅使得上市公司風險智能識別模型的實用性降低,而且可能會導致決策者對模型的不信任。具有較高透明性和可解釋性的模型不僅能夠為決策者的上市公司風險識別提供直觀可靠的決策依據(jù),提高管理決策的效果并有效地降低管理決策的風險;同時還可以抽取和發(fā)現(xiàn)上市公司風險識別相關(guān)的領(lǐng)域知識,從而有助于豐富上市公司風險識別理論。