楊 靜,劉 炯
(宣城職業(yè)技術學院 信息與財經(jīng)學院,安徽 宣城 242000)
全球市場經(jīng)濟發(fā)展快速而復雜,受到各種內(nèi)外部因素的影響。企業(yè)財務長期變化趨勢的預測能夠幫助企業(yè)根據(jù)不同的經(jīng)濟環(huán)境作出適應性調(diào)整,提高經(jīng)營效率和競爭力。隨著信息技術的迅猛發(fā)展,企業(yè)財務信息獲得的渠道越來越廣泛,預測企業(yè)財務長期變化趨勢需要處理和分析大量的財務數(shù)據(jù)及各種類型的財務信息,如會計報表[1]、財務指標[2]等,可通過建立模型和設計算法,幫助企業(yè)進行綜合分析和風險預測。目前,相關研究已取得一些進展,部分研究人員致力于改進和創(chuàng)新財務預測模型和方法,以更好地解決企業(yè)長期變化趨勢預測問題。李珊珊等[3]提出基于粗糙集的企業(yè)財務變化趨勢預測方法,針對企業(yè)財務金融數(shù)據(jù)的含噪、非線性與非平穩(wěn)性的特點,利用粗糙集濾除財務冗余數(shù)據(jù),根據(jù)各個變量之間的關聯(lián)性生成一組決策規(guī)則,結合時間加權實現(xiàn)財務長期趨勢預測。該方法考慮了企業(yè)財務數(shù)據(jù)特點,能夠處理含噪、非線性和非平穩(wěn)性等問題,提高財務預測的準確性;通過粗糙集方法濾除冗余信息,可以減少噪聲數(shù)據(jù)對預測結果的影響,提高預測模型的魯棒性;結合時間加權調(diào)整能夠適應財務數(shù)據(jù)的變化趨勢,使預測結果更加貼近實際情況。但是,該方法需要清洗和處理大量的財務數(shù)據(jù),對數(shù)據(jù)質(zhì)量要求較高,數(shù)據(jù)量較小或質(zhì)量較差時會影響預測結果。所以,該方法適合在綜合考慮不同變量之間的關系和影響因素環(huán)境下使用。李珊珊等[4]利用小波支持向量機對企業(yè)財務進行長期預測,通過小波變換與神經(jīng)網(wǎng)絡結合的方式提取財務預測指標特征向量,并對提取向量降維處理,利用支持向量機得到最優(yōu)解,實現(xiàn)對企業(yè)財務運行狀況的預測。該方法結合小波變換和神經(jīng)網(wǎng)絡,可更好地提取和表示財務數(shù)據(jù)的特征信息,通過降維處理可以減少數(shù)據(jù)維度、提高計算效率,避免過擬合問題。并且,支持向量機作為一種強大的分類器,具有較好的適應性和泛化能力。但是,該方法的特征提取參數(shù)選擇和小波基選擇等可能影響預測結果,而且支持向量機對于大規(guī)模數(shù)據(jù)集訓練和計算的要求較高。所以,該方法適合在周期性特征明顯且財務數(shù)據(jù)時頻特征變化較大環(huán)境下使用。部分研究人員開展了相關研究和實踐,為企業(yè)提供財務長期變化趨勢預測的咨詢和服務。王曉梅等[5]以灰色GM(1,1)預測模型為依據(jù),提出企業(yè)業(yè)務收入和凈利潤預測方法,以采集2011—2020 年不同企業(yè)業(yè)務數(shù)據(jù)為基礎,利用灰導數(shù)與灰微分方程對業(yè)務數(shù)據(jù)作離散處理,幫助企業(yè)預測主營業(yè)務收入和凈利潤發(fā)展趨勢。該方法一般應用于中小樣本數(shù)據(jù)預測,尤其是在數(shù)據(jù)量較小、趨勢不明確或非線性情況下,能夠提供較為準確的預測結果。灰度化和GM(1,1)模型可以更好地處理不完整、緊缺或低質(zhì)量數(shù)據(jù)。但是,GM(1,1)模型是基于數(shù)據(jù)發(fā)展趨勢的預測,對于具有明顯周期性或不穩(wěn)定的數(shù)據(jù),預測效果可能不佳。所以,該方法適合數(shù)據(jù)量較小、信息相對不完整的中小型企業(yè)財務指標預測。Liu G 等[6]采用雙鏈量子遺傳算法對股票市場波動預測,經(jīng)調(diào)整模型的學習速率,實現(xiàn)有效的股票市場行為預測。通過對6 只股票市場收盤價格的預測驗證,證明了它的有效性。但是由于驗證數(shù)據(jù)集較少,可能存在不適合數(shù)據(jù)量較大、數(shù)據(jù)類型較為豐富的業(yè)務預測問題。
ARIMA(Autoregressive Integrated Moving Average,差分整合自回歸移動平均)模型是一種統(tǒng)計預測模型,可以利用過去和現(xiàn)在的數(shù)值結果,實現(xiàn)預測未來值走向的目的[7]。Ma L 等[8]將該模型引入到智能電表故障率的預測中,并分析了所構建模型的可靠性。將自適應高斯遺傳算法自回歸綜合移動平均和比例相結合,優(yōu)化ARIMA 的階數(shù),建立模型。最終使用ARIMA 模型對基本誤差進行預測,分析其可靠性。實驗發(fā)現(xiàn),在小樣本數(shù)據(jù)集條件下,所設計的模型具有較高的適應性。LSTM(Long Short Term Memory,長短期記憶)神經(jīng)網(wǎng)絡是一種遞歸神經(jīng)網(wǎng)絡[9],通過時間序列捕獲更長的依賴關系,利用多個門提高神經(jīng)網(wǎng)絡參數(shù)調(diào)整速率,縮小神經(jīng)網(wǎng)絡參數(shù)調(diào)整幅度,能夠有效避免矯枉過正[10]。賀毅岳等[11]使用LSTM 預測方法實現(xiàn)股市指數(shù)日內(nèi)交易量分布預測。通過構建本征模態(tài)函數(shù),進行去噪與重構處理,完成預測模型的構建。采用M-LSTM,ARIMA 和向量回歸方法,預測日內(nèi)交易量分布。實驗發(fā)現(xiàn),M-LSTM預測誤差更小、更具預測優(yōu)勢。姚遠等[12]將HP 濾波(Hodrick-Prescott Filter)和LSTM 神經(jīng)網(wǎng)絡模型相融合,構建了股指價格預測模型。通過學習長期趨勢和短期波動序列特征,實現(xiàn)股指價格時間序列的賬期趨勢和短期波動的預測,實驗發(fā)現(xiàn)該方法的整體預測精度較高。鑒于企業(yè)財務數(shù)據(jù)統(tǒng)計過程中業(yè)務收入與利潤數(shù)據(jù)具有數(shù)據(jù)數(shù)量大、數(shù)據(jù)類型多、財務指標異構等特點,提出了一種基于ARIMA-LSTM的企業(yè)財務長期變化趨勢預測算法,以下試就所提出的方法展開必要的討論。
企業(yè)財務數(shù)據(jù)包括不同種類數(shù)據(jù)、數(shù)據(jù)規(guī)模較大,因此設計ARIMA-LSTM 模型,首先通過ARIMA 模型獲取影響企業(yè)財務數(shù)據(jù)平穩(wěn)性因素特征,根據(jù)特征參數(shù)計算殘差數(shù)據(jù),將原始數(shù)據(jù)中非線性特征數(shù)據(jù)隱藏處理,避免非線性數(shù)據(jù)對整體數(shù)據(jù)產(chǎn)生干擾;其次構建LSTM 模型,將隱藏處理后的殘差數(shù)據(jù)輸入該模型中,利用LSTM 模型修正處理殘差數(shù)據(jù),最終以ARIMA 模型和LSTM 模型融合的形式完成企業(yè)財務長期變化趨勢預測[13-15]并獲取對應的預測結果。ARIMA-LSTM 模型框架如圖1 所示。
圖1 企業(yè)財務長期變化趨勢預測示意圖
ARIMA 模型包括自回歸(AR)過程和移動平均(MA)過程,以時間序列的方式完成數(shù)據(jù)預處理。構建應用于企業(yè)財務長期變化趨勢預測的ARIMA 算法模型,要求企業(yè)財務數(shù)據(jù)具有平穩(wěn)性。但企業(yè)財務數(shù)據(jù)在實際采集處理過程中,容易受到債償能力、盈利能力、運營能力、發(fā)展能力等因素的影響,進而導致獲取的企業(yè)資產(chǎn)負債率、凈資產(chǎn)收益率、固定資產(chǎn)成新率等存在不平穩(wěn)的情況。通過加入差分變換方法,解決隨機擾動,完成序列平穩(wěn)化處理,進而提高企業(yè)財務數(shù)據(jù)的平穩(wěn)性,ARIMA 模型平穩(wěn)性驗證表達式為:
式(1)中,ε為隨機擾動項,θ(B)為財務時間序列; 為自回歸多項式,d為移動平均多項式。在驗證了模型平穩(wěn)性以及濾除隨機擾動后,需要對模型進行定階獲取企業(yè)財務數(shù)據(jù)的線性特征。利用自相關函數(shù)和偏自相關函數(shù)明確模型參數(shù)大致取值范圍,列出所有取值組合,選取最優(yōu)組合數(shù)值,保證ARIMA模型最優(yōu)[16]。在參數(shù)估計階段,以信息準則定階,根據(jù)最小數(shù)值結果調(diào)整ARIMA 模型結構,使經(jīng)濟變量、財務專家分析、技術指標等參數(shù)達到最優(yōu)組合適度,進而增加ARIMA 模型的擬合能力。模型中存在一定的殘差數(shù)據(jù),以平穩(wěn)性因素特征為依據(jù)計算模型殘差數(shù)據(jù):
式(2)中,k為參數(shù)個數(shù),n為取樣數(shù)量,L為極大似然函數(shù)值。殘差數(shù)據(jù)處理后,需要驗證模型的擬合程度,以白噪聲為驗證依據(jù),當擬合所得殘差為白噪聲,證明該模型能夠較好地擬合財務時間序列。利用時間序列二階差分方程序列,將財務時間序列數(shù)據(jù)中的非線性特征進行隱藏處理,以此避免非線性數(shù)據(jù)對財務數(shù)據(jù)預測產(chǎn)生干擾,具體表達式為:
式(3)中,αm為波動幅度,Xt為時間序列變量方差,m為噪聲數(shù)據(jù)數(shù)量。
ARIMA 算法模型構建過程如圖2 所示。
圖2 ARIMA 算法模型過程示意圖
在獲取財務隱藏數(shù)據(jù)的基礎上,利用LSTM 模型將隱藏處理后的殘差數(shù)據(jù)輸入該模型中,完成數(shù)據(jù)修正。具體LSTM 隱藏層網(wǎng)絡結構圖如圖3 所示。
圖3 LSTM 神經(jīng)網(wǎng)絡記憶單元結構示意圖
由圖3 可知,LSTM 神經(jīng)網(wǎng)絡屬于遞歸神經(jīng)網(wǎng)絡,包含遺忘門、輸入門、更新門、輸出門和儲存單元。其中,xt為模型訓練過程中的企業(yè)財務預測指標參數(shù),ht為模型迭代過程中產(chǎn)生的因素信息,ct為上一個時期的總資產(chǎn)周轉(zhuǎn)結果狀態(tài),cv為資產(chǎn)學習結果狀態(tài)。
LSTM 神經(jīng)網(wǎng)絡通過遺忘門優(yōu)化梯度傳播過程中的反饋誤差功能,以輸入門多次迭代的方式修正殘差數(shù)據(jù),利用更新門更新計算狀態(tài),由輸出門控制輸出有效信息,以此提高神經(jīng)網(wǎng)絡收斂性。根據(jù)LSTM 結構,由邏輯函數(shù)(S 型函數(shù))獲取單元狀態(tài)向量,完成神經(jīng)元狀態(tài)激活,具體表達式為:
式(4)中,ft為遺忘門計算結果,it為輸入門數(shù)據(jù)采集結果,Wxc為神經(jīng)網(wǎng)絡權重系數(shù),Wkc為記憶模塊權重系數(shù);bt為神經(jīng)元偏置。LSTM 神經(jīng)網(wǎng)絡輸入門對不同類型的財務數(shù)據(jù)進行計算,判定其是否激活,具體表達式為:
式(5)中,s為輸入門輸入前一時刻的殘差數(shù)據(jù),σ為偏置梯度。當it≤0 時,在LSTM 神經(jīng)網(wǎng)絡中剔除數(shù)據(jù),在當it>0 時,數(shù)據(jù)將進入更新門進行記憶單元計算,并結合動態(tài)控制在輸出門完成結果輸出。更新門計算公式為:
式(6)中,zt為所有時刻上的損失函數(shù)總和,rt為隱藏向量。將更新門計算結果傳遞至輸出門,根據(jù)輸出門的加權影響,完成LSTM 神經(jīng)網(wǎng)絡的殘差數(shù)據(jù)修正輸出。
通過構建ARIMA 模型和LSTM 模型的組合模型,獲取響應時間的財務預測指標數(shù)據(jù),濾除非線性規(guī)律數(shù)據(jù),在ARIMA 模型中完成財務時間序列特征提取,在LSTM 模型中完成殘差數(shù)據(jù)處理。最終以結果疊加的方式,獲取企業(yè)財務長期變化趨勢預測結果,以解決大容量、多維數(shù)據(jù)的預測。非線性成分殘差數(shù)學表達式為:
式(7)中,lt為企業(yè)財務各個要素的關聯(lián)度指標;Ut為ARIMA 模型的預測值。在得到et后,利用LSTM 模型對企業(yè)財務長期變化趨勢建模,獲取財務變化預測值,具體表達式為:
式(8)中,f()為LSTM 模型建立的關系函數(shù);v為限制變量。最后,將Ut和Ft相加,獲取企業(yè)財務長期變化趨勢預測結果。如式(9):
為了確保組合模型的收斂性,需要結合迭代預測的方法,對企業(yè)財務長期變化趨勢預測結果進行下一刻財務時間序列值預測,以此完成未來每個時刻的財務長期變化趨勢預測。
為了驗證基于ARIMA-LSTM 的企業(yè)財務長期變化趨勢預測算法的有效性,選取了文獻[4]方法和文獻[5]方法對比實驗。選擇某上市公司可公開的2019—2021 年間的部分財務數(shù)據(jù)作為測試內(nèi)容,其中包含資產(chǎn)負債率、固定資產(chǎn)周轉(zhuǎn)率、業(yè)務毛利率、產(chǎn)權比率和業(yè)務利潤率等數(shù)據(jù)。所有財務數(shù)據(jù)均來源于網(wǎng)易財經(jīng)①https://money.163.com/stock/。
選擇3 000 個財務數(shù)據(jù)作為預測總量,本文所提方法、文獻[4]方法、文獻[5]方法的預測準確性,結果如表1 所示。
表1 不同方法的企業(yè)財務長期變化趨勢預測結果
由表1 可以看出,與文獻[4]方法和文獻[5]方法相比,本文所提方法在企業(yè)財務長期變化趨勢預測過程中準確性更高。這是因為本文方法是根據(jù)LSTM 結構,以邏輯函數(shù)激活神經(jīng)元狀態(tài),進而提升了預測精度。由此說明本文所提方法具有較強的實時性,更適合企業(yè)制定未來發(fā)展規(guī)劃,為企業(yè)決策提供財務依據(jù)。
擬合性能測試能夠有效驗證模型訓練集的表現(xiàn)效果,當訓練集效果越優(yōu),則模型復雜程度較高,且能夠有效學習規(guī)律。模型的擬合程度分為擬合、欠擬合、過擬合三種形式,擬合表明模型處于最優(yōu)效果,欠擬合表明模型具有較高的誤差,過擬合表明模型復雜度高于實際問題,無法在測試集上具有良好的表現(xiàn)。以文獻[4]方法和文獻[5]方法為對照,檢驗所提方法的擬合,測試結果如圖4 所示。
圖4 3 種方法擬合結果示意圖
分析圖4 可知,本文所提方法為擬合狀態(tài),模型具有較好的計算算力,能夠穩(wěn)定輸出數(shù)據(jù),準確預測正樣本。這是因為本文所提方法構建了組合模型,進而提升了模型的泛化能力和收斂效果。而文獻[4]方法欠擬合,文獻[5]方法過擬合,因此無法高效獲取預測結果。由此表明,所提方法具有較好的適用性。
文章設計了一種基于ARIMA-LSTM 的企業(yè)財務長期變化趨勢預測算法。實驗證明,組合模型可以取得比單一模型更好的效果,預測企業(yè)財務變化趨勢準確性較高,擬合性能更優(yōu)。由于影響企業(yè)財務變化的因素較多,預測結果會有一定的隨機性,所以該模型需要進一步調(diào)優(yōu)參數(shù)。通過蒙特卡洛模擬方法對ARIMA 模型階數(shù)和LSTM 模型的神經(jīng)元個數(shù)、層數(shù)等參數(shù)進行隨機搜索,從參數(shù)空間隨機采樣,多次運行模型并比較結果,評估每個參數(shù)組合的性能,選擇最佳參數(shù)組合。經(jīng)此,使模型更好地適應企業(yè)的各種財務數(shù)據(jù),提高預測結果準確性,為企業(yè)決策提供可靠的參考依據(jù)。