厲書涵
【摘要】隨著我國經(jīng)濟(jì)的發(fā)展,社會科學(xué)中的金融經(jīng)濟(jì)的創(chuàng)新,使得投資者判斷股價長期發(fā)展趨勢時又回到一個最基本的概念,即由于公司本身的價值帶來股價的增長。因此上市公司的季度或年度綜合經(jīng)營績效可以較好的反映出公司的經(jīng)營狀況。本文將從上市公司披露的財務(wù)報表中捕捉因素,通過決策樹算法及人工神經(jīng)網(wǎng)絡(luò)算法對公司綜合經(jīng)營能力進(jìn)行預(yù)測。
【關(guān)鍵詞】ID3決策樹 BP人工神經(jīng)網(wǎng)絡(luò) 動態(tài)市盈率 財務(wù)指標(biāo)
1主要研究方法和內(nèi)容
本文利用數(shù)據(jù)挖掘技術(shù)中的ID3決策樹和BP神經(jīng)網(wǎng)絡(luò)兩種算法,以上市公司的動態(tài)市盈率作為綜合經(jīng)營績效的分類標(biāo)準(zhǔn)進(jìn)行分類預(yù)測。本文先隨機(jī)選取2017年A股市場上共1847條上市公司的動態(tài)市盈率作為分類數(shù)據(jù)集,對優(yōu)秀、良好、一般以1:2:1劃分得到分類結(jié)果。再以隨機(jī)選取的210個上市公司作為樣本,市盈率等級為優(yōu)秀、良好、一般的各占70條數(shù)據(jù)。以動態(tài)市盈率的等級作為輸出變量,選取六個不同方面的財務(wù)指標(biāo)作為輸入變量,隨機(jī)選取90%的數(shù)據(jù)作為訓(xùn)練樣本,用于建立模型;其余的10%則作為測試樣本,用于對模型的有效性檢測。利用兩種算法分別建立分類預(yù)測模型。
2數(shù)據(jù)收集、探索及清洗
2.1確定指標(biāo)
對一個上市公司的經(jīng)營效益進(jìn)行評估時,需要從財務(wù)報表中選擇多個財務(wù)指標(biāo)進(jìn)行綜合分析,一般包括投資收益、盈利能力、短期償債能力、長期償債能力、成長能力、營運(yùn)能力這六大類指標(biāo)。通過對它們進(jìn)行綜合分析,選擇更有投資價值的上市公司進(jìn)行投資。
2.2屬性構(gòu)造
從財務(wù)比率的描述統(tǒng)計量中可以發(fā)現(xiàn),凈資產(chǎn)增長率、存貨周轉(zhuǎn)率和動態(tài)市盈率的極差和標(biāo)準(zhǔn)差都較大,說明了數(shù)據(jù)的離中趨勢非常強(qiáng)烈。從中可以說明上市公司的經(jīng)營狀況差別非常大,因此在對動態(tài)市盈率進(jìn)行分類、隨機(jī)抽樣之后,還要對相應(yīng)的變量進(jìn)行數(shù)據(jù)規(guī)范化的操作。
為了更好的提取數(shù)據(jù)中的信息并得到更準(zhǔn)確的分類預(yù)測的結(jié)果,需要利用已有的數(shù)據(jù)和屬性構(gòu)造出新的屬性,并加入到現(xiàn)有的屬性集合中。根據(jù)通常的分類經(jīng)驗(yàn),將動態(tài)市盈率這一變量以1:2:1的比例進(jìn)行等頻離散,并分別歸類于“優(yōu)秀”、“良好”、“一般”三類屬性,構(gòu)造屬性“未來盈利能力預(yù)期等級”作為新的指標(biāo),并以此為模型預(yù)測中的輸出變量。
2.3數(shù)據(jù)的特征值分析
(1)基本每股收益:該指標(biāo)反映上市公司的盈利能力,每股收益越高,表示企業(yè)的盈利能力越強(qiáng)?!皟?yōu)秀”股的均值較低,但其同時又較低的極差和標(biāo)準(zhǔn)差,說明該分類中每股收益較為相近,“良好”股和“一般”股則有較大的標(biāo)準(zhǔn)差和極差,說明該分類中受到極值的影響較大。
(2)營業(yè)凈利率:該指標(biāo)表示企業(yè)每單位資產(chǎn)可以獲得利潤總額的數(shù)量,凈利率越高表明企業(yè)的盈利能力越強(qiáng)。三類上市公司中,“優(yōu)秀”股的標(biāo)準(zhǔn)差最小,說明該分類中凈利率較為集中和穩(wěn)健,“良好”股和“一般”股則有較大的標(biāo)準(zhǔn)差和極差,說明該分類中受到極值的影響較大。
(3)流動比率:流動比率過高表明流動資產(chǎn)占用較多,會影響企業(yè)的經(jīng)營資金周轉(zhuǎn)率和獲利能力,過低表明企業(yè)的短期償債能力比較弱。這里,“良好”股票的流動比率平均值為2.64,偏高;“一般”股的平均值為 2.11,偏低;“優(yōu)秀”股票的平均值為 2.28,最為合理。
(4)資產(chǎn)負(fù)債率:該指標(biāo)反映企業(yè)總資產(chǎn)中有多少資產(chǎn)是通過負(fù)債籌集的,是一個評價企業(yè)負(fù)債水平的綜合指標(biāo)。從債權(quán)人、投資者和經(jīng)營者不同的角度去看,對資產(chǎn)負(fù)債率的高低有不同的理解。一般認(rèn)為,資產(chǎn)負(fù)債率維持在40%-60%之間最為適宜。三類上市公司中,“優(yōu)秀”股的資產(chǎn)負(fù)債率均值為41.2%;“良好”股的均值為 40%,偏低;“一般”股的均值為 50%。相比之下,“一般”股的企業(yè)總資產(chǎn)中,通過負(fù)債籌集的資產(chǎn)比例偏高。
(5)凈資產(chǎn)增長率:該指標(biāo)可以反映企業(yè)的發(fā)展能力,它越高代表企業(yè)的生命力越強(qiáng)。如果在較高凈資產(chǎn)收益率的情況下,又保持較高的凈資產(chǎn)增長率,則表示企業(yè)未來發(fā)展更加強(qiáng)勁。三類上市公司中,“優(yōu)秀”股的凈資產(chǎn)增長率最高,其次是“良好”股,最低的是“一般”股
(6)存貨周轉(zhuǎn)率:存貨周轉(zhuǎn)率的高低反映企業(yè)存貨管理水平的好壞,存貨周轉(zhuǎn)率越高,表明存貨轉(zhuǎn)換為現(xiàn)金的速度越高。本文中,“良好”股的存貨周轉(zhuǎn)率高于“優(yōu)秀”股,“優(yōu)秀”股高于“一般”股。
3決策樹與BP神經(jīng)網(wǎng)絡(luò)對市盈率分類的預(yù)測
3.1抽取訓(xùn)練集和測試集
首先對上一步得到的210條數(shù)據(jù)的數(shù)據(jù)集按照訓(xùn)練集:測試集=9:1的比例進(jìn)行 sample函數(shù)的隨機(jī)抽樣,選出 189個樣本作為學(xué)習(xí)對象,其余 21個作為測試集測試泛化能力。沒有按照普通的8:2的比例是因?yàn)闃颖緮?shù)據(jù)過少,如果按照該比例則可能出現(xiàn)學(xué)習(xí)不足的情況。
3.2預(yù)測結(jié)果
擬合和測試結(jié)果的混淆矩陣顯示訓(xùn)練集的正確率為96.83%,而測試集的正確率為52.38%。決策樹模型的擬合和測試結(jié)果的混淆矩陣顯示訓(xùn)練集的正確率為76.19%,而測試集的正確率為61.91%。
3.3模型對比與結(jié)果分析
在利用ID3決策樹和BP人工神經(jīng)網(wǎng)絡(luò)兩種分類方法分別建立預(yù)測模型,并通過比較它們的訓(xùn)練集和測試集正確率后可以發(fā)現(xiàn),ID3決策樹算法給出的預(yù)測準(zhǔn)確率較BP人工神經(jīng)網(wǎng)絡(luò)算法高,最高達(dá)到了71.43%。但是兩者的預(yù)測準(zhǔn)確率都沒有達(dá)到非常高的水平,主要原因可能是:決策樹算法適用于指標(biāo)數(shù)量不是特別多且各指標(biāo)間的邏輯關(guān)系不是特別復(fù)雜的情況,而神經(jīng)網(wǎng)絡(luò)算法具有通過非線性輸出以及利用多層結(jié)構(gòu)進(jìn)行預(yù)測的特點(diǎn),適合處理指標(biāo)較多且指標(biāo)間關(guān)系相對復(fù)雜的對象。因此,可能在模型的選擇和影響變量的選擇上仍然存在可改進(jìn)的部分。此外,數(shù)據(jù)數(shù)量的多少也極大的影響了模型擬合和泛化的能力,因此如果加入數(shù)據(jù)挖掘的技術(shù),獲得更大的樣本容量,也許會得到更高的預(yù)測精度。
參考文獻(xiàn):
[1]潘靜,張穎,劉璐.基于ARIMA模型與GM(1,1)模型的居民消費(fèi)價格指數(shù)預(yù)測對比分析[J].統(tǒng)計與決策,2017(20):110-112.
[2]吳玉霞,溫欣.基于ARIMA模型的短期股票價格預(yù)測[J].統(tǒng)計與決策.2016(23):83-86.
[3]張玉林.神經(jīng)網(wǎng)絡(luò)在股市預(yù)測中的建模及應(yīng)用[D].大連:大連理工大學(xué),2004.