劉澄 胡巧紅 孫瑩
[摘要] 會計信息失真現(xiàn)象將給投資者、政府、公司所有者等眾多會計信息使用者帶來很大的損失和麻煩。因此,科學地識別會計信息是否失真就很重要。本文選取2008年的159家上市公司的財務數(shù)據(jù)作為訓練樣本建立分類回歸樹模型,并以該模型對2009年滬深上市公司的1 862家企業(yè)進行了檢測,實證研究表明:分類回歸樹算法具有很高的會計信息失真識別能力。
[關鍵詞] 分類回歸樹;會計信息失真;審計意見
[中圖分類號] F234;F276.6 [文獻標識碼] A [文章編號] 1673 - 0194(2013)06- 0002- 02
1 文獻綜述
目前會計信息失真識別研究較多集中在2個方面:多元統(tǒng)計分析方法發(fā)現(xiàn)會計信息失真企業(yè)的特征和利用特征指標變量建立識別模型對企業(yè)會計信息失真的可能性進行識別和預測。國內(nèi)外學者都基于這兩類方法通過建立多種模型對會計信息失真問題進行了研究。
多元統(tǒng)計分析方法被用來作為會計信息失真的偵測方法已經(jīng)有較長的歷史,并且取得了較好的識別效果。而利用特征指標變量來建立會計信息識別模型的國內(nèi)外研究在近年來得到了快速發(fā)展。Imran Kurt等[1]學者比較了分類回歸樹模型、logistic模型、神經(jīng)網(wǎng)絡在預測方面的作用,發(fā)現(xiàn)分類回歸樹算法具有很高的準確率。Belinna Bai[2]證明分類回歸樹模型對財務欺詐具有較高的識別能力。國內(nèi)學者中,劉君[3]、張玲[4]等也都運用特征變量建立會計信息分析模型。
本文就是運用分類回歸樹算法來進行會計信息的識別,首先選取2008年的159家滬深上市公司的財務數(shù)據(jù)作為訓練樣本建立分類回歸樹模型,然后對2009年滬深上市公司的1 862家企業(yè)利用建立的分類回歸樹模型進行檢測,進一步證實利用分類回歸樹算法進行會計信息失真識別的有效性和準確性。
2 分類回歸樹的構建步驟
分類回歸樹算法(CART)是一種有監(jiān)督學習算法,即用戶在使用CART進行預測之前,必須首先提供一個學習樣本集對 CART 進行構建和評估,然后才能使用。根據(jù)給定的樣本集構建分類回歸樹的步驟由以下3部分組成:
(1)使用L構建樹Tmax,使得Tmax中每個葉節(jié)點要么很?。ü?jié)點內(nèi)部所包含的樣本個數(shù)小于給定的值Nmin),要么它是純節(jié)點(節(jié)點內(nèi)部樣本的Y同屬于一類);要么是只有唯一的屬性向量可以作為分支向量。本文在計算過程中采取最大雜度削減算法——基尼系數(shù)尋找最佳的分支向量。從根結點開始進行分割,遞歸地對每個結點重復進行分割:首先對每一個結點選擇每個屬性最優(yōu)的分割點,若基尼系數(shù)最小,則Xi就是當前屬性的最優(yōu)分割點;接著在這些最優(yōu)的分割點中選取使上式最小的作為這個結點的最優(yōu)的分割規(guī)則;最后繼續(xù)對由該結點分割出來的兩個結點繼續(xù)進行分割。分割過程一直持續(xù)下去,直到具備以下任一條件時停止:①每一個葉節(jié)點很?。虎诩児?jié)點(節(jié)點內(nèi)部樣本的Y 屬于同一個類別);③僅有唯一屬性向量作為分支選擇。
(2)使用修剪算法構建一個有限的節(jié)點數(shù)目遞減的有序子樹序列。修剪是為了獲得誤分率低、大小合適、評估準確率高的子樹。該過程應用最小代價—復雜度算法,生成一系列Tmax的修剪子樹。修剪過程主要完成生成有序樹序列和確定葉節(jié)點的所屬類兩步驟工作。
(3)使用評估算法從第2步產(chǎn)生的子樹序列中選出一棵最優(yōu)樹,作為最終的決策樹。本文將使用2009年所有滬深上市公司年度報告中的財務數(shù)據(jù)進行對所建分類回歸樹的識別和評估。
3 基于分類回歸樹的會計信息識別實證研究
3.1 樣本選擇
將上市公司年度審計報告中被出具標準無保留審計意見的公司劃分為會計信息真實的企業(yè)樣本,將年度審計報告中被出具非標準無保留審計意見的公司劃分為會計信息失真的企業(yè)樣本。本文的樣本數(shù)據(jù)主要來自CCER中國經(jīng)濟金融數(shù)據(jù)庫和RESSET金融研究數(shù)據(jù)庫。
訓練樣本的選擇中,會計信息失真的企業(yè)樣本為滬深證券交易所2008年年報被出具非標準無保留意見的53家上市公司,其中上交所31家,深交所22家,具體審計意見包括保留意見、拒絕表示意見和保留意見帶解釋性說明。此外,訓練樣本中會計信息真實的企業(yè)樣本為2008年滬深證券交易所中年報審計意見為標準無保留意見的106家上市公司,其中上交所62家,深交所44家。
測試樣本的選擇中,將用2009年滬深證券交易所的1 862家上市公司作為測試樣本,對所建立的分類回歸樹模型進行評估和檢驗,其中136家上市公司在年報中被出具了非標準無保留意見,即會計信息失真。
3.2 財務指標初選與處理
本文選擇反映企業(yè)經(jīng)營狀況的財務指標來判定會計信息的失真。初步選取了一些常用的典型的可以反映這幾個方面的財務指標,初步選取的規(guī)則是在反映企業(yè)償債能力、盈利能力、成長能力、營運能力及其他各個方面的財務指標均選取一些,并且排除可直觀判斷具有相關重復性的指標。 初選財務指標及其描述見表1。
如表1所示,初步選取了19個財務指標,其中X1~X5是反映企業(yè)償債能力的財務指標,X6~X10是反映企業(yè)盈利能力的財務指標,X11~X16是反映企業(yè)成長能力的財務指標,X17~X19是反映企業(yè)營運能力的財務指標。
3.3 財務指標進一步篩選
本文采用SPSS軟件進行建模,變量個數(shù)太多不利于最優(yōu)回歸樹的生成,因此為了采用少量的變量個數(shù)得到最合理和科學的回歸樹模型,在建模之前需要對之前得到的財務指標進一步處理和篩選,剔除重復性和相關性較大的指標。本文采用相關性檢驗,對上述財務指標進行進一步處理,具體處理采用Pearson系數(shù)來反映和發(fā)現(xiàn)各個財務指標之間的相關性。利用SPSS軟件求Pearson相關系數(shù)得到結果。根據(jù)相關系數(shù)計算結果,X2與X3的相關系數(shù)為0.905,X6與X7的相關系數(shù)為-0.967,X10與X8的相關系數(shù)為0.921,其絕對值均顯著大于0.8,說明這三組的每兩個財務指標存在非常顯著的信息重疊和相關現(xiàn)象,因此在該步相關性檢驗中可以剔除X3、X6、X8三個財務指標。
3.4 最優(yōu)分類回歸樹的生成
經(jīng)過財務指標的初步篩選和進一步篩選,本文最終確定以X1、X2、X4、X5、X7、X9、X10、X11、X12、X13、X14、X15、X16、X17、X18、X1916個財務指標建立模型。該建模過程采用SPSS直接生成最優(yōu)分類回歸樹,即分類回歸樹的生長、修剪過程直接由軟件完成。通過SPSS軟件的數(shù)據(jù)導入—分析—分類—決策樹等相關操作,得出最優(yōu)分類回歸樹。
在分類回歸樹中,得到以X7(銷售期間費用率)、X2(流動比率)、X9(資本收益率)、X11(每股收益增長率)4個財務指標為拆分變量的具有5個節(jié)點的最優(yōu)分類回歸樹。當X7>38.603 5時,將其歸類為會計信息失真企業(yè);當X7≤38.603 5∩X2≤0.382 3時,將其歸類為會計信息失真企業(yè);當X7≤38.603 5∩X2>0.382 3∩X9>1.597 4時,將其歸類為會計信息真實企業(yè);當X7≤38.603 5∩X2>0.382 3∩X9<1.597 4∩X11<-628時,將其歸類為會計信息真實企業(yè);當X7≤38.603 5∩X2>0.382 3∩X9<1.597 4∩X11>-628時,將其歸類為會計信息失真企業(yè)。
3.5 分類回歸樹的檢驗
3.5.1 利用訓練樣本評估最優(yōu)分類回歸樹
利用SPSS軟件生成最優(yōu)分類回歸樹的時候可以直接得出該分類回歸樹對訓練樣本(159個樣本)的識別準確率。樣本中,會計信息真實企業(yè)和會計信息失真企業(yè)的識別準確率分別達到了90.6%和90.6%,可以看出該分類回歸樹對樣本企業(yè)會計信息真實和失真具有很高的識別能力。
3.5.2 利用測試樣本評估最優(yōu)分類回歸樹
測試樣本為2009年滬深證券交易所的1 862家上市企業(yè),其中137家在年報中被出具非標準無保留意見,1 725家在年報中被出具標準無保留意見。為了評估本文所得出的最優(yōu)分類回歸樹對會計信息失真的識別準確度,本文根據(jù)這1 862家上市企業(yè)的X7(銷售期間費用率)、X2(流動比率)、X9(資本收益率)、X11(每股收益增長率)得出的最優(yōu)分類回歸樹來判斷這1 862家企業(yè)會計信息是否真實:當X7>38.603 5時,將其歸類為會計信息失真企業(yè);當X7≤38.603 5∩X2≤0.382 3時,將其歸類為會計信息失真企業(yè);當X7≤38.603 5∩X2>0.382 3∩X9>1.597 4時,將其歸類為會計信息真實企業(yè);當X7≤38.603 5∩X2>0.382 3∩X9<1.597 4∩X11<-628時,將其歸類為會計信息真實企業(yè);當X7≤38.603 5∩X2>0.382 3∩X9<1.597 4∩X11>-628時,將其歸類為會計信息失真企業(yè)。此步驟主要使用SPSS采用上述規(guī)則進行數(shù)據(jù)篩選,經(jīng)測試樣本評估,得到測試樣本會計信息失真和會計信息真實的識別準確率分別為88.32%和88.98%,可以看出分類回歸樹算法對會計信息是否失真具有很高的識別能力。
4 結 論
本文運用2008-2009年度我國上市公司財務數(shù)據(jù),建立并檢驗了分類回歸樹模型在上市公司會計信息失真識別中的有效性。實證研究表明:①分類回歸樹算法對會計信息失真具有很高的識別能力,其識別準確率很高;②銷售期間費用率、流動比率、資本收益率和每股收益增長率4個財務指標對會計信息失真具有很高的識別能力,因此可以將這4個財務指標作為判別標準,可以非常準確地判斷會計信息是否失真。③分類回歸樹模型是非參數(shù)非線性方法,使用簡單方便,研究結果容易理解。本文研究的分類回歸樹模型為審計機構、監(jiān)管機構和廣大投資者提供了一種識別會計信息失真狀況的方便實用的方法。
主要參考文獻
[1]Imran Kurt, Mevlut Ture ,Turhan Kurum. Comparing Performances of Logistic Regression, Classification and Regression Tree, and Neural Networks for Predicting Coronary Artery Disease [J]. Expert Systems with Applications, 2008(34):366-374.
[2]Belinna Bai, Jerome Yen, Xiaoguang Yang. False Financial Statements: Characteristics of Chinas Listed Companies and CART Detecting Approach[J]. International Journal of Information Technology and Decision Making, 2008 (7):339-359.
[3]劉君,王理平. 基于概率神經(jīng)網(wǎng)絡的財務舞弊識別模型[J]. 哈爾濱商業(yè)大學學報:社會科學版,2006(3):102-105.
[4]張玲,陳收,張昕.基于多元判別分析和神經(jīng)網(wǎng)絡技術的公司財務困境預警[J].系統(tǒng)工程,2005,23(11):49-56.