張日升 中央財(cái)經(jīng)大學(xué)金融學(xué)院 方肇益 中央財(cái)經(jīng)大學(xué)保險(xiǎn)學(xué)院
?
基于數(shù)據(jù)挖掘方法的我國(guó)非壽險(xiǎn)公司規(guī)模效率實(shí)證研究
張日升中央財(cái)經(jīng)大學(xué)金融學(xué)院方肇益中央財(cái)經(jīng)大學(xué)保險(xiǎn)學(xué)院
我國(guó)保險(xiǎn)業(yè)自恢復(fù)經(jīng)營(yíng)以來,以超越國(guó)內(nèi)生產(chǎn)總值增長(zhǎng)率的超常速度快速發(fā)展。特別是進(jìn)入21世紀(jì)我國(guó)加入WTO以來,我國(guó)保險(xiǎn)市場(chǎng)真正實(shí)現(xiàn)對(duì)外開放,隨著外資公司的入駐,我國(guó)保險(xiǎn)市場(chǎng)競(jìng)爭(zhēng)加劇,但同時(shí)在行業(yè)制度、業(yè)務(wù)模塊、機(jī)構(gòu)設(shè)置以及市場(chǎng)監(jiān)管等方面的革新起到了促進(jìn)作用,加速了我國(guó)保險(xiǎn)市場(chǎng)的改革進(jìn)程。
隨著保險(xiǎn)業(yè)的深入發(fā)展,我們發(fā)現(xiàn)很多保險(xiǎn)公司盲目擴(kuò)張資產(chǎn)規(guī)模,而忽視了公司經(jīng)營(yíng)的效率問題,導(dǎo)致出現(xiàn)費(fèi)用支出不合理、損失率過大、盈利能力下降等問題。保險(xiǎn)公司經(jīng)營(yíng)效率已經(jīng)成為當(dāng)今保險(xiǎn)業(yè)發(fā)展的焦點(diǎn)。本文采用《中國(guó)保險(xiǎn)年鑒2014》的數(shù)據(jù),通過數(shù)據(jù)挖掘的方法對(duì)國(guó)內(nèi)50家財(cái)產(chǎn)保險(xiǎn)公司進(jìn)行聚類分析,篩選主要財(cái)務(wù)指標(biāo)對(duì)財(cái)險(xiǎn)公司進(jìn)行歸類,旨在用數(shù)據(jù)來發(fā)現(xiàn)我國(guó)保險(xiǎn)業(yè)發(fā)展存在的問題。
自2005年以來,大量已發(fā)表的財(cái)務(wù)分析、財(cái)務(wù)危機(jī)識(shí)別、企業(yè)績(jī)效評(píng)價(jià)的文章采用了數(shù)據(jù)挖掘中的技術(shù)。李思志、郭春暉、李艷紅(2006)分析,2000—2005年間中國(guó)核心刊物上發(fā)表的利用數(shù)據(jù)挖掘在財(cái)務(wù)領(lǐng)域運(yùn)用的文章不到10篇,而數(shù)據(jù)挖掘的技術(shù)主要運(yùn)用于行業(yè)企業(yè)特征分類和財(cái)務(wù)預(yù)警。之后,學(xué)術(shù)界主要利用數(shù)據(jù)挖掘中的機(jī)械學(xué)習(xí)、決策樹方法,對(duì)企業(yè)績(jī)效進(jìn)行評(píng)價(jià),如傅毓維、尹航、楊貴彬(2006)選取了財(cái)務(wù)報(bào)表中的一些重要指標(biāo),設(shè)定輸入和輸出因素,進(jìn)行了BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),得到評(píng)價(jià)模型。此外,機(jī)械學(xué)習(xí)在異常點(diǎn)診斷方面,也被應(yīng)用到財(cái)務(wù)領(lǐng)域。黃章樹、喬昕(2011)利用神經(jīng)網(wǎng)絡(luò)和SVM對(duì)ST公司進(jìn)行分類判別。數(shù)據(jù)挖掘中的PCA降維方法也被廣泛運(yùn)用到企業(yè)財(cái)務(wù)領(lǐng)域,如范瑜、宋宇翔(2013)對(duì)2006—2011年的具有完整數(shù)據(jù)的上市公司進(jìn)行了因子分析。本文采用的聚類分析方法相對(duì)于神經(jīng)網(wǎng)絡(luò)方面的文獻(xiàn)較少,但是也被運(yùn)用到企業(yè)財(cái)務(wù)研究中。李劍鋒(2005)對(duì)我國(guó)十大鋼鐵公司進(jìn)行了聚類研究,齊中華、黃麗娜(2010)對(duì)上市公司財(cái)務(wù)狀況采用了模糊聚類的研究方法,孫力(2009)則在其論文中對(duì)滬市上市公司進(jìn)行分類,并對(duì)聚類剖面進(jìn)行了分析。
(一)數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(Data Mining)是近年來隨著計(jì)算機(jī)技術(shù)被廣泛應(yīng)用的數(shù)據(jù)處理技術(shù),主要分為聚類、關(guān)聯(lián)、分類、異常點(diǎn)診斷、預(yù)測(cè)、回歸。數(shù)據(jù)挖掘的流程一般為目標(biāo)定義、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)探索、模型建立、模型部署,而日新月異的數(shù)據(jù)庫(kù)技術(shù)和各類優(yōu)化算法的發(fā)展,極大促進(jìn)了數(shù)據(jù)挖掘的應(yīng)用。
以往的數(shù)據(jù)挖掘在公司經(jīng)營(yíng)狀況的研究,主要利用的是傳統(tǒng)打分法和神經(jīng)網(wǎng)絡(luò)、SVM、決策樹等有監(jiān)督的機(jī)械學(xué)習(xí)結(jié)合,構(gòu)建評(píng)價(jià)模型,對(duì)于聚類這樣的無監(jiān)督學(xué)習(xí)方法應(yīng)用較少。此外,之前的數(shù)據(jù)挖掘主要對(duì)一些一級(jí)或二級(jí)財(cái)務(wù)指標(biāo)進(jìn)行評(píng)價(jià),作為輸入,有一定加工,而本文嘗試使用原始財(cái)務(wù)報(bào)表簡(jiǎn)單處理的信息。先前的公司研究對(duì)象一般是生產(chǎn)制造型企業(yè),而對(duì)保險(xiǎn)公司的研究幾乎一片空白,而保險(xiǎn)公司的財(cái)務(wù)報(bào)告又具有特殊性,因此本文在此基礎(chǔ)上進(jìn)行了嘗試。
(二)聚類分析
聚類方法在多元統(tǒng)計(jì)領(lǐng)域已經(jīng)被廣泛運(yùn)用,其屬于無監(jiān)督學(xué)習(xí)的方法,這是指對(duì)于聚類的結(jié)果,并沒有統(tǒng)一的外部評(píng)價(jià)。聚類是將相似的樣本歸為一類,當(dāng)達(dá)到外部設(shè)定的類數(shù)時(shí),則停止聚類,那么聚類的關(guān)鍵是對(duì)于相似的定義。本文應(yīng)用的聚類方法是K-means方法,給出分組數(shù)k以及初始分組,隨后反復(fù)迭代,直到分組不再變化為止。
類的度量方法主要是指類的距離,這里的距離往往有三種定義:閔科夫斯基(Minkowski)距離、蘭式(Lance、Williams)距離和馬哈拉諾比斯(Mahalanobis)距離。這里我們采用閔科夫斯基距離進(jìn)行歸類。閔科夫斯基(Minkowski)距離:
當(dāng)q=1,閔氏指絕對(duì)距離;當(dāng)q=2,閔氏指歐式距離;當(dāng)q〉2時(shí),是切比雪夫距離。本文采取的是歐氏距離,它是m維空間中兩點(diǎn)之間的真實(shí)距離:
(三)輪廓系數(shù)法
對(duì)于分組的個(gè)數(shù)k,往往采用經(jīng)驗(yàn)法、閾值法和輪廓系數(shù)法。經(jīng)驗(yàn)法是根據(jù)經(jīng)驗(yàn)給出分組數(shù),閾值法是觀察分類結(jié)果,給出適當(dāng)閾值重新分類,防止類數(shù)太少或者類數(shù)過多,輪廓系數(shù)法是計(jì)算類別數(shù)和輪廓系數(shù)關(guān)系,盡量使平均輪廓系數(shù)變大。這里我們采用輪廓系數(shù)法確定分組數(shù)k。
輪廓系數(shù)(ASW,averagesilhouettewidth)是由Kaufman和Rousseeuw提出的用于度量類內(nèi)相異度與類間最小相異度比值的參數(shù)。第i個(gè)點(diǎn)的輪廓系數(shù)定義如下:
a是第i個(gè)點(diǎn)與其他同類點(diǎn)的平均距離,b表示第i個(gè)點(diǎn)與不同類的類內(nèi)個(gè)點(diǎn)平均距離構(gòu)成的向量,S(i)在[-1,1]之間。因?yàn)镵-means方法受初始點(diǎn)敏感性較大,所以分類時(shí)多次實(shí)驗(yàn),取其中最頻繁結(jié)果為其穩(wěn)定結(jié)果,避免離散點(diǎn)的干擾。
圖1 固定資產(chǎn)總計(jì)、負(fù)債總計(jì)、資產(chǎn)總計(jì)和投資收益企業(yè)數(shù)量頻次分布圖
圖2 已賺保費(fèi)、實(shí)際期望損失、營(yíng)業(yè)費(fèi)用和利潤(rùn)總額頻次分布圖
圖3 剔除離群點(diǎn)后的固定資產(chǎn)總計(jì)、負(fù)債總計(jì)、資產(chǎn)總計(jì)和投資收益企業(yè)數(shù)量頻次分布圖
(一)數(shù)據(jù)選取
本文選取的數(shù)據(jù)為2013年內(nèi)的我國(guó)所有財(cái)險(xiǎn)公司,數(shù)據(jù)來源自《中國(guó)保險(xiǎn)年鑒2014》。截止到2013年年末,全國(guó)共有保險(xiǎn)集團(tuán)公司10家,保險(xiǎn)公司143家。其中財(cái)險(xiǎn)公司有64家,原保險(xiǎn)保費(fèi)收入達(dá)到6212.26億元,同比增長(zhǎng)16.53%。
數(shù)據(jù)挖掘前應(yīng)當(dāng)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理及清洗。資產(chǎn)負(fù)債表保留固定資產(chǎn)、負(fù)債總計(jì)、資產(chǎn)總計(jì)三項(xiàng),損益表營(yíng)業(yè)收入保留已賺保費(fèi)、投資收益,營(yíng)業(yè)支出歸納為實(shí)際損失期望(賠付支出+提取未決賠款準(zhǔn)備金)、營(yíng)業(yè)費(fèi)用(營(yíng)業(yè)稅金及附加+手續(xù)費(fèi)及傭金支出+業(yè)務(wù)及管理費(fèi)),利潤(rùn)類保留利潤(rùn)總額,總計(jì)8項(xiàng)屬性。上述刪減是由于財(cái)務(wù)報(bào)表中各項(xiàng)分錄相關(guān)性大,而相互之間有線性關(guān)系,因此在盡量保留信息的情況下對(duì)屬性類型進(jìn)行降維處理,以解決樣本數(shù)較少的問題。
圖4 剔除離群點(diǎn)后的已賺保費(fèi)、實(shí)際期望損失、營(yíng)業(yè)費(fèi)用和利潤(rùn)總額頻次分布圖
?表1 八因素聚類5組別數(shù)據(jù)歸一化平均系數(shù)
?表2 八因素聚類5組別保險(xiǎn)公司
?表3 八因素聚類5組別原始數(shù)據(jù)(單位:百萬元)
(二)數(shù)據(jù)探索
數(shù)據(jù)預(yù)處理后,我們需要對(duì)數(shù)據(jù)進(jìn)行預(yù)先探索,了解其特征。對(duì)于上述篩選出的八項(xiàng)屬性,我們利用MATLAB畫出每項(xiàng)屬性的值的頻次分布圖,如圖1、圖2。
從圖中可以清晰發(fā)現(xiàn),大部分屬性的集中度較高,但是有少數(shù)離群點(diǎn),所以我們需要對(duì)離群點(diǎn)進(jìn)行篩除,經(jīng)過檢測(cè),我們采取的過濾條件為資產(chǎn)總計(jì)大于200億元人民幣以及實(shí)際期望損失小于0。經(jīng)過去除離群點(diǎn)后,我們得到如圖3、圖4的頻次分布情況。
可以看出剩余點(diǎn)所形成的分布較為連續(xù),具有可聚類性。篩除的公司為人保財(cái)險(xiǎn)、國(guó)壽財(cái)險(xiǎn)、大地、太保產(chǎn)險(xiǎn)、平安產(chǎn)險(xiǎn)、中華聯(lián)合、陽光產(chǎn)險(xiǎn)、安邦產(chǎn)險(xiǎn)、陽光農(nóng)險(xiǎn)。其中陽光農(nóng)險(xiǎn)因?yàn)槠鋵?shí)際損失期望為負(fù)而被篩除,其余幾家保險(xiǎn)公司因?yàn)槠滟Y產(chǎn)規(guī)模龐大而被篩除。
(一)初步聚類分析
在對(duì)數(shù)據(jù)進(jìn)行歸一化處理后,筆者對(duì)3項(xiàng)主要數(shù)據(jù)項(xiàng)進(jìn)行了聚類。聚類的類數(shù)利用了輪廓系數(shù)法。因?yàn)槊看蜬-means結(jié)果都有可能不同,因此我們進(jìn)行了5次輪廓系數(shù)—類別數(shù)關(guān)系圖的繪制,其結(jié)果都基本相同,圖5、圖6為一次結(jié)果展示。
可以發(fā)現(xiàn)2、3類別數(shù)時(shí),結(jié)果較為完好,而2類類別數(shù)過于稀少,因此采取3類類別數(shù)分類結(jié)果較為有意義。接下來,進(jìn)行3類類別的聚類,同樣,采取了多次實(shí)驗(yàn)的方法,尋找出現(xiàn)頻率最高的分類結(jié)果,下述結(jié)果被確定為聚類的結(jié)果。圖7為分類結(jié)果的空間分布圖以及各點(diǎn)的輪廓系數(shù)圖。
通過對(duì)圖7進(jìn)行分析發(fā)現(xiàn),保險(xiǎn)公司的資產(chǎn)規(guī)模、費(fèi)用支出與利潤(rùn)抱成三團(tuán),三個(gè)屬性存在確定的相關(guān)關(guān)系。
(二)八屬性聚類
在對(duì)3項(xiàng)主要屬性聚類分析后,我們對(duì)八項(xiàng)屬性也進(jìn)行了聚類分析。首先多次實(shí)驗(yàn),判別聚類數(shù)量,經(jīng)過20次實(shí)驗(yàn),筆者發(fā)現(xiàn),聚類效果并不明顯,這可能是因?yàn)楦鳂颖静皇前凑涨驙畲胤植紝?dǎo)致的。因?yàn)闃颖緮?shù)為50,而聚類效果不應(yīng)當(dāng)超過5類(50/10),否則會(huì)產(chǎn)生過度擬合,因此,本文選用5類來對(duì)八屬性樣本進(jìn)行聚類。
圖5 3因素聚類類別數(shù)—平均輪廓值折線圖
圖6 3因素聚類3組別輪廓值柱狀圖
圖7 3因素聚類3組別空間分布圖
圖8 八因素聚類類別數(shù)——平均輪廓值折線圖
圖9 八因素聚類5組別輪廓值柱狀圖
進(jìn)行10次5類聚類后,下述結(jié)果是最頻繁結(jié)果,且輪廓系數(shù)值較為優(yōu)秀,其結(jié)果如表1,而分類結(jié)果如表2。按分類結(jié)果提取原始數(shù)據(jù),結(jié)果如表3。
(一)對(duì)資本利潤(rùn)率進(jìn)行分析
根據(jù)表4,第1類公司處于嚴(yán)重虧損狀態(tài),平均資本利潤(rùn)率低至-12.25%;而資本利潤(rùn)率隨著資產(chǎn)規(guī)模的增大而趨于好轉(zhuǎn),到第2類、第3類、第4類盈利能力好轉(zhuǎn)但還是處于虧損或面臨虧損狀態(tài);而在第5類才基本實(shí)現(xiàn)盈利狀態(tài)。表明保險(xiǎn)公司的盈利能力與資產(chǎn)規(guī)模存在一定的正相關(guān)關(guān)系。而觀察被剔除的大規(guī)模保險(xiǎn)公司,例如國(guó)壽財(cái)險(xiǎn)、大地保險(xiǎn)及陽光財(cái)險(xiǎn)三家大保險(xiǎn)公司的平均資本利潤(rùn)率是1.45%,說明資產(chǎn)規(guī)模并不是越大越好,在達(dá)到一定規(guī)模后盈利能力減弱。
?表4 5組別保險(xiǎn)公司資本利潤(rùn)率(單位:百萬元)
?表5 5組別保險(xiǎn)公司費(fèi)用率(單位:百萬元)
?表6 5組別保險(xiǎn)公司承保風(fēng)險(xiǎn)(單位:百萬元)
(二)對(duì)營(yíng)業(yè)費(fèi)用進(jìn)行分析
根據(jù)表5,我們發(fā)現(xiàn)資產(chǎn)規(guī)模較大的財(cái)險(xiǎn)公司資產(chǎn)費(fèi)用率一般也較大,如第2、5類大于第3、4類;但第1類資本費(fèi)用率顯然與其資產(chǎn)規(guī)模不匹配,而其費(fèi)用利潤(rùn)率(每單位費(fèi)用貢獻(xiàn)的利潤(rùn))處于超低水平,不難推斷費(fèi)用支出不合理是造成第1類公司巨虧的重要原因。在剔除的公司中,我們發(fā)現(xiàn)安邦財(cái)險(xiǎn)資本費(fèi)用率低至1.163%,同時(shí)其費(fèi)用利潤(rùn)率高達(dá)336.018%,說明營(yíng)業(yè)費(fèi)用低是公司實(shí)現(xiàn)盈利的一個(gè)重大因素。
(三)對(duì)已賺保費(fèi)、實(shí)際期望損失進(jìn)行分析
根據(jù)表6,由于已賺保費(fèi)與實(shí)際期望損失一般都隨資產(chǎn)規(guī)模增大而增大,難以發(fā)現(xiàn)其中關(guān)系。我們觀察兩者比值發(fā)現(xiàn)資產(chǎn)規(guī)模較大的保險(xiǎn)公司,如第2類、第5類實(shí)際期望損失/已賺保費(fèi)值普遍小于規(guī)模較小的公司。可能的原因是資產(chǎn)規(guī)模較大的保險(xiǎn)公司相對(duì)充足的業(yè)務(wù)規(guī)模使得承保風(fēng)險(xiǎn)得以有效分散,從而增加了風(fēng)險(xiǎn)管理的靈活性,維持了公司的穩(wěn)定經(jīng)營(yíng)。
(四)對(duì)投資收益進(jìn)行分析
根據(jù)表7,第1、3、4類公司投資收益率低于第2、5類公司,此時(shí)保險(xiǎn)公司的投資收益率與資產(chǎn)規(guī)模存在一定正相關(guān)關(guān)系。而對(duì)比異常樣本點(diǎn),8家大規(guī)模財(cái)險(xiǎn)公司(人保財(cái)險(xiǎn)、國(guó)壽財(cái)險(xiǎn)、大地保險(xiǎn)、太保產(chǎn)險(xiǎn)、平安產(chǎn)險(xiǎn)、中華聯(lián)合、陽光產(chǎn)險(xiǎn)、安邦產(chǎn)險(xiǎn))平均投資收益率處于3.5%的水平,說明投資收益率在第2類規(guī)模的水平已經(jīng)達(dá)到相對(duì)最優(yōu)狀態(tài),此后不會(huì)再出現(xiàn)規(guī)模遞增。
由以上幾項(xiàng)分析,我們不難發(fā)現(xiàn)規(guī)模不佳是大多數(shù)中小規(guī)模保險(xiǎn)公司存在的主要問題。規(guī)模不佳導(dǎo)致保險(xiǎn)公司盈利能力的下降主要表現(xiàn)在以下幾個(gè)方面:
(一)費(fèi)用支出不合理。營(yíng)業(yè)費(fèi)用作為保險(xiǎn)公司一項(xiàng)主要管理成本,主要由新合同費(fèi)用、合同維持費(fèi)用和收費(fèi)費(fèi)用構(gòu)成。許多保險(xiǎn)公司或者規(guī)模小難以分?jǐn)偝杀荆蛘呙つ繑U(kuò)增資產(chǎn)規(guī)模而忽視了公司內(nèi)部運(yùn)營(yíng)效率,導(dǎo)致費(fèi)用支出占比過大。
(二)經(jīng)營(yíng)穩(wěn)定性低。保險(xiǎn)業(yè)務(wù)得以開展的基礎(chǔ)是大數(shù)定律,即風(fēng)險(xiǎn)單位越多,實(shí)際損失的結(jié)果會(huì)越接近預(yù)期損失。而當(dāng)公司規(guī)模過小,導(dǎo)致承保業(yè)務(wù)量少,違背大數(shù)法則,風(fēng)險(xiǎn)不能有效分散,使得公司經(jīng)營(yíng)穩(wěn)定性差。
(三)投資環(huán)節(jié)薄弱。資金的投資運(yùn)營(yíng)是保險(xiǎn)公司的一個(gè)重要的收入來源,當(dāng)保險(xiǎn)公司規(guī)模小,資金不能有效運(yùn)用,投資收益下降。
針對(duì)保險(xiǎn)公司存在的問題,筆者認(rèn)為在做好內(nèi)部管理、提高效率的同時(shí),適當(dāng)增大公司規(guī)模將有助于提高公司盈利能力。而規(guī)模的擴(kuò)增應(yīng)以有序的保險(xiǎn)市場(chǎng)競(jìng)爭(zhēng)體系、完善的市場(chǎng)監(jiān)管機(jī)制為前提,提高經(jīng)營(yíng)效率的同時(shí)需要推進(jìn)市場(chǎng)改革,從公司內(nèi)部與市場(chǎng)環(huán)境兩方面著手實(shí)現(xiàn)保險(xiǎn)公司經(jīng)濟(jì)規(guī)模。