亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機器學(xué)習(xí)在財務(wù)欺詐風(fēng)險預(yù)警問題中的應(yīng)用研究

        2021-09-23 03:16:42李林杰
        今日財富 2021年28期
        關(guān)鍵詞:欺詐貝葉斯靜態(tài)

        李林杰

        隨著大數(shù)據(jù)時代的到來與機器學(xué)習(xí)方法的不斷的發(fā)展,如何系統(tǒng)挖掘并識別企業(yè)的財務(wù)報表中的欺詐風(fēng)險,建立高識別率的財務(wù)欺詐風(fēng)險預(yù)警模型,對于證券市場的規(guī)范運作,高效率完成審計工作具有重要意義。本文以我國制造業(yè)A股上市公司為例,在基本財務(wù)數(shù)據(jù)的基礎(chǔ)上從靜態(tài)、個體、時間三個維度進(jìn)行指標(biāo)構(gòu)建,訓(xùn)練了lightgbm、xgboost、catboost、svm4種模型,根據(jù)模型的特點不同分別采用貝葉斯優(yōu)化與網(wǎng)格搜索法進(jìn)行參數(shù)調(diào)優(yōu),最終將調(diào)優(yōu)后的模型采用等權(quán)重voting法進(jìn)行模型融合。結(jié)果發(fā)現(xiàn):測試集上的AUC值可達(dá)到0.8,能夠?qū)Πl(fā)生財務(wù)欺詐的企業(yè)進(jìn)行有效識別,希冀能夠為機器學(xué)習(xí)方法在財務(wù)欺詐風(fēng)險預(yù)警中的應(yīng)用提供一定的思路與參考。

        一、引言

        近年來,隨著上市公司規(guī)模的增大,越來越多的財務(wù)欺詐開始出現(xiàn)。財務(wù)欺詐發(fā)生時將會對資本市場,個人投資者造成巨大傷害,不利于金融市場的良好發(fā)展,因此如何對財務(wù)欺詐進(jìn)行有效識別與預(yù)警成為一個備受關(guān)注的問題。

        在財務(wù)欺詐的方面,可以劃分為傳統(tǒng)人力審計與大數(shù)據(jù)識別模型兩種。傳統(tǒng)方法大多基于具有一定專業(yè)知識的審計類財務(wù)人員,運用其財務(wù)知識對企業(yè)的財務(wù)數(shù)據(jù)報表進(jìn)行審查,這將耗費巨大的人力,效率與準(zhǔn)確率都具有較大的局限性。隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,運用機器學(xué)習(xí)方法建立有效、高識別率的財務(wù)欺詐預(yù)警模型成為了可能。

        本文的貢獻(xiàn)包括兩個方面:第一,特征工程。在從盈利、償債、資產(chǎn)管理、現(xiàn)金、成長五個維度構(gòu)建靜態(tài)財務(wù)指標(biāo)的基礎(chǔ)上,從公司個體維度構(gòu)建橫向動態(tài)指標(biāo)、從時間維度構(gòu)建縱向動態(tài)財務(wù)指標(biāo),最終完成靜態(tài)、個體、時間三個維度的特征構(gòu)建。第二,模型融合。在應(yīng)用xgboost、lightGbm、catBoost、svm等優(yōu)異的機器學(xué)習(xí)方法基礎(chǔ)上,通過等權(quán)重voting方法進(jìn)行模型融合,進(jìn)一步提高了對財務(wù)欺詐識別模型的準(zhǔn)確率。

        二、相關(guān)理論

        (一)財務(wù)欺詐的動機

        上市公司財務(wù)欺詐即因自身利益而在財務(wù)報告中采用故意錯報、瞞報等方式,以虛假的財務(wù)信息欺騙財務(wù)報表使用者的行為。財務(wù)欺詐的動機可分為外因和內(nèi)因兩個部分:

        外部原因主要體現(xiàn)在監(jiān)管體制、會計制度和證券機制三個方面。由于監(jiān)管體制的放松,會計制度在某些層面規(guī)定不嚴(yán)密,證券機制要求公司在上市前三年必須實現(xiàn)連續(xù)盈利,因此某些公司會鋌而走險發(fā)生財務(wù)欺詐行為。

        內(nèi)部原因即企業(yè)的利益驅(qū)動。經(jīng)濟(jì)利益是企業(yè)的核心目的,為了吸取融資公司會通過財務(wù)欺詐來騙取投資方的信任。

        (二)財務(wù)欺詐表現(xiàn)

        雖然財務(wù)欺詐的表現(xiàn)形式多種多樣,總體來說可概括成以下四個方面:

        1.會計資料:編制虛假會計報表、會計資料和其他資料。

        2.會計政策方面:蓄意披露和使用與經(jīng)濟(jì)事實不符的會計政策,掩蓋事實真相。

        3.會計確認(rèn)與計量:隨意變更財務(wù)指標(biāo),諸如資產(chǎn)、負(fù)債以及所有者權(quán)益等確認(rèn)標(biāo)準(zhǔn)。

        4.交易事項及記錄:沒有如實按實際的業(yè)務(wù)結(jié)果予以記錄。

        三、實證分析

        (一)數(shù)據(jù)來源

        本文的研究對象為A股的制造業(yè)上市公司,其中企業(yè)的財務(wù)數(shù)據(jù)包括盈利、償債、現(xiàn)金等多個維度,包括5年的年度財務(wù)數(shù)據(jù),涉及到300余個變量。數(shù)據(jù)來源為某大數(shù)據(jù)挖掘平臺。

        (二)數(shù)據(jù)預(yù)處理

        在數(shù)據(jù)預(yù)處理階段,主要對缺失值進(jìn)行處理,將來原始數(shù)據(jù)中缺失值大于10%的變量剔除。剔除缺失值高的變量之后,在數(shù)據(jù)填充方面,對于每個指標(biāo),若公司有往年相關(guān)數(shù)據(jù)的話,使用公司歷年指標(biāo)的平均值進(jìn)行填充;若該公司沒有該指標(biāo)的數(shù)據(jù)的話,通過該指標(biāo)行業(yè)的平均值進(jìn)行填充。

        (三)特征工程

        1.靜態(tài)指標(biāo)

        基于上市發(fā)生財務(wù)數(shù)據(jù)造假的動因及數(shù)據(jù)維度的劃分,借鑒張宏斌(2020)等學(xué)者的指標(biāo)構(gòu)建思路,本文從盈利、償債、資產(chǎn)管理、現(xiàn)金、成長五個維度構(gòu)造靜態(tài)財務(wù)指標(biāo),如表1所示:

        2.動態(tài)指標(biāo)

        考慮到機器學(xué)習(xí)方法對大數(shù)據(jù)的強擬合能力以及企業(yè)發(fā)生財務(wù)欺詐的動因與數(shù)據(jù)表現(xiàn),本文在靜態(tài)財務(wù)指標(biāo)的基礎(chǔ)上構(gòu)建動態(tài)財務(wù)指標(biāo)。在動態(tài)指標(biāo)方面,從個體與時間維度分別構(gòu)造橫向動態(tài)指標(biāo)與縱向動態(tài)指標(biāo):

        橫向動態(tài)指標(biāo)即對當(dāng)年與該行業(yè)其它公司的平均值做差值,幫助發(fā)現(xiàn)企業(yè)今年相對于行業(yè)平均變動的異常變動,若存在缺失值則用同年份該指標(biāo)均值填充。

        縱向動態(tài)指標(biāo)即靜態(tài)指標(biāo)與該公司往年指標(biāo)的平均值做差值,幫助發(fā)現(xiàn)企業(yè)今年與往年相比是否存在指標(biāo)的異常變動。其中若存在缺失值則用平均值進(jìn)行填充;若該公司每年的指標(biāo)均缺失,則用所有公司對應(yīng)指標(biāo)的平均值進(jìn)行填充。

        (四)數(shù)據(jù)集劃分

        將前4年的數(shù)據(jù)為訓(xùn)練集,以第5年的數(shù)據(jù)為測試集來對調(diào)優(yōu)后的模型進(jìn)行性能評估。為了不改變原始樣本的分布,在數(shù)據(jù)集劃分時通過python數(shù)據(jù)預(yù)處理函數(shù)train_test_split中的stratify參數(shù)進(jìn)行分層劃分,劃分后的訓(xùn)練集、驗證集、測試集的樣本量分別為6054、2595、2660。

        (五)財務(wù)欺詐預(yù)警模型構(gòu)建及調(diào)優(yōu)

        將經(jīng)過靜態(tài)、個體、時間三個維度所構(gòu)建特征作為自變量,以企業(yè)是否發(fā)生財務(wù)欺詐為因變量,分別訓(xùn)練lightgbm、xgboost、catboost、svm模型,最終通過voting方法進(jìn)行等權(quán)重模型融合,最終得到企業(yè)是否發(fā)生財務(wù)欺詐的預(yù)測結(jié)果,模型構(gòu)建過程如圖1所示:

        其中,在機器學(xué)習(xí)模型的訓(xùn)練過程中將進(jìn)行參數(shù)調(diào)優(yōu)。參數(shù)調(diào)優(yōu)的方法包括貝葉斯優(yōu)化、網(wǎng)格搜索方法。貝葉斯優(yōu)化方法的其主要思想是:給定優(yōu)化的目標(biāo)函數(shù),然后不斷地添加樣本點,進(jìn)而更新目標(biāo)函數(shù)的后驗分布。相比于常規(guī)的網(wǎng)格搜索法而言具有以下優(yōu)勢:

        第一, 貝葉斯調(diào)參采用高斯過程,即利用之前的參數(shù)信息,不斷地更新先驗;而網(wǎng)格搜索未考慮之前的參數(shù)信息;

        第二, 貝葉斯調(diào)參迭代次數(shù)少,速度快;而網(wǎng)格搜索速度慢,并且參數(shù)較多時易導(dǎo)致維度爆炸;

        第三, 貝葉斯調(diào)參針對非凸問題依然穩(wěn)健;網(wǎng)格搜索針對非凸問題易陷入局部最優(yōu)。

        考慮到不同模型與調(diào)參方法的優(yōu)點,采用貝葉斯全局優(yōu)化方法對lightgbm、xgboost、catboost模型的多個參數(shù)進(jìn)行調(diào)優(yōu);采用網(wǎng)格搜索對svm模型進(jìn)行參數(shù)調(diào)優(yōu),最終基于模型在測試集上的AUC指標(biāo)對調(diào)參效果進(jìn)行評價。各模型在測試集上的擬合效果對比結(jié)果如圖2所示:

        通過圖2可以發(fā)現(xiàn),在經(jīng)過模型的參數(shù)調(diào)優(yōu)后,各模型的AUC值均得到了提升,說明參數(shù)調(diào)優(yōu)有效,得到了最優(yōu)的單一模型。

        (六)模型融合

        在通過參數(shù)調(diào)優(yōu)獲得最優(yōu)的單一模型結(jié)果的基礎(chǔ)上,運用等權(quán)重voting投票法進(jìn)行模型融合,結(jié)果如表2所示:

        經(jīng)過voting融合后,模型在測試集上的auc值達(dá)到了0.8,相對于單一的機器學(xué)習(xí)方法,模型融合進(jìn)一步提升了對財務(wù)欺詐的識別能力,驗證了本文提出的財務(wù)欺詐風(fēng)險預(yù)警模型的有效性。

        四、結(jié)語

        本文在上市公司基本財務(wù)數(shù)據(jù)的基礎(chǔ)上,對缺失值在10%以上的指標(biāo)進(jìn)行剔除處理。考慮到上市公司發(fā)生財務(wù)數(shù)據(jù)造假的動機、表現(xiàn)以及機器學(xué)習(xí)對高維數(shù)據(jù)的強擬合能力,從盈利、償債、資產(chǎn)管理、現(xiàn)金、成長五個維度構(gòu)建了靜態(tài)財務(wù)指標(biāo),并在此基礎(chǔ)上從個體維度與時間維度分別構(gòu)建了橫向動態(tài)指標(biāo)與縱向動態(tài)指標(biāo),并將指標(biāo)作為機器學(xué)習(xí)的輸入特征用于預(yù)測企業(yè)是否發(fā)生財務(wù)欺詐。通過lightgbm、xgboost、catboost、svm模型的訓(xùn)練及調(diào)優(yōu)后發(fā)現(xiàn),除了svm模型外,其余模型在測試集上的auc值均能達(dá)到0.7以上,且相對于調(diào)參前的auc值均有效提高,說明經(jīng)過調(diào)參的有效性。最終,采用Voting等權(quán)重投票法進(jìn)行模型融合,最終結(jié)果在測試集上的auc值可達(dá)到0.8,能夠?qū)ω攧?wù)欺詐風(fēng)險進(jìn)行有效的識別與預(yù)警。本文的核心工作在于特征構(gòu)建與前沿機器學(xué)習(xí)方法、貝葉斯優(yōu)化、模型融合的應(yīng)用,通過制造業(yè)上市公司的財務(wù)數(shù)據(jù)的實證結(jié)果證明了本文的財務(wù)欺詐預(yù)警模型的有效性。

        (作者單位:上海對外經(jīng)貿(mào)大學(xué))

        猜你喜歡
        欺詐貝葉斯靜態(tài)
        關(guān)于假冒網(wǎng)站及欺詐行為的識別
        關(guān)于假冒網(wǎng)站及欺詐行為的識別
        靜態(tài)隨機存儲器在軌自檢算法
        警惕國際貿(mào)易欺詐
        中國外匯(2019年10期)2019-08-27 01:58:04
        貝葉斯公式及其應(yīng)用
        基于貝葉斯估計的軌道占用識別方法
        網(wǎng)購遭欺詐 維權(quán)有種法
        一種基于貝葉斯壓縮感知的說話人識別方法
        電子器件(2015年5期)2015-12-29 08:43:15
        機床靜態(tài)及動態(tài)分析
        機電信息(2015年9期)2015-02-27 15:55:56
        具7μA靜態(tài)電流的2A、70V SEPIC/升壓型DC/DC轉(zhuǎn)換器
        青青青草视频手机在线| 午夜福利啪啪片| 中文字幕久无码免费久久| 999精品全免费观看视频| 欧洲一级无码AV毛片免费| 少妇性l交大片免费1一少| 毛片无遮挡高清免费久久| 天堂岛国精品在线观看一区二区| 人妻熟女中文字幕av| 日本精品视频二区三区| 久久99热狠狠色精品一区| 性动态图av无码专区| 在线毛片一区二区不卡视频| 小草手机视频在线观看| 风韵人妻丰满熟妇老熟| 成人中文乱幕日产无线码| 中文字幕在线播放| 国产成人免费一区二区三区| 亚洲中文字幕诱惑第一页| 极品一区二区在线视频| 曰韩无码无遮挡a级毛片| 国产欧美日韩久久久久| 亚洲中文一本无码AV在线无码| 亚洲综合中文一区二区| 公厕偷拍一区二区三区四区五区| 国产草草影院ccyycom| 亚洲国产区男人本色| 久久一区av蜜桃人妻| 亚洲精品一区二区成人精品网站 | 亚洲熟妇无码一区二区三区导航| 国产成人av一区二区三区在线| 在线你懂| 日本老熟妇五十路一区二区三区 | 熟妇人妻无码中文字幕| 国产一区二区a毛片色欲| 久久精品av在线视频| 亚洲av综合色区无码专区桃色| 欧洲一卡2卡三卡4卡免费网站| 四川丰满少妇被弄到高潮 | 国产又黄又湿又爽的免费视频| 大地资源网在线观看免费官网|