亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        審計(jì)知識(shí)圖譜構(gòu)建與推理在審計(jì)風(fēng)險(xiǎn)評(píng)估中的應(yīng)用研究*

        2023-03-21 02:22:08劉一鳴單鴻濤張高煜張勤濤袁先智
        計(jì)算機(jī)時(shí)代 2023年3期
        關(guān)鍵詞:決策樹圖譜實(shí)體

        劉一鳴,單鴻濤,張高煜,張勤濤,袁先智

        (1.上海工程技術(shù)大學(xué),上海 201620;2.上海立信會(huì)計(jì)金融學(xué)院;3.上海機(jī)電股份有限公司(資產(chǎn)財(cái)務(wù)部);4.中山大學(xué)管理學(xué)院)

        0 引言

        傳統(tǒng)的人工審計(jì)模式存在著流程復(fù)雜、審計(jì)廣度有限等缺陷,面對(duì)大數(shù)據(jù)下信息量龐大、離散程度高的財(cái)務(wù)數(shù)據(jù),就會(huì)產(chǎn)生處理數(shù)據(jù)耗時(shí)長、信息披露不全面等后果,難以支持實(shí)體經(jīng)濟(jì)。因此,有效地運(yùn)用大數(shù)據(jù)背景下帶來的海量數(shù)據(jù),通過智能化的推理方法深度挖掘隱藏信息,成為了審計(jì)人員重點(diǎn)關(guān)注的問題。

        本文基于自然語言處理和審計(jì)合規(guī)知識(shí),提出并實(shí)現(xiàn)了審計(jì)知識(shí)圖譜構(gòu)建與推理的新型體系框架輔助審計(jì)風(fēng)險(xiǎn)評(píng)估,并通過案例公司——WD 醫(yī)療,從業(yè)務(wù)層面具體分析知識(shí)圖譜構(gòu)建與推理如何賦能審計(jì)風(fēng)險(xiǎn)評(píng)估程序。

        本文的創(chuàng)新之處在于:目前審計(jì)領(lǐng)域尚未有學(xué)者提出普適性的審計(jì)語義網(wǎng)絡(luò)定義,也未有資料提及審計(jì)知識(shí)圖譜與規(guī)則推理的整個(gè)實(shí)現(xiàn)流程。本文在這幾方面都提出了創(chuàng)新的解決方案與算法。

        1 國內(nèi)外文獻(xiàn)綜述

        在智能審計(jì)研究領(lǐng)域,隨著數(shù)據(jù)挖掘概念的提出與普及,有學(xué)者設(shè)計(jì)了3種數(shù)據(jù)挖掘方法,對(duì)于理論知識(shí)和方法實(shí)現(xiàn)詳盡描述的同時(shí),嘗試將其運(yùn)用于實(shí)際審計(jì)工作之中(McNamee D.and G,1998)[1]。有學(xué)者提出了持續(xù)審計(jì)智能服務(wù)(CAIaaS)的新架構(gòu),可以幫助審計(jì)師充分利用智能技術(shù)進(jìn)行工作(Dai J,Vasarhelyi M A,2020)[2];另有學(xué)者提供了用于智能審計(jì)的智能檢測引擎,自動(dòng)實(shí)現(xiàn)對(duì)合約等模塊的驗(yàn)證(Chakinam S,Tadepalli B,Pallapolu K C,2021)[3]。

        國內(nèi)對(duì)智能審計(jì)的研究起步較晚,但已有諸多學(xué)者專家進(jìn)行了理論研究與實(shí)踐。有學(xué)者針對(duì)知識(shí)審計(jì)提出研究內(nèi)容與知識(shí)圖譜、文獻(xiàn)計(jì)量綜合分析的方法,強(qiáng)調(diào)借助其他領(lǐng)域的研究成果補(bǔ)充審計(jì)理論知識(shí),完善整個(gè)審計(jì)體系(孟志華,關(guān)瑞娣,2017)[4]。還有學(xué)者在醫(yī)保審計(jì)方向進(jìn)行相關(guān)研究與調(diào)查,開創(chuàng)性將醫(yī)保審計(jì)知識(shí)圖譜實(shí)戰(zhàn)投入到審計(jì)實(shí)務(wù)之中,解決客觀存有的實(shí)際問題,發(fā)揮了風(fēng)險(xiǎn)識(shí)別與監(jiān)督作用(樊世昊,2018)[5];近兩年,有學(xué)者提出關(guān)于知識(shí)圖譜的未來發(fā)展方向主要包括時(shí)空多元關(guān)系抽取,動(dòng)態(tài)知識(shí)的獲取與表示,融合先驗(yàn)知識(shí)的實(shí)體鏈接等,基于圖數(shù)據(jù)的混合存儲(chǔ),構(gòu)建多模態(tài)知識(shí)圖譜(杭婷婷,2021)[6]。

        研究評(píng)述:在大數(shù)據(jù)環(huán)境下,諸多學(xué)者已關(guān)注到大數(shù)據(jù)對(duì)于傳統(tǒng)審計(jì)帶來的各種變化及影響,也逐漸關(guān)注到知識(shí)圖譜,但對(duì)于將知識(shí)圖譜與審計(jì)的跨學(xué)科研究內(nèi)容成果匱乏,真正搭建審計(jì)業(yè)務(wù)知識(shí)圖譜解析功能模塊的文獻(xiàn)較少。基于此,本文將從知識(shí)圖譜構(gòu)建與推理出發(fā),對(duì)其在審計(jì)風(fēng)險(xiǎn)評(píng)估中的應(yīng)用進(jìn)行具體闡述。

        2 審計(jì)知識(shí)圖譜系統(tǒng)構(gòu)建

        審計(jì)知識(shí)圖譜構(gòu)建包含九個(gè)模塊,模塊間關(guān)系及系統(tǒng)設(shè)計(jì)架構(gòu)如圖1所示。

        圖1 審計(jì)知識(shí)圖譜構(gòu)建的模塊及架構(gòu)

        2.1 基于財(cái)務(wù)和非財(cái)務(wù)指標(biāo)的審計(jì)語義網(wǎng)絡(luò)定義

        要構(gòu)建財(cái)務(wù)審計(jì)的語義網(wǎng)絡(luò),首先要對(duì)審計(jì)實(shí)體、關(guān)系以及屬性進(jìn)行定義。

        2.1.1 審計(jì)實(shí)體

        從原始數(shù)據(jù)集中,抽取出的獨(dú)立存在的實(shí)體,定義為審計(jì)實(shí)體,分為財(cái)務(wù)實(shí)體與非財(cái)務(wù)實(shí)體。其中,財(cái)務(wù)實(shí)體依據(jù)財(cái)政部頒發(fā)的《企業(yè)會(huì)計(jì)準(zhǔn)則應(yīng)用指南》中的會(huì)計(jì)科目名稱直接定義,例如庫存現(xiàn)金、銀行存款、應(yīng)收票據(jù)等;對(duì)于非財(cái)務(wù)實(shí)體,由于標(biāo)準(zhǔn)化程度相對(duì)較低,所以需要根據(jù)搜集的各類企業(yè)信息進(jìn)行歸納整理得出,數(shù)據(jù)來源包括企業(yè)的合同、產(chǎn)權(quán)證、憑證、票據(jù)、報(bào)關(guān)單等等,多為非結(jié)構(gòu)化數(shù)據(jù)。

        2.1.2 審計(jì)關(guān)系

        審計(jì)實(shí)體間的語義關(guān)系定義為審計(jì)關(guān)系,包括數(shù)據(jù)間及數(shù)據(jù)與屬性間的關(guān)系。

        財(cái)務(wù)與財(cái)務(wù)數(shù)據(jù)之間的關(guān)系:主要形式為會(huì)計(jì)科目間的上下級(jí)關(guān)系,可以直接從被審計(jì)單位提供的內(nèi)部數(shù)據(jù)中“科目名稱”項(xiàng)作為實(shí)體和關(guān)系進(jìn)行提取。

        非財(cái)務(wù)與非財(cái)務(wù)數(shù)據(jù)之間的關(guān)系:即與經(jīng)濟(jì)活動(dòng)相關(guān)聯(lián)的非財(cái)務(wù)數(shù)據(jù)間的關(guān)系。包括公司的高管任免情況、關(guān)聯(lián)交易情況等等,這類信息通常是非結(jié)構(gòu)化的。

        財(cái)務(wù)與非財(cái)務(wù)數(shù)據(jù)之間的關(guān)系:即財(cái)務(wù)數(shù)據(jù)與實(shí)際經(jīng)營活動(dòng)中產(chǎn)生的信息之間的關(guān)系。有兩種挖掘方法:第一種根據(jù)被審計(jì)單位財(cái)務(wù)軟件中存儲(chǔ)的科目信息、憑證信息、摘要等抽取相關(guān)聯(lián)的內(nèi)容;第二種是根據(jù)文本信息進(jìn)行關(guān)系挖掘。

        2.1.3 審計(jì)實(shí)體的屬性

        審計(jì)實(shí)體的屬性即被審計(jì)單位數(shù)據(jù)的具體信息,譬如固定資產(chǎn)科目中具體一項(xiàng)資產(chǎn)的編號(hào)、原值、折舊情況、購置日期等,作為對(duì)于實(shí)體的屬性的補(bǔ)充。

        2.2 數(shù)據(jù)獲取

        數(shù)據(jù)獲取階段的流程如圖2所示。獲取原始數(shù)據(jù)后,整合并建立三個(gè)數(shù)據(jù)庫:被審計(jì)單位原始數(shù)據(jù)庫、審計(jì)詞典及法律法規(guī)庫。審計(jì)詞典庫包含了會(huì)計(jì)和審計(jì)術(shù)語,作為財(cái)經(jīng)文本實(shí)體關(guān)系抽取分詞所需要的詞典備用;法律法規(guī)庫包含了上市公司遵循的會(huì)計(jì)和審計(jì)法律法規(guī),作為審計(jì)規(guī)則庫構(gòu)建所需要的事實(shí)備用。

        圖2 數(shù)據(jù)獲取模塊及流程結(jié)構(gòu)

        2.3 數(shù)據(jù)預(yù)處理

        由于大數(shù)據(jù)具有4V(即容量大、多樣性、價(jià)值低、速度快)的特性,難以直接作為審計(jì)數(shù)據(jù),因此需要進(jìn)行列清洗、轉(zhuǎn)化、標(biāo)注等步驟,流程如圖3所示。

        圖3 數(shù)據(jù)預(yù)處理模塊及流程結(jié)構(gòu)

        2.4 審計(jì)實(shí)體抽取

        由于審計(jì)實(shí)體較長、專業(yè)詞匯復(fù)雜、文本定位困難等問題,給信息抽取帶來了極大難度。如圖4所示,本文的實(shí)體抽取通過Bert-BiLSTM-CRF模型實(shí)現(xiàn)。

        圖4 Bert-BiLSTM-CRF模型

        Bert-BiLSTM-CRF 模型共分為三層,第一層為Bert 層,Bert 預(yù)訓(xùn)練模型運(yùn)用了雙向Transformer 的編碼器,引入了自注意力機(jī)制以及位置編碼表示。

        第二層為BiLSTM(長短時(shí)記憶神經(jīng)網(wǎng)絡(luò))層,在Bert 模型以及LSTM 基礎(chǔ)上以句子為單位建模,解決了只能獲取單向信息的問題,自動(dòng)提取句子特征。

        第三層為CRF(條件隨機(jī)場)層,BiLSTM 層僅考量了上下文信息,缺乏對(duì)于標(biāo)注序列間依賴信息的考慮。CRF可以為標(biāo)簽填寫一些額外的約束予以補(bǔ)充。

        2.5 審計(jì)關(guān)系抽取

        關(guān)系抽取面向非結(jié)構(gòu)化文本數(shù)據(jù),通過抽取實(shí)體間的語義關(guān)系來組成結(jié)構(gòu)化知識(shí),本模塊嘗試使用依存句法分析和PCNN 神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),其在CNN 的基礎(chǔ)上,對(duì)卷積層的輸出進(jìn)行優(yōu)化,同時(shí)運(yùn)用分段池化取代CNN 神經(jīng)網(wǎng)絡(luò)模型中的最大值池化操作。PCNN的分段池化是指以句中定位的兩個(gè)實(shí)體的位置分為三個(gè)片段,對(duì)這三個(gè)獨(dú)立的片段分別進(jìn)行池化操作,提煉句中具體精細(xì)的語義特征。

        在為PCNN構(gòu)建數(shù)據(jù)集時(shí),實(shí)體基于2.4中的實(shí)體抽取結(jié)果,關(guān)系基于依存句法分析結(jié)合關(guān)系抽取的規(guī)則對(duì)句中實(shí)體成分和關(guān)系成分的抽取,包含句子、關(guān)系、實(shí)體1、實(shí)體1 在句中的位置、實(shí)體2、實(shí)體2 在句中的位置。

        2.6 審計(jì)規(guī)則庫構(gòu)建

        該模塊運(yùn)用一階謂詞邏輯表示法構(gòu)建審計(jì)規(guī)則,格式為:if(如果)……,then(則)……。規(guī)則中的if 部分包含了一個(gè)或多個(gè)前置條件,作為決策樹的規(guī)則劃分,then部分表示如果滿足前置所有的前置條件(即各項(xiàng)指標(biāo)),則根據(jù)前置條件可以推斷出存在某一風(fēng)險(xiǎn)事項(xiàng)(即審計(jì)解釋)。

        2.7 審計(jì)實(shí)體關(guān)系統(tǒng)一及知識(shí)存儲(chǔ)

        在審計(jì)報(bào)告中“WD 醫(yī)療”、“WD 醫(yī)療科技股份有限公司”、“本公司”等財(cái)經(jīng)文本中抽取出來的實(shí)體代表著相同的含義,但卻通過簡稱、全稱、口語化稱呼抽取成為了三個(gè)不同的實(shí)體,因此需要進(jìn)行統(tǒng)一。

        知識(shí)圖譜構(gòu)建基礎(chǔ)是由實(shí)體間的關(guān)系組合的“圖”結(jié)構(gòu),因此在完成實(shí)體關(guān)系統(tǒng)一后采用適合語義網(wǎng)絡(luò)的三元組資源描述框架表示并完成知識(shí)存儲(chǔ)。

        2.8 知識(shí)圖譜生成及展示

        基于導(dǎo)入Neo4j 圖數(shù)據(jù)庫中的實(shí)體關(guān)系三元組,構(gòu)建與被審計(jì)單位相關(guān)的知識(shí)圖譜。如圖5 所示,以銀行存款科目圖譜為例,將銀行賬號(hào)作為節(jié)點(diǎn),屬性值包括開戶銀行、賬戶性質(zhì)、幣種、期初原幣金額、期初本位幣金額、本期增加額、本期減少額、期末原幣金額、匯率、期末本位幣金額等10余項(xiàng)信息。

        圖5 WD醫(yī)療銀行存款科目信息圖譜

        2.9 知識(shí)圖譜推理

        基于構(gòu)建的知識(shí)圖譜和審計(jì)規(guī)則庫,知識(shí)圖譜推理借助決策樹和隨機(jī)森林模型實(shí)現(xiàn)。由于審計(jì)決策樹只能推理評(píng)判某一組維度的數(shù)據(jù),而對(duì)于審計(jì)業(yè)務(wù)而言是由多維度的數(shù)據(jù)組成的,因此還需要通過隨機(jī)森林模型進(jìn)行全局補(bǔ)充。

        3 知識(shí)圖譜構(gòu)建與推理應(yīng)用分析

        本文提出的知識(shí)圖譜構(gòu)建與推理開源代碼在https://github.com/LaffitteZ。

        基于第2 節(jié)圖譜構(gòu)建方法,對(duì)WD 醫(yī)療知識(shí)圖譜構(gòu)建與推理簡要說明:

        ⑴研讀審計(jì)法律法規(guī)及規(guī)范性文件,結(jié)合專家經(jīng)驗(yàn)構(gòu)建審計(jì)規(guī)則庫;

        ⑵將采集的數(shù)據(jù)中結(jié)構(gòu)化部分直接轉(zhuǎn)換成三元組格式,非結(jié)構(gòu)化數(shù)據(jù)則通過語句切分和序列標(biāo)注,使用Bert-BiLSTM-CRF 模型進(jìn)行實(shí)體抽取,使用依存句法分析+PCNN 模型進(jìn)行關(guān)系抽取后轉(zhuǎn)存,構(gòu)建WD醫(yī)療知識(shí)圖譜;

        ⑶根據(jù)企業(yè)規(guī)章制度以及會(huì)計(jì)審計(jì)準(zhǔn)則,列示重點(diǎn)審計(jì)項(xiàng)目;

        ⑷以Neo4j中字段要求將審計(jì)規(guī)則進(jìn)行列示;

        ⑸與財(cái)務(wù)負(fù)責(zé)人進(jìn)行交流,了解字段存在位置,搞清對(duì)應(yīng)名稱關(guān)系;

        ⑹根據(jù)審計(jì)規(guī)則和交流結(jié)果設(shè)計(jì)校驗(yàn)邏輯,即圖譜推理的過程,確定哪些情況屬于會(huì)提示存在風(fēng)險(xiǎn)點(diǎn)的異常情況;

        ⑺對(duì)數(shù)據(jù)量進(jìn)行把控,因?yàn)檎麄€(gè)系統(tǒng)數(shù)據(jù)量巨大,故測試階段首先以某一審計(jì)項(xiàng)目中的一項(xiàng)財(cái)務(wù)科目為例運(yùn)行,以保證不會(huì)影響審計(jì)進(jìn)程;

        ⑻從知識(shí)圖譜中提取數(shù)據(jù),從審計(jì)規(guī)則庫中提取規(guī)則,進(jìn)行圖譜推理;

        ⑼對(duì)推理中發(fā)現(xiàn)的審計(jì)風(fēng)險(xiǎn)點(diǎn)在知識(shí)圖譜中加以標(biāo)注并提取;

        ⑽對(duì)于自動(dòng)化識(shí)別評(píng)估的風(fēng)險(xiǎn)項(xiàng)追加執(zhí)行審計(jì)程序予以核實(shí)。對(duì)于可以確認(rèn)的項(xiàng)目修改后進(jìn)行再評(píng)估,對(duì)于無法確認(rèn)的則判定為風(fēng)險(xiǎn)事項(xiàng)。

        以貨幣資金審計(jì)為例,實(shí)務(wù)中從法律法規(guī)、權(quán)限管理、資產(chǎn)安全、現(xiàn)金盤點(diǎn)、賬務(wù)處理、銀行賬戶余額及匯兌、對(duì)賬單及余額調(diào)節(jié)表核對(duì)、開戶銀行查驗(yàn)、銀行存款函證、發(fā)生額分析以及雙向核對(duì)等10個(gè)風(fēng)險(xiǎn)點(diǎn)入手,基于知識(shí)圖譜做智能推理。以法律法規(guī)項(xiàng)目為例,如果企業(yè)受到行政處罰或者刑事處罰,且處罰原因是貨幣資金造假,則說明存在違反法律法規(guī)風(fēng)險(xiǎn),決策樹如圖6所示。

        圖6 審計(jì)風(fēng)險(xiǎn)點(diǎn)推理決策樹

        基于圖譜推理貨幣資金審計(jì)的潛在風(fēng)險(xiǎn)點(diǎn),綜合判斷10個(gè)決策樹并進(jìn)行融合,最終得出貨幣資金審計(jì)存在審計(jì)風(fēng)險(xiǎn)的評(píng)估結(jié)論。實(shí)現(xiàn)流程如圖7所示。

        圖7 貨幣資金審計(jì)的隨機(jī)森林模型

        函證程序發(fā)函時(shí)發(fā)現(xiàn),存在一項(xiàng)地址不一致的情況,發(fā)函地址為財(cái)神廣場6 層C14 室,工商查詢?yōu)榻鹄谏虖B6 層C14 室,是存在風(fēng)險(xiǎn)的。以地址核對(duì)舉例來看,通過賬戶屬性推理得出風(fēng)險(xiǎn),并標(biāo)注的結(jié)果如圖8所示。

        圖8 地址核對(duì)風(fēng)險(xiǎn)標(biāo)識(shí)

        4 結(jié)束語

        本文提出了一套基于知識(shí)圖譜構(gòu)建與推理的智能審計(jì)方法,以WD 醫(yī)療科技股份有限公司為案例公司進(jìn)行應(yīng)用研究。采集異構(gòu)數(shù)據(jù)并進(jìn)行預(yù)處理后,在實(shí)體抽取階段運(yùn)用BERT-BiLSTM-CRF 模型對(duì)審計(jì)財(cái)經(jīng)文本進(jìn)行實(shí)體抽取,結(jié)果準(zhǔn)確率為84.94%,在關(guān)系抽取階段通過依存句法分析和PCNN神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練結(jié)果準(zhǔn)確率為84.27%。通過知識(shí)統(tǒng)一和存儲(chǔ)將抽取結(jié)果導(dǎo)入Neo4j 后構(gòu)建審計(jì)知識(shí)圖譜,結(jié)合設(shè)計(jì)的審計(jì)規(guī)則庫,運(yùn)用了決策樹與隨機(jī)森林模型將規(guī)則推理融入審計(jì)風(fēng)險(xiǎn)評(píng)估程序,輔助審計(jì)人員更有針對(duì)性地聚焦?jié)撛陲L(fēng)險(xiǎn)的同時(shí),從理論和實(shí)踐方面為智能審計(jì)工作的開展提供參考與借鑒。

        猜你喜歡
        決策樹圖譜實(shí)體
        繪一張成長圖譜
        前海自貿(mào)區(qū):金融服務(wù)實(shí)體
        中國外匯(2019年18期)2019-11-25 01:41:54
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
        補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        兩會(huì)進(jìn)行時(shí):緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
        振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
        基于決策樹的出租車乘客出行目的識(shí)別
        主動(dòng)對(duì)接你思維的知識(shí)圖譜
        18禁高潮出水呻吟娇喘蜜芽| 午夜一区二区视频在线观看| 射精区-区区三区| 中文字幕av无码一区二区三区| 国产福利片无码区在线观看 | 激情亚洲一区国产精品| 国产激情视频一区二区三区| 国产女在线| 亚洲一区极品美女写真在线看| 亚洲精品视频中文字幕| 丰满爆乳在线播放| 亚洲一区二区在线| 最新日本免费一区二区三区| 老鲁夜夜老鲁| 综合无码一区二区三区| 国产成人永久在线播放| 午夜精品男人天堂av| 精品国产麻豆免费人成网站| 日本a级特黄特黄刺激大片| 久久久亚洲精品免费视频| 国产精品国三级国产a| 亚洲av高清在线一区二区三区| 国产免费专区| 人妻露脸国语对白字幕| 亚洲成av人片乱码色午夜| 国产熟妇搡bbbb搡bb七区| 91精品亚洲一区二区三区| 亚州终合人妖一区二区三区| 337p西西人体大胆瓣开下部| 亚洲中文字幕无码卡通动漫野外| 日本av一区二区三区四区| 丰满少妇作爱视频免费观看| 久热在线播放中文字幕| 性色av成人精品久久| 国产精品女主播福利在线| 亚洲男同志网站| 天堂Av无码Av一区二区三区| 漂亮人妻被强了中文字幕| 黄瓜视频在线观看| 白白色免费视频一区二区| 亚洲男人的天堂av一区|