亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于OCR文字識別的審計(jì)技術(shù)創(chuàng)新

        2021-07-08 09:46:42王攀娜楊昆
        數(shù)碼影像時(shí)代 2021年7期
        關(guān)鍵詞:信息

        王攀娜 楊昆

        編者按:隨著人工智能、大數(shù)據(jù)等信息技術(shù)的不斷發(fā)展,OCR文字識別技術(shù)逐漸應(yīng)用于審計(jì)領(lǐng)域,成為重要的審計(jì)技術(shù)創(chuàng)新工具。文章探討如何將OCR文字識別技術(shù)應(yīng)用于審計(jì),發(fā)現(xiàn)OCR文字識別技術(shù)與審計(jì)系統(tǒng)相結(jié)合、與智能審計(jì)工具共建數(shù)字化審計(jì)平臺、助力構(gòu)建數(shù)據(jù)共享平臺三條路徑,并分析了基于OCR文字識別技術(shù)實(shí)現(xiàn)審計(jì)技術(shù)創(chuàng)新的保障措施,以期通過OCR文字識別技術(shù)實(shí)現(xiàn)審計(jì)技術(shù)創(chuàng)新,提高審計(jì)工作效率。

        在大數(shù)據(jù)、區(qū)塊鏈、云計(jì)算、人工智能等創(chuàng)新技術(shù)的驅(qū)動下,將OCR文字識別等智能技術(shù)融合到審計(jì)實(shí)務(wù)工作中,可以為審計(jì)工作提供數(shù)字化賦能。使用OCR文字識別技術(shù),可以大大提高數(shù)據(jù)的準(zhǔn)確性,將審計(jì)人員從枯燥繁重的工作中解脫出來,節(jié)省鍵盤輸入的人力和時(shí)間,為審計(jì)技術(shù)打下非結(jié)構(gòu)化數(shù)據(jù)采集的基礎(chǔ),推進(jìn)審計(jì)技術(shù)創(chuàng)新。

        OCR文字識別技術(shù)介紹

        OCR文字識別技術(shù)概念

        光學(xué)字符識別(Optical Character Recognition,OCR),通稱為文字識別,通過光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息,再以通用格式存儲為文本文件。OCR是一種高效、快捷的自動文字輸入方法,實(shí)現(xiàn)了計(jì)算機(jī)認(rèn)字技術(shù),是計(jì)算機(jī)視覺研究領(lǐng)域中模式識別和人工智能領(lǐng)域的一種應(yīng)用。OCR系統(tǒng)性能好壞的衡量指標(biāo)主要包括識別速度、識別比例、產(chǎn)品的穩(wěn)定性、用戶界面是否友好、使用的方便性和可行性等。OCR文字識別是實(shí)現(xiàn)文字高速錄入的一項(xiàng)關(guān)鍵技術(shù),在身份信息識別、金融票據(jù)識別、合同信息提取等商業(yè)場景中都有比較成熟的應(yīng)用。

        OCR文字識別的處理流程主要包括圖像處理和文字識別,具體處理流程見圖1。圖像處理包括圖像輸入、圖像預(yù)處理、版面分析和字符切割四個(gè)步驟。圖像輸入是通過電子信號處理讀取圖像。圖像預(yù)處理指將圖像處理為有文字的黑色和沒有文字的白色區(qū)域、去除圖像成形的噪音、校正傾斜的文字和數(shù)字等。版面分析是將文檔圖片進(jìn)行段落和行的劃分。字符切割是將粘連在一起的文字、段筆等情況進(jìn)行切割。文字識別過程包括特征提取、字符識別、版面恢復(fù)以及后處理四個(gè)步驟。特征提取是識別字符圖像的關(guān)鍵特征,通過降維處理以便后續(xù)進(jìn)行字符識別。字符識別是根據(jù)數(shù)學(xué)的向量特征,進(jìn)行字符識別。版面恢復(fù)是根據(jù)原文檔的排版情況,識別格式,將結(jié)果輸出。后處理是將識別出來的文檔與原文檔進(jìn)行比對校正。

        OCR文字識別技術(shù)的應(yīng)用場景

        近年來,文字識別技術(shù)作為一項(xiàng)采集圖片信息的工具,已經(jīng)在很多實(shí)踐案例中都得到了運(yùn)用。具體來看,OCR文字識別技術(shù)的應(yīng)用場景大致可分為:通用類,表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片;證件類,身份證、駕駛證、行駛證、護(hù)照等證件圖片;票據(jù)類,增值稅發(fā)票、機(jī)動車銷售發(fā)票、醫(yī)療發(fā)票等各種發(fā)票;行業(yè)類,物流面單、醫(yī)療化驗(yàn)單據(jù)等多種行業(yè)特定類型圖片;定制模板,用戶自定義識別模板。

        OCR文字識別技術(shù)應(yīng)用于審計(jì)的路徑

        我們認(rèn)為OCR文字識別技術(shù)運(yùn)用到審計(jì)工作場景的路徑主要包括如下三個(gè)方面。

        OCR文字識別技術(shù)與審計(jì)系統(tǒng)的連接

        1.實(shí)時(shí)性

        審計(jì)系統(tǒng)需要及時(shí)獲取相關(guān)的審計(jì)數(shù)據(jù),并在短時(shí)間內(nèi)做出專業(yè)判斷,借助OCR技術(shù)可實(shí)現(xiàn)審計(jì)系統(tǒng)的實(shí)時(shí)計(jì)算。此外,OCR文字識別技術(shù)可實(shí)現(xiàn)審計(jì)數(shù)據(jù)的持久存儲。OCR在審計(jì)中的應(yīng)用主要分為圖像采集模塊、OCR文字識別模塊和審計(jì)模塊三個(gè)部分,中間通過Redis和Kafaka兩個(gè)傳輸工具實(shí)現(xiàn)。

        (1)圖像采集模塊。圖片采集是OCR技術(shù)應(yīng)用的基礎(chǔ),實(shí)現(xiàn)系統(tǒng)的圖像輸入流程,主要功能是對圖像進(jìn)行預(yù)處理,包括去除噪聲、二值化、校正傾斜等,然后發(fā)布到Redis的圖形通道中。

        (2)OCR文字識別模塊。通過調(diào)用Redis的圖形通道獲取到初步處理后的圖片,進(jìn)行文本檢測,包括文本行分隔和文字分隔;最后將圖片中的信息還原為可被計(jì)算機(jī)識別的信息,識別之后將文字發(fā)布到Kafaka文字通道。

        (3)審計(jì)模塊。通過Kafaka文字通道,將OCR文字識別模塊識別信息傳遞到審計(jì)模塊,進(jìn)行信息實(shí)時(shí)計(jì)算和持久化存儲。Redis和Kafaka是文字識別技術(shù)與審計(jì)系統(tǒng)連接框架系統(tǒng)中的消息傳輸工具,因?yàn)閳D像采集和文字識別速度不同,文字識別和審計(jì)模塊處理速度不同,各模塊間直接進(jìn)行數(shù)據(jù)的傳遞可能導(dǎo)致消息堵塞。使用Redis和Kafaka作為緩沖,可為系統(tǒng)的穩(wěn)定性提供保證。

        2.全量審計(jì)

        在對公客戶信貸舞弊風(fēng)險(xiǎn)年審時(shí),審計(jì)人員需要從行內(nèi)信貸系統(tǒng)中隨機(jī)抽取100個(gè)有貸款的對公客戶信息,通過比對貸款投向信息與企業(yè)營業(yè)執(zhí)照的經(jīng)營范圍是否匹配來識別舞弊信號。審計(jì)人員要手動錄入企業(yè)名稱、經(jīng)營范圍信息、統(tǒng)一社會信用代碼等,然后開始后續(xù)工作。使用到OCR具體工作流程見圖2。審計(jì)人員只需要獲取全量的企業(yè)營業(yè)執(zhí)照的照片,并導(dǎo)入到文字識別工具中,即可獲得可編輯的文本信息。為進(jìn)一步提高審計(jì)效率,還可先設(shè)計(jì)一份數(shù)據(jù)匯總表單,規(guī)定自己所需的信息,將這些文字版企業(yè)營業(yè)執(zhí)照變成更可觀的表單。將節(jié)省下來的時(shí)間用在發(fā)現(xiàn)舞弊信號等方面,有效降低抽樣審計(jì)導(dǎo)致的重要信息遺漏風(fēng)險(xiǎn),并提高審計(jì)的質(zhì)量。

        OCR文字識別應(yīng)用于智能審計(jì)技術(shù)

        OCR文字識別技術(shù)有助于審計(jì)實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)采集,助推其他審計(jì)技術(shù)發(fā)揮功效,使得應(yīng)用范圍可以拓展到更多社會實(shí)踐工作領(lǐng)域中。融合OCR文字識別、機(jī)器人流程自動化、高級數(shù)據(jù)分析等多種新興審計(jì)技術(shù),將為審計(jì)工作提供數(shù)字化賦能。智能審計(jì)數(shù)字化平臺通過數(shù)據(jù)加工、轉(zhuǎn)化、存儲、交換、關(guān)聯(lián)共享和管理等專業(yè)化處理,對數(shù)據(jù)的組合分析、交叉驗(yàn)證,以實(shí)現(xiàn)全面分析。動態(tài)、真實(shí)地反映審計(jì)對象的相關(guān)信息,幫助審計(jì)部門識別各種審計(jì)風(fēng)險(xiǎn)。目前該技術(shù)應(yīng)用于審計(jì)數(shù)據(jù)采集、文檔審閱、底稿編制、海量合同文本、錄音等非結(jié)構(gòu)數(shù)據(jù)等方面發(fā)揮了巨大的優(yōu)勢。

        在審計(jì)業(yè)務(wù)中,審計(jì)人員需要閱讀大量的合同,提取合同名稱、合同簽訂雙方名稱、簽訂時(shí)間、結(jié)算方式等信息,與單位財(cái)務(wù)報(bào)表進(jìn)行對照、核查,形成初步審計(jì)報(bào)告。借助OCR文字識別技術(shù)和數(shù)據(jù)分析技術(shù),幫助審計(jì)人員發(fā)現(xiàn)合同條款中的潛在風(fēng)險(xiǎn)。審核合同時(shí),如果合同信息未電子化,審計(jì)人員很難發(fā)現(xiàn)多個(gè)合同中存在建設(shè)內(nèi)容部分重復(fù)或全部重復(fù)的情況。使用OCR文字識別技術(shù)將合同信息電子化,建立合同信息庫,對合同數(shù)據(jù)進(jìn)行重復(fù)篩查和關(guān)聯(lián)匹配。通過將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變?yōu)殡娮踊问?,再利用?shù)據(jù)分析功能,將轉(zhuǎn)換后的數(shù)據(jù)與現(xiàn)存的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行關(guān)聯(lián),通過匹配進(jìn)行核對,實(shí)現(xiàn)多點(diǎn)聯(lián)動審計(jì)。

        OCR文字識別技術(shù)助力構(gòu)建共享平臺

        OCR文字識別技術(shù)是共享中心的關(guān)鍵所在,在傳統(tǒng)的共享中心數(shù)據(jù)的采集主要是人工來進(jìn)行文字的轉(zhuǎn)化,將紙質(zhì)文件上的數(shù)據(jù)錄入到系統(tǒng)中,但OCR改變了人工錄入數(shù)據(jù)的工作模式,從源頭上提高數(shù)據(jù)的準(zhǔn)確性。尤其是伴隨著數(shù)據(jù)的不斷增加,數(shù)據(jù)不斷復(fù)雜化,借助OCR將為共享中心的發(fā)展提供更有力的支撐。

        使用OCR文字識別技術(shù)將紙質(zhì)文件數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)上傳至共享中心,可簡化審計(jì)工作流程。通過OCR文字識別技術(shù)構(gòu)建共享中心,內(nèi)部審計(jì)人員可在業(yè)務(wù)前端直接抓取數(shù)據(jù),看見原始憑證的圖像,不必再通過財(cái)務(wù)人員傳遞才能獲得,超越了業(yè)務(wù)地點(diǎn)時(shí)間的限制,解決了時(shí)滯問題和舞弊。OCR文字識別技術(shù)能規(guī)避手動輸入可能的錯誤,實(shí)現(xiàn)自動驗(yàn)證發(fā)票真?zhèn)?,從發(fā)票臺賬取數(shù),掃描識別時(shí)直接驗(yàn)證發(fā)票真?zhèn)?,降低稅?wù)風(fēng)險(xiǎn)。

        OCR文字識別技術(shù)應(yīng)用于審計(jì)的保障措施

        為了實(shí)現(xiàn)OCR文字識別技術(shù)在審計(jì)工作中的應(yīng)用,下面探討其保障措施。

        探尋新型審計(jì)模式

        隨著內(nèi)外環(huán)境的快速變化,需要探尋符合時(shí)代發(fā)展的新型審計(jì)模式。在業(yè)務(wù)風(fēng)險(xiǎn)越來越隱蔽的情況下,審計(jì)人員必須形成數(shù)據(jù)思維,統(tǒng)籌分析信息。審計(jì)人員需要更多地考慮未來審計(jì)工作模式的轉(zhuǎn)變,改進(jìn)創(chuàng)新審計(jì)技術(shù)。將各種前沿技術(shù)應(yīng)用于審計(jì)的核心流程中,識別并評估日常工作中可以標(biāo)準(zhǔn)化和自動化的場景,為審計(jì)中的關(guān)鍵審計(jì)流程提供了全新的數(shù)字化解決方案,提高了工作效率。

        構(gòu)建智能審計(jì)平臺

        伴隨著信息技術(shù)的快速發(fā)展、數(shù)據(jù)應(yīng)用的持續(xù)拓展,搭建智能化審計(jì)平臺,可以實(shí)現(xiàn)基于OCR文字識別開展審計(jì)工作。參考全球領(lǐng)先的專業(yè)服務(wù)機(jī)構(gòu)德勤公司的做法,從計(jì)劃和風(fēng)險(xiǎn)評估到控制測試再到實(shí)質(zhì)性測試,以及最后的結(jié)論與報(bào)告階段。

        (1)計(jì)劃和風(fēng)險(xiǎn)評估階段,使用自動式綜合性數(shù)據(jù)分析,可快速實(shí)現(xiàn)報(bào)表、會計(jì)科目及分錄的可視化分析,聚焦高風(fēng)險(xiǎn)科目,揭示異常風(fēng)險(xiǎn)。

        (2)控制測試階段,借助數(shù)字化流程挖掘和設(shè)計(jì)工具,自動跟蹤業(yè)務(wù)流程,通過動態(tài)視圖可視化呈現(xiàn),幫助企業(yè)更直觀了解流程運(yùn)行情況,識別異常操作業(yè)務(wù),進(jìn)而深入分析企業(yè)內(nèi)控流程中的潛在風(fēng)險(xiǎn)。

        (3)實(shí)質(zhì)性測試階段,利用數(shù)據(jù)動態(tài)可視化技術(shù)、機(jī)器人流程自動化技術(shù)結(jié)合第三方數(shù)據(jù)平臺,對企業(yè)圖譜、股權(quán)結(jié)構(gòu)、關(guān)系圖譜等信息進(jìn)行挖掘和展示,對企業(yè)關(guān)聯(lián)交易進(jìn)行展示,輔助審計(jì)人員對客戶關(guān)聯(lián)關(guān)系及關(guān)聯(lián)交易進(jìn)行充分挖掘,從而提升風(fēng)險(xiǎn)防范能力,保障審計(jì)質(zhì)量。

        (4)結(jié)論與報(bào)告階段,德勤公司自主研發(fā)的“勤報(bào)通”工具能實(shí)現(xiàn)報(bào)告審閱流程的高度自動化與智能化,還能通過健康檢查全面快捷地識別報(bào)告中的錯誤情況,改進(jìn)報(bào)告質(zhì)量,提高審計(jì)交付的質(zhì)量。

        保障數(shù)據(jù)的安全性和準(zhǔn)確性

        信息技術(shù)通過計(jì)算機(jī)程序自動處理,可大大提高工作效率,但不可忽視風(fēng)險(xiǎn)。OCR文字識別技術(shù)應(yīng)用于審計(jì)過程中,數(shù)據(jù)的安全性和準(zhǔn)確性是必須面對的重要問題。如采用OCR審計(jì)無形資產(chǎn)的形成和攤銷時(shí),要考慮數(shù)據(jù)獲取是否準(zhǔn)確,是否能支持最終形成的審計(jì)結(jié)論。要注重對數(shù)據(jù)的管理和保護(hù),設(shè)置好數(shù)據(jù)訪問和存儲的權(quán)限,嚴(yán)格限制訪問,采用授權(quán)機(jī)制來保證審計(jì)數(shù)據(jù)的安全。使用OCR文字識別技術(shù)提取數(shù)據(jù)時(shí),可使用一定措施來提高識別準(zhǔn)確度。對圖像進(jìn)行文字識別時(shí),保證光線盡量充足和穩(wěn)定,且文字的背景最好是純白的背景,這樣能去除干擾因素,進(jìn)一步保證文字識別技術(shù)的識別準(zhǔn)確率。在文字識別技術(shù)處理流程中,最后一步的人工對比和校正也將保證輸出數(shù)據(jù)的準(zhǔn)確性。

        結(jié)語

        數(shù)據(jù)時(shí)代的到來,審計(jì)數(shù)據(jù)的載體變得越來越多樣化,圖片、照片、影像等資料承載著豐富的審計(jì)數(shù)據(jù)信息。為了了解藏在這些信息背后的復(fù)雜關(guān)系和潛在風(fēng)險(xiǎn),審計(jì)需要將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為可審計(jì)的數(shù)字或文本信息,揭開審計(jì)對象之間的復(fù)雜關(guān)系。OCR文字識別技術(shù)為智慧審計(jì)打下了 非結(jié)構(gòu)化數(shù)據(jù)采集的基礎(chǔ),如機(jī)器人流程自動化技術(shù)、自然語言處理技術(shù)等。OCR文字識別技術(shù)與審計(jì)系統(tǒng)結(jié)合、與智能審計(jì)工具結(jié)合、助力構(gòu)建共享中心這三方面的應(yīng)用,進(jìn)一步落實(shí)到數(shù)據(jù)采集、信息審核、審計(jì)抽樣三階段具體審計(jì)工作流程當(dāng)中,有助于推進(jìn)審計(jì)智能化水平,提升審計(jì)工作的社會服務(wù)價(jià)值。

        參考文獻(xiàn):

        [1]汪莉,葉健彪.基于OCR的審計(jì)技術(shù)創(chuàng)新與實(shí)現(xiàn)[J].中國內(nèi)部審計(jì),2019(04):44-47.

        [2]徐超,陳勇.大數(shù)據(jù)技術(shù)與方法在審計(jì)監(jiān)督中的應(yīng)用研究[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2021,38(05):135-153.

        [3]余玉苗,徐慧慧.利用機(jī)器學(xué)習(xí)提升內(nèi)部審計(jì)價(jià)值——讀《機(jī)器學(xué)習(xí)強(qiáng)化保證》[J].財(cái)務(wù)與會計(jì),2020(12):86-87.

        [4]張晶,李雅琴,王博文.光學(xué)字符識別(OCR)技術(shù)在內(nèi)部審計(jì)中的實(shí)踐應(yīng)用[J].納稅,2020,14(01):275.

        [5]趙文華.德勤探路審計(jì)中的人工智能應(yīng)用[N].中國會計(jì)報(bào),2017-03-03(010).

        第一作者:王攀娜(1980—),四川自貢人,副教授、博士、碩士生導(dǎo)師,現(xiàn)就職于重慶銀行博士后科研工作站。

        猜你喜歡
        信息
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        信息超市
        展會信息
        展會信息
        展會信息
        展會信息
        展會信息
        信息
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        日本一区二区三区不卡在线| 亚洲成年网站在线777| 国内精品福利在线视频| 国产av精品一区二区三区视频| 偷拍综合在线视频二区| 欧美精品v国产精品v日韩精品| 啪啪免费网站| 青青草原亚洲在线视频| 国产成人综合精品一区二区| 亚洲国产成人久久三区| 无码人妻一区二区三区免费n鬼沢| 久久精品国产88久久综合| 久久免费精品日本久久中文字幕 | 在线国产视频精品视频| 国产精品一区二区蜜臀av| 国产香港明星裸体xxxx视频| 国产精品人妻一码二码尿失禁 | 熟妇高潮一区二区三区在线观看 | 性生大片免费观看性少妇| 又色又爽又黄高潮的免费视频 | 国产乱人激情h在线观看| 97人伦色伦成人免费视频| 国产精品久久久久久人妻精品| 国产欧美日本亚洲精品一4区| 久久精品国产黄片一区| 亚洲第一幕一区二区三区在线观看| 国产精品泄火熟女| 亚洲欧美另类自拍| 少妇一区二区三区乱码| 国产精品国产三级国产密月| 黑人巨大无码中文字幕无码| 激情人妻在线视频| 久久亚洲综合亚洲综合| 亚洲无av在线中文字幕| 小sao货水好多真紧h视频| 色窝综合网| 日韩精品在线一二三四区| 免费人成视频xvideos入口| 免费观看一区二区| 精品亚洲在线一区二区| 亚洲第一最快av网站|