亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)環(huán)境下Python語(yǔ)言在會(huì)計(jì)師事務(wù)所審計(jì)中的應(yīng)用研究

        2021-06-20 06:27:10
        關(guān)鍵詞:爬蟲(chóng)結(jié)構(gòu)化事務(wù)所

        李 信

        進(jìn)入21世紀(jì),信息技術(shù)創(chuàng)新日新月異,以數(shù)字化、網(wǎng)絡(luò)化、智能化為特征的信息化浪潮蓬勃興起。文本、圖片、XML、HTML、各類(lèi)報(bào)表、圖像和音頻/視頻等非結(jié)構(gòu)化數(shù)據(jù)的大量涌現(xiàn),以及會(huì)計(jì)資料電子化、辦公無(wú)紙化以及數(shù)據(jù)規(guī)模、數(shù)據(jù)種類(lèi)的極速增長(zhǎng),給審計(jì)人員開(kāi)展審計(jì)工作帶來(lái)了新的挑戰(zhàn)。過(guò)去傳統(tǒng)的審計(jì)技術(shù)已經(jīng)不能適應(yīng)當(dāng)下事務(wù)所審計(jì)人員提高審計(jì)質(zhì)量和效率的要求。審計(jì)人員要想尋求新的突破,需要改變審計(jì)思路:即從傳統(tǒng)審計(jì)的手工查賬轉(zhuǎn)變?yōu)榻Y(jié)合大數(shù)據(jù)分析技術(shù)來(lái)輔助審計(jì)。面對(duì)這一改變,審計(jì)工作中使用的數(shù)據(jù)分析技術(shù)該如何改進(jìn)才能適應(yīng)當(dāng)前社會(huì)的發(fā)展成為時(shí)下研究熱點(diǎn)。

        Python是一種跨平臺(tái)的計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,是一個(gè)高層次的結(jié)合了解釋性、編譯性、互動(dòng)性和面向?qū)ο蟮哪_本語(yǔ)言。由于Python語(yǔ)言的簡(jiǎn)潔性、易讀性以及可擴(kuò)展性,深受數(shù)據(jù)分析者的喜愛(ài)。大數(shù)據(jù)環(huán)境下,會(huì)計(jì)師事務(wù)所審計(jì)人員在開(kāi)展審計(jì)工作中可以利用這一編程語(yǔ)言分析處理數(shù)據(jù),編寫(xiě)爬蟲(chóng)、數(shù)據(jù)可視化、數(shù)據(jù)分析等與審計(jì)有關(guān)的程序,以此來(lái)提高審計(jì)效率。本文就大數(shù)據(jù)環(huán)境下Python語(yǔ)言在會(huì)計(jì)師事務(wù)所審計(jì)中的應(yīng)用進(jìn)行探討。

        表1 國(guó)際四大所引進(jìn)先進(jìn)審計(jì)技術(shù)統(tǒng)計(jì)

        表2 大數(shù)據(jù)技術(shù)應(yīng)用于審計(jì)數(shù)據(jù)分析框架

        表3 某企業(yè)某年份煤炭銷(xiāo)售毛利分析

        一、當(dāng)前會(huì)計(jì)師事務(wù)所審計(jì)工作中存在的問(wèn)題

        1.審計(jì)效率低。在審計(jì)方式上,審計(jì)小組入駐現(xiàn)場(chǎng)之前,只能由項(xiàng)目負(fù)責(zé)人通過(guò)電話跟被審計(jì)單位對(duì)接人溝通索要相關(guān)審計(jì)資料,對(duì)項(xiàng)目現(xiàn)場(chǎng)的審計(jì)情況不可預(yù)估。當(dāng)審計(jì)小組進(jìn)場(chǎng)時(shí)可能就需要花費(fèi)一定的時(shí)間去了解,這樣就占用了大量的人力和精力。執(zhí)行審計(jì)時(shí),審計(jì)小組成員全程參與從審計(jì)準(zhǔn)備到出具審計(jì)報(bào)告的所有流程,不能讓審計(jì)組成員發(fā)揮各自的審計(jì)特長(zhǎng),這樣會(huì)降低項(xiàng)目組審計(jì)的專(zhuān)業(yè)性;其次,按審計(jì)對(duì)象劃分審計(jì)小組參與審計(jì)業(yè)務(wù)流程的審計(jì)模式,使得審計(jì)資源得不到優(yōu)化。

        目前我國(guó)信息化環(huán)境下所使用的審計(jì)數(shù)據(jù)分析方法主要有:賬表分析、數(shù)據(jù)查詢(xún)、審計(jì)抽樣、統(tǒng)計(jì)分析和數(shù)值分析等,常用的輔助審計(jì)工具有:審計(jì)軟件、SQL sever、excel等。目前會(huì)計(jì)師事務(wù)所審計(jì)人員大都使用excel分析處理數(shù)據(jù)、審計(jì)軟件來(lái)開(kāi)展財(cái)務(wù)審計(jì)工作,但是面對(duì)海量的非結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)的輔助審計(jì)工具在提升審計(jì)效率上往往顯得力不從心,在分析處理數(shù)據(jù)時(shí)容易造成電腦運(yùn)行速度緩慢,甚至出現(xiàn)宕機(jī)現(xiàn)象。

        2.現(xiàn)有的審計(jì)技術(shù)難應(yīng)對(duì)被審計(jì)單位提供的混合型數(shù)據(jù)。當(dāng)前大部分會(huì)計(jì)師事務(wù)所的審計(jì)人員缺乏對(duì)大數(shù)據(jù)知識(shí)和技術(shù)的了解,整體審計(jì)知識(shí)結(jié)構(gòu)也較為單薄,仍然依賴(lài)于傳統(tǒng)的審計(jì)工具開(kāi)展審計(jì)工作,但這些輔助審計(jì)工具也存在著局限性,審計(jì)人員無(wú)法深層次去挖掘非結(jié)構(gòu)化數(shù)據(jù)之間隱藏的有價(jià)值信息,容易造成審計(jì)遺漏,忽略重要的審計(jì)信息。大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)對(duì)比結(jié)果如圖1所示。

        目前國(guó)際四大會(huì)計(jì)師事務(wù)所均引入了先進(jìn)的審計(jì)技術(shù)來(lái)應(yīng)對(duì)這些混合型數(shù)據(jù),如表1所示。面對(duì)海量的數(shù)據(jù),本土事務(wù)所為了減小審計(jì)風(fēng)險(xiǎn),只是在審計(jì)工作中不斷加大細(xì)節(jié)測(cè)試,未能提出升級(jí)審計(jì)技術(shù)、改進(jìn)審計(jì)流程等應(yīng)對(duì)措施。

        圖1 大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)特征對(duì)比

        圖2 爬蟲(chóng)巨潮資訊網(wǎng)上市公司年度報(bào)告

        二、數(shù)據(jù)科學(xué)視角下的審計(jì)數(shù)據(jù)分析詮釋

        大數(shù)據(jù)時(shí)代,數(shù)據(jù)科學(xué)視角下審計(jì)數(shù)據(jù)分析對(duì)象由以前的結(jié)構(gòu)化數(shù)據(jù)擴(kuò)展為復(fù)雜多變的海量混合型數(shù)據(jù),其數(shù)據(jù)分析方法也由傳統(tǒng)審計(jì)經(jīng)驗(yàn)導(dǎo)向的數(shù)據(jù)匯總與查詢(xún)轉(zhuǎn)變?yōu)閿?shù)據(jù)導(dǎo)向的數(shù)據(jù)的采集、審計(jì)數(shù)據(jù)的預(yù)處理、數(shù)據(jù)分析及深度挖掘、數(shù)據(jù)可視化等步驟,因此有必要構(gòu)建大數(shù)據(jù)技術(shù)應(yīng)用于審計(jì)數(shù)據(jù)分析的框架,如表2所示,使用大數(shù)據(jù)審計(jì)分析技術(shù)開(kāi)展審計(jì)工作,而Python語(yǔ)言正是將傳統(tǒng)審計(jì)數(shù)據(jù)分析引入數(shù)據(jù)科學(xué)分析的有利利器之一。

        圖3 陽(yáng)泉煤業(yè)年報(bào)爬蟲(chóng)結(jié)果

        Python 是一個(gè)高層次結(jié)合了解釋性、編譯性、互動(dòng)性和面向?qū)ο蟮哪_本語(yǔ)言。它擁有豐富的工具包與活躍的開(kāi)源社區(qū),能夠?qū)?shù)據(jù)進(jìn)行行之有效的探索性分析;其超強(qiáng)的可視化功能,能夠?qū)⒎墙Y(jié)構(gòu)化數(shù)據(jù)以可視化的效果展現(xiàn)出來(lái),為實(shí)現(xiàn)在審計(jì)實(shí)務(wù)中運(yùn)用大數(shù)據(jù)技術(shù)提供經(jīng)驗(yàn)支持。完成同一個(gè)任務(wù),C語(yǔ)言要寫(xiě)1000行代碼,Java只需要寫(xiě)100行,而Python可能只要20行,而且Python的學(xué)習(xí)并不困難,并不一定要具備編程基礎(chǔ),對(duì)于初學(xué)者來(lái)講,可以下載Sublime Text編輯器對(duì)數(shù)據(jù)進(jìn)行分析。

        三、引入Python實(shí)施大數(shù)據(jù)審計(jì)的可行性

        大數(shù)據(jù)環(huán)境下,事務(wù)所審計(jì)人員使用Python開(kāi)展審計(jì)工作時(shí),有以下幾點(diǎn)但又不限于此幾點(diǎn)的應(yīng)用功能:

        1.網(wǎng)絡(luò)爬蟲(chóng)巨潮資訊網(wǎng)下載A股上市公司半年報(bào)或年報(bào)技術(shù)。網(wǎng)絡(luò)爬蟲(chóng)是一種按照一定的規(guī)則,自動(dòng)地抓取萬(wàn)維網(wǎng)信息的程序或者腳本,將目標(biāo)定為抓取與某一特定主題內(nèi)容相關(guān)的網(wǎng)頁(yè),獲取其中有價(jià)值的信息,為面向主題的用戶(hù)查詢(xún)準(zhǔn)備數(shù)據(jù)資源。審計(jì)人員可以使用Python從巨潮資訊網(wǎng)(http://www.cninfo.com.cn/new/index)自動(dòng)化下載審計(jì)需要的上市公司某一年份或者多年份的年度報(bào)告或者半年報(bào),從而減少審計(jì)人員人工下載的時(shí)間。此處以煤炭行業(yè)上市公司陽(yáng)泉煤業(yè)為例,爬蟲(chóng)過(guò)程如圖2所示,爬蟲(chóng)結(jié)果如圖3所示。也可以通過(guò)Python自動(dòng)下載某一時(shí)間段A股或者H股上市公司的所有年報(bào)、半年報(bào)數(shù)據(jù),譬如下載2020年6月30日后的A股上市公司半年報(bào),爬蟲(chóng)下載過(guò)程如圖4所示,爬蟲(chóng)下載結(jié)果如圖5所示。

        圖4 爬蟲(chóng)下載巨潮資訊網(wǎng)2020年6月30日后所有A股公司半年度報(bào)告

        圖5 2020年6月30日后A股上市公司半年報(bào)爬蟲(chóng)下載結(jié)果

        圖6 問(wèn)卷調(diào)查統(tǒng)計(jì)結(jié)果

        2.相似度分析技術(shù)。在開(kāi)展審計(jì)工作前,項(xiàng)目組負(fù)責(zé)人可以通過(guò)大數(shù)據(jù)相似度分析技術(shù)了解審計(jì)助理對(duì)現(xiàn)場(chǎng)負(fù)責(zé)人的期望。這樣可以讓他們明確審計(jì)計(jì)劃、目的和任務(wù)。對(duì)XX所2019年新進(jìn)員工展開(kāi)了一次問(wèn)卷調(diào)查,通過(guò)相似度分析技術(shù)對(duì)調(diào)查問(wèn)卷第三小問(wèn):“您希望現(xiàn)場(chǎng)負(fù)責(zé)人在審計(jì)進(jìn)場(chǎng)前給予哪些幫助”結(jié)果進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)結(jié)果如圖6所示,分析結(jié)果如圖7所示,形成的可視化結(jié)果如圖8所示。從圖7發(fā)現(xiàn):“項(xiàng)目”“審計(jì)”“計(jì)劃”“介紹”“情況”“安排”這些詞語(yǔ)字體較大,代表這些詞語(yǔ)在答卷內(nèi)容中出現(xiàn)的次數(shù)較多,圖8發(fā)現(xiàn)“介紹項(xiàng)目情況,審計(jì)目的,審計(jì)計(jì)劃安排以及特別注意事項(xiàng)”這項(xiàng)回答相似度占比為8%,比例最高,是審計(jì)助理普遍的想法。審計(jì)項(xiàng)目負(fù)責(zé)人可以針對(duì)項(xiàng)目組成員的需求,在開(kāi)展審計(jì)工作前做到分工明確。

        3.標(biāo)簽云分析技術(shù)。開(kāi)展審計(jì)工作時(shí),審計(jì)人員可以利用Python語(yǔ)言的Requests模塊從各大主流行業(yè)網(wǎng)站上爬取當(dāng)前年度某一行業(yè)發(fā)展規(guī)模及行業(yè)發(fā)展趨勢(shì)分析等數(shù)據(jù),將其中的文字全部提取出來(lái)保存為T(mén)xt格式,使用Python中的Jieba包對(duì)這類(lèi)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分詞、詞頻統(tǒng)計(jì),通過(guò)大數(shù)據(jù)分析技術(shù)——標(biāo)簽云對(duì)其進(jìn)行文本分析,提取出文本中出現(xiàn)的高頻詞語(yǔ),統(tǒng)計(jì)各個(gè)分詞出現(xiàn)的頻數(shù),最終將這些非結(jié)構(gòu)化數(shù)據(jù)以可視化圖形展現(xiàn)出來(lái),從而生成初步的判斷,這樣方便審計(jì)人員快速抓取審計(jì)重點(diǎn)。以2020年度煤炭發(fā)展規(guī)模及行業(yè)發(fā)展趨勢(shì)分析為例,形成的可視化圖形如圖9所示,

        從圖形中可以看出,“銷(xiāo)售”“下游”“煤價(jià)”“復(fù)產(chǎn)”“恢復(fù)”字體較大,出現(xiàn)的次數(shù)較多,可見(jiàn)2020年度煤炭行業(yè)因?yàn)槭芤咔橛绊戜N(xiāo)售量下降、價(jià)格出現(xiàn)下跌,復(fù)產(chǎn)過(guò)后煤炭行業(yè)的需求有所增長(zhǎng),但下游市場(chǎng)恢復(fù)較慢,煤炭全產(chǎn)業(yè)鏈復(fù)蘇仍面臨庫(kù)存和價(jià)格劇烈波動(dòng)、進(jìn)口煤沖擊等關(guān)鍵隱患,這些信息能夠幫助審計(jì)人員在開(kāi)展審計(jì)工作時(shí),明確被審計(jì)單位行業(yè)發(fā)展情況。

        圖7 進(jìn)場(chǎng)前審計(jì)助理答卷內(nèi)容分析

        圖8 進(jìn)場(chǎng)前審計(jì)助理答卷內(nèi)容結(jié)果可視化分析

        4.可視化分析技術(shù)。大數(shù)據(jù)環(huán)境下,文本、圖片、XML、HTML、各類(lèi)報(bào)表、圖像和音頻/視頻等非結(jié)構(gòu)化數(shù)據(jù)具有數(shù)據(jù)量大、來(lái)源多樣性、數(shù)據(jù)高價(jià)值的特點(diǎn),這也就意味著這些數(shù)據(jù)成為審計(jì)人員開(kāi)展審計(jì)工作不可忽視的一部分。可視化分析技術(shù)可以將這些非結(jié)構(gòu)化數(shù)據(jù)蘊(yùn)含的信息變得直觀,幫助審計(jì)人員更快識(shí)別審計(jì)風(fēng)險(xiǎn)。標(biāo)簽云是可視化的方式之一,對(duì)審計(jì)文檔進(jìn)行可視化分析處理,可以幫助審計(jì)人員快速確定審計(jì)重點(diǎn)。

        可視化(Visualization)是利用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來(lái),再進(jìn)行交互處理的理論、方法和技術(shù)。Python語(yǔ)言里面的matplotlib是一個(gè)2D繪圖庫(kù),可以將數(shù)據(jù)以直方圖、條形圖、散點(diǎn)圖形式展現(xiàn)出來(lái),方便審計(jì)人員直觀明了地查看數(shù)據(jù)之間的比例關(guān)系變化。以某企業(yè)某年1-12月份煤炭銷(xiāo)售毛利分析為例,該企業(yè)某年份的煤炭銷(xiāo)售毛利分析表如表3所示,形成的折線圖如圖10所示,同時(shí)審計(jì)人員可以將被審計(jì)單位的賬套導(dǎo)出到excel,整理被審計(jì)單位1-12月份的主營(yíng)業(yè)務(wù)收入和主營(yíng)業(yè)務(wù)成本,將產(chǎn)品類(lèi)別、訂單數(shù)量、銷(xiāo)售收入、成本歸集整理在一張表格上,通過(guò)Python繪畫(huà)出散點(diǎn)圖進(jìn)行可視化分析,多維度挖掘數(shù)據(jù)之間隱藏的信息,從視覺(jué)上更直觀地發(fā)現(xiàn)數(shù)據(jù)異常值。

        通過(guò)上述對(duì)審計(jì)數(shù)據(jù)的分析,大數(shù)據(jù)環(huán)境下事務(wù)所審計(jì)人員在開(kāi)展審計(jì)工作時(shí),可以利用Python的爬蟲(chóng)技術(shù)從外部獲取被審計(jì)單位某一時(shí)間段的年度或者半年度報(bào)告;使用Python的標(biāo)簽云分析技術(shù)了解審計(jì)組成員進(jìn)場(chǎng)前需要的審計(jì)需求和被審計(jì)單位及所在行業(yè)發(fā)展情況;使用Python的可視化技術(shù)分析被審計(jì)單位的收入分布,發(fā)現(xiàn)是否存在虛增收入的情況等等,這樣能夠幫助審計(jì)人員從海量的混合型數(shù)據(jù)中將重要信息抽離出來(lái),抓住審計(jì)重點(diǎn),發(fā)現(xiàn)數(shù)據(jù)之間的異常值,從而提高審計(jì)人員的工作效率和工作質(zhì)量。

        圖9 行業(yè)報(bào)告云標(biāo)簽

        圖10 某企業(yè)煤炭毛利率與毛利折線圖

        總之,大數(shù)據(jù)時(shí)代,會(huì)計(jì)師事務(wù)所審計(jì)人員可以將大數(shù)據(jù)分析語(yǔ)言Python運(yùn)用于審計(jì)分析程序,對(duì)文本、圖片、XML、 HTML、各類(lèi)報(bào)表、圖像和音頻/視頻等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行深層次的挖掘,利用Python的爬蟲(chóng)技術(shù)、相似度分析技術(shù)、標(biāo)簽云分析技術(shù)以及可視化分析技術(shù)對(duì)數(shù)據(jù)進(jìn)行異常分析,找出規(guī)律,發(fā)現(xiàn)數(shù)據(jù)間的異常值,從而判斷出審計(jì)重點(diǎn),為后續(xù)的審計(jì)工作提供指引方向,減少審計(jì)人員的工作量。

        猜你喜歡
        爬蟲(chóng)結(jié)構(gòu)化事務(wù)所
        利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說(shuō)
        設(shè)計(jì)事務(wù)所
        基于Python的網(wǎng)絡(luò)爬蟲(chóng)和反爬蟲(chóng)技術(shù)研究
        促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
        設(shè)計(jì)事務(wù)所 芬蘭PES建筑師事務(wù)所
        設(shè)計(jì)事務(wù)所LLA建筑設(shè)計(jì)事務(wù)所
        結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
        利用爬蟲(chóng)技術(shù)的Geo-Gnutel la VANET流量采集
        設(shè)計(jì)事務(wù)所
        大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)
        電子制作(2017年9期)2017-04-17 03:00:46
        偷拍美女上厕所一区二区三区| 国内精品伊人久久久久av| 亚洲中文无码精品久久不卡| 亚洲女同性恋激情网站| 亚洲av片无码久久五月| 少妇无码av无码专区| 国产高清无码在线| 亚洲人妻中文字幕在线视频 | 日韩欧美国产丝袜视频| 青青草视全福视频在线| 亚洲伦理第一页中文字幕| 国产精品无码久久久久成人影院| 日韩另类在线| 亚洲国产精品夜男人天堂| 精品女同一区二区三区| 日韩丰满少妇无码内射| 日韩中文网| 久久久成人av毛片免费观看| 日本一区二区三区视频网站| 天堂国精产品2023年| 在线观看亚洲AV日韩A∨| 最新亚洲视频一区二区| 揄拍成人国产精品视频| 性色av无码一区二区三区人妻| 免费国产99久久久香蕉| 中文字幕亚洲综合久久久| 欧美激情肉欲高潮视频| 亚洲国产高清在线一区二区三区| 亚洲五月七月丁香缴情| 亚洲精品98中文字幕| 成在线人免费视频| 97视频在线播放| 国产精品午夜福利天堂| 色窝窝亚洲av网在线观看| 亚洲av男人的天堂在线观看| 人妻少妇精品无码专区app| 国产精品毛片av毛片一区二区| 99精品国产丝袜在线拍国语| 色综合一本| 亚洲一区二区三区亚洲| 亚洲成av人片乱码色午夜|