亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)背景下Python技術(shù)在審計(jì)工作中的應(yīng)用

        2021-02-21 08:26:12陳倩倩彭甜典張琦
        中國(guó)集體經(jīng)濟(jì) 2021年4期
        關(guān)鍵詞:大數(shù)據(jù)

        陳倩倩 彭甜典 張琦

        摘要:大數(shù)據(jù)時(shí)代下,云審計(jì)、區(qū)塊鏈審計(jì)、聯(lián)網(wǎng)審計(jì)等各種新型審計(jì)方式充斥著我們審計(jì)的工作,傳統(tǒng)審計(jì)方式受到挑戰(zhàn)。在審計(jì)工作中,快速獲得充分、適當(dāng)?shù)臄?shù)據(jù)信息是提高審計(jì)效率和效果的重要保證。文章基于近年來(lái)興起的Python技術(shù),研究其在審計(jì)數(shù)據(jù)搜集與分析中的應(yīng)用,為大數(shù)據(jù)審計(jì)技術(shù)的發(fā)展提供支持。

        關(guān)鍵詞:Python;大數(shù)據(jù);分析數(shù)據(jù)

        一、引言

        目前,無(wú)論是在外部審計(jì)還是內(nèi)部審計(jì)中,傳統(tǒng)的審計(jì)工作方法是我們稱之為“七大武器”的觀察、檢查、詢問(wèn)、分析程序、重新執(zhí)行、重新計(jì)算、函證。審計(jì)人員結(jié)合自身經(jīng)驗(yàn)對(duì)這七種武器進(jìn)行巧妙組合,可以很大程度上實(shí)現(xiàn)“提供合理保證”這一目標(biāo),然而,道高一尺,魔高一丈,隨著大數(shù)據(jù)的發(fā)展,審計(jì)的對(duì)象漸趨復(fù)雜,目前,傳統(tǒng)審計(jì)在數(shù)據(jù)采集與分析過(guò)程中主要存在以下缺陷:傳統(tǒng)審計(jì)標(biāo)準(zhǔn)難以適用于大數(shù)據(jù)審計(jì)方法的開(kāi)展;傳統(tǒng)審計(jì)方法效率和效果難以保證;傳統(tǒng)審計(jì)方法難以發(fā)現(xiàn)系統(tǒng)中存在的漏洞,大數(shù)據(jù)時(shí)代,很多財(cái)務(wù)舞弊、內(nèi)控失效都是由于信息系統(tǒng)的缺陷而引發(fā)的;大數(shù)據(jù)背景下,人們不在追求數(shù)據(jù)的精確度,而是追求數(shù)據(jù)獲取與利用的效率。

        二、Python技術(shù)的工作原理

        (一)Python技術(shù)介紹

        人們經(jīng)常把Python和網(wǎng)絡(luò)爬蟲(chóng)聯(lián)系在一起,那么什么是網(wǎng)絡(luò)爬蟲(chóng)?他們之間的關(guān)系是什么?如果把互聯(lián)網(wǎng)比作是由一個(gè)個(gè)站點(diǎn)和網(wǎng)絡(luò)設(shè)備組成的龐大網(wǎng)絡(luò),如果把這張網(wǎng)比作是蜘蛛網(wǎng),那么在這張網(wǎng)絡(luò)上,數(shù)據(jù)便是存放在各個(gè)網(wǎng)絡(luò)上的節(jié)點(diǎn),而爬蟲(chóng)就是一只只小蜘蛛,它們沿著網(wǎng)絡(luò)路線來(lái)獲取“數(shù)據(jù)”獵物。爬蟲(chóng)一般是指網(wǎng)絡(luò)資源的抓取,因?yàn)閜ython的腳本特性,python易于配置,對(duì)字符的處理也非常靈活,加上python有豐富的網(wǎng)絡(luò)抓取模塊,所以兩者經(jīng)常聯(lián)系在一起。

        (二)Python技術(shù)運(yùn)行原理

        Python技術(shù)又稱網(wǎng)絡(luò)機(jī)器人、網(wǎng)路蜘蛛,是一種按照規(guī)則自動(dòng)抓取信息的程序或者腳本,當(dāng)腳本啟動(dòng)后, 爬蟲(chóng)可自動(dòng)從互聯(lián)網(wǎng)上標(biāo)準(zhǔn)資源的地址中下載網(wǎng)頁(yè)內(nèi)容,隨后以匹配的方法從網(wǎng)頁(yè)中對(duì)感興趣的信息進(jìn)行抓取,與此同時(shí),爬蟲(chóng)會(huì)持續(xù)不斷地獲取新的資源。最終讓用戶能夠獲取自己想要的信息。我們以Python爬蟲(chóng)在網(wǎng)頁(yè)挖掘信息的過(guò)程為例。

        一個(gè)完整的爬蟲(chóng)流程包含三個(gè)模塊:爬取-解析-存儲(chǔ)。

        爬取流程控制模塊,內(nèi)容分析提取模塊以及網(wǎng)絡(luò)請(qǐng)求模塊。首先在待抓取隊(duì)列當(dāng)中放入經(jīng)過(guò)篩選的種子URL,抓取URL后爬取對(duì)應(yīng)的網(wǎng)頁(yè),通過(guò) http 向目標(biāo)站點(diǎn)發(fā)出相關(guān)的請(qǐng)求,發(fā)出的請(qǐng)求未被服務(wù)器及時(shí)響應(yīng),則會(huì)獲得圖片、視頻、音頻 html 等形式的答復(fù)。之后通過(guò)數(shù)據(jù)解析模塊對(duì) html 數(shù)據(jù)進(jìn)行解析,對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行分析,提取需要的數(shù)據(jù),再將數(shù)據(jù)傳給清洗模塊,隨后將URL傳給調(diào)度模塊,相關(guān)數(shù)據(jù)會(huì)被存儲(chǔ)到數(shù)據(jù)庫(kù)當(dāng)中。按照需求,從數(shù)據(jù)庫(kù)中對(duì)爬蟲(chóng)結(jié)果進(jìn)行讀取,通過(guò)文字或是圖形進(jìn)行展示。

        以上步驟我們可以發(fā)現(xiàn)爬蟲(chóng)在獲取網(wǎng)頁(yè)信息數(shù)據(jù)上功能的強(qiáng)大,若將此利用于被審計(jì)單位的數(shù)據(jù)庫(kù),通過(guò)爬蟲(chóng)提取發(fā)票、原始憑證、合同等信息,可以保證公司各項(xiàng)財(cái)務(wù)會(huì)計(jì)數(shù)據(jù)的真實(shí)性。也能夠?qū)咀陨頂?shù)據(jù)以及行業(yè)相關(guān)企業(yè)數(shù)據(jù)進(jìn)行相應(yīng)審計(jì)對(duì)比,對(duì)數(shù)據(jù)真實(shí)性 判斷提出合理性建議。

        (三)Python技術(shù)的優(yōu)點(diǎn)

        相對(duì)于其它網(wǎng)絡(luò)爬蟲(chóng)技術(shù),Python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)具有以下優(yōu)點(diǎn)。

        除了Python和R,還有各種各樣非常強(qiáng)大的商業(yè)數(shù)據(jù)分析軟件。但是,與這些商業(yè)產(chǎn)品相比,Python具有以下優(yōu)勢(shì)。

        1. Python的開(kāi)源許可證(與GPL兼容,但是您可以發(fā)布修改后的版本而無(wú)需將更改設(shè)為開(kāi)源)意味著可以免費(fèi)使用它。Python語(yǔ)法簡(jiǎn)單清晰,容易學(xué)習(xí)掌握。另一方面,商業(yè)軟件包帶有許可限制,并且相關(guān)的成本因素通常會(huì)限制組織中少數(shù)員工的可用性。

        2. 與許多商業(yè)數(shù)據(jù)分析軟件不同,Python甚至可以在低規(guī)格的臺(tái)式計(jì)算機(jī)上使用,使其適用于大規(guī)模部署,而無(wú)需在硬件上進(jìn)行額外投資。用本機(jī)Python編寫的數(shù)據(jù)分析代碼也可以用于支持Python的多個(gè)計(jì)算平臺(tái)和操作系統(tǒng)(例如Windows,Linux和MacOS)。

        3. 大多數(shù)(如果不是全部的話)商業(yè)數(shù)據(jù)分析軟件都是為交互使用而設(shè)計(jì)的,通常使它們不適合實(shí)施完全自動(dòng)化和可重用的數(shù)據(jù)分析解決方案。另一方面,Python代碼可用于完全自動(dòng)化整個(gè)數(shù)據(jù)分析過(guò)程,并且還可以不受限制地進(jìn)行分發(fā)和重用。

        4. 世界范圍內(nèi)的Python社區(qū)正在不斷為其豐富的功能集添加新的軟件包和功能。由于社區(qū)支持的規(guī)模,來(lái)自學(xué)術(shù)界和研究機(jī)構(gòu)的新數(shù)據(jù)分析技術(shù)也比免費(fèi)提供的Python版本更快地免費(fèi)提供。

        5. 有許多專門討論P(yáng)ython知識(shí)共享的在線討論論壇。 PyData會(huì)議還提供了寶貴的渠道,用于交換有關(guān)數(shù)據(jù)管理,處理,分析和可視化的新方法和新興開(kāi)源技術(shù)的信息。 PyData會(huì)議記錄的錄像在YouTube上免費(fèi)提供。

        三、Python技術(shù)應(yīng)用案例

        案例一:以德勤會(huì)計(jì)師事務(wù)所為例:2018年,作為四大會(huì)計(jì)師事務(wù)所之一的德勤會(huì)計(jì)師事務(wù)所在審計(jì)一家銀行時(shí),利用網(wǎng)絡(luò)爬蟲(chóng)Python技術(shù)對(duì)該銀行近2萬(wàn)個(gè)對(duì)公貸款客戶進(jìn)行數(shù)據(jù)搜集,獲取了包括工商、司法、輿情、征信、稅務(wù)在內(nèi)的17類專項(xiàng)數(shù)據(jù)。傳統(tǒng)審計(jì)方法一般只能通過(guò)一些數(shù)據(jù)查詢網(wǎng)站(比如:天眼查、企業(yè)查查等)進(jìn)行數(shù)據(jù)查詢與搜集。但在該案例中,需要對(duì)近20萬(wàn)個(gè)客戶展開(kāi)調(diào)查,需要花費(fèi)審計(jì)人員大量的時(shí)間和精力,如何批量查詢相關(guān)數(shù)據(jù)成為困擾審計(jì)人員的問(wèn)題。網(wǎng)絡(luò)爬蟲(chóng)可以在短時(shí)間內(nèi)通過(guò)鋪設(shè)路徑和邏輯,快速進(jìn)行網(wǎng)絡(luò)抓取。

        在分析數(shù)據(jù)時(shí),德勤事務(wù)所將搜集到的數(shù)據(jù)與行內(nèi)客戶歷史交易、業(yè)務(wù)辦理信息等內(nèi)部數(shù)據(jù)系統(tǒng)打通整合,最終形成了客戶關(guān)聯(lián)關(guān)系、資金往來(lái)關(guān)系、業(yè)務(wù)辦理信息、外部風(fēng)險(xiǎn)信息4大維度的客戶全景畫像。德勤風(fēng)險(xiǎn)咨詢將這2萬(wàn)個(gè)對(duì)公客戶的信貸申請(qǐng)資料與其全景畫像執(zhí)行關(guān)聯(lián)分析、交叉檢驗(yàn)等驗(yàn)證,最終發(fā)現(xiàn)了36個(gè)客戶涉及虛報(bào)財(cái)務(wù)信息、刻意隱瞞負(fù)面信息等虛假行為。借助網(wǎng)絡(luò)爬蟲(chóng)技術(shù),不僅在數(shù)據(jù)獲取上提高了審計(jì)的效率,更在審計(jì)上提高了完整性。

        案例二:A市X會(huì)計(jì)師事務(wù)所在審計(jì)一家主營(yíng)話費(fèi)充值業(yè)務(wù)的企業(yè)時(shí)。其收入來(lái)源為每一筆手機(jī)充值業(yè)務(wù)提取的服務(wù)費(fèi)。其客戶就是每一個(gè)手機(jī)號(hào)碼的個(gè)體,面對(duì)海量的客戶,甚至傳統(tǒng)意義上客商的概念都沒(méi)有了。其中審計(jì)工作的一部分就是核查手機(jī)用戶的真實(shí)性。需要在聯(lián)通、電信、移動(dòng)的官網(wǎng)上進(jìn)行號(hào)碼查詢、驗(yàn)證其真實(shí)性。在這種情況下,審計(jì)師無(wú)法利用傳統(tǒng)的詢證法發(fā)函證,也無(wú)法取得客戶真實(shí)性的信息。于是X會(huì)計(jì)師事務(wù)所借助網(wǎng)絡(luò)爬蟲(chóng)技術(shù),快速獲取到了客戶的全部信息。

        案例三:2018年B市審計(jì)局派出審計(jì)小組對(duì)某預(yù)算執(zhí)行審計(jì)項(xiàng)目進(jìn)行審計(jì)。為充分了解某片區(qū)住房的空置率問(wèn)題,審計(jì)人員從自來(lái)水公司采集了相關(guān)片區(qū)房屋的年度用水情況數(shù)據(jù)。針對(duì)審計(jì)數(shù)據(jù)中存在的水費(fèi)數(shù)據(jù)零散、傳統(tǒng)方法不便匯總的問(wèn)題,審計(jì)組積極探索新技術(shù)、新手段,特邀請(qǐng)計(jì)算機(jī)審計(jì)科的技術(shù)人員協(xié)助解決。相關(guān)技術(shù)人員在認(rèn)真分析數(shù)據(jù)特征和審計(jì)業(yè)務(wù)要求后,利用Python開(kāi)發(fā)語(yǔ)言開(kāi)發(fā)了“水費(fèi)數(shù)據(jù)分析小程序”,實(shí)現(xiàn)快速進(jìn)行數(shù)據(jù)匯總,并生成審計(jì)疑點(diǎn)數(shù)據(jù),由審計(jì)組有針對(duì)性地進(jìn)行現(xiàn)場(chǎng)核實(shí),大大提高了審計(jì)的工作效率。

        四、結(jié)語(yǔ)

        大數(shù)據(jù)的運(yùn)用是未來(lái)趨勢(shì)。與以往的審計(jì)模式不同,Python技術(shù)大大提高了數(shù)據(jù)搜集的效率和完整性。將驗(yàn)證性分析變?yōu)榱送诰蛐苑治觯瑥浹a(bǔ)了審計(jì)抽樣無(wú)法搜集全部數(shù)據(jù)的缺陷。并將審計(jì)方式從事后補(bǔ)救轉(zhuǎn)向全過(guò)程防御,尤其關(guān)注事前防御,有助于在風(fēng)險(xiǎn)發(fā)生之前就做好預(yù)測(cè)與判斷。但Python在運(yùn)行過(guò)程中也存在編寫復(fù)雜、代碼不能加密、執(zhí)行速度不夠快等缺點(diǎn)。

        參考文獻(xiàn):

        [1]李玉香,王孟玉,涂宇晰.基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)研究[J].信息技術(shù)與信息化,2019(12):143-145.

        [2]謝克武.大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)[J].電子制作,2017(09):44-45.

        [3]陳偉.大數(shù)據(jù)環(huán)境下基于模糊匹配的審計(jì)方法[J].中國(guó)注冊(cè)會(huì)計(jì)師,2016(11):84-88+3.

        (作者單位:南京理工大學(xué)泰州科技學(xué)院)

        猜你喜歡
        大數(shù)據(jù)
        大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
        新聞世界(2016年10期)2016-10-11 20:13:53
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
        在线视频 亚洲精品| 日韩av午夜在线观看| 人妻丰满熟妇av无码区不卡| 亚洲综合婷婷久久| 日韩成人精品一区二区三区| 黄色一区二区三区大全观看| 日韩精品成人无码专区免费| 香蕉视频www.5.在线观看| 人妻无码∧V一区二区| 亚洲丝袜美腿精品视频| 丰满少妇弄高潮了www| 国产女女做受ⅹxx高潮| 亚洲成AV人片在一线观看| 狼人精品剧情av在线观看| 日韩人妻ol丝袜av一二区| 亚洲人成人影院在线观看| 国产杨幂AV在线播放| 国产精品大片一区二区三区四区| 熟女少妇精品一区二区| 亚洲色图+国产精品| 日本人妻伦理片在线观看| 亚洲精品国产精品乱码视色| 成人免费777777被爆出| 国产97色在线 | 免| 我也色自拍俺也色自拍| 亚洲无av在线中文字幕| 曰本女人牲交全视频免费播放| 99精品国产兔费观看久久99| 国产中文久久精品| 日本一区二区三区区视频| 久久精品国产精油按摩| 久久综合色鬼| 亚洲无人区一码二码国产内射 | 日韩女人毛片在线播放| 日韩精品人妻视频一区二区三区 | 国产99r视频精品免费观看 | 吃奶呻吟打开双腿做受视频| 国产精品一区二区电影| 尤物成av人片在线观看| 国产欧美日韩一区二区加勒比| 亚洲av无码男人的天堂在线|