亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        信息技術(shù)在大氣污染防治審計(jì)中的應(yīng)用
        ——基于“計(jì)算審計(jì)學(xué)”新領(lǐng)域

        2022-12-12 05:28:06邢春玉副教授張立民博士生導(dǎo)師教授
        財(cái)會(huì)月刊 2022年24期
        關(guān)鍵詞:大氣模型

        邢春玉(副教授),張立民(博士生導(dǎo)師),張 莉(教授)

        一、引言

        隨著社會(huì)逐步邁入大數(shù)據(jù)和智能化時(shí)代,審計(jì)人員應(yīng)該重視計(jì)算機(jī)審計(jì)技術(shù)的發(fā)展,并運(yùn)用大數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)等新興方法查找審計(jì)線索,以計(jì)算機(jī)代替人工,去發(fā)現(xiàn)更為復(fù)雜的函數(shù)關(guān)系,學(xué)習(xí)數(shù)據(jù)分布,挖掘傳統(tǒng)審計(jì)手段難以發(fā)現(xiàn)的審計(jì)疑點(diǎn)。尤其在大氣污染防治領(lǐng)域,迫于環(huán)保壓力,部分地區(qū)存在大氣污染監(jiān)測(cè)數(shù)據(jù)造假的情況,如2016年西安監(jiān)測(cè)站空氣采樣器“戴口罩”現(xiàn)象,2017年寧夏監(jiān)測(cè)站點(diǎn)周邊被人為噴水霧等操作時(shí)有發(fā)生。北京地區(qū)的大氣污染形勢(shì)一直以來(lái)都受到人們的極大關(guān)注,2010~2020年出現(xiàn)了800多次重度污染,且持續(xù)時(shí)間長(zhǎng)。同時(shí),污染物來(lái)源的增加,使大氣污染的監(jiān)控和預(yù)防更加困難,因此需要新的大氣污染監(jiān)測(cè)技術(shù),來(lái)滿足環(huán)境監(jiān)測(cè)與大氣污染防治和預(yù)警的要求。我國(guó)的大氣污染防治缺乏系統(tǒng)性技術(shù)和實(shí)踐方案,在目前的審計(jì)工作中,很多審計(jì)人員還是采用SQL數(shù)據(jù)庫(kù)導(dǎo)入數(shù)據(jù)進(jìn)行數(shù)據(jù)查詢和分析、利用Excel等電子表格軟件進(jìn)行數(shù)據(jù)處理和分析,在處理百萬(wàn)級(jí)審計(jì)數(shù)據(jù)時(shí),無(wú)法通過(guò)簡(jiǎn)單查詢語(yǔ)句、分類匯總、數(shù)據(jù)透視表等功能發(fā)現(xiàn)舞弊問題。此外,受限于計(jì)算機(jī)審計(jì)技術(shù)的發(fā)展,處理大量數(shù)據(jù)給審計(jì)人員造成很大困難,加之大氣污染防治審計(jì)涉及主體較多(包括政府部門、相關(guān)企業(yè)、財(cái)政部門等),需要多個(gè)單位的協(xié)作,導(dǎo)致我國(guó)大氣污染監(jiān)測(cè)信息難以充分披露,透明度不高,信息質(zhì)量難以保證。

        針對(duì)以上問題和挑戰(zhàn),在大氣污染防治審計(jì)中,運(yùn)用大數(shù)據(jù)方法分析污染物成分,采用人工智能技術(shù)進(jìn)行預(yù)測(cè)分析,有助于對(duì)大氣污染實(shí)現(xiàn)防控和治理,能顯著提升大氣污染監(jiān)測(cè)數(shù)據(jù)的透明度,減少政府在大氣污染防治方面的經(jīng)濟(jì)損失,促進(jìn)京津冀區(qū)域乃至全國(guó)其他地區(qū)的生態(tài)文明建設(shè)。

        本文的創(chuàng)新之處主要有以下兩點(diǎn):一是將計(jì)算機(jī)信息技術(shù)與大氣污染防治審計(jì)理論方法相結(jié)合,利用數(shù)字化技術(shù)與人工智能技術(shù)賦能審計(jì)過(guò)程,探索環(huán)境審計(jì)中異常數(shù)據(jù)的智能分析與挖掘方法,對(duì)于提升審計(jì)工作的效率和質(zhì)量,豐富和促進(jìn)“計(jì)算審計(jì)學(xué)”的理論發(fā)展具有重要的學(xué)術(shù)價(jià)值,同時(shí)該研究也將豐富人工智能技術(shù)的應(yīng)用場(chǎng)景,對(duì)人工智能理論的應(yīng)用具有重要的學(xué)術(shù)價(jià)值。二是研究成果將大大降低環(huán)境審計(jì)人員的勞動(dòng)強(qiáng)度,便于開展全覆蓋、全流程的環(huán)境審計(jì),對(duì)于提升審計(jì)工作效率和質(zhì)量具有重要作用,同時(shí),可減少審計(jì)單位的經(jīng)費(fèi)投入,產(chǎn)生良好的經(jīng)濟(jì)效益和社會(huì)效益,且研究成果可供其他審計(jì)領(lǐng)域借鑒,具有重要的應(yīng)用價(jià)值。

        二、文獻(xiàn)回顧

        環(huán)境審計(jì)研究領(lǐng)域普遍認(rèn)為,政府環(huán)境審計(jì)產(chǎn)生于受托環(huán)境責(zé)任理論,受托責(zé)任是指環(huán)保部門和審計(jì)機(jī)關(guān)的受托責(zé)任。自然資源是公眾公有財(cái)產(chǎn),企業(yè)、個(gè)人和社會(huì)發(fā)展在追求經(jīng)濟(jì)利益及社會(huì)效益時(shí),對(duì)自然資源造成浪費(fèi)和破壞,最終給人民生活帶來(lái)負(fù)面影響,這種環(huán)境成本最終由公眾來(lái)承擔(dān)。為保證政府受托環(huán)境責(zé)任全面履行,公眾有權(quán)委托審計(jì)機(jī)關(guān)對(duì)政府管理成果進(jìn)行評(píng)價(jià)和考量,審查政府受托責(zé)任履行情況,以改善政府管理制度,促進(jìn)政府部門高效工作并更好地履行環(huán)境保護(hù)責(zé)任[1]。史曉燕和班景剛[2]、卞興忠[3]等總結(jié)了環(huán)境審計(jì)的定義和內(nèi)容,提出了健全的環(huán)境審計(jì)理論體系并進(jìn)行了實(shí)證研究。曹鍵和李曉琴[4]對(duì)企業(yè)環(huán)境管理進(jìn)行績(jī)效評(píng)價(jià)并將環(huán)境績(jī)效審計(jì)作為環(huán)境管理的工具。周暢[5]分析了政府環(huán)境履責(zé)審計(jì)的定義、內(nèi)容和作用機(jī)制,研究了政府環(huán)境履責(zé)績(jī)效審計(jì)。趙慧琪和李宏欣[6]回顧了大氣環(huán)境審計(jì)現(xiàn)狀,通過(guò)對(duì)現(xiàn)存問題進(jìn)行分析,對(duì)豐富審計(jì)內(nèi)容、創(chuàng)新大氣環(huán)境審計(jì)技術(shù)方法做出了貢獻(xiàn)。劉桂春和王碧玉[7]通過(guò)對(duì)北京地區(qū)大氣污染防治情況的分析,提出了區(qū)域性環(huán)境績(jī)效審計(jì),建立了區(qū)域績(jī)效審計(jì)評(píng)價(jià)指標(biāo)體系,指出可運(yùn)用環(huán)境費(fèi)用效益分析進(jìn)行績(jī)效審計(jì)。張璐[8]對(duì)政府環(huán)境績(jī)效審計(jì)目標(biāo)和方法進(jìn)行了研究,將審計(jì)目標(biāo)分為根本目標(biāo)、具體目標(biāo)和最終目標(biāo),并指出指標(biāo)設(shè)計(jì)是政府環(huán)境審計(jì)的重要環(huán)節(jié)。

        我國(guó)對(duì)大氣污染防治審計(jì)的研究是近幾年才開始的。喻亞敏[9]研究了大氣污染防治審計(jì)的依據(jù),認(rèn)為目前并未形成統(tǒng)一完整的大氣污染環(huán)境審計(jì)依據(jù)。國(guó)內(nèi)現(xiàn)有文獻(xiàn)主要是翻譯其他國(guó)家在大氣污染防治審計(jì)方面的法律法規(guī)和一些經(jīng)驗(yàn)做法。劉譽(yù)澤[10]認(rèn)為,我國(guó)的大氣污染環(huán)境審計(jì)在制度制定方面、審計(jì)人員使用審計(jì)工具技術(shù)方面、政府財(cái)政撥款方面都存在很多不足,并借鑒英國(guó)和美國(guó)的霧霾治理經(jīng)驗(yàn),對(duì)我國(guó)審計(jì)部門執(zhí)行大氣污染防治審計(jì)工作提出了建設(shè)性意見。鐘廷勇等[11]指出我國(guó)環(huán)境審計(jì)方面的不足,如缺少完整的大氣污染環(huán)境審計(jì)方面的法律法規(guī),存在對(duì)環(huán)境專項(xiàng)資金管理使用不當(dāng)、不及時(shí)的情況,同時(shí)資金的使用也缺少監(jiān)督,以至于存在專項(xiàng)資金不能及時(shí)分發(fā)、被占用貪污的現(xiàn)象?!洞髿馐畻l》對(duì)大氣污染治理工作做出指示,即在大氣污染防治工作開展過(guò)程中,對(duì)于政府對(duì)大氣污染治理的經(jīng)濟(jì)性、效率性、效果性是否與預(yù)期目標(biāo)相匹配,投入和產(chǎn)出是否合理,有必要通過(guò)績(jī)效審計(jì)做出客觀評(píng)價(jià)[12]。

        國(guó)外學(xué)者在較早時(shí)期就開展了大氣污染防治審計(jì)方面的研究。英美等國(guó)進(jìn)入工業(yè)化時(shí)代較早。在空氣污染問題頻發(fā)之后,英國(guó)審計(jì)署于20世紀(jì)60年代就頒布了相應(yīng)法案,近幾年又頒布了審計(jì)相關(guān)法律來(lái)規(guī)范大氣污染防治工作。美國(guó)審計(jì)署也十分重視空氣質(zhì)量狀況,十分重視對(duì)大氣污染防治及相關(guān)工作的審計(jì)監(jiān)督,逐漸發(fā)展形成了多種模型方法輔助空氣質(zhì)量預(yù)測(cè)[13,14],并發(fā)布審計(jì)報(bào)告。在大氣污染監(jiān)測(cè)技術(shù)和方法領(lǐng)域,國(guó)外運(yùn)用的模型主要有統(tǒng)計(jì)預(yù)測(cè)模型、模糊時(shí)間序列模型、機(jī)器學(xué)習(xí)預(yù)測(cè)模型和綜合評(píng)價(jià)模型等,但上述方法在我國(guó)大氣污染防治審計(jì)領(lǐng)域的應(yīng)用卻十分少見。因此,借鑒國(guó)外機(jī)器學(xué)習(xí)預(yù)測(cè)模型的應(yīng)用,本文嘗試在大氣污染防治審計(jì)中基于無(wú)監(jiān)督和監(jiān)督學(xué)習(xí)的相關(guān)理論,運(yùn)用DBSCAN聚類算法和長(zhǎng)短期記憶網(wǎng)絡(luò)的方法,對(duì)大氣污染相關(guān)數(shù)據(jù)的異常情況進(jìn)行審計(jì)。

        三、研究設(shè)計(jì)

        2013~2015年北京出現(xiàn)了280次重度污染,且持續(xù)時(shí)間長(zhǎng)、數(shù)據(jù)量較大,因此本文選擇利用2013年12月31日~2015年8月10日北京地區(qū)95個(gè)監(jiān)測(cè)站點(diǎn)的165140條大氣污染物濃度數(shù)據(jù),分析北京地區(qū)大氣污染物的濃度變化,對(duì)大氣監(jiān)測(cè)數(shù)據(jù)進(jìn)行審計(jì)。通過(guò)對(duì)不同監(jiān)測(cè)點(diǎn)多年數(shù)據(jù)的分析,找出在大氣監(jiān)測(cè)數(shù)據(jù)集中存在的與模型預(yù)測(cè)值不同的數(shù)據(jù),最終統(tǒng)計(jì)出異常數(shù)據(jù)出現(xiàn)次數(shù)較多的監(jiān)測(cè)站點(diǎn),發(fā)現(xiàn)審計(jì)疑點(diǎn),從而助力審計(jì)人員的進(jìn)一步調(diào)查分析。選擇的六個(gè)大氣污染物度量指標(biāo)為:SO2、NO2、O3、CO、PM2.5、PM10的24小時(shí)滑動(dòng)平均值。在大氣污染防治審計(jì)中,本文采用監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)方法分別進(jìn)行空氣質(zhì)量數(shù)據(jù)舞弊的監(jiān)測(cè)。

        (一)DBSCAN聚類算法

        DBSCAN屬于無(wú)監(jiān)督學(xué)習(xí)方法的一種,是具有噪聲的基于密度的空間聚類算法。該算法按照設(shè)定好的參數(shù)(根據(jù)參數(shù)可進(jìn)一步確定密度),把數(shù)據(jù)歸為不同的類。噪聲點(diǎn)會(huì)被聚類算法孤立出來(lái),異常檢測(cè)就是要找出這些噪聲點(diǎn)。由于獲取的北京地區(qū)大氣監(jiān)測(cè)數(shù)據(jù)中存在的異常情況并沒有被標(biāo)注,不清楚具體是哪一條數(shù)據(jù),而利用DBSCAN聚類算法可以對(duì)大量的樣本集進(jìn)行聚類,進(jìn)一步找出異常數(shù)據(jù)。

        1.模型設(shè)置和調(diào)參。研究樣本的數(shù)據(jù)集中一共有六個(gè)指標(biāo),包括CO濃度、NO2濃度、O3濃度、PM10濃度、PM2.5濃度、SO2濃度,其中完整特征如表1所示。

        表1 數(shù)據(jù)集的六個(gè)指標(biāo)

        在該算法中,需要設(shè)定兩個(gè)超參數(shù)——eps(半徑)和MinPts(半徑內(nèi)數(shù)據(jù)點(diǎn)的個(gè)數(shù)),參數(shù)的設(shè)置需要經(jīng)過(guò)不斷擬合,然后確定最優(yōu)的eps和MinPts。模型結(jié)果對(duì)這兩個(gè)參數(shù)的變化較為敏感,參數(shù)的變化會(huì)嚴(yán)重影響模型的聚類效果。

        DBSCAN聚類算法對(duì)數(shù)據(jù)的處理過(guò)程是:①人為確定后輸入eps和MinPts這兩個(gè)參數(shù)。②算法會(huì)從輸入的原始數(shù)據(jù)集中隨機(jī)抽取一個(gè)尚未訪問過(guò)的樣本x。③如果樣本x是核心對(duì)象,進(jìn)入步驟④,否則重新回到步驟②。④找出從樣本x出發(fā)的所有密度可達(dá)的數(shù)據(jù),劃分到同一個(gè)聚類,形成以x為核心對(duì)象的簇,并標(biāo)記這些對(duì)象為已訪問。⑤當(dāng)全部數(shù)據(jù)集都被訪問后,結(jié)束算法。否則再次回到步驟②。

        最后,該聚類算法可以得到核心對(duì)象(coreSamples)和非核心對(duì)象(noiseSamples),將核心對(duì)象的數(shù)據(jù)標(biāo)簽coreSampleMask設(shè)置為True,通過(guò)代碼coreSampleMask[db.core_sample_indices_]=True來(lái)實(shí)現(xiàn)。剩下的其他數(shù)據(jù)就是非核心對(duì)象,將其標(biāo)簽設(shè)置為False。經(jīng)過(guò)不斷調(diào)試,最終確定MinPts=30、eps=30,代入聚類算法的學(xué)習(xí)。通過(guò)查看noiseSamples的Excel文件,發(fā)現(xiàn)一共有7771條數(shù)據(jù)被劃分為非核心數(shù)據(jù)(異常數(shù)據(jù)),該結(jié)果是在計(jì)算機(jī)現(xiàn)有內(nèi)存和該算法結(jié)構(gòu)下能得到的最好的一個(gè),因此確定超參數(shù)MinPts=30、eps=30。

        測(cè)試結(jié)果見圖1。

        圖1 MinPts=30和eps=30時(shí)的聚類結(jié)果

        2.結(jié)果判定。通過(guò)對(duì)異常結(jié)果的分析發(fā)現(xiàn),165140條大氣污染監(jiān)測(cè)數(shù)據(jù)中,運(yùn)用DBSCAN算法聚類生成7771個(gè)非核心對(duì)象,并應(yīng)用本福特定律進(jìn)行異常分析,發(fā)現(xiàn)原始輸入數(shù)據(jù)中存在10處異常,算法生成的異常數(shù)據(jù)中存在21處異常,其中這21個(gè)異常中有7個(gè)與原始輸入數(shù)據(jù)的異常情況一致,其余未被標(biāo)注的地方是原始數(shù)據(jù)與異常數(shù)據(jù)不同的地方。由此看來(lái),該聚類算法可以劃分出異常數(shù)據(jù),為大氣污染防治審計(jì)人員的后續(xù)審計(jì)工作提供技術(shù)支持,縮小審計(jì)范圍。

        在10處異常中檢測(cè)出7處,說(shuō)明DBSCAN聚類算法準(zhǔn)確度不夠高,在處理輸入數(shù)據(jù)集的時(shí)候,并沒有考慮到獲取的大氣數(shù)據(jù)同時(shí)是一個(gè)時(shí)間序列,具有時(shí)序性。在整個(gè)算法處理過(guò)程中,只是簡(jiǎn)單地對(duì)數(shù)據(jù)進(jìn)行密度聚類,找出了很多值為0(最小值)和最大值這種極端情況,沒有充分利用原始數(shù)據(jù)的特征進(jìn)行分析。如果聯(lián)系數(shù)據(jù)所處時(shí)間前后情況看,該極端情況可能是數(shù)據(jù)平緩增加或減少得到的,并不是數(shù)據(jù)激增或者迅速減少的結(jié)果,所以生成的近4.71%(7771/165140)的異常數(shù)據(jù)很有可能偏多。

        對(duì)于DBSCAN算法模型,可以對(duì)數(shù)據(jù)進(jìn)行聚類處理以發(fā)現(xiàn)異常數(shù)據(jù),但是在準(zhǔn)確度上需要進(jìn)一步提升。因此,本文結(jié)合大氣污染物數(shù)據(jù)的時(shí)序性特點(diǎn),進(jìn)一步利用神經(jīng)網(wǎng)絡(luò)模型對(duì)異常數(shù)據(jù)進(jìn)行更精確的檢測(cè)。

        (二)長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)

        LSTM是長(zhǎng)短期記憶網(wǎng)絡(luò),是一種改進(jìn)后的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),屬于監(jiān)督學(xué)習(xí)方法,其顯著的優(yōu)點(diǎn)是可以解決長(zhǎng)序列訓(xùn)練過(guò)程中的梯度消失和梯度爆炸問題。相比于普通的循環(huán)神經(jīng)網(wǎng)絡(luò),長(zhǎng)短期記憶網(wǎng)絡(luò)可以更好地處理時(shí)序性數(shù)據(jù)。該方法中的異常檢測(cè)是通過(guò)觀察大部分?jǐn)?shù)據(jù)分布,識(shí)別出分布罕見或不同的情況。對(duì)于時(shí)間序列數(shù)據(jù)的異常檢測(cè)問題主要關(guān)注意外的峰值、意外的低谷、趨勢(shì)變化與水平平移?,F(xiàn)在個(gè)別大氣污染監(jiān)測(cè)站點(diǎn)存在數(shù)據(jù)造假現(xiàn)象,通過(guò)人為操控改變大氣污染監(jiān)測(cè)指標(biāo),這可能會(huì)使某個(gè)時(shí)點(diǎn)的數(shù)據(jù)與前一天相比出現(xiàn)很大變化,或者連續(xù)多天數(shù)據(jù)都保持不變。通過(guò)異常檢測(cè)可以發(fā)現(xiàn)造假現(xiàn)象或者機(jī)器統(tǒng)計(jì)錯(cuò)誤,并及時(shí)對(duì)錯(cuò)誤數(shù)據(jù)進(jìn)行改正。

        1.模型設(shè)置和調(diào)參。采取同樣的數(shù)據(jù)集并通過(guò)pycharm繪制子圖,可以看到2013年12月31日~2015年8月10日這一時(shí)間段中數(shù)據(jù)的大致分布情況,如圖2所示。

        圖2 大氣污染監(jiān)測(cè)數(shù)據(jù)時(shí)間序列折線圖

        首先,將數(shù)據(jù)集清洗后進(jìn)行歸一化處理。為了應(yīng)用多變量時(shí)間序列預(yù)測(cè)模型,通過(guò)The series_to_supervised()函數(shù)對(duì)輸入數(shù)據(jù)進(jìn)行處理,可以把輸入的北京地區(qū)大氣污染監(jiān)測(cè)數(shù)據(jù)(時(shí)間序列數(shù)據(jù))轉(zhuǎn)化為監(jiān)督學(xué)習(xí)問題。在這里監(jiān)督學(xué)習(xí)就是由輸入(X)和輸出(Y)構(gòu)成,能夠?qū)崿F(xiàn)輸入到輸出的預(yù)測(cè)。The series_to_supervised()函數(shù)會(huì)返回DataFrame,從而將原始大氣監(jiān)測(cè)數(shù)據(jù)轉(zhuǎn)變?yōu)楸O(jiān)督學(xué)習(xí)的X和Y部分。在此,將前一刻時(shí)間(t-1)的六個(gè)大氣污染物指標(biāo)和空氣質(zhì)量指數(shù)(AQI)作為X,將空氣污染狀況作為Y,創(chuàng)建一個(gè)X為t-1、Y為t的DataFrame。即通過(guò)過(guò)去時(shí)間(t-1)的污染物狀況,預(yù)測(cè)下一段時(shí)間(t)的空氣污染情況。

        其次,把原始數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集。在165140條數(shù)據(jù)中,選擇使用25000條數(shù)據(jù)來(lái)擬合模型(選擇25000條數(shù)據(jù)是經(jīng)過(guò)多次模型優(yōu)化后獲得的最優(yōu)結(jié)果),然后用其余140140條數(shù)據(jù)進(jìn)行評(píng)估。在訓(xùn)練集中,實(shí)現(xiàn)把輸入(X)重構(gòu)為長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)期的格式,即[樣本,時(shí)間步,特征]([samples,timesteps,features])。samples為輸入數(shù)據(jù)的數(shù)量。timesteps=n,就意味著對(duì)前n個(gè)值的學(xué)習(xí)來(lái)預(yù)測(cè)目前狀態(tài)下的值。features為變量的個(gè)數(shù)。例如:一個(gè)長(zhǎng)短期記憶網(wǎng)絡(luò)的輸入輸出格式是[samples,timesteps,features],那么[[[0 1 2][3 4 5]]]也就是1條樣本(samples),每條樣本2個(gè)步驟(timesteps),每個(gè)步驟3個(gè)維度(features)。

        然后,建立并優(yōu)化LSTM模型,并對(duì)模型進(jìn)行調(diào)參。在調(diào)參過(guò)程中,筆者發(fā)現(xiàn)epochs在達(dá)到50步左右的時(shí)候訓(xùn)練集和測(cè)試集的損失函數(shù)中期達(dá)到最小值,基本處于一個(gè)水平線,已經(jīng)達(dá)到收斂,多增加步數(shù)會(huì)產(chǎn)生過(guò)擬合的效果;當(dāng)在模型中設(shè)置較少數(shù)量的神經(jīng)元時(shí),發(fā)現(xiàn)模型擬合效果并不好,出現(xiàn)欠擬合的現(xiàn)象,應(yīng)該適當(dāng)增加神經(jīng)元的數(shù)量,提升模型準(zhǔn)確度;試著調(diào)整timesteps,改為7,即模型中每次細(xì)胞輸入門所輸入的數(shù)據(jù)量。將上一步驟中生成的變量和這一次的7行連續(xù)時(shí)間序列數(shù)據(jù)一起輸入,再產(chǎn)生新的變量傳遞下去;接下來(lái)選擇激活函數(shù),雖然當(dāng)數(shù)據(jù)值大小差異較大時(shí),sigmoid會(huì)出現(xiàn)梯度消失的情況,但是在上文中已經(jīng)對(duì)數(shù)據(jù)進(jìn)行了歸一化處理,不會(huì)出現(xiàn)梯度消失和梯度爆炸的情況,同時(shí)結(jié)合模型訓(xùn)練效果,最終選擇sigmoid作為激活函數(shù)。通過(guò)多次調(diào)整參數(shù),對(duì)比訓(xùn)練集和測(cè)試集損失函數(shù)的不同表現(xiàn),最后確定最優(yōu)參數(shù):神經(jīng)元個(gè)數(shù)(units)=256,epochs=128,batch_size=128,訓(xùn)練集數(shù)據(jù)量=25000,timesteps=1,激活函數(shù)選擇sigmoid,損失函數(shù)選擇mae,優(yōu)化器選擇Adam。測(cè)試結(jié)果如圖3所示,擬合效果良好。

        圖3 units=256,epochs=128,batch_size=128,訓(xùn)練集數(shù)據(jù)量=25000,timesteps=1時(shí)的訓(xùn)練情況

        2.結(jié)果判定。在完成對(duì)LSTM模型的訓(xùn)練和優(yōu)化之后,下面對(duì)模型預(yù)測(cè)生成的數(shù)據(jù)進(jìn)行進(jìn)一步分析。通過(guò)代碼將numpy數(shù)據(jù)格式轉(zhuǎn)化生成Excel文件(.xlsx),對(duì)數(shù)據(jù)進(jìn)行整理合并處理后,將數(shù)據(jù)實(shí)際值和預(yù)測(cè)值的差值進(jìn)行排序,得到可能出現(xiàn)異常的數(shù)據(jù),一共1630條。對(duì)篩選出的1630條數(shù)據(jù)進(jìn)行本福特定律分析,發(fā)現(xiàn)1630條數(shù)據(jù)首位數(shù)字分布出現(xiàn)的異常情況與全北京地區(qū)大氣污染物數(shù)據(jù)異常情況是一致的,在165140條原始輸入數(shù)據(jù)中,本福特定律得出的異常分布有10處,這里生成的異常數(shù)據(jù)顯示異常分布有15處,其中有8處是一致的,2處不一致,剩下5處是新增的異常分布。例如在生成的異常數(shù)據(jù)當(dāng)中,PM10都是在首位數(shù)字是7、8、9的數(shù)據(jù)偏離本福特定律分布,而且這里首位數(shù)字是6的分布也出現(xiàn)異常情況。在查詢異常數(shù)據(jù)出現(xiàn)的時(shí)間后,發(fā)現(xiàn)部分異常數(shù)據(jù)出現(xiàn)在數(shù)據(jù)突起的時(shí)候,即出現(xiàn)極大值時(shí),空氣質(zhì)量指數(shù)真實(shí)值和預(yù)測(cè)值之間的差值很大,這符合對(duì)異常值的定義。

        (三)兩種方法的對(duì)比

        將DBSCAN聚類算法和LSTM模型進(jìn)行比較,結(jié)果如表2所示。

        表2 算法模型的結(jié)果準(zhǔn)確度比較

        通過(guò)對(duì)兩個(gè)算法模型能夠正確檢測(cè)出異常點(diǎn)的比例進(jìn)行比較,LSTM模型能夠更準(zhǔn)確地檢測(cè)出異常點(diǎn)的分布區(qū)域,進(jìn)而對(duì)具體的每一條異常數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,重點(diǎn)關(guān)注出現(xiàn)異常頻率較高的大氣污染監(jiān)測(cè)站點(diǎn),審計(jì)人員可以前往站點(diǎn)進(jìn)行現(xiàn)場(chǎng)審計(jì),檢查監(jiān)測(cè)站點(diǎn)空氣采樣器是否經(jīng)過(guò)處理,或者是否有噴水霧、周邊車輛限行的情況出現(xiàn)。

        在排除這些情況后,可以對(duì)大氣污染監(jiān)測(cè)系統(tǒng)進(jìn)行審計(jì)。進(jìn)一步實(shí)施的審計(jì)流程包括:①了解站點(diǎn)大氣監(jiān)測(cè)系統(tǒng)基本情況。比如大氣監(jiān)測(cè)系統(tǒng)的使用和運(yùn)行年限、人員的工作流程、是否有明確的規(guī)章制度,對(duì)此形成一個(gè)初步印象,進(jìn)而明確審計(jì)難度,確定審計(jì)所需時(shí)間以及人員等后續(xù)審計(jì)工作安排。②檢測(cè)數(shù)據(jù)的生成過(guò)程,從數(shù)據(jù)處理流程入手,檢查是否存在防錯(cuò)糾錯(cuò)的保護(hù)機(jī)制,有助于減少機(jī)器誤差。③調(diào)查大氣污染監(jiān)測(cè)系統(tǒng)操作順序是否標(biāo)準(zhǔn)化,調(diào)查系統(tǒng)管理維護(hù)人員在大氣污染監(jiān)測(cè)系統(tǒng)中的權(quán)限,是否存在對(duì)數(shù)據(jù)進(jìn)行修改等導(dǎo)致數(shù)據(jù)失真的操作。

        四、研究結(jié)論及建議

        本文通過(guò)運(yùn)用DBSCAN聚類算法和長(zhǎng)短期記憶網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法,得到了相應(yīng)的數(shù)據(jù)異常值。審計(jì)人員在審計(jì)工作中可以通過(guò)這些方法對(duì)不同大氣污染監(jiān)測(cè)站點(diǎn)的大氣污染監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析以及挖掘,了解大氣污染物濃度的真實(shí)情況。此外,在LSTM模型中,不同時(shí)刻的數(shù)據(jù)都對(duì)應(yīng)生成了空氣質(zhì)量指數(shù)(AQI)的預(yù)測(cè)值(inv_yhat),根據(jù)真實(shí)值(inv_y)和預(yù)測(cè)值(inv_yhat)之間的差值,審計(jì)人員可以進(jìn)一步劃分異常數(shù)據(jù),特別是當(dāng)審計(jì)時(shí)間和人力不足時(shí),可以篩選出誤差最大的異常數(shù)據(jù)進(jìn)行重點(diǎn)審計(jì)調(diào)查,以此來(lái)提升審計(jì)效率,盡快為審計(jì)人員確定審計(jì)方向,可以在較短時(shí)間內(nèi)及時(shí)確定需要進(jìn)行審計(jì)的監(jiān)測(cè)站點(diǎn)。

        另外,本文通過(guò)相關(guān)分析發(fā)現(xiàn),在2013年之前北京對(duì)地方環(huán)境方面的財(cái)政支出很少,導(dǎo)致北京市對(duì)大氣污染的防控工作不能得到足夠的財(cái)政支持,加劇了當(dāng)時(shí)持續(xù)數(shù)年的空氣污染;加之北京的發(fā)展十分迅速,經(jīng)濟(jì)增長(zhǎng)也伴隨著環(huán)境治理的壓力。因此,加強(qiáng)監(jiān)測(cè)站能力建設(shè)、利用大數(shù)據(jù)手段進(jìn)行環(huán)境審計(jì)監(jiān)督等就顯得尤為重要。

        對(duì)于大氣污染防治審計(jì)工作,結(jié)合北京市具體情況提出以下建議:

        第一,對(duì)能夠影響大氣污染防治審計(jì)的其他因素進(jìn)行調(diào)查研究。文中主要選取了大氣中六個(gè)污染物指標(biāo)進(jìn)行分析研究,如果要做到更為準(zhǔn)確的預(yù)測(cè)防控,需要審計(jì)人員跟進(jìn)現(xiàn)有審計(jì)特點(diǎn),明確大氣污染防治審計(jì)體系下的審計(jì)目標(biāo)、審計(jì)主體、審計(jì)客體、審計(jì)范圍、審計(jì)技術(shù)方法,調(diào)整大氣污染審計(jì)報(bào)告出具標(biāo)準(zhǔn)等,使大氣污染防治審計(jì)報(bào)告更為規(guī)范。

        第二,財(cái)政部門要給予足夠的資金支持,提高對(duì)大氣污染防治審計(jì)的重視程度。因?yàn)榇髿馕廴痉乐螌徲?jì)數(shù)據(jù)量龐大,這就需要高性能計(jì)算機(jī)的支持,以有利于先進(jìn)的大數(shù)據(jù)審計(jì)方法的施行。

        第三,對(duì)于環(huán)保部門而言,應(yīng)當(dāng)不定期對(duì)大氣污染監(jiān)測(cè)站點(diǎn)的審計(jì)工作進(jìn)行監(jiān)督,了解大氣污染防治審計(jì)人員是否真正落實(shí)審計(jì)工作,對(duì)各地大氣污染監(jiān)測(cè)站點(diǎn)是否執(zhí)行了充足的審計(jì)程序。同時(shí),應(yīng)向人民群眾普及大氣環(huán)境保護(hù)的知識(shí),提高大氣污染監(jiān)測(cè)信息透明度。

        第四,對(duì)于大氣污染防治審計(jì)部門而言,應(yīng)當(dāng)注重審計(jì)人員的培訓(xùn),提升審計(jì)人員的專業(yè)能力。在大數(shù)據(jù)時(shí)代,審計(jì)人員應(yīng)學(xué)會(huì)使用大數(shù)據(jù)審計(jì)方法,運(yùn)用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等領(lǐng)域的先進(jìn)算法模型進(jìn)行審計(jì),熟悉業(yè)務(wù)流程,快速建立算法模型來(lái)發(fā)現(xiàn)異常,提升發(fā)現(xiàn)審計(jì)疑點(diǎn)的能力。

        五、信息技術(shù)推動(dòng)“計(jì)算審計(jì)學(xué)”新興學(xué)科的產(chǎn)生

        隨著信息技術(shù)的不斷發(fā)展和廣泛應(yīng)用,計(jì)算數(shù)學(xué)、計(jì)算金融學(xué)等“計(jì)算機(jī)+”交叉學(xué)科陸續(xù)出現(xiàn)。信息化是審計(jì)事業(yè)發(fā)展的不竭動(dòng)力,信息技術(shù)為審計(jì)業(yè)務(wù)的開展提供了各種科學(xué)技術(shù)方法和手段,與“計(jì)算機(jī)+”緊密結(jié)合的交叉學(xué)科“計(jì)算審計(jì)學(xué)”應(yīng)運(yùn)而生。計(jì)算審計(jì)學(xué)側(cè)重審計(jì)業(yè)務(wù)邏輯和流程的研究,突破傳統(tǒng)審計(jì)模式的局限,可提高審計(jì)質(zhì)量和審計(jì)效率、節(jié)約審計(jì)成本,更加契合當(dāng)前信息技術(shù)的發(fā)展以及新頒布的《審計(jì)法》對(duì)科技強(qiáng)審和審計(jì)功能全覆蓋的需求。經(jīng)過(guò)多年的發(fā)展與變革,我國(guó)審計(jì)對(duì)信息技術(shù)的應(yīng)用逐步走向完善。計(jì)算審計(jì)學(xué)的提出,符合當(dāng)前社會(huì)對(duì)計(jì)算機(jī)和審計(jì)領(lǐng)域復(fù)合型人才的需求,信息技術(shù)在大氣污染防治審計(jì)中的運(yùn)用,也進(jìn)一步推動(dòng)了計(jì)算審計(jì)學(xué)的實(shí)踐應(yīng)用。

        信息技術(shù)在審計(jì)領(lǐng)域的應(yīng)用具有重要意義。審計(jì)從業(yè)者要始終牢記科技強(qiáng)審的理念,在審計(jì)領(lǐng)域積極引入信息技術(shù)的應(yīng)用,借助科技手段提高審計(jì)效率;信息技術(shù)能夠簡(jiǎn)化審計(jì)實(shí)務(wù)中繁瑣復(fù)雜的工作流程,有助于審計(jì)單位節(jié)約成本、優(yōu)化審計(jì)實(shí)踐;通過(guò)對(duì)審計(jì)與信息技術(shù)領(lǐng)域的多學(xué)科融合,研究人員能夠加強(qiáng)“計(jì)算審計(jì)學(xué)”理論研究,構(gòu)建“計(jì)審雙強(qiáng)”團(tuán)隊(duì),推動(dòng)“計(jì)算審計(jì)學(xué)”學(xué)科體系的建設(shè)與發(fā)展;監(jiān)管機(jī)構(gòu)和決策單位應(yīng)順應(yīng)信息技術(shù)的發(fā)展,推動(dòng)審計(jì)信息化相關(guān)標(biāo)準(zhǔn)和應(yīng)用指南的修訂,不斷完善審計(jì)準(zhǔn)則和相關(guān)法律體系,加強(qiáng)審計(jì)人員在數(shù)字化和智能化審計(jì)領(lǐng)域的技能考評(píng)工作,推動(dòng)審計(jì)改革浪潮的順利到來(lái)。

        猜你喜歡
        大氣模型
        一半模型
        大氣的呵護(hù)
        軍事文摘(2023年10期)2023-06-09 09:15:06
        太赫茲大氣臨邊探測(cè)儀遙感中高層大氣風(fēng)仿真
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        大氣古樸揮灑自如
        大氣、水之后,土十條來(lái)了
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        世界知識(shí)畫報(bào)·藝術(shù)視界(2010年9期)2010-12-31 00:00:00
        欧美h久免费女| 五十路丰满中年熟女中出| 亚洲中文字幕无码mv | 亚洲午夜久久久久中文字幕| 国产啪啪视频在线观看| av影片在线免费观看| 少妇仑乱a毛片| 欧美一级三级在线观看| 亚洲美女av一区二区| 午夜大片在线播放观看| 色天使综合婷婷国产日韩av | 一区二区三区不卡在线| 少妇又紧又色又爽又刺| 久久亚洲道色综合久久| 日本牲交大片免费观看| 国产精品自产拍在线18禁| 亚洲一区有码在线观看| 白白色白白色视频发布| 男男性恋免费视频网站| 久久精品性无码一区二区爱爱| 中文字幕文字幕一区二区 | 亚洲中文乱码在线视频| 国产精品久久久久一区二区三区 | 伊人久久大香线蕉免费视频| 青青草视频国产在线观看| 一本色道久久亚洲加勒比| 亚洲国色天香卡2卡3卡4| 国产精品亚洲А∨天堂免下载| 国产精品一级黄色大片| 成人自慰女黄网站免费大全| 丰满岳妇乱一区二区三区| 欧美色图50p| 射进去av一区二区三区| 麻豆蜜桃av蜜臀av色欲av| 成全视频高清免费| 精品熟妇av一区二区三区四区| 日韩少妇人妻中文视频| 国产午夜精品理论片| 九九久久国产精品大片| 日本高清一区二区不卡| 中文字幕日本人妻久久久免费|