亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Python的隨機(jī)森林算法在電網(wǎng)企業(yè)人力資源審計(jì)中的應(yīng)用研究

        2021-09-08 05:52:40賀雅蔡真捷
        中國內(nèi)部審計(jì) 2021年8期

        賀雅 蔡真捷

        [摘要]大數(shù)據(jù)的運(yùn)用不僅改變了電網(wǎng)企業(yè)的發(fā)展和管理模式,也給內(nèi)部審計(jì)帶來了前所未有的機(jī)遇與挑戰(zhàn)。本文介紹了在審計(jì)大數(shù)據(jù)的背景下,基于Python的隨機(jī)森林算法在電網(wǎng)企業(yè)人力資源審計(jì)中的應(yīng)用方法,進(jìn)一步提高內(nèi)部審計(jì)管理的科學(xué)化水平,以提升內(nèi)部審計(jì)的工作質(zhì)量和效率。

        [關(guān)鍵詞]人力資源審計(jì)? ?隨機(jī)森林算法? ?Python

        一、引言

        電網(wǎng)企業(yè)作為關(guān)系國民經(jīng)濟(jì)命脈和國家能源安全的骨干企業(yè),有力地支撐著國家能源體系。在社會(huì)經(jīng)濟(jì)和科學(xué)技術(shù)不斷發(fā)展,政策環(huán)境不斷變化,電力體制改革不斷深化的大背景下,以國家電網(wǎng)公司為代表的電網(wǎng)企業(yè)提出了要建設(shè)運(yùn)營好堅(jiān)強(qiáng)智能電網(wǎng)和泛在電力物聯(lián)網(wǎng)的目標(biāo),即要充分運(yùn)用移動(dòng)互聯(lián)網(wǎng)、人工智能等現(xiàn)代信息技術(shù),實(shí)現(xiàn)電力系統(tǒng)各環(huán)節(jié)萬物互聯(lián)、人機(jī)交互的智慧服務(wù)系統(tǒng)。這標(biāo)志著電網(wǎng)企業(yè)的大數(shù)據(jù)時(shí)代已經(jīng)到來,“電網(wǎng)+大數(shù)據(jù)”的發(fā)展模式,成為電網(wǎng)企業(yè)應(yīng)對(duì)建設(shè)泛在電力物聯(lián)網(wǎng)這一新需求的唯一出路。電網(wǎng)企業(yè)在生產(chǎn)、經(jīng)營過程中會(huì)接觸并產(chǎn)生海量數(shù)據(jù),利用合適的工具對(duì)這些數(shù)據(jù)進(jìn)行挖掘和分析,一方面可以幫助電網(wǎng)企業(yè)適應(yīng)電力市場的發(fā)展,另一方面也可幫助電網(wǎng)企業(yè)規(guī)范內(nèi)部管理,進(jìn)一步提升管理質(zhì)量和效果。而如何將上述海量、散落且無序的數(shù)據(jù)剝離、整理、歸類、分析,以便找到數(shù)據(jù)間的規(guī)律和聯(lián)系,進(jìn)而發(fā)現(xiàn)審計(jì)線索,發(fā)揮大數(shù)據(jù)全面覆蓋的優(yōu)勢,是內(nèi)部審計(jì)人員目前亟待解決的課題,現(xiàn)以電網(wǎng)企業(yè)人力資源審計(jì)為例來作一研究。

        二、審計(jì)數(shù)據(jù)采集

        基于大數(shù)據(jù)的審計(jì)方式不同于傳統(tǒng)方式,主要的數(shù)據(jù)獲取方式是通過各類信息平臺(tái)或系統(tǒng)主動(dòng)、實(shí)時(shí)地獲取被審計(jì)單位的業(yè)務(wù)數(shù)據(jù)。這種方式相對(duì)于被動(dòng)地依靠被審計(jì)單位提供審計(jì)數(shù)據(jù),再利用其他證據(jù)進(jìn)行核實(shí)的傳統(tǒng)方式而言,數(shù)據(jù)的真實(shí)性、完整性、實(shí)時(shí)性和審計(jì)工作效率等均得到明顯提升。

        (一)數(shù)據(jù)來源

        在對(duì)電網(wǎng)企業(yè)實(shí)施人力資源審計(jì)時(shí),需要獲取的數(shù)據(jù)按照來源可分為內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)。內(nèi)部數(shù)據(jù)是指從電網(wǎng)企業(yè)自建的系統(tǒng)中獲取的數(shù)據(jù)及被審計(jì)單位提供的數(shù)據(jù)。外部數(shù)據(jù)是指從外部機(jī)構(gòu)如銀行、政府、客戶等渠道獲取的數(shù)據(jù)。按照數(shù)據(jù)類別可分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)主要指能夠用數(shù)據(jù)或同一結(jié)構(gòu)表示的數(shù)據(jù),如數(shù)字、符號(hào)等,而各類文檔、圖片、影像,如被審計(jì)單位的人事任免文件、活動(dòng)通知、各部門自行編制的登記資料等則稱為非結(jié)構(gòu)化數(shù)據(jù)。在實(shí)施電網(wǎng)企業(yè)人力資源審計(jì)時(shí),獲取的有效數(shù)據(jù)中內(nèi)部數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)占比較高,審計(jì)人員需要利用合適的數(shù)據(jù)處理工具如Excel、Oracle數(shù)據(jù)庫等將數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)化后再進(jìn)一步利用。

        (二)數(shù)據(jù)獲取方式

        實(shí)施電網(wǎng)企業(yè)人力資源專項(xiàng)審計(jì)時(shí),審計(jì)人員需要獲取的數(shù)據(jù)主要有人資、財(cái)務(wù)、工會(huì)、后勤等專業(yè)的業(yè)務(wù)數(shù)據(jù)和管理數(shù)據(jù)。主要獲取方式有:直接復(fù)制數(shù)據(jù);通過中間文件采集數(shù)據(jù);通過開放式數(shù)據(jù)互聯(lián)方式采集數(shù)據(jù);通過專用模板采集數(shù)據(jù);通過互聯(lián)網(wǎng)采集數(shù)據(jù)。實(shí)際工作中,使用較多的是直接復(fù)制數(shù)據(jù)和通過開放式數(shù)據(jù)互聯(lián)方式采集數(shù)據(jù)這兩種方法。

        審計(jì)數(shù)據(jù)來源日益豐富化、數(shù)據(jù)類型愈發(fā)多元化、獲取方式逐漸多樣化促使審計(jì)人員不斷提升信息化審計(jì)能力,在追求數(shù)據(jù)的完整性、使用數(shù)據(jù)的高效性上下功夫,同時(shí)也在推動(dòng)審計(jì)與信息通信等其他學(xué)科的融合。

        三、隨機(jī)森林算法的應(yīng)用

        決策樹(Decision Trees)算法是一種根據(jù)歸納原理從數(shù)據(jù)集中抽取規(guī)則并構(gòu)建樹狀預(yù)測模型的機(jī)器學(xué)習(xí)方法。隨機(jī)森林(Random Forest)算法最早由美國統(tǒng)計(jì)學(xué)家Leo Breiman和Adele Culter在2001年提出,通過自助重復(fù)采樣,從原始訓(xùn)練樣本集中重復(fù)隨機(jī)抽取k個(gè)樣本生成新的訓(xùn)練樣本集合,然后根據(jù)自主樣本集生成k個(gè)決策樹組成隨機(jī)森林,是一種以決策樹為基學(xué)習(xí)器的集成學(xué)習(xí)方法,包含了多個(gè)決策樹的分類器,輸出結(jié)果是由每一個(gè)決策樹投票或者平均得到,即將投票次數(shù)最多的類別或輸出結(jié)果平均值指定為最終的輸出結(jié)果。

        該算法解決了單個(gè)決策樹泛化能力弱的缺點(diǎn),較其他算法而言具有預(yù)測結(jié)果更準(zhǔn)確、運(yùn)行簡單高效、可處理大量多類型數(shù)據(jù)、訓(xùn)練速度快、可平衡誤差等優(yōu)點(diǎn)。將隨機(jī)森林算法應(yīng)用到電網(wǎng)企業(yè)內(nèi)部審計(jì)工作中,可用于對(duì)已知的審計(jì)數(shù)據(jù)進(jìn)行整合分析,也可用于審計(jì)預(yù)測。這不僅可以發(fā)揮審計(jì)大數(shù)據(jù)全覆蓋的優(yōu)勢,還可以提高審計(jì)效率、降低審計(jì)風(fēng)險(xiǎn)。將隨機(jī)森林算法應(yīng)用于電網(wǎng)企業(yè)人力資源審計(jì)中,主要有以下幾個(gè)步驟:

        步驟一:明確審計(jì)內(nèi)容

        電網(wǎng)企業(yè)人力資源審計(jì)主要包括人力資源基礎(chǔ)管理、管理決策、干部管理、用工管理、人工成本管理、教育培訓(xùn)管理、績效管理、歷史遺留問題整改情況8個(gè)方面的內(nèi)容。在運(yùn)用隨機(jī)森林算法進(jìn)行數(shù)據(jù)挖掘之前,應(yīng)根據(jù)審計(jì)需要,首先需明確此次審計(jì)疑點(diǎn)預(yù)測的主題內(nèi)容,即具體需要核查的問題,如:虛列教育培訓(xùn)經(jīng)費(fèi)、主業(yè)和集體企業(yè)相互承擔(dān)工資、存在在職不在崗人員等。

        步驟二:采集審計(jì)數(shù)據(jù)

        采集與被審計(jì)單位人力資源管理活動(dòng)相關(guān)的各類數(shù)據(jù)。包括從企業(yè)自建的系統(tǒng)中獲取數(shù)據(jù),如從ERP系統(tǒng)中導(dǎo)出員工花名冊(cè)、工資核算明細(xì)、年度績效考核結(jié)果、員工異動(dòng)情況等,主要采取直接復(fù)制數(shù)據(jù)的方法進(jìn)行采集。有時(shí)也需要從外部機(jī)構(gòu)獲取數(shù)據(jù),如社會(huì)保險(xiǎn)明細(xì)等,這部分?jǐn)?shù)據(jù)則需要通過開放式數(shù)據(jù)互聯(lián)方式或通過互聯(lián)網(wǎng)進(jìn)行采集。

        步驟三:進(jìn)行數(shù)據(jù)分析

        首先,根據(jù)審計(jì)內(nèi)容和數(shù)據(jù)特點(diǎn),設(shè)定若干變量,這些變量應(yīng)與審計(jì)疑點(diǎn)預(yù)測的主題內(nèi)容相關(guān)。如需預(yù)測員工離職率時(shí),設(shè)定的變量可為:(1)入職時(shí)間;(2)年均薪酬水平;(3)近5年績效考評(píng)結(jié)果;(4)最高學(xué)歷水平;(5)近5年是否升職等。設(shè)定的變量可能是定性的數(shù)據(jù),也可能是定量的數(shù)據(jù),但最關(guān)鍵的是設(shè)定變量應(yīng)與需預(yù)測的結(jié)果緊密相關(guān),變量的關(guān)聯(lián)度越高,預(yù)測結(jié)果越準(zhǔn)確。其次,對(duì)數(shù)據(jù)進(jìn)行整體分析,找出變量和預(yù)測結(jié)果的關(guān)系,一般關(guān)系為正相關(guān)或負(fù)相關(guān)。如薪酬水平越低的員工離職率越高,最高學(xué)歷水平越高的員工離職率越高,近5年未能升職的員工比已升職的員工離職率高等,即明確變量與審計(jì)內(nèi)容間的具體關(guān)系。

        步驟四:建立審計(jì)模型

        根據(jù)審計(jì)內(nèi)容的業(yè)務(wù)邏輯和變量間的勾稽關(guān)系建立數(shù)字化審計(jì)模型。業(yè)務(wù)邏輯和數(shù)據(jù)勾稽關(guān)系往往是具體的業(yè)務(wù)之間固定關(guān)系的直接反應(yīng),如匯總關(guān)系、比例關(guān)系、特定的計(jì)算方法等。利用Python、SQL Server、Excel高級(jí)函數(shù)等數(shù)據(jù)處理工具對(duì)將要分析的問題做出概括、抽象表達(dá),進(jìn)而建立數(shù)據(jù)分析模型,以便對(duì)特定問題進(jìn)行核查。

        步驟五:訓(xùn)練模型與數(shù)據(jù)預(yù)測

        利用已知數(shù)據(jù)對(duì)步驟四中建立的模型進(jìn)行訓(xùn)練,訓(xùn)練后的審計(jì)模型可運(yùn)用在實(shí)際審計(jì)工作中,用于數(shù)據(jù)預(yù)測,如預(yù)測被審計(jì)單位出現(xiàn)某特定問題的概率等。由于隨機(jī)森林算法是一種靈活的機(jī)器學(xué)習(xí)算法,利用以往的數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練,通過不斷更新數(shù)據(jù)庫并對(duì)模型進(jìn)行訓(xùn)練,預(yù)測結(jié)果將越來越準(zhǔn)確。

        四、基于Python隨機(jī)森林算法的應(yīng)用案例

        Python是一種計(jì)算機(jī)程序設(shè)計(jì)語言,由于其易學(xué)、便于維護(hù),并且擁有豐富的擴(kuò)展庫可用于完成各種高級(jí)任務(wù),近年來成為眾多用戶廣泛使用的語言之一,也是機(jī)器學(xué)習(xí)的首選語言。為驗(yàn)證隨機(jī)森林算法在電網(wǎng)企業(yè)人力資源審計(jì)中的有效性,本文使用Python進(jìn)行編程,并選擇某電網(wǎng)企業(yè)下屬某省公司2016年1月至2018年12月的人力資源管理相關(guān)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。該數(shù)據(jù)集中包括員工花名冊(cè)、工資核算明細(xì)、崗位異動(dòng)情況等,數(shù)據(jù)量超過30萬條。

        應(yīng)用案例一:虛列職工教育培訓(xùn)費(fèi)概率審計(jì)模型

        本案例擬運(yùn)用基于Python的隨機(jī)森林算法對(duì)被審計(jì)單位出現(xiàn)虛列職工教育培訓(xùn)費(fèi)的問題的概率進(jìn)行審計(jì)。首先,對(duì)原始審計(jì)數(shù)據(jù)進(jìn)行初步分析,統(tǒng)計(jì)人均年薪水平、人員調(diào)動(dòng)次數(shù)情況、員工升職情況、各單位績效排名、各類費(fèi)用支出情況等。其次,按照數(shù)據(jù)與審計(jì)內(nèi)容之間的關(guān)系,設(shè)定若干個(gè)相關(guān)的變量。根據(jù)以往的審計(jì)經(jīng)驗(yàn),以下8個(gè)變量與虛列職工教育培訓(xùn)費(fèi)問題有較高的相關(guān)性:(1)年底集中列支職工教育培訓(xùn)費(fèi),10月至12月列支金額占全年的40%以上;(2)職工教育培訓(xùn)費(fèi)集中支付某一個(gè)人,未分別支付至相關(guān)人員賬戶;(3)人均薪酬水平較低,低于該電網(wǎng)企業(yè)人均薪資水平;(4)頻繁更換人資部負(fù)責(zé)人、培訓(xùn)專責(zé),頻率高于平均更換頻率;(5)存在超標(biāo)準(zhǔn)列支培訓(xùn)費(fèi)的情況;(6)存在超范圍列支培訓(xùn)費(fèi)的情況;(7)被審計(jì)單位年度考核排名情況,近3個(gè)年度考核排名在全省后30%;(8)以前年度審計(jì)中發(fā)現(xiàn)過被審計(jì)單位或其下屬機(jī)構(gòu)存在虛列職工教育培訓(xùn)費(fèi)的問題。之后,利用Excel軟件將原始數(shù)據(jù)進(jìn)行清理、轉(zhuǎn)換,按下表的取值范圍轉(zhuǎn)換成相應(yīng)的數(shù)字,如“0”“1”“2”等,如表1所示。

        如圖1所示,模型一(對(duì)應(yīng)案例一)的運(yùn)行結(jié)果用“risk level”表示,其中,“0”代表被審計(jì)單位虛列職工教育培訓(xùn)費(fèi)的概率較低,“1”則代表出現(xiàn)該問題的概率較高。將圖1中的運(yùn)行結(jié)果與以往的審計(jì)數(shù)據(jù)進(jìn)行比對(duì),發(fā)現(xiàn)運(yùn)行結(jié)果(圖2中“risk-output”)與以往的審計(jì)結(jié)果(圖3中“risk level”)完全一致。說明模型一經(jīng)訓(xùn)練后,可以對(duì)被審計(jì)單位出現(xiàn)虛列職工教育培訓(xùn)費(fèi)的概率進(jìn)行較準(zhǔn)確的預(yù)測。

        應(yīng)用案例二:在職不在崗人員審計(jì)模型

        本案例擬運(yùn)用基于Python的隨機(jī)森林算法對(duì)被審計(jì)單位是否存在在職不在崗人員的問題進(jìn)行審計(jì)。

        首先,運(yùn)用數(shù)據(jù)分析工具對(duì)被審計(jì)單位在職員工2016年1月至2018年12月間的年度績效工資金額、升職情況、報(bào)銷費(fèi)用情況、年度績效考核結(jié)果、調(diào)動(dòng)情況、參加會(huì)議培訓(xùn)情況等進(jìn)行初步統(tǒng)計(jì)。其次,按照數(shù)據(jù)與審計(jì)內(nèi)容的關(guān)系,設(shè)定若干個(gè)相關(guān)的變量。根據(jù)以往的審計(jì)經(jīng)驗(yàn),以下7個(gè)變量與員工在職不在崗問題有較高的相關(guān)性:(1)審計(jì)期間年度績效工資總額偏低,低于3萬元/人/年;(2)未得到職務(wù)或職級(jí)提升、晉升,或薪檔提升;(3)無差旅費(fèi)、培訓(xùn)費(fèi)等費(fèi)用報(bào)銷記錄;(4)無崗位調(diào)動(dòng)記錄;(5)無參加各類會(huì)議、培訓(xùn)記錄;(6)無參加健康類、榮譽(yù)類等各類療休養(yǎng)記錄;(7)門戶登陸次數(shù)偏少,低于30次/人/年。利用Excel軟件將原始數(shù)據(jù)進(jìn)行清理、轉(zhuǎn)換之后,將原始數(shù)據(jù)按下表的取值范圍轉(zhuǎn)換成相應(yīng)的數(shù)字,如“0”“1”等,如表2所示。

        在Python中輸入以下編程語句,利用上一步中轉(zhuǎn)換后的數(shù)據(jù),對(duì)此次建立的員工在職不在崗人員審計(jì)模型進(jìn)行訓(xùn)練:

        如圖4所示,模型二的運(yùn)行結(jié)果用“risk level”表示,其中,運(yùn)行結(jié)果為“0”代表該員工在職不在崗的可能性較低,為“1”則代表該員工在職不在崗的可能性較高。模型二的運(yùn)行結(jié)果說明,本次200個(gè)樣本數(shù)據(jù)中,有9名員工是在職不在崗員工的可能性較高,審計(jì)人員可進(jìn)一步重點(diǎn)核實(shí)這9名員工的實(shí)際工作情況。

        將上圖中的運(yùn)行結(jié)果與已進(jìn)行核實(shí)的在職不在崗人員情況進(jìn)行比對(duì),發(fā)現(xiàn)運(yùn)行結(jié)果(圖5中“risk-output”)與以往的審計(jì)結(jié)果(圖6中“risk level”)完全一致,即模型二中篩選出的可疑人員經(jīng)核實(shí)確認(rèn)為在職不在崗人員。

        實(shí)驗(yàn)結(jié)論:以上兩個(gè)實(shí)驗(yàn)結(jié)果充分說明模型一和模型二分別對(duì)于被審計(jì)單位出現(xiàn)虛列職工教育培訓(xùn)費(fèi)的概率和員工是否在職不在崗的問題在運(yùn)行速度及運(yùn)行準(zhǔn)確度上均表現(xiàn)出了良好的預(yù)測性能,兩個(gè)實(shí)驗(yàn)都驗(yàn)證了隨機(jī)森林算法在電網(wǎng)人力資源審計(jì)中的有效性。

        隨機(jī)森林算法不僅訓(xùn)練速度快,訓(xùn)練結(jié)束后還可生成相應(yīng)的數(shù)據(jù)庫,通過不斷更新數(shù)據(jù)庫并對(duì)模型進(jìn)行訓(xùn)練,可以持續(xù)提高預(yù)測準(zhǔn)確度。在開展審計(jì)工作前,審計(jì)人員可將相關(guān)審計(jì)數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫中,利用相關(guān)模型預(yù)測是否存在特定風(fēng)險(xiǎn)或問題,為提前明確審計(jì)重點(diǎn)、準(zhǔn)確把握審計(jì)方向提供了有力的數(shù)據(jù)支撐。

        五、結(jié)束語

        隨著大數(shù)據(jù)的廣泛運(yùn)用,如何合理運(yùn)用信息化手段高效地分析、處理、挖掘大數(shù)據(jù)成為實(shí)現(xiàn)科技強(qiáng)審、實(shí)現(xiàn)審計(jì)信息化過程中必須解決的課題。本文提出了基于Python的隨機(jī)森林算法在電網(wǎng)企業(yè)人力資源審計(jì)中的運(yùn)用方式相關(guān)研究,該方法不僅能幫助審計(jì)人員高效、精準(zhǔn)地挖掘出隱藏在數(shù)據(jù)下的信息,進(jìn)而構(gòu)建更健全、高效的日常監(jiān)督體系,同時(shí)也為大數(shù)據(jù)在審計(jì)中的應(yīng)用技術(shù)研究提供了支持,促進(jìn)了審計(jì)大數(shù)據(jù)的學(xué)術(shù)積累和實(shí)踐發(fā)展。

        (作者單位:國網(wǎng)湖南省電力有限公司,郵政編碼:410001 ,電子郵箱:776721444@qq.com )

        国产欧美成人一区二区a片 | 一区二区三区国产97| 国产又色又爽又刺激视频| 免费国产一级特黄aa大片在线 | 日美韩精品一区二区三区| 国产不卡在线视频观看| 亚洲人精品亚洲人成在线| 在线视频一区色| 亚洲av乱码国产精品色| 风韵人妻丰满熟妇老熟| 国产精品成人va在线观看| 乱子真实露脸刺激对白| 日本一区二区国产高清在线播放| 人妖在线一区二区三区| 亚洲av日韩av天堂久久| 午夜成人精品福利网站在线观看| 无码之国产精品网址蜜芽| av网站韩日在线观看免费| 国产精品久久久久久久久久红粉 | 国产日产综合| 视频一区欧美| 91精品啪在线观看国产色| 在线观看视频免费播放| 三年的高清电影免费看| 无码人妻丰满熟妇区五十路百度| 伊人亚洲综合网色AV另类| 青青草免费观看视频免费| 加勒比一本heyzo高清视频| 999久久久免费精品国产| 国产精品毛片99久久久久| 亚洲视频专区一区二区三区| 欧美乱人伦人妻中文字幕| 亞洲綜合一區二區三區無碼| 伊人狼人影院在线视频| 邻居人妻的肉欲满足中文字幕| 久久综合九色综合97欧美| 亚洲成人欧美| 精品免费看国产一区二区白浆| 精品高清免费国产在线| 看av免费毛片手机播放| 国产免费人成视频在线播放播|