袁立華
[摘要]隨著審計的數(shù)據(jù)量越來越大,傳統(tǒng)的審計手段很難滿足大數(shù)據(jù)的審計要求,引入Python可以更好地解決大數(shù)據(jù)審計中的問題。
[關(guān)鍵詞]大數(shù)據(jù) ? ?審計 ? ?公務(wù)用車 ? ?Python
公務(wù)用車使用、管理涉及落實中央八項規(guī)定精神、領(lǐng)導(dǎo)干部執(zhí)行廉政紀(jì)律情況,是巡視巡查、內(nèi)外部審計關(guān)注的重點。而公車私用、私車公養(yǎng)又是車輛審計的重中之重。公車加油審計需將審計期間全部車輛的加油、ETC通行記錄與派車單、公車使用管理臺賬等進行比對分析,表單多、數(shù)據(jù)量大,傳統(tǒng)的手工抽樣方式難以實現(xiàn)審計全覆蓋,存在審計風(fēng)險。運用Python的數(shù)據(jù)處理、分析、可視化展示等優(yōu)勢,對公車加油情況進行檢查,有助于查實“公油私用”等問題。
一、數(shù)據(jù)分析思路及方法
總結(jié)“公油私用”問題發(fā)生的規(guī)律及特點,內(nèi)部審計列出四個關(guān)注點:加油時間是否異常,包含是否存在節(jié)假日加油、周末加油、非工作時間加油;是否存在一段時間連續(xù)加油;車輛百公里油耗是否正常;是否存在未經(jīng)審批的異地加油。
(一)法定節(jié)假日加油
將法定節(jié)假日庫導(dǎo)入Python,通過關(guān)鍵詞“交易時間”,將加油對賬單中全部加油時間快速提取并與法定節(jié)假日庫進行比對,篩選出節(jié)假日加油記錄并進行可視化展示,見圖1。
展示結(jié)果表明,2019年國慶節(jié)、2020年春節(jié)與勞動節(jié)均有加油記錄。審計人員與派車單、公務(wù)用車使用管理臺賬進行核對,發(fā)現(xiàn)上述節(jié)假日并無派車記錄。
(二)周末加油
通過關(guān)鍵詞“交易時間”,將加油對賬單中全部加油時間快速提取,利用Python“week_day”函數(shù)將交易時間轉(zhuǎn)化為周一到周日格式,并統(tǒng)計周一至周日加油次數(shù),將統(tǒng)計結(jié)果進行可視化展示,見圖2。
展示結(jié)果表明,周六、周日均有加油記錄,其中車牌號5751加油次數(shù)最多。審計人員將周日加油日期與派車單逐一核對發(fā)現(xiàn),2019年9月22日、2019年10月6日、2019年12月1日、2020年2月2日均無派車記錄。
(三)非工作時間加油
通過關(guān)鍵詞“交易時間”提取一天不同時間段加油記錄,并統(tǒng)計非工作時間加油次數(shù),將統(tǒng)計結(jié)果進行可視化展示,見圖3。
展示結(jié)果表明,4:00—6:00、18:00—20:00、20:00—22:00均有加油記錄,與派車單、ETC通行記錄逐一核對,發(fā)現(xiàn)2019年9月26日、2019年10月15日、2019年10月22日等10個日期的加油記錄均與行車記錄不符。
(四)連續(xù)加油(連續(xù)多日、一天多次)
利用Python提取連續(xù)N日(N≥2)、一天N次(N≥2)的加油記錄,與派車單、公務(wù)用車使用管理臺賬、ETC記錄比對,將統(tǒng)計結(jié)果進行可視化展示,見圖4。
展示結(jié)果表明,2019年9月至2020年5月,存在多次連續(xù)多日、一天多次加油記錄,其中2019年9月29日、2019年10月15日、2019年10月22日等20個日期的加油記錄與派車單、公務(wù)用車使用管理臺賬、ETC等記錄不符。
(五)百公里油耗
利用Python按月提取加油量和一車一檔行駛里程數(shù)據(jù),計算百公里油耗,將百公里油耗趨勢進行可視化展示,見圖5。
展示結(jié)果表明,2019年3月至2019年9月,月平均油耗為10.49,2019年10月至2020年5月,月平均油耗大幅增加為17.14,增長率達63.4%,與實際派車情況不符。
(六)異地加油
通過剔除關(guān)鍵字“連云港”提取異地加油記錄,并統(tǒng)計異地加油量,將統(tǒng)計結(jié)果進行可視化展示,見圖6。
展示結(jié)果表明,2019年1月至2020年5月,共有異地加油5次,與派車單、ETC通行記錄核對,發(fā)現(xiàn)“上海31000103”無派車單和高速通行記錄。
二、主要成效
一是數(shù)據(jù)整理快速完整。在公車加油審計中,審計人員需要處理18張IC卡加油對賬單,每張表單均包含卡號、持卡人、交易時間、交易類型、金額、數(shù)量、單價、余額、地點等要素,數(shù)據(jù)量大且分散。運用Python處理Excel,通過調(diào)用模塊,處理這些數(shù)據(jù)并生成報表。相比Excel,Python能夠處理更大的數(shù)據(jù)集,更容易實現(xiàn)自動化分析,大大提高了數(shù)據(jù)搜集、整理、處理的效率和質(zhì)量。
二是數(shù)據(jù)分析方便快捷。運用Python擁有的numpy、matplotlib、glob、os、pandas、datetime等工具對卡號、交易類型、交易時間、金額、數(shù)量、地點等關(guān)鍵詞分別進行提取、建模、評估,篩選異常數(shù)據(jù)方便快捷。
三是結(jié)果展示直觀明晰。利用Python可視化圖形探索分析數(shù)據(jù)、直觀展現(xiàn)分析結(jié)果,使審計線索更加清晰明了,促使審計人員能夠通過圖形精準(zhǔn)查看審計發(fā)現(xiàn),審計的便利性和精準(zhǔn)性極大提高。
四是具有可繼承性與可重復(fù)性。利用Python代碼分別得到車輛每月百公里油耗、非工作時間加油記錄、連續(xù)天數(shù)加油記錄、一天不同時間段加油記錄、月度加油金額及數(shù)量等數(shù)據(jù)。公務(wù)用車加油的原始數(shù)據(jù)為“中國石化加油IC卡臺賬對賬單”,其數(shù)據(jù)格式是不變的。在審計分析完成后,可以將代碼進行保存,在下次公務(wù)用車加油審計中稍加修改即可直接使用,具有極高的可繼承性和可重復(fù)性。
(作者單位:中國人民銀行連云港市中心支行,郵政編碼:222000,電子郵箱:271769150@qq.com)