在當(dāng)前大數(shù)據(jù)環(huán)境下,各類信息化、數(shù)字化技術(shù)層出不窮并不斷發(fā)展和深度融合,為審計(jì)工作思路與工作模式的優(yōu)化、調(diào)整、完善提供了有力基礎(chǔ)。隨著近幾年的探索,國內(nèi)通信企業(yè)基于“云計(jì)算”等技術(shù)相繼構(gòu)建了各類審計(jì)作業(yè)系統(tǒng),通過審計(jì)建模實(shí)現(xiàn)了對高風(fēng)險(xiǎn)領(lǐng)域的全覆蓋和準(zhǔn)實(shí)時(shí)。審計(jì)工作“原力”的海量業(yè)務(wù)數(shù)據(jù)作為審計(jì)證據(jù)后,將對審計(jì)成果產(chǎn)生幾何倍數(shù)的影響。如何將海量的業(yè)務(wù)數(shù)據(jù)變?yōu)闇?zhǔn)確的審計(jì)數(shù)據(jù),已成為大數(shù)據(jù)環(huán)境下開展審計(jì)的重要“痛點(diǎn)”??梢哉f,現(xiàn)階段審計(jì)工作的難點(diǎn)是讓海量業(yè)務(wù)數(shù)據(jù)脫離其原始特征轉(zhuǎn)變?yōu)榫珶挼摹⒕邆涓邇r(jià)值審計(jì)含義的數(shù)據(jù),從而最終生成高質(zhì)量審計(jì)成果。
業(yè)務(wù)數(shù)據(jù)的日益龐雜、審計(jì)信息化系統(tǒng)的逐步建立、數(shù)據(jù)審計(jì)體系的逐步完善,為進(jìn)一步實(shí)現(xiàn)內(nèi)部審計(jì)工作價(jià)值帶來了機(jī)遇和挑戰(zhàn)。
通信企業(yè)信息化水平程度整體較高,各類網(wǎng)絡(luò)運(yùn)維、運(yùn)營生產(chǎn)、企業(yè)管理均有系統(tǒng)平臺支撐,進(jìn)而造成數(shù)據(jù)的維度極其豐富,各數(shù)據(jù)域的數(shù)據(jù)間相互影響,但關(guān)聯(lián)度低。任意用戶或產(chǎn)品背后就有多達(dá)數(shù)百項(xiàng)的屬性數(shù)據(jù)。如何將各數(shù)據(jù)域間的數(shù)據(jù)加以整合,從豐富多維的數(shù)據(jù)挖掘有價(jià)值的審計(jì)線索,存在一定困難。
企業(yè)為應(yīng)對市場的需求、行業(yè)的監(jiān)管、業(yè)績的考核等都需要不斷優(yōu)化業(yè)務(wù),通信領(lǐng)域的技術(shù)日新月異,勢必帶來數(shù)據(jù)的變化。這些變化,不僅只是數(shù)據(jù)項(xiàng)的新增和刪除,還存在大量數(shù)據(jù)屬性、類型等的變化。行業(yè)“戰(zhàn)場”環(huán)境復(fù)雜多變,這些重要的作戰(zhàn)數(shù)據(jù)如何時(shí)刻“保鮮”,有效服務(wù)于審計(jì),正逐漸提上數(shù)據(jù)審計(jì)支撐工作的日程。
在信息社會,數(shù)據(jù)可以劃分為兩大類:一類能夠用統(tǒng)一的結(jié)構(gòu)加以表示,稱之為結(jié)構(gòu)化數(shù)據(jù),如數(shù)字、符號等;一類無法用數(shù)字或統(tǒng)一的結(jié)構(gòu)表示,如文本、圖像等,稱為非結(jié)構(gòu)化數(shù)據(jù)。過去幾年,業(yè)界更多關(guān)注的是如何處理海量和異構(gòu)的數(shù)據(jù),從中挖掘?qū)徲?jì)價(jià)值,這其中絕大多數(shù)是結(jié)構(gòu)化數(shù)據(jù),但這些只是企業(yè)運(yùn)營數(shù)據(jù)中的冰山一角。實(shí)際上,企業(yè)運(yùn)營的數(shù)據(jù)資料中80%都是以文件形式存在的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),包括紙質(zhì)文件(合同等)、圖片(現(xiàn)場記錄等)、手工憑證(發(fā)票、臺賬等)等。如果能夠充分利用這些數(shù)據(jù),將能大大降低現(xiàn)場審計(jì)壓力,全面實(shí)現(xiàn)由數(shù)據(jù)驅(qū)動的遠(yuǎn)程審計(jì),提升審計(jì)效率和質(zhì)量。
為應(yīng)對上述機(jī)遇與挑戰(zhàn),筆者初步提出構(gòu)建基于業(yè)務(wù)數(shù)據(jù)審計(jì)標(biāo)簽化的數(shù)據(jù)審計(jì)體系。該體系的核心是對業(yè)務(wù)數(shù)據(jù)的潛在審計(jì)價(jià)值進(jìn)行深度挖掘和開發(fā),通過類自然語言構(gòu)造基礎(chǔ)審計(jì)標(biāo)簽庫,對目標(biāo)業(yè)務(wù)數(shù)據(jù)輸出審計(jì)標(biāo)簽,并據(jù)此打造審計(jì)數(shù)據(jù)集市,輔以相關(guān)數(shù)據(jù)審計(jì)作業(yè)流程。實(shí)現(xiàn)讓業(yè)務(wù)數(shù)據(jù)直接展現(xiàn)審計(jì)含義,使審計(jì)人員擺脫對海量元數(shù)據(jù)的基礎(chǔ)分析,直接應(yīng)用審計(jì)標(biāo)簽開展工作。進(jìn)而為企業(yè)提供更具有戰(zhàn)略性、系統(tǒng)性、參謀性和前瞻性的審計(jì)建議,促進(jìn)企業(yè)健康發(fā)展,提升企業(yè)運(yùn)營管理效率,實(shí)現(xiàn)內(nèi)部審計(jì)的高價(jià)值轉(zhuǎn)型。具體模型如圖1。
圖1:基于業(yè)務(wù)數(shù)據(jù)審計(jì)標(biāo)簽化的數(shù)據(jù)審計(jì)體系模型
1.標(biāo)簽的定義
審計(jì)數(shù)據(jù)標(biāo)簽化是對某數(shù)據(jù)集合的一種或多種穩(wěn)定的審計(jì)特征進(jìn)行分析和描述,由多個(gè)可定性的屬性條件或特征標(biāo)識組合而成,從而使該數(shù)據(jù)集合脫離元數(shù)據(jù)屬性,形成高度精煉的、具備審計(jì)含義的數(shù)據(jù)子集。
2.標(biāo)簽的建立
筆者采用類自然語言構(gòu)造基礎(chǔ)審計(jì)標(biāo)簽庫,通過多種方式建模,對目標(biāo)審計(jì)數(shù)據(jù)輸出標(biāo)簽,實(shí)現(xiàn)對各系統(tǒng)業(yè)務(wù)數(shù)據(jù)的標(biāo)簽化,將元數(shù)據(jù)中具備審計(jì)價(jià)值的信息剝離出來。
(1)邏輯層次
審計(jì)數(shù)據(jù)標(biāo)簽化構(gòu)成邏輯模型如圖2所示。
該模型由元數(shù)據(jù)層、處理層、標(biāo)記層及應(yīng)用層組成,在標(biāo)記層與配置域進(jìn)行參數(shù)交互。
圖2:審計(jì)數(shù)據(jù)標(biāo)簽化邏輯模型
元數(shù)據(jù)層向所有標(biāo)記過程提供元數(shù)據(jù),這里主要是CRM、OA、ERP等結(jié)構(gòu)化業(yè)務(wù)運(yùn)營數(shù)據(jù)。
處理層從元數(shù)據(jù)層獲取數(shù)據(jù)后,按照預(yù)先定義的類自然語言審計(jì)標(biāo)簽,通過固有基本屬性分析、基礎(chǔ)信息處理、用戶行為推測分析、數(shù)據(jù)挖掘4個(gè)方法建模,對目標(biāo)審計(jì)數(shù)據(jù)進(jìn)行分析處理,向標(biāo)記層輸出已標(biāo)簽化的審計(jì)數(shù)據(jù)。
標(biāo)記層負(fù)責(zé)對標(biāo)記后的審計(jì)數(shù)據(jù)進(jìn)行分類匯總,形成可被審計(jì)使用的標(biāo)簽化數(shù)據(jù)。
應(yīng)用層主要是提供給審計(jì)人員使用,讓審計(jì)人員結(jié)合審計(jì)項(xiàng)目需要,對標(biāo)簽化數(shù)據(jù)進(jìn)行抽取,采用交叉、組合、時(shí)序、關(guān)聯(lián)等分析,結(jié)合訪談、審閱等,最終形成審計(jì)發(fā)現(xiàn)。
(2)舉例
①固有基本屬性分析
通過對業(yè)務(wù)數(shù)據(jù)中已定義的結(jié)構(gòu)化數(shù)據(jù)信息對其進(jìn)行建模,得出符合審計(jì)邏輯的標(biāo)簽。以主標(biāo)簽“異常證件地址”為例,對用戶的基本屬性信息“證件地址”進(jìn)行分析建模:
子標(biāo)簽為“同址不同號”,口徑為:用戶證件地址完全相同,但證件號不同。
子標(biāo)簽為“證址不符”,口徑為:用戶證件地址省份與證號前2位歸屬省編號不一致。如:XX省份證件號前2位為34,但證件地址省份為其他?。ㄆ渲幸泊嬖谡5霓D(zhuǎn)戶籍情況)。
②基礎(chǔ)信息處理
通過對基礎(chǔ)信息進(jìn)行分析處理,構(gòu)造模型,得出符合審計(jì)邏輯的標(biāo)簽。以主標(biāo)簽“集中呼轉(zhuǎn)”為例,對用戶呼叫轉(zhuǎn)移業(yè)務(wù)操作記錄、通話記錄進(jìn)行關(guān)聯(lián)分析建模。
口徑為:首先分析通過后臺工號(如:10086,網(wǎng)廳等)受理呼叫轉(zhuǎn)移操作,超過N個(gè)用戶呼轉(zhuǎn)至同一號碼;然后分析該批用戶連續(xù)M個(gè)月的通話記錄,對其中周期內(nèi)僅通話A次或通話時(shí)長低于B分鐘的定義為“集中呼轉(zhuǎn)”。
③用戶行為推測分析
通過對用戶行為進(jìn)行推測分析,建立模型,得出符合審計(jì)邏輯的標(biāo)簽。以主標(biāo)簽“侵占用戶權(quán)益”下的子標(biāo)簽“套取滯納金”為例,研究用戶繳費(fèi)行為特征,如存在欠費(fèi)滯納金用戶來網(wǎng)點(diǎn)繳納欠費(fèi)時(shí),全額繳納滯納金和欠費(fèi)后,一般不會返銷操作。設(shè)計(jì)審計(jì)模型口徑:同一網(wǎng)點(diǎn)期間內(nèi)用戶繳納欠費(fèi)滯納金后,當(dāng)日發(fā)生返銷,后減免滯納金,再次按減免后的金額繳納欠費(fèi)。即:交滯納金及欠費(fèi)→返銷→減免滯納金→交欠費(fèi)。
④數(shù)據(jù)挖掘
通過對各類數(shù)據(jù)進(jìn)行全量分析,挖掘其中符合審計(jì)邏輯的模型,得出符合審計(jì)邏輯的標(biāo)簽。以主標(biāo)簽“異常受限解除”下子標(biāo)簽“違規(guī)解除低消”為例。通過對受限解除操作及后續(xù)受限辦理行為數(shù)據(jù)統(tǒng)計(jì)得出該標(biāo)簽結(jié)論。口徑為:保底消費(fèi)用戶解除產(chǎn)品(如:最低消費(fèi))受限后,未能再次疊加同檔或更高檔次的產(chǎn)品受限。
3.標(biāo)簽的撤銷
若某類審計(jì)標(biāo)簽整改后已不再存在,則應(yīng)對該標(biāo)簽進(jìn)行撤銷。撤銷時(shí),對審計(jì)基礎(chǔ)標(biāo)簽庫和審計(jì)標(biāo)簽標(biāo)記均進(jìn)行撤銷標(biāo)記。
4.基礎(chǔ)標(biāo)簽庫的構(gòu)成
審計(jì)基礎(chǔ)標(biāo)簽庫由標(biāo)簽名、標(biāo)簽定義、標(biāo)簽分類、標(biāo)簽口徑、標(biāo)簽狀態(tài)等屬性組成,如圖3。
圖3:基礎(chǔ)標(biāo)簽庫構(gòu)成
1.目標(biāo)
基于對業(yè)務(wù)數(shù)據(jù)的審計(jì)標(biāo)簽化,將標(biāo)簽化后的數(shù)據(jù)構(gòu)造為審計(jì)數(shù)據(jù)集市,為審計(jì)單位提供獨(dú)立、穩(wěn)定、具備審計(jì)含義的專用數(shù)據(jù)倉庫。
2.建立與維護(hù)
我們按G網(wǎng)用戶、寬帶用戶、終端用戶、其他類別這4類構(gòu)造審計(jì)事實(shí)表。以用戶標(biāo)識、終端IMEI等唯一值為主鍵,將各標(biāo)簽作為事實(shí)表的屬性值,按月新增。
將基礎(chǔ)標(biāo)簽庫和從經(jīng)營分析系統(tǒng)的數(shù)據(jù)倉庫同步來的關(guān)鍵參數(shù)表作為維表。
基于上述內(nèi)容,筆者根據(jù)審計(jì)項(xiàng)目各階段要素建立如圖4的新型數(shù)據(jù)審計(jì)作業(yè)流程。
圖4:新型數(shù)據(jù)審計(jì)作業(yè)流程
在審計(jì)準(zhǔn)備階段,圍繞審計(jì)點(diǎn),提供審計(jì)作業(yè)系統(tǒng)已固化的審計(jì)模型結(jié)果,以及對應(yīng)審計(jì)點(diǎn)相關(guān)的全量審計(jì)標(biāo)簽數(shù)據(jù),直接形成審計(jì)發(fā)現(xiàn)或線索。在現(xiàn)場階段,配合對審計(jì)點(diǎn)的數(shù)據(jù)分析(通進(jìn)一步過關(guān)聯(lián)、時(shí)序、組合標(biāo)簽數(shù)據(jù))及驗(yàn)證。在報(bào)告階段,提供審計(jì)發(fā)現(xiàn)的邏輯、清單等,輔助問題定性。
筆者以2017年某地市主要負(fù)責(zé)人離任經(jīng)濟(jì)責(zé)任審計(jì)為例,針對審計(jì)框架中的“社會網(wǎng)點(diǎn)套取業(yè)務(wù)酬金”審計(jì)點(diǎn)進(jìn)行實(shí)踐說明。如圖5。
在審計(jì)準(zhǔn)備階段,審計(jì)人員首先在審計(jì)數(shù)據(jù)集市中獲取被審計(jì)單位審計(jì)期內(nèi)全量的審計(jì)標(biāo)簽數(shù)據(jù),分析梳理其中標(biāo)記較多且存在一定重合度的標(biāo)簽明細(xì)數(shù)據(jù),重點(diǎn)關(guān)注與“渠道酬金”相關(guān)的標(biāo)簽數(shù)據(jù)。隨后通過審計(jì)作業(yè)平臺已有的監(jiān)控模塊,提取審計(jì)期內(nèi)全量與酬金發(fā)放相關(guān)的預(yù)警和審計(jì)發(fā)現(xiàn)內(nèi)容。
數(shù)據(jù)審計(jì)人員根據(jù)該審計(jì)點(diǎn)的審計(jì)要求,進(jìn)行趨勢和異常分析。在本項(xiàng)目中,對審計(jì)作業(yè)平臺數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn),被審計(jì)單位的社會渠道酬金發(fā)放在2016年中部分月有突增,進(jìn)一步觀察酬金清單發(fā)現(xiàn),突增的酬金項(xiàng)目均為“4G套餐遷移獎勵(lì)酬金”;對審計(jì)數(shù)據(jù)集市中的標(biāo)簽數(shù)據(jù)分析發(fā)現(xiàn),在2016年部分月中存在較多的“高頻次返銷工號”、“異常返銷”標(biāo)簽數(shù)據(jù)。將上述兩類異常清單的用戶號碼和業(yè)務(wù)月份進(jìn)行重合度匹配,同時(shí)對該批用戶的“疑似養(yǎng)卡”標(biāo)簽也進(jìn)行關(guān)聯(lián),均發(fā)現(xiàn)重合度極高,其中部分社會渠道集中返銷與獎勵(lì)酬金呈正比關(guān)系。
數(shù)據(jù)審計(jì)人員抽取渠道酬金突增明顯的社會渠道及其期間內(nèi)返銷業(yè)務(wù)記錄,經(jīng)日志軌跡審查,發(fā)現(xiàn)社會渠道通過違規(guī)繳費(fèi),虛假辦理業(yè)務(wù)后返銷,套取激勵(lì)酬金的行為。
在該項(xiàng)目的實(shí)施階段,數(shù)據(jù)審計(jì)人員將該審計(jì)發(fā)現(xiàn)報(bào)告給審計(jì)組,由審計(jì)組遠(yuǎn)程與被審計(jì)單位溝通,確認(rèn)了該審計(jì)發(fā)現(xiàn)并最終披露在審計(jì)報(bào)告中。
圖5:最佳實(shí)踐舉例示意圖
通過構(gòu)建數(shù)據(jù)審計(jì)體系,實(shí)現(xiàn)了“點(diǎn)、線、面、人、財(cái)、物”的三升三降,有效降低審計(jì)成本,提高審計(jì)質(zhì)量和效益,提升審計(jì)時(shí)效,健全數(shù)據(jù)審計(jì)生態(tài),實(shí)現(xiàn)審計(jì)全覆蓋。
實(shí)施業(yè)務(wù)數(shù)據(jù)審計(jì)標(biāo)簽化,還有以下優(yōu)勢。
圖6:成果價(jià)值
1.打破了業(yè)務(wù)的數(shù)據(jù)壁壘,實(shí)現(xiàn)了對跨域數(shù)據(jù)的全景分析。傳統(tǒng)審計(jì)項(xiàng)目中,由于審計(jì)業(yè)務(wù)場景的不同,往往需要數(shù)據(jù)分析人員分別從各域獲取數(shù)據(jù),同時(shí)受“系統(tǒng)孤島”影響,各數(shù)據(jù)域的數(shù)據(jù)關(guān)聯(lián)關(guān)系梳理困難,造成審計(jì)口徑持續(xù)應(yīng)用難、審計(jì)數(shù)據(jù)覆蓋面不夠、審計(jì)數(shù)據(jù)可用性不高、審計(jì)效率受數(shù)據(jù)影響大等問題。通過對各域數(shù)據(jù)的標(biāo)簽化,將分散的業(yè)務(wù)數(shù)據(jù)標(biāo)記為具備審計(jì)含義的審計(jì)數(shù)據(jù),形成可直接被審計(jì)人員識別的數(shù)據(jù)集,打破數(shù)據(jù)域的壁壘,為實(shí)現(xiàn)跨域數(shù)據(jù)的全景分析奠定了堅(jiān)實(shí)的基礎(chǔ)。
2.推動新型審計(jì)模式落地,提升審計(jì)價(jià)值?;趯徲?jì)數(shù)據(jù)標(biāo)簽化,將各類業(yè)務(wù)數(shù)據(jù)標(biāo)記為具有類自然語言標(biāo)簽的審計(jì)數(shù)據(jù),從而剔除了元數(shù)據(jù)中與審計(jì)無關(guān)的數(shù)據(jù),使審計(jì)數(shù)據(jù)輕量化、簡潔化,讓沒有大數(shù)據(jù)分析能力的審計(jì)人員可以在現(xiàn)場利用EXCEL等工具開展數(shù)據(jù)分析。大數(shù)據(jù)分析人員可遠(yuǎn)程同時(shí)支撐多個(gè)審計(jì)現(xiàn)場的工作,有效提升了審計(jì)效率,降低了審計(jì)人力的投入,切實(shí)提升了審計(jì)價(jià)值。
3.通過對元數(shù)據(jù)的透視,圈選審計(jì)范圍,實(shí)現(xiàn)審計(jì)項(xiàng)目的快速推進(jìn)。傳統(tǒng)審計(jì)項(xiàng)目的準(zhǔn)備階段,需要對元數(shù)據(jù)進(jìn)行清洗和分析,形成審計(jì)線索,圈定問題范圍。而基于審計(jì)標(biāo)簽化的數(shù)據(jù),準(zhǔn)備階段就無需預(yù)處理數(shù)據(jù),大大縮短了審計(jì)項(xiàng)目周期,有效提升了審計(jì)項(xiàng)目的效率。經(jīng)初步測算,平均每個(gè)審計(jì)項(xiàng)目都至少需要2名數(shù)據(jù)分析人員使用0.5周時(shí)間進(jìn)行元數(shù)據(jù)的預(yù)處理,體系建立后,同樣的人力投入可以同時(shí)為2個(gè)審計(jì)項(xiàng)目直接提供審計(jì)線索數(shù)據(jù),某些項(xiàng)目甚至不需要專職的人員進(jìn)行數(shù)據(jù)分析。
4、標(biāo)簽化作為業(yè)務(wù)數(shù)據(jù)審計(jì)化的解決方案,為實(shí)現(xiàn)大數(shù)據(jù)智慧審計(jì)提供堅(jiān)實(shí)基礎(chǔ)。近年來,業(yè)界積極探索運(yùn)用人工智能技術(shù)推進(jìn)審計(jì)工作開展,相繼提出大數(shù)據(jù)審計(jì)、智慧審計(jì)的思路。面對海量業(yè)務(wù)數(shù)據(jù),元數(shù)據(jù)審計(jì)標(biāo)簽化,正是實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)審計(jì)化的解決方案之一,它采用類自然語言構(gòu)造基礎(chǔ)審計(jì)標(biāo)簽庫,通過多種方式建模,對目標(biāo)審計(jì)數(shù)據(jù)輸出標(biāo)簽,實(shí)現(xiàn)對各系統(tǒng)業(yè)務(wù)數(shù)據(jù)的標(biāo)簽化,將元數(shù)據(jù)中具備審計(jì)價(jià)值的信息剝離,為實(shí)現(xiàn)智慧審計(jì)提供了數(shù)據(jù)基礎(chǔ)。
初步構(gòu)建基于業(yè)務(wù)數(shù)據(jù)審計(jì)標(biāo)簽化的通信企業(yè)數(shù)據(jù)審計(jì)體系,是將審計(jì)業(yè)務(wù)與信息技術(shù)深度融合的突破口。如何將之與人工智能技術(shù)結(jié)合,發(fā)揮機(jī)器學(xué)習(xí),語義識別等能力,進(jìn)一步解決非結(jié)構(gòu)化數(shù)據(jù)的獲取、清洗和加工,以更加智能化的手段挖掘各類業(yè)務(wù)數(shù)據(jù)中的審計(jì)價(jià)值,還有很長的路要走。未來通過充分開發(fā)人工智能等信息技術(shù),積探索挖掘?qū)徲?jì)數(shù)據(jù)的方式,提升駕馭業(yè)務(wù)大數(shù)據(jù)的能力,讓海量的業(yè)務(wù)數(shù)據(jù)自如地說“審計(jì)方言”,能把握住審計(jì)創(chuàng)新發(fā)展的主動權(quán),釋放出大數(shù)據(jù)審計(jì)的潛力,迎來審計(jì)工作的新發(fā)展。