王愛清 朱凱達
【摘 要】 人工智能技術的出現(xiàn)和應用,為稅收風險管理的創(chuàng)新提供了極為便利的技術平臺和創(chuàng)新性思路?!叭斯ぶ悄?稅收風險管理”在稅務稽查篩選中極具優(yōu)勢,文章選擇Bagging和SVM兩種計算機算法預測逃稅模型,構建了預測指標,快速且精確地對實例進行聚類,將出現(xiàn)明顯異常的小類識別為異常,判斷其存在稅收風險。該模型可在稅務稽查中篩選重點企業(yè)和可疑業(yè)務,以減少稅收流失風險,提高稅務稽查命中率。人工智能與稅收風險管理的結(jié)合必將是未來提高稅收風險管控水平的重要手段之一。
【關鍵詞】 人工智能; 稅收風險; 風險管理
【中圖分類號】 F208;F812.42? 【文獻標識碼】 A? 【文章編號】 1004-5937(2020)07-0126-05
一、人工智能技術原理及其對社會的沖擊效應
(一)人工智能技術的原理
人工智能技術亦稱為AI技術,被譽為21世紀三大尖端技術之一,近30年的發(fā)展勢如破竹。人工智能的基本含義是“人工+智能”。通過人為創(chuàng)造類似于人腦思維模式的一種計算機算法,來釋放人類大腦中一些繁瑣簡單的思考活動,即為人工智能的目標[ 1 ]。
目前主流的人工智能系統(tǒng)使用人工神經(jīng)網(wǎng)絡來模擬人類大腦中的神經(jīng)元,這些網(wǎng)絡通過調(diào)整神經(jīng)元之間的連接進行學習。創(chuàng)造智能的方式有兩種:一種是首先完全了解大腦思考的全部過程,然后將整個過程進行人為的模擬;另一種是僅大腦功能的模擬,即不對全部過程及結(jié)構完全模仿,僅對其本身的作用進行模仿?,F(xiàn)代科技還不足以解開大腦的秘密,只能通過對其功能的模擬來實現(xiàn)人工創(chuàng)造的智能。人工智能技術善于識別海量數(shù)據(jù)中隱藏的模式,而依賴經(jīng)驗和知識的人類卻不容易發(fā)現(xiàn)海量數(shù)據(jù)中隱藏的模式和信息,這就是人工智能的優(yōu)勢所在。
(二)人工智能技術對社會的沖擊效應
異軍突起的人工智能技術之所以勢不可擋,在很大程度上是因為開放的軟件工具(也稱為框架),使得構建和訓練一個神經(jīng)網(wǎng)絡實現(xiàn)目標應用程序變得容易,即使用各種不同的編程語言,對已知的識別目標可以離線定義和訓練一個神經(jīng)網(wǎng)絡。一旦訓練完成,神經(jīng)網(wǎng)絡可以很容易地部署到嵌入式平臺上,也可以遷移到各種軟件程序和硬件平臺上,并借助PC或云的能力訓練神經(jīng)網(wǎng)絡。
人工智能技術的出現(xiàn)和實際應用,對很多行業(yè)產(chǎn)生了顛覆性的影響,人工智能的廣泛應用,使得大部分簡單的體力以及腦力勞動被智能機器所替代,這對各個行業(yè)的就業(yè)產(chǎn)生強烈沖擊。社會勞動結(jié)構本身呈現(xiàn)金字塔形,底層的就業(yè)大部分是簡單的體力或者腦力勞動,而人工智能的出現(xiàn)完全可以替代金字塔中的絕大部分底層勞動力,對整個社會的就業(yè)產(chǎn)生不可預知的巨大沖擊。不僅如此,人工智能技術為整個行業(yè)的經(jīng)營模式以及商業(yè)模式開辟出一個全新的方向,對產(chǎn)業(yè)營銷模式和管理模式的顛覆性改變必將開拓出一片新領域,在開發(fā)新領域新技術的同時又會產(chǎn)生大量就業(yè)需求。另外,一些基本的人工智能能夠幫助各行業(yè)大大減少運營成本,并精確完整地完成各項預定任務。諸如此類的變化將對所有行業(yè)的商業(yè)管理模式提出新的要求。
2017年7月8日,國務院頒布了《關于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》,計劃到2030年建成世界主要人工智能創(chuàng)新中心。由此,我國將借助人工智能把稅收管理和納稅服務工作提升到一個嶄新的高度。當然,在這個發(fā)展過程中需要我們以新的思想理念和技術思維,不斷研究發(fā)掘新的信息技術應用,迭代新的納稅服務產(chǎn)品,深化智能化技術手段,創(chuàng)新“人工智能+稅收風險管理”方式。
總之,從人工智能技術特征、實施核心和終極目的來看,人工智能技術為目前實施合作型稅收風險管理戰(zhàn)略提供了最佳契機。
二、人工智能在稅收領域的應用分析
(一)人工智能助推稅收管理現(xiàn)代化
自2017年人工智能被寫進政府工作報告,我國正式進入人工智能元年,各行業(yè)領跑者已經(jīng)著手自身產(chǎn)業(yè)與人工智能技術的結(jié)合研究,越來越多的企業(yè)開始大規(guī)模運用人工智能[ 2 ]。運用計算機進行信息處理以及電子化的時代已經(jīng)過去,目前最有發(fā)展價值和巨大變革的就是對數(shù)據(jù)的分析以及對人工智能的開發(fā)。在各行各業(yè)都大力發(fā)展人工智能管理的大趨勢下,稅收與人工智能的結(jié)合成為必然。國家稅收征管部門對各行各業(yè)的稅收征管技術必定要在社會平均水平以上,否則對一些采用高科技企業(yè)的稅收征管監(jiān)督不能精準地判斷企業(yè)相關涉稅業(yè)務的真實性,這對我國稅收征管提出了挑戰(zhàn)。在各個行業(yè)都大力發(fā)展人工智能的時代,國家稅收征管部門必定要跟上潮流,甚至采用強人工智能技術來協(xié)助自己更有效率地對市場主體進行監(jiān)管,也只有跟上科技潮流,才能對稅收征管的相關成本進行必要的降低,以及有效監(jiān)督相關稅收風險,減少國家稅源流失。
(二)人工智能助推稅收征管提高效率
我國自分稅制以來稅收征管一直存在征收成本大、管理水平低等各種問題,在國地稅還未合并之前雙方信息溝通不到位,各自為政,稅收征管部門溝通效率不高,導致納稅人納稅成本高,程序的繁多以及鞋底成本的存在也是長期高額征管成本和納稅成本的原因。征管成本的降低需要通過先進的科技和盡職盡責的稅務局人員共同來完成。人工智能時代,稅收征管系統(tǒng)必然要與人工智能技術完美結(jié)合,使得一些簡單、冗多、易錯的繁瑣工作交由人工智能機器人來處理,而一些專業(yè)性的稅收風險評估以及稅務稽查選案工作,依靠人工智能技術利用海量數(shù)據(jù)進行分析篩選,重塑稅收風險管理組織體系,形成集成化的稅收風險管理系統(tǒng)。
(三)人工智能優(yōu)化稅收征管程序
自2015年國務院總理李克強提出簡政放權,深化“放管服”改革以來,我國相關行政審批事項大大減少,進一步優(yōu)化了政府職能。然而在稅收征管方面依舊存在很多問題,比如相關納稅人身份認定、高新技術企業(yè)安全生產(chǎn)設備的資格鑒定等還需要納稅人自身進行判定和申報,手續(xù)相當復雜?!白疃嗯芤淮巍备母锶匀皇恰胺殴芊备母镏凶蠲黠@的短板。因此,稅收征管部門應大力加強人工智能技術在稅收認定或鑒定中的應用,進一步簡化納稅認定程序,運用人工智能技術幫助納稅人進行相關資格認定,真正為納稅人降低稅收風險。
三、利用人工智能推進稅收風險管理創(chuàng)新
在人工智能時代,稅務機關應充分利用大數(shù)據(jù)、“互聯(lián)網(wǎng)+”的信息技術,優(yōu)化集成內(nèi)外部數(shù)據(jù)資源,建設大數(shù)據(jù)管理平臺,加快風險管理與大數(shù)據(jù)平臺對接融合的步伐[ 3 ],結(jié)合高效、準確的“機器學習”算法推動稅收管理從“業(yè)務驅(qū)動”轉(zhuǎn)向“數(shù)據(jù)驅(qū)動”。
集中打造涉稅信息數(shù)據(jù)人工智能云平臺,按照互聯(lián)網(wǎng)思維中的平臺思維,通過云平臺,一方面集中收集和處理涉稅數(shù)據(jù)信息,另一方面將大數(shù)據(jù)分析挖掘形成的有價值信息放在人工智能云平臺,為納稅人當然也為稅務部門和相關政府部門的管理決策提供高端服務。這些通過大數(shù)據(jù)、人工智能云計算所形成的高含金量的涉稅數(shù)據(jù)信息不同于以往的數(shù)據(jù)庫,主要涵蓋諸如“納稅人特征庫”“稅收知識庫”“稅收案例庫”“稅收風險特征庫”“納稅人需求調(diào)查”“行業(yè)稅收經(jīng)濟特征庫”“地區(qū)稅收經(jīng)濟特征庫”“稅收經(jīng)濟分析報告”和“稅收營商環(huán)境指數(shù)報告”,也包括各種應用場景的相關知識,所有這些都是基于人工智能云計算的新型基礎設施。全社會可以在這樣的條件下構建不同的業(yè)務應用,形成高端的涉稅服務組合。
人工智能系統(tǒng)依托風險管理系統(tǒng)和大數(shù)據(jù)平臺,對以往正常納稅人以及逃稅人的相關海量數(shù)據(jù)進行分析、篩選和標識,形成數(shù)據(jù)的特征集[ 4 ],探索用“機器學習”算法預測納稅人的逃稅概率,然后將判斷結(jié)果提交給稅務機關。稅務機關再根據(jù)策略選擇分辨逃稅概率較高的納稅人進行嚴厲的稅務稽查,從而節(jié)省稅務風險管理識別的時間和成本,降低稅收管理成本。
傳統(tǒng)的檢查過分依賴于稅務干部業(yè)務水平、工作經(jīng)驗以及納稅人在眾人心目中的固有形象,這大多含有主觀判斷性,且判斷結(jié)果具有離散性,即只存在兩種可能性:逃稅或者沒有逃稅[ 5 ]。而使用機器學習算法,由于計算機存儲性能、計算性能的指數(shù)式提高以及機器學習算法的不斷優(yōu)化,使得可以從海量的過往數(shù)據(jù)中快速地學習到不同類別(本文中指正常納稅人和逃稅人)所具有的特征,然后給出一個納稅人逃稅的概率,進而稅務局可以重點挑選檢查對象。每次預測的結(jié)果都可以進行保存,在下次定期預測時被利用,避免人工反復對同一個納稅人進行重復的一些檢查、核對工序。
(一)稅務風險管理模型的設計思路
通過登記數(shù)據(jù)、申報數(shù)據(jù)、財務數(shù)據(jù)、繳納稅額以及是否享有稅收優(yōu)惠等納稅人的相關數(shù)據(jù),建立起納稅人和逃稅概率之間的一個預測模型。該模型對納稅人有如下假設:(1)具有相似經(jīng)營條件的納稅人,比如相同地域、相同行業(yè)、相同規(guī)模、相同投入的納稅人,他們的納稅額度應該比較接近;(2)企業(yè)的財務報表數(shù)據(jù)是通過一定的會計準則對企業(yè)生產(chǎn)經(jīng)營過程中的資金流動進行會計核算的結(jié)果,能較為綜合地反映企業(yè)的生產(chǎn)經(jīng)營行為;(3)大量樣本可以反映具有相似經(jīng)營條件的納稅人的行為規(guī)律,從而可以從過往的海量數(shù)據(jù)學習到特征,進而對其他納稅人進行逃稅概率的預測。
(二)稅收風險管理模型的選擇
考慮實際情況,模型選擇結(jié)合使用Bagging和SVM算法。
Bagging采用重復抽取訓練數(shù)據(jù)的方式進行取樣,即從訓練集中按等概率抽取樣本進行模型的訓練,模型可以很好地覆蓋訓練樣本空間的所有數(shù)據(jù)。此外,Bagging對數(shù)據(jù)的抗干擾能力較強,適合注冊登記類型不同、公司規(guī)模大小有差異、公司投資金額有差距的不同納稅人,能很好地保證觀測值的“獨立同分布”性質(zhì)。
SVM,即支持向量機,它旨在尋找不同類別訓練樣本的劃分超平面,如圖1中的三角和五角之間的劃分線C(二維空間顯示為劃分線,多維空間顯示為劃分平面)。三角和五角分別代表兩類不同的訓練數(shù)據(jù),雖然A、B、C(都是劃分平面)都可以將兩類數(shù)據(jù)進行劃分,但是顯然C更好,因為它對訓練樣本局部擾動的“容忍”性最好。例如由于訓練集的局限性或噪聲的原因,三角可能出現(xiàn)在平面B、C之間,五角可能出現(xiàn)在平面C、A之間,這時候,平面A、平面B都將把數(shù)據(jù)分錯,而平面C卻不會。換言之,C平面,即超平面,它所產(chǎn)生的分類結(jié)果是最優(yōu)的。
由于目前的數(shù)據(jù)是人工根據(jù)實際情況對很多數(shù)據(jù)的評價指標進行了篩選的,數(shù)據(jù)的特征是比較明確的,所以使用SVM。SVM是專門針對二分類問題的,模型相比于神經(jīng)網(wǎng)絡較簡單,不需要花費大量的時間訓練。
(三)稅收風險管理變量的選擇
有監(jiān)督的機器學習可以形式化地表示為已知目標變量y與輸入x之間存在一定的未知依賴關系,即存在一個未知的映射F(x,y),通過逼近函數(shù)反復地訓練調(diào)整,使預測的期望風險降到最低,以找到最佳的F(x,y)近似目標函數(shù)。根據(jù)研究目標,模型選用“是否為逃稅人”作為目標變量。分類器在輸出結(jié)果的上一層會對每個類別有一個打分,然后將本條測試數(shù)據(jù)分到得分較高的那個類別。所以,雖然目標變量是個離散值,但是其實可以得到一個概率值(將每類的得分進行歸一化就可以得到每類的概率)。對于參與變量,原始數(shù)據(jù)中可供選擇的指標很多,但這些指標并非全部有助于稅收流失測算,反而可能因為變量之間的相關性、噪聲變量等降低模型的有效性。運用傳統(tǒng)的聚類方法、因子分析、逐步回歸等進行自變量選擇是比較繁瑣、艱難的工作,而機器學習支持全樣本、全變量參與,符合大數(shù)據(jù)分析的需求,所以本文運用機器學習法中的噪聲穩(wěn)健性算法計算各變量的重要性排序,然后選取繳納稅額、以往違反稅法程度、企業(yè)整體稅負率等作為參與變量。
最后即可通過將所有申報到稅務局的企業(yè)信息輸入模型進行測評,同時根據(jù)實際情況不斷修正結(jié)果和模型,不斷優(yōu)化和改善,最終使誤差達到一定標準即可在全國稅務系統(tǒng)進行大規(guī)模試用,以減少稅務局征管成本,大大減少稅收流失。
(四)人工智能在稅收風險管理實踐中的應用
人工智能主要為稅收管理提供了技術支撐,人工智能技術可在稅收風險管理中應用于稽查異常企業(yè)、異常業(yè)務及異常行為三個方面。在稅收風險管理實踐中應用人工智能技術,可以首先篩選出最有可能逃稅的企業(yè),然后對此類目標企業(yè)的涉稅業(yè)務進行系統(tǒng)性篩選,即通過Bagging和SVM算法排查目標企業(yè)最可疑的涉稅業(yè)務并進行重點稽查。
1.篩選目標企業(yè)
稅務系統(tǒng)在稽查系統(tǒng)中篩選重點稽查企業(yè)時嵌入包含Bagging和SVM算法的人工智能算法系統(tǒng),將兩類企業(yè)(即正常納稅企業(yè)和有逃稅行為的企業(yè))的大量相關信息,如企業(yè)注冊的時間、企業(yè)注冊的經(jīng)營范圍、企業(yè)的注冊金額與繳納稅款的金額、企業(yè)的信用度、企業(yè)在銀行的相關信用記錄以及企業(yè)以往違反稅法記錄等變量作為訓練數(shù)據(jù)的特征集輸入到模型的Input端,訓練出篩選目標企業(yè)的模型,如圖2所示。
通過將稅務稽查系統(tǒng)想要篩選的企業(yè)的以上信息按照提前設定好的方法轉(zhuǎn)化成相應的特征向量輸入到模型中,測出樣本企業(yè)對行業(yè)正常水平的偏離度并評價得分,得分越高的樣本企業(yè)違反稅收遵從度的可能性越大,可以設置得分百分制,設置算法系統(tǒng)將得分超過80分的企業(yè)輸出反饋到稅務篩選系統(tǒng),再將算法篩選系統(tǒng)選出的目標企業(yè)得分以及對目標企業(yè)的檢查結(jié)果信息重新反饋到數(shù)據(jù)對比庫中進行標記修正,同時通過檢查結(jié)果對算法篩選系統(tǒng)進一步完善和不斷增加變量以提高篩選精度,從而使誤差達到一個可控范圍。
2.篩選重點稽查業(yè)務
通過上一步方式篩選得到目標企業(yè),再設計一套算法篩選系統(tǒng)(見圖3),將行業(yè)平均利潤率、行業(yè)成本產(chǎn)出比率、行業(yè)平均交易價格等參與變量依據(jù)稅務局賦予的權重進行排列,并且通過一個簡單的二分篩選將超過設定標準的業(yè)務數(shù)額輸入到算法篩選系統(tǒng)進行對比評估,將低于設定標準的排除在系統(tǒng)之外。太低的業(yè)務數(shù)額對稅收稽查的成本遠大于收益,且會對算法系統(tǒng)構成一定的誤差影響。
用于算法系統(tǒng)對比學習的數(shù)據(jù)庫可以采用區(qū)塊鏈技術建立一個分布式云賬本體系和云發(fā)票系統(tǒng),通過建立企業(yè)財務的云賬本體系,讓能夠通過秘鑰驗證的真實信息進入財務節(jié)點。由于區(qū)塊鏈信息的不可篡改性,給稅務部門在稽查時提供了公開透明的財務證據(jù),且通過企業(yè)財務節(jié)點與其他節(jié)點的連接可以實現(xiàn)所有相關數(shù)據(jù)全部共享,使數(shù)據(jù)的質(zhì)和量得到雙重保證。
算法篩選系統(tǒng)通過對區(qū)塊鏈云賬本體系的數(shù)據(jù)進行機器學習并根據(jù)SVM算法得出數(shù)額較大且與行業(yè)合理浮動閾值相差較大的重點稽查業(yè)務,此時再通過稅務稽查人員親自查驗是否存在稅收風險問題,并將結(jié)果數(shù)據(jù)重新存入算法篩選系統(tǒng)作為執(zhí)行下次任務的一個參考指標。
(五)稅收風險管理系統(tǒng)的維護
模型建立后,需要控制系統(tǒng)中數(shù)據(jù)的量和質(zhì)。在工業(yè)時代,最有價值的是自然資源,而在信息時代以及智能時代,最有價值的是數(shù)據(jù)。對于數(shù)據(jù)的量,目前來說是不少的,只是由于技術及成本的原因無法開發(fā),無法將隱藏的“數(shù)據(jù)礦藏”全部發(fā)掘出來,因此不僅稅務部門需要發(fā)掘未開發(fā)的數(shù)據(jù)礦藏,而且其他政府部門也要盡力發(fā)掘,不斷補充樣本,使樣本的數(shù)量足夠大。當樣本達到無限大時,就相當于包含所有數(shù)據(jù),測量的精度就可近似為真實值。
在數(shù)據(jù)質(zhì)的管控方面,要在數(shù)據(jù)輸入端加以把控,保證數(shù)據(jù)的準確性和完整性,一旦數(shù)據(jù)準確性發(fā)生偏差,最后模型測量結(jié)果必然也出現(xiàn)一定的偏差,甚至產(chǎn)生蝴蝶效應,所以通過加強數(shù)據(jù)準入層面的監(jiān)管,在數(shù)據(jù)樣本選擇環(huán)節(jié)二次進行篩選將失真數(shù)據(jù)加以排除,以保證樣本精度在可控范圍內(nèi)。
信息共享方面,信息共享的目的,其一是為了擴大數(shù)據(jù)數(shù)量,其二是為了對比本部門擁有的數(shù)據(jù)是否準確以及是否完整,最終目的是為了保證數(shù)據(jù)的質(zhì)和量,因此需要加強稅務局和銀行、工商、國外涉稅相關機構的信息交換工作,打造完整的數(shù)據(jù)鏈條以及數(shù)據(jù)體系,系統(tǒng)地整合數(shù)據(jù)質(zhì)量,為后續(xù)模型的預測打好基礎。
系統(tǒng)安全方面,由于信息技術日新月異,層出不窮的系統(tǒng)漏洞及補丁對稅收部門建立的智能預測系統(tǒng)是一種極大的風險,稅收管理部門應當定期檢查并更新系統(tǒng),保證防火墻的安全性,防止惡意病毒及黑客篡改程序、竊取數(shù)據(jù)等。
綜上所述,我國稅收風險管理體系的改革是大勢所趨。稅收風險管理與人工智能的結(jié)合為我國稅收風險管理的創(chuàng)新提供了一條新的思路,在提高納稅人服務滿意度以及降低納稅人納稅成本方面,人工智能也提供了新的方向和思路。全面推進智能化稅收風險管理,需要在互聯(lián)網(wǎng)平臺、大數(shù)據(jù)平臺和云平臺的基礎上構建稅收風險管理人工智能平臺;推進多元異構數(shù)據(jù)融合,構建復雜應用場景下的多維涉稅信息綜合大數(shù)據(jù)應用平臺;打造智能化涉稅服務系統(tǒng),搭建稅務人工智能基礎設施和納稅服務創(chuàng)新平臺??梢酝茰y,新的人工智能系統(tǒng)應當是鑲嵌于綜合納稅服務平臺中的一組人工智能軟件系統(tǒng),而不是一臺智能機器人。該系統(tǒng)能夠自動搜集和處理涉稅大數(shù)據(jù),依靠強大的機器學習增強學習能力和服務經(jīng)驗,為納稅人提供智能化服務產(chǎn)品,最終形成“流程化+智能化”的稅收風險管理模式。
【參考文獻】
[1] 李為人,李斌.在稅收風險分析中引入人工智能技術的思考[J].稅務研究,2018(6):29-34.
[2] 杜莉,鄭毓文.應用區(qū)塊鏈技術推動我國增值稅征管創(chuàng)新:機制分析和方案設計[J].稅務研究,2018(6):72-79.
[3] 劉小瑜,溫有棟,江炳官.“互聯(lián)網(wǎng)+”背景下高新技術企業(yè)的稅收風險預警:基于智能優(yōu)化算法的研究[J].稅務研究,2018(6):80-86.
[4] 王會波.大型企業(yè)集團稅務風險管控模式探討[J].會計之友,2017(11):89-93.
[5] 趙瑜,孫存一,王坤.基于微觀數(shù)據(jù)的房地產(chǎn)業(yè)稅收流失研究:基于以機器學習法的實證分析[J].中國物價,2015(9):65-67.