張 翼,陳清晰
(廈門(mén)市同安區(qū)國(guó)家稅務(wù)局,福建 廈門(mén) 361100)
關(guān)于稅收大數(shù)據(jù)深度分析應(yīng)用的探索
張翼,陳清晰
(廈門(mén)市同安區(qū)國(guó)家稅務(wù)局,福建 廈門(mén) 361100)
近年來(lái),隨著大數(shù)據(jù)技術(shù)的普遍應(yīng)用,國(guó)稅機(jī)關(guān)結(jié)合稅收工作也開(kāi)始涉及大數(shù)據(jù)處理分析。國(guó)稅系統(tǒng)將原來(lái)的單機(jī)報(bào)表逐步調(diào)整到現(xiàn)在的省局集中處理,實(shí)現(xiàn)了信息的充分共享,隨之而來(lái)的就是數(shù)據(jù)的激增。在這種情況下,對(duì)稅收數(shù)據(jù)進(jìn)行大數(shù)據(jù)的深度分析應(yīng)用,可以為決策者提供數(shù)據(jù)支撐,輔助決策。
稅收;大數(shù)據(jù);分析;思考
稅收信息系統(tǒng)經(jīng)過(guò)了四個(gè)發(fā)展時(shí)期,逐步趨于完善,分別是單機(jī)報(bào)表處理、分局集中征收、市局集中征收和省局集中征收處理(上海和西藏除外),目前正處于大數(shù)據(jù)集中管理這個(gè)階段[1],隨著稅收數(shù)據(jù)的激增,其利用度將得到大大的提高。
進(jìn)行稅收大數(shù)據(jù)的深度分析應(yīng)用需要滿(mǎn)足兩個(gè)基本條件:一是稅收數(shù)據(jù)在數(shù)量上要形成規(guī)模,這樣才能在大量離散的數(shù)據(jù)中找到規(guī)律;二是大數(shù)據(jù)的分析技術(shù)要成熟,可以對(duì)海量數(shù)據(jù)實(shí)現(xiàn)深度的分析應(yīng)用。結(jié)合信息發(fā)展的情況來(lái)看,這兩個(gè)條件已經(jīng)具備,稅收大數(shù)據(jù)實(shí)現(xiàn)了省局的高度集中,為深度分析提供了基礎(chǔ)的海量數(shù)據(jù);大數(shù)據(jù)分析挖掘技術(shù)的快速發(fā)展,為稅收大數(shù)據(jù)的深度分析提供了技術(shù)保障[2]。因此,稅收大數(shù)據(jù)深度分析應(yīng)用是稅收信息化發(fā)展的必然要求。
王向東和王文匯[3]等人指出隨著大數(shù)據(jù)時(shí)代的來(lái)臨,我國(guó)現(xiàn)行的“管事制”模式受到了嚴(yán)峻的挑戰(zhàn),逐漸陷入困境,面臨轉(zhuǎn)型壓力。因此,數(shù)據(jù)處理成為了現(xiàn)階段著重要解決的問(wèn)題,沙亞清等[4]和張社安[5]在大數(shù)據(jù)的環(huán)境下,分別構(gòu)建了稅收應(yīng)用的新格局和稅收共治格局,對(duì)大數(shù)據(jù)分析有借鑒意義。孫開(kāi)和沈昱池[6]更是將大數(shù)據(jù)看作是現(xiàn)代稅收征管體系構(gòu)建和完善的助推器,任東飚[7]和白子千[8]等人利用大數(shù)據(jù)的技術(shù)手段對(duì)稅收管理進(jìn)行了探析。除此之外,周詠琦[9]還對(duì)電子商務(wù)的稅收管理進(jìn)行了剖析,在大數(shù)據(jù)的背景下,不僅許多互聯(lián)網(wǎng)企業(yè)信息都可得到共享,而且可運(yùn)用大數(shù)據(jù)思維,對(duì)電子商務(wù)稅收征管通過(guò)大數(shù)據(jù)進(jìn)行統(tǒng)籌管理。
(一)內(nèi)涵
大數(shù)據(jù)分析,不是采用抽樣調(diào)查法來(lái)分析數(shù)據(jù),而是分析所有掌握的數(shù)據(jù),從中得到有序的、可信的、有效并能被應(yīng)用主體理解的高級(jí)數(shù)據(jù)處理技術(shù)。大數(shù)據(jù)分析的過(guò)程主要包括前期的數(shù)據(jù)收集,數(shù)據(jù)整理和后期的定量和定性分析。
稅收大數(shù)據(jù)的分析就是依照科學(xué)管理的要求,結(jié)合大數(shù)據(jù)分析技術(shù),實(shí)現(xiàn)用數(shù)據(jù)來(lái)分析指導(dǎo)稅收工作,通過(guò)對(duì)海量數(shù)據(jù)的挖掘,總結(jié)現(xiàn)有的稅收管理現(xiàn)狀和存在的問(wèn)題,預(yù)測(cè)發(fā)展趨勢(shì),為稅收管理提供數(shù)據(jù)支持,改進(jìn)稅收管理工作[10]。
(二)方法
1.數(shù)據(jù)質(zhì)量檢測(cè)分析。數(shù)據(jù)質(zhì)量檢測(cè)分析方法主要有關(guān)聯(lián)分析法、聚類(lèi)分析法等。關(guān)聯(lián)分析法是根據(jù)數(shù)據(jù)之間的關(guān)系,建立數(shù)學(xué)模型,篩選出異常的數(shù)據(jù),可以用在對(duì)納稅人申稅情況、納稅人入庫(kù)級(jí)次核定、逾期申報(bào)和辦理稅務(wù)登記等問(wèn)題的分析。聚類(lèi)分析法是對(duì)所有得到的數(shù)據(jù)進(jìn)行歸類(lèi),建立分析模型,從而發(fā)現(xiàn)有問(wèn)題的數(shù)據(jù),可以用在對(duì)納稅人進(jìn)行年審時(shí)等問(wèn)題的分析。
2.稅收收入分析。稅收收入分析方法主要有三種,分別是:回歸模型預(yù)測(cè)、時(shí)間序列預(yù)測(cè)和對(duì)比分析,這三種方法相結(jié)合可以判斷納稅人收入的相關(guān)增長(zhǎng)情況與經(jīng)濟(jì)發(fā)展的協(xié)調(diào)關(guān)系,指導(dǎo)納稅組織收入工作。
3.宏觀經(jīng)濟(jì)稅收分析。宏觀經(jīng)濟(jì)稅收分析方法主要有三種,分別是彈性分析法、同行業(yè)稅負(fù)比較法、宏觀稅負(fù)分析法,通過(guò)這三種宏觀層面的分析,可以了解到較長(zhǎng)時(shí)間內(nèi)稅負(fù)的變動(dòng)情況,分析研究行業(yè)稅負(fù)的不同,更好地把握稅收來(lái)源情況,為宏觀調(diào)控提供數(shù)據(jù)支持。
4.微觀稅收分析。微觀領(lǐng)域的稅收分析一般有三種,分別是:?jiǎn)我恢笜?biāo)預(yù)警法、多項(xiàng)指標(biāo)預(yù)警法和數(shù)量經(jīng)濟(jì)規(guī)模估算法。通過(guò)微觀領(lǐng)域的稅收分析,可以發(fā)現(xiàn)存在問(wèn)題的企業(yè),在稅務(wù)稽查方面發(fā)揮了重要作用。首先是單一指標(biāo)預(yù)警,為稅收分析的各項(xiàng)指標(biāo)設(shè)定預(yù)警值,然后用被分析企業(yè)的各項(xiàng)指標(biāo)與預(yù)警值逐一對(duì)比,找到存在問(wèn)題的數(shù)據(jù),也就意味著被調(diào)查企業(yè)在這項(xiàng)指標(biāo)所反映的稅務(wù)方面存在問(wèn)題。多項(xiàng)指標(biāo)預(yù)警與單一指標(biāo)預(yù)警的方法很相似,同時(shí)選取了多項(xiàng)分析指標(biāo)建立綜合分析體系,可以從多方面進(jìn)行分析,并找到其中的關(guān)聯(lián)性。數(shù)量經(jīng)濟(jì)規(guī)模估算是典型的定量分析法,利用微觀經(jīng)濟(jì)學(xué)的相關(guān)數(shù)學(xué)模型對(duì)企業(yè)的經(jīng)營(yíng)情況進(jìn)行模擬,估算出企業(yè)應(yīng)繳納的稅額,與企業(yè)實(shí)際繳納的稅額進(jìn)行比對(duì),尋找存在偷稅漏稅情況的企業(yè),但同時(shí)這種方法的工作量巨大,需要大數(shù)據(jù)技術(shù)的保障[11]。
(三)稅收大數(shù)據(jù)深度分析的意義
稅收大數(shù)據(jù)深度分析應(yīng)用主要有四方面的重要意義:一是科學(xué)指導(dǎo)稅收工作,通過(guò)稅收大數(shù)據(jù)的深度分析與應(yīng)用,可以發(fā)現(xiàn)稅收工作中存在問(wèn)題的薄弱環(huán)節(jié),從而制定相應(yīng)的改進(jìn)措施,將以往靠政策監(jiān)管的現(xiàn)狀改為靠“數(shù)據(jù)說(shuō)話”,提高稅收管理的科學(xué)性。二是加強(qiáng)稅源管理,通過(guò)微觀領(lǐng)域的估算,可以對(duì)主要企業(yè)的稅收總額進(jìn)行估算,從根源上加強(qiáng)對(duì)企業(yè)的監(jiān)控管理,為納稅評(píng)估和稅務(wù)稽查提供基礎(chǔ)數(shù)據(jù),提高稅源管理的精細(xì)化。三是加強(qiáng)執(zhí)法監(jiān)督,通過(guò)稅收大數(shù)據(jù)的深度分析應(yīng)用,可以及時(shí)總結(jié)稅收工作中的不規(guī)范問(wèn)題,從而實(shí)施責(zé)任追究,加強(qiáng)執(zhí)法的規(guī)范性,提高稅收服務(wù)水平。四是加強(qiáng)質(zhì)量考核,通過(guò)稅收大數(shù)據(jù)深度分析應(yīng)用,可以對(duì)數(shù)據(jù)收集質(zhì)量、處理質(zhì)量和執(zhí)法質(zhì)量進(jìn)行量化,使稅收管理向數(shù)字化的方向發(fā)展,為稅收評(píng)估和工作績(jī)效考核提供依據(jù)。
(一)數(shù)據(jù)挖掘的主要步驟
1.數(shù)據(jù)收集。海量豐富的數(shù)據(jù)是進(jìn)行數(shù)據(jù)挖掘的首要條件,所以數(shù)據(jù)收集是數(shù)據(jù)挖掘的第一步,數(shù)據(jù)可以從現(xiàn)有的稅務(wù)系統(tǒng)中直接獲得,也可以通過(guò)數(shù)據(jù)倉(cāng)庫(kù)獲得。
2.數(shù)據(jù)整理。收集到的數(shù)據(jù)中,可能存在有問(wèn)題的數(shù)據(jù),所以要簡(jiǎn)單地進(jìn)行處理,從而在原始的數(shù)據(jù)基礎(chǔ)上得到更為可信的數(shù)據(jù)信息,為下一步的工作做準(zhǔn)備。
3.數(shù)據(jù)挖掘。這是最重要的一個(gè)環(huán)節(jié),要對(duì)收集整理后的數(shù)據(jù)通過(guò)各種方法進(jìn)行深度分析,常用的方法有遺傳算法、神經(jīng)元網(wǎng)絡(luò)、決策樹(shù)和OLAP聯(lián)機(jī)分析等。數(shù)據(jù)挖掘的的工具主要有兩類(lèi):一類(lèi)是專(zhuān)用數(shù)據(jù)挖掘工具,可以針對(duì)某個(gè)特定的領(lǐng)域充分考慮數(shù)據(jù)需求的特殊性,提供優(yōu)化解決方案;另一類(lèi)是通用數(shù)據(jù)挖掘工具,可以處理常見(jiàn)的數(shù)據(jù)類(lèi)型,提供通用的處理模式,如回歸模式、時(shí)間序列模式和關(guān)聯(lián)模式等[12~14]。
4.數(shù)據(jù)挖掘結(jié)果評(píng)估。進(jìn)過(guò)數(shù)據(jù)挖掘得到的結(jié)論很多,但是有些跟我們要研究的內(nèi)容不符,所以要對(duì)結(jié)果進(jìn)行評(píng)估,進(jìn)而調(diào)整數(shù)據(jù)挖掘模型,重復(fù)進(jìn)行數(shù)據(jù)挖掘。
5.分析決策。數(shù)據(jù)挖掘的最終目的是幫助決策者做出決策,決策者可以根據(jù)數(shù)據(jù)挖掘的結(jié)果,結(jié)合實(shí)際情況,做出戰(zhàn)略決策。
(二)數(shù)據(jù)挖掘的主要任務(wù)
1.數(shù)據(jù)總結(jié)。數(shù)據(jù)總結(jié)是對(duì)數(shù)據(jù)的一個(gè)濃縮整理過(guò)程,對(duì)數(shù)據(jù)進(jìn)行綜合描述,將數(shù)據(jù)庫(kù)中關(guān)聯(lián)的數(shù)據(jù)從個(gè)體總結(jié)到總體層次上,實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的總體把握。
2.數(shù)據(jù)分類(lèi)。通過(guò)分類(lèi)器(分類(lèi)函數(shù)或者分類(lèi)模型)將基礎(chǔ)數(shù)據(jù)根據(jù)屬性分到不同的組中,并找到同組數(shù)據(jù)的屬性模型,利用該模型分析已有的數(shù)據(jù)并預(yù)測(cè)新數(shù)據(jù)將屬于哪一組。
3.關(guān)聯(lián)分析。關(guān)聯(lián)分析可以找到一組數(shù)據(jù)隱藏的關(guān)聯(lián)網(wǎng),但這種關(guān)聯(lián)度具有不確定性,所以在進(jìn)行關(guān)聯(lián)描述時(shí)要確定置信度,從而反映數(shù)據(jù)的關(guān)聯(lián)強(qiáng)度[15]。
4.聚類(lèi)分析。當(dāng)某些數(shù)據(jù)通過(guò)分類(lèi)器分不到任何已有的組中時(shí),可以選擇聚類(lèi)分析,將這些數(shù)據(jù)按照某種相近程度聚類(lèi)成一類(lèi)有意義的子集合,每一個(gè)子集合的數(shù)據(jù)屬性相似,但不同子集合之間的數(shù)據(jù)屬性相差很大。
稅收管理已進(jìn)入大數(shù)據(jù)時(shí)代,要想在海量數(shù)據(jù)中尋求規(guī)律,為稅收管理工作提供數(shù)據(jù)支撐,就必須掌握科學(xué)的分析方法,再結(jié)合數(shù)據(jù)挖掘技術(shù)和大數(shù)據(jù)思維模式,實(shí)現(xiàn)用數(shù)據(jù)說(shuō)話,從根本上加強(qiáng)稅源管理和稅務(wù)監(jiān)督。
[1]王海森.關(guān)于稅收數(shù)據(jù)深度分析應(yīng)用的思考[J].信息技術(shù)與信息化,2007,(8):25-28.
[2]和家鳳,何少武.大數(shù)據(jù)時(shí)代的納稅評(píng)估信息采集模式[J].財(cái)經(jīng)理論與實(shí)踐,2015,(3):98-98.
[3]王向東,王文匯,王再堂.大數(shù)據(jù)時(shí)代下我國(guó)稅收征管模式轉(zhuǎn)型的機(jī)遇與挑戰(zhàn)[J].當(dāng)代經(jīng)濟(jì)研究,2014,(8):92-96.
[5]張社安.依托大數(shù)據(jù),構(gòu)建稅收共治格局[N].中國(guó)稅務(wù)報(bào),2016-03-23.
[6]孫開(kāi),沈昱池.大數(shù)據(jù)——構(gòu)建現(xiàn)代稅收征管體系的推進(jìn)器[J].稅務(wù)研究,2015,(1):96-99.
[7]任東飚,費(fèi)銘海,袁明昌.稅收數(shù)據(jù)在大數(shù)據(jù)中的利用探析[J].稅務(wù)研究,2015,(10):25-28.
[8]白子千,李晶晶,杜嘉.試析大數(shù)據(jù)時(shí)代的稅收管理[J].企業(yè)改革與管理,2016,(4):11.
[9]周詠琦.大數(shù)據(jù)對(duì)電子商務(wù)稅收征管的影響[J].經(jīng)營(yíng)與管理,2016,(4):15-17.
[10]李淵.大數(shù)據(jù)時(shí)代強(qiáng)化稅源管理的思考[J].經(jīng)濟(jì)論壇,2016,(3):123-128.
[11]Power DJ.Using“Big Data”for analytics and decision support[J].Journal of Decision Systems,2014,(2):222-228.
[12]夏琰.基于數(shù)據(jù)挖掘技術(shù)的稅務(wù)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用平臺(tái)建設(shè)[D].杭州:浙江工業(yè)大學(xué),2012.
[13]許藝.基于數(shù)據(jù)挖掘的零散稅收預(yù)測(cè)研究[D].武漢:武漢理工大學(xué),2013.
[14]張升文,張少仲.數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘和OLAP分析及其應(yīng)用實(shí)例[J].危機(jī)發(fā)展,2002,(1):22-23.
[15]劉以堂,張述成.關(guān)聯(lián)規(guī)則在稅收征管中的應(yīng)用[J].科技創(chuàng)新導(dǎo)報(bào),2012,(17):27-28.
[責(zé)任編輯陳麗敏]
F810.42
A
1673-291X(2016)22-0073-02
2016-07-16
張翼(1966-),男,福建惠安人,局長(zhǎng),工程師,碩士,從事大數(shù)據(jù)開(kāi)發(fā)與應(yīng)用、稅收理論、稅收籌劃研究;陳清晰(1974-),男,福建廈門(mén)人,政策法規(guī)科科長(zhǎng),碩士,從事大數(shù)據(jù)開(kāi)發(fā)與應(yīng)用、稅收理論研究。