[摘 要]針對(duì)當(dāng)前納稅評(píng)估中存在的問(wèn)題,構(gòu)建了納稅評(píng)估指標(biāo)體系,提出了基于支持向量機(jī)(SVM)和領(lǐng)域知識(shí)的納稅評(píng)估預(yù)警模型,該模型可以很好地對(duì)企業(yè)的納稅情況進(jìn)行分析和判別,有利于稅務(wù)部門(mén)開(kāi)展稅收調(diào)查工作。
[關(guān)鍵詞]稅收 支持向量機(jī) 預(yù)警 增值稅
一、序言
稅收是國(guó)家的經(jīng)濟(jì)命脈和財(cái)力基礎(chǔ)。稅收是政府財(cái)政取得收入的最主要來(lái)源,是政府為滿足公共需要而向社會(huì)提供公共產(chǎn)品的成本和費(fèi)用,也為政府實(shí)施宏觀經(jīng)濟(jì)調(diào)控聚斂了必要的財(cái)力。
納稅評(píng)估工作是現(xiàn)代征管模式下的一種新的稅收征管方式,它是利用信息化平臺(tái),對(duì)基礎(chǔ)稅收信息進(jìn)行加工處理,從而對(duì)納稅人納稅情況進(jìn)行評(píng)價(jià)的一種新的管理模式。具體來(lái)說(shuō)就是要根據(jù)稅收征管中獲得的納稅人的生產(chǎn)經(jīng)營(yíng)、財(cái)務(wù)核算情況等主要指標(biāo)信息,對(duì)納稅情況的真實(shí)性、準(zhǔn)確性、合法性進(jìn)行審核、分析和綜合評(píng)定,通過(guò)檢查或稽查,及時(shí)發(fā)現(xiàn)、糾正和處理納稅行為中的錯(cuò)誤,并對(duì)異常申報(bào)等專(zhuān)項(xiàng)問(wèn)題進(jìn)行調(diào)查研究和分析評(píng)價(jià),為征收、管理、稽查提供工作重點(diǎn)和措施建議,從而對(duì)征納情況進(jìn)行全面、實(shí)時(shí)監(jiān)控。納稅評(píng)估的核心工作就是根據(jù)相關(guān)的涉稅信息,運(yùn)用一定技術(shù)手段來(lái)識(shí)別、評(píng)判納稅人的誠(chéng)信水平。
因而納稅評(píng)估工作是既能經(jīng)濟(jì)可行地達(dá)到稅收管理目標(biāo),又能竭誠(chéng)服務(wù)于納稅人和社會(huì)的一項(xiàng)舉措,有利于轉(zhuǎn)變政府工作方式,服務(wù)于社會(huì)經(jīng)濟(jì)的和諧進(jìn)步。
二、納稅評(píng)估的現(xiàn)狀
1998年開(kāi)始實(shí)行的《外商投資企業(yè)、外國(guó)企業(yè)和外籍個(gè)人納稅申報(bào)審核評(píng)稅辦法》,標(biāo)志著我國(guó)納稅評(píng)估實(shí)踐的正式開(kāi)始。2001年底,國(guó)家稅務(wù)總局根據(jù)我國(guó)商貿(mào)企業(yè)增值稅征管中存在的問(wèn)題和對(duì)商貿(mào)企業(yè)增值稅征管制度改革的需要,制定印發(fā)了《商貿(mào)企業(yè)增值稅納稅評(píng)估辦法》,要求對(duì)商貿(mào)企業(yè)的增值稅開(kāi)展納稅評(píng)估,通過(guò)銷(xiāo)售變動(dòng)率和稅負(fù)差異這兩個(gè)核心指標(biāo)對(duì)商貿(mào)企業(yè)進(jìn)行納稅評(píng)估,以進(jìn)一步堵塞商貿(mào)企業(yè)增值稅的稅收漏洞。
2007年,江門(mén)市國(guó)稅局結(jié)合全市重點(diǎn)行業(yè)的特點(diǎn),組織轄下各市(區(qū))局對(duì)摩托車(chē)及零配件生產(chǎn)經(jīng)營(yíng)行業(yè)、五金衛(wèi)浴產(chǎn)業(yè)、造紙業(yè)、不銹鋼五金制品業(yè)、化工行業(yè)、麥克風(fēng)及配件、制鞋業(yè)和制傘業(yè)制造業(yè)等8個(gè)行業(yè)開(kāi)展了增值稅重點(diǎn)行業(yè)的納稅評(píng)估。
納稅評(píng)估中最為關(guān)鍵的環(huán)節(jié)就是建立科學(xué)合理的納稅評(píng)估指標(biāo)和預(yù)警值測(cè)算體系。雖然國(guó)家稅務(wù)總局已經(jīng)于2005年頒布了《納稅評(píng)估管理辦法(試行)》,提出了《納稅評(píng)估通用分析指標(biāo)及其使用方法》和《納稅評(píng)估分稅種特定分析指標(biāo)及其使用方法》,但是當(dāng)前納稅評(píng)估還存在以下不足:(1)納稅評(píng)估主體指標(biāo)設(shè)計(jì)不科學(xué),難以評(píng)價(jià)納稅人行為;(2)納稅評(píng)估信息過(guò)分依賴于納稅人會(huì)計(jì)報(bào)表,不能有效評(píng)估納稅經(jīng)營(yíng);(3)沒(méi)有形成科學(xué)的納稅評(píng)估體系;(4)納稅評(píng)估系統(tǒng)建設(shè)滯后,納稅評(píng)估效率較低;(5)納稅評(píng)估指標(biāo)預(yù)警值測(cè)算體系不夠完善。
綜合以上分析,可知目前還沒(méi)有一套完善的納稅評(píng)估指標(biāo)預(yù)警值測(cè)算體系,這對(duì)納稅評(píng)估的后續(xù)工作影響加大。因此,對(duì)納稅評(píng)估體系和預(yù)警模型的研究具有十分重要的意義,它可以為當(dāng)前的稅務(wù)評(píng)估工作提供有效的參考依據(jù)。
三、基于SVM的納稅評(píng)估模型
支持向量機(jī)(Support Vector Machine,SVM)是Vapnik等人在1963年提出的用于解決模式識(shí)別問(wèn)題的支持向量方法。該方法最初來(lái)自對(duì)于二值分類(lèi)問(wèn)題的處理,其起機(jī)理可以簡(jiǎn)單的描述為:在樣本空間中尋找一個(gè)將訓(xùn)練集中的正例和反例樣本分割開(kāi)來(lái)的超平面,并使其兩側(cè)的空白域最大,如圖1所示:
實(shí)心點(diǎn)和空心點(diǎn)分別表示兩類(lèi)的訓(xùn)練樣本,H為分類(lèi)面,H1、H2分別為過(guò)各類(lèi)樣本中離分類(lèi)線最近的點(diǎn)且平行于分類(lèi)的直線,H1和H2之間的距離叫做兩類(lèi)的分類(lèi)空隙或分類(lèi)間(Margin)。所謂最優(yōu)分類(lèi)面就是要求分類(lèi)線不但能將兩類(lèi)無(wú)誤地分開(kāi),而且要使兩類(lèi)的分類(lèi)間隔最大。前者是保證經(jīng)驗(yàn)風(fēng)最小,使分類(lèi)間隔最大實(shí)際上就是使推廣性的界中的置信范最小,從而使真實(shí)風(fēng)險(xiǎn)最小。推廣到高維空間,最優(yōu)分類(lèi)線就為最優(yōu)分類(lèi)面。
設(shè)線性可分樣本集為:。所有在這個(gè)超平面上的點(diǎn)滿足,是超平面的法向量。那么尋找最優(yōu)平面的問(wèn)題為最小化:使其滿足
這里是w的凸函數(shù),于是上面的問(wèn)題轉(zhuǎn)化為約束條件下最優(yōu)化求解問(wèn)題??梢杂美窭嗜辗椒ㄇ蠼?。則有拉格朗日方程:
對(duì)于線性不可分問(wèn)題,則將其映射到一個(gè)高維空間中,在該間中線性可分,并且線性判決只需要在高維空間中進(jìn)行內(nèi)積算,甚至不需要知道采用的非線性變換的形式,所以避開(kāi)了高變化計(jì)算的問(wèn)題,使問(wèn)題大大簡(jiǎn)化。
納稅評(píng)估從實(shí)際操作中來(lái)看,也是屬于2類(lèi)分類(lèi)的問(wèn)題,一類(lèi)是納稅情況正常的,一類(lèi)是有問(wèn)題的(偷稅漏稅)。因此,可以考慮使用支持向量機(jī)來(lái)對(duì)納稅企業(yè)進(jìn)行分類(lèi),并且由于納稅企業(yè)數(shù)量較大,指標(biāo)數(shù)量較多,也適用于提高支持向量機(jī)分類(lèi)模型的訓(xùn)練和測(cè)試效果。
四、模型的應(yīng)用
1. SVM分類(lèi)
本文根據(jù)江門(mén)市產(chǎn)業(yè)結(jié)構(gòu)的特點(diǎn),選取金屬制品行業(yè)的納稅評(píng)估的對(duì)象,結(jié)合本人實(shí)際的工作經(jīng)驗(yàn),參考已有的評(píng)估指標(biāo)體系,并經(jīng)過(guò)數(shù)據(jù)的相關(guān)性分析,最終選擇以下指標(biāo)作為評(píng)估的對(duì)象,各指標(biāo)的數(shù)據(jù)編碼如表1所示。
表1 指標(biāo)數(shù)據(jù)編碼
增值稅稅負(fù)率(累計(jì))ZB005增值稅稅負(fù)差異率(累計(jì))ZB007
增值稅稅負(fù)變動(dòng)率(累計(jì)同比)ZB010主營(yíng)業(yè)務(wù)成本變動(dòng)率(累計(jì)同比)ZB036
銷(xiāo)售毛利率(累計(jì))ZB015增值稅稅收貢獻(xiàn)增長(zhǎng)率(累計(jì)同比)ZB082
主營(yíng)業(yè)務(wù)收入變動(dòng)率(累計(jì)同比)ZB039存貨月周轉(zhuǎn)率(累計(jì)平均)ZB083
由于實(shí)際的樣本數(shù)據(jù)不全,且在數(shù)據(jù)的錄入過(guò)程中可能存在誤差,因此,在用模型對(duì)數(shù)據(jù)進(jìn)行計(jì)算之前,首先要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:
(1)對(duì)于各樣本的某個(gè)指標(biāo),如果對(duì)應(yīng)的數(shù)據(jù)均不存在,則舍去該指標(biāo)。
(2)對(duì)于少數(shù)樣本的某個(gè)指標(biāo),如果對(duì)應(yīng)的數(shù)據(jù)不存在,則結(jié)合實(shí)際情況,對(duì)比類(lèi)似的樣本數(shù)據(jù),按照數(shù)據(jù)平滑處理的方法,給該樣本的指標(biāo)賦值。
(3)由于各指標(biāo)數(shù)據(jù)的單位不統(tǒng)一,導(dǎo)致模型求解的結(jié)果會(huì)偏離實(shí)際情況,因此要求先把樣本數(shù)據(jù)做歸一化處理。經(jīng)預(yù)處理完的樣本數(shù)據(jù)(部分)如表2所示。
由于支持向量機(jī)分類(lèi)模型在訓(xùn)練前需要確定樣本的類(lèi)別,在本文所使用的樣本指標(biāo)體系中,根據(jù)實(shí)際操作經(jīng)驗(yàn)總結(jié)可知,稅負(fù)率是反映一個(gè)企業(yè)納稅正常與否最重要的衡量指標(biāo),因此本文以金屬制品行業(yè)的平均稅負(fù)率作為衡量的標(biāo)準(zhǔn),如果某個(gè)樣本的稅負(fù)率低于該行業(yè)平均稅負(fù)率的20%,則認(rèn)為該企業(yè)的納稅情況有問(wèn)題,該樣本屬于不正常的樣本,其他情況下的樣本則屬于正常樣本。以此為標(biāo)準(zhǔn)把樣本數(shù)據(jù)分為2類(lèi),一類(lèi)是正常樣本,類(lèi)別號(hào)為1,另一類(lèi)屬于不正常的樣本,類(lèi)別號(hào)為-1。
本模型使用的樣本數(shù)一共是47個(gè),為了實(shí)現(xiàn)本文所構(gòu)建模型的分類(lèi)效果,首先把樣本數(shù)據(jù)分為2部分,前40個(gè)樣本作為訓(xùn)練樣本,目的確定模型的最優(yōu)參數(shù)值,最后7個(gè)樣本作為測(cè)試樣本,以檢驗(yàn)?zāi)P偷姆诸?lèi)效果。
SVM分類(lèi)模型為:[alpha,b]=trainlssvm({X,Y,type,gam,sig2,'RBF_kernel'});(4)
其中type的值是“classification”,表示使用分類(lèi)的方法。X為訓(xùn)練樣本,Y是各樣本對(duì)應(yīng)的分類(lèi)號(hào)組成的數(shù)組。經(jīng)過(guò)訓(xùn)練樣后確定的參數(shù)值分別是:
Gam=60;sig2=1.5;ker=RBF_kernel;b= -0.041146; (5)
根據(jù)上述確定的模型,將測(cè)試樣本代入模型進(jìn)行計(jì)算, 可以把樣本劃分為2種類(lèi)型,以下分別是測(cè)試分類(lèi)結(jié)果和實(shí)際的分類(lèi)結(jié)果,如表3所示。
根據(jù)上述表格的數(shù)據(jù)對(duì)比可知,除了測(cè)試樣本42類(lèi)別判別有誤,其余6個(gè)樣本的類(lèi)別分類(lèi)正確,準(zhǔn)確度為85.7%,測(cè)試樣本的分類(lèi)結(jié)果比較好,是可以接受的。對(duì)于新的樣本數(shù)據(jù),經(jīng)標(biāo)準(zhǔn)化處理后,使用該模型可以計(jì)算出其類(lèi)別號(hào),如果是-1,則說(shuō)明該樣本有問(wèn)題,如果是+1,則屬于正常樣本。
2. 結(jié)合領(lǐng)域知識(shí)分析
由支持向量機(jī)分類(lèi)篩選出來(lái)樣本號(hào)為-1的樣本數(shù)據(jù),可能存在一定的問(wèn)題,為了確認(rèn)其問(wèn)題所在,依據(jù)該行業(yè)各指標(biāo)的平均值,做進(jìn)一步的分析。首先使用相關(guān)性分析,求出指標(biāo)體系中8個(gè)輸入指標(biāo)和樣本類(lèi)別的相關(guān)系數(shù),如表4所示。
從以上的計(jì)算結(jié)果可知,與納稅結(jié)果關(guān)系最大的影響因子,分別是X1、X2、X4,也就是說(shuō)這3個(gè)指標(biāo)的變化將會(huì)在很大程度上決定納稅的結(jié)果好壞,因此我們通過(guò)分析這3個(gè)指標(biāo)的實(shí)際值與該行業(yè)的平均值的差異性,就可以基本確定該樣本是否存在問(wèn)題。
根據(jù)SVC分類(lèi)模型的測(cè)試,發(fā)現(xiàn)42號(hào)樣本的分類(lèi)結(jié)果與實(shí)際的情況不相符,因此以該樣本為例,分析它各指標(biāo)數(shù)據(jù)的情況,該樣本的數(shù)據(jù)以及行業(yè)平均數(shù)據(jù)對(duì)比如表5所示。
為了便于判斷該樣本是否有問(wèn)題,結(jié)合統(tǒng)計(jì)分析方法和實(shí)際的操作經(jīng)驗(yàn)設(shè)置一個(gè)判別的原則:如果3個(gè)指標(biāo)與行業(yè)指標(biāo)的平均值的差的平方和大于0.1,則認(rèn)為該樣本是有問(wèn)題的,應(yīng)該要對(duì)該企業(yè)的納稅情況做深入的調(diào)查,否則不予調(diào)查。根據(jù)該樣本和平均值的數(shù)據(jù),計(jì)算所得的值是0.123,大于0.1。因此可以認(rèn)為該企業(yè)的納稅情況是不正常的,需要對(duì)企業(yè)的稅收情況進(jìn)行實(shí)際的調(diào)查,以確定問(wèn)題所在。
五、結(jié)論
本文結(jié)合江門(mén)中小企業(yè)企業(yè)納稅的實(shí)際情況,構(gòu)建了稅務(wù)評(píng)估的指標(biāo)體系,并提出了基于SVC和領(lǐng)域知識(shí)的預(yù)警模型,為稅務(wù)評(píng)估工作提供了一個(gè)新的、有效的途徑。
參考文獻(xiàn):
[1]呂新利:對(duì)納稅評(píng)估理實(shí)踐的思考[EB/OL]. 中國(guó)稅網(wǎng),2009,2
[2]崔源潮:納稅評(píng)估若干問(wèn)題思考[J]. 稅務(wù)研究. 2009,5
[3]史文軍:納稅評(píng)估理論與實(shí)踐[J].稅務(wù)研究.2000,7
[4]譚光榮:選擇納稅評(píng)估指標(biāo)的局限性及應(yīng)對(duì)措施[J]. 稅務(wù)研究. 2007,02
[5]陳繼陽(yáng):建立科學(xué)納稅評(píng)估指標(biāo)體系 提高納稅評(píng)估水平[J]. 黑龍江對(duì)外經(jīng)貿(mào).2007,05
[6]徐 戎 王文杰 周四新:神經(jīng)網(wǎng)絡(luò)與領(lǐng)域知識(shí)結(jié)合的納稅評(píng)估預(yù)警模型[J]. 電子科技大學(xué)學(xué)報(bào), 2009,01
[7]李 晶 姚明海:基于支持向量機(jī)的語(yǔ)義圖像分類(lèi)研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展,2010,2