摘 要:杭州市拱墅區(qū)招商局要將稅收績效數(shù)據(jù)和固定資產(chǎn)實(shí)際數(shù)據(jù)錄入杭州市招商統(tǒng)計(jì)系統(tǒng)中,在數(shù)據(jù)錄入之前要先對數(shù)據(jù)進(jìn)行整理、計(jì)算、統(tǒng)計(jì),由于數(shù)據(jù)量大,Excel中統(tǒng)計(jì)方法不夠強(qiáng)大。本文論述了從Excel文件到SQL Server的數(shù)據(jù)遷移,并利用SQL Server中強(qiáng)大的數(shù)據(jù)查詢和分析功能,對杭州市拱墅區(qū)招商局的數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)計(jì)算,生成表格后,重新導(dǎo)出到Excel的過程并給出了關(guān)鍵代碼。
關(guān)鍵詞:Excel;SQL Server;數(shù)據(jù)統(tǒng)計(jì)
中圖分類號:TP311
SQL Server數(shù)據(jù)庫查詢速度快,查詢能力豐富,對數(shù)據(jù)集合的解決方法相當(dāng)多,特別是數(shù)據(jù)多的時候,優(yōu)勢特明顯。由于杭州市拱墅區(qū)招商局平時在Excel中有多個臺帳,每個臺帳上千條記錄,十幾個分部要匯總,而且每月都在增長,速度明顯在下降。另外,Excel速度慢,且查詢分組計(jì)算功能相對SQL Server來說相對薄弱。用SQL Server解決數(shù)據(jù)錄入、匯總、存儲和函數(shù)計(jì)算分析處理更方便。
1 項(xiàng)目需求分析
杭州市拱墅區(qū)招商局要將稅收績效數(shù)據(jù)和固定資產(chǎn)實(shí)際數(shù)據(jù)錄入杭州市招商統(tǒng)計(jì)系統(tǒng)中。從圖1可以看到,需要錄入到系統(tǒng)的數(shù)據(jù)有外地投資方股權(quán)比重、稅收總額和稅務(wù)登記證號,其中稅務(wù)登記證號表中直接就有記錄,但是外地投資方股權(quán)比重和稅收總額需要對多個臺賬進(jìn)行統(tǒng)計(jì)計(jì)算才能得到。
圖1 杭州市招商統(tǒng)計(jì)系統(tǒng)中需錄入的數(shù)據(jù)
杭州市拱墅區(qū)招商局目前主要是這三張excel表格,內(nèi)容見表1、表2、表3。每張表內(nèi)容都有6000多條,內(nèi)容較多而雜。
表1 2014年1-11月份的企業(yè)收入情況
表2 2013年12月份企業(yè)收入情況
表3 各個企業(yè)已投資額情況
2 項(xiàng)目實(shí)現(xiàn)過程
首先將表1、表2、表3導(dǎo)入SQL Server數(shù)據(jù)庫中,作為數(shù)據(jù)庫中的三張表,表名分別為表1、表2、表3。接下去就通過SQL代碼來實(shí)現(xiàn)對外地股權(quán)占比及稅收總額的計(jì)算和分析。
2.1 對表1和表2中的稅收總額求和
現(xiàn)要對表1和表2中稅號相同的企業(yè)收入(企業(yè)稅收總額)求和。表1中是2014年1-11月的稅收總額,表2中是2013年12月份的稅收總額。先對表1和表2中的稅收相加,但是難點(diǎn)是表1和表2中的稅號和企業(yè)名稱部分相同,部分不相同,且不對應(yīng)。所以如果直接在Excel中很難實(shí)現(xiàn)。由于要保留兩張表中不能相互匹配的企業(yè),所以采用全外連接來實(shí)現(xiàn)。
實(shí)現(xiàn)代碼如下:
圖2
2.2 求出表3中外地股權(quán)占比
見表3,已投資額分為杭州方和外地方,現(xiàn)在要求出外地方與總投資額的比值。公式為:
外地股權(quán)占比=工商注冊代碼相同的企業(yè)的(D項(xiàng)+E項(xiàng))/(C+D+E)*100。
但是表3中可見,每個相同工商注冊代碼都有三條或多條記錄,所以在求出比值之前,需要先對工商注冊代碼進(jìn)行分組,求出每個工商注冊代碼的杭州方及外地方的總投資額。
實(shí)現(xiàn)代碼如下:
圖3
2.3 求每個企業(yè)的稅收總額和外地股權(quán)占比
求出每個企業(yè)的稅收總額和外地股權(quán)占比,由于稅收總額和外地股權(quán)占比在兩張不同的表中,因此,通過連接查詢將稅收總額和外地股權(quán)占比查出來,將企業(yè)名稱作為關(guān)鍵字進(jìn)行匹配。
實(shí)現(xiàn)代碼如下:
圖4
得到了我們想要的稅收總額和外地股權(quán)占比,將最后需要的表從SQL Server導(dǎo)出到Excel中[1],最后將Excel中的數(shù)據(jù)導(dǎo)入到杭州市招商統(tǒng)計(jì)系統(tǒng)中,就完成了整個數(shù)據(jù)的錄入工作。
3 結(jié)束語
實(shí)現(xiàn)SQL Server數(shù)據(jù)庫Excel數(shù)據(jù)表的數(shù)據(jù)導(dǎo)入導(dǎo)出功能。數(shù)據(jù)導(dǎo)入導(dǎo)出功能簡化了數(shù)據(jù)錄入的工作,降低了建立數(shù)據(jù)庫的工作量,同時也很好的實(shí)現(xiàn)了報表輸出功能。而且SQL Server中強(qiáng)大的查詢分析數(shù)據(jù)的功能,輕松快速的實(shí)現(xiàn)了對于Excel中多個Sheet中的數(shù)據(jù)的統(tǒng)計(jì)歸納和計(jì)算。
參考文獻(xiàn):
[1]王曉剛,楊春金.Excel到SQL Server數(shù)據(jù)庫的數(shù)據(jù)導(dǎo)入導(dǎo)出技術(shù)研究[J].計(jì)算機(jī)與數(shù)字工程.2007(03)
作者簡介:胡丹桂(1980-),女,浙江永康人,教師,講師,博士研究生,研究方向:時空統(tǒng)計(jì)及GIS開發(fā)。
作者單位:武漢職業(yè)技術(shù)學(xué)院,湖北武漢 430074;杭州市拱墅區(qū)招商局,浙江杭州 310015