艾琳 宋瑜輝 張俠 王慧婷
摘要:基于當前發(fā)票電子化在企業(yè)信息管理系統(tǒng)的深度應用,本文提出構(gòu)建新型企業(yè)級發(fā)票池綜合管理平臺的處理解決方案。同時,利用成熟的大數(shù)據(jù)技術(shù)優(yōu)勢進行技術(shù)框架設計,構(gòu)建高并發(fā),高可靠性服務平臺,為業(yè)務系統(tǒng)提供發(fā)票數(shù)據(jù)支撐,為稅務指標監(jiān)控與發(fā)票綜合分析等提供數(shù)據(jù)支撐。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;電子發(fā)票
中圖分類號: TP311 ? ? ? ?文獻標識碼:A
文章編號:1009-3044(2020)34-0027-02
當前,“金稅三期”全面升級,“互聯(lián)網(wǎng)+稅務”持續(xù)推進, 增值稅發(fā)票電子化及新稅控應用模式轉(zhuǎn)變實質(zhì)上是整個發(fā)票管理體制的重大調(diào)整和變革,集團型企業(yè)稅務管理必須主動適應新形勢,向數(shù)字化運營、智能化管理轉(zhuǎn)型。
基于國家電網(wǎng)公司在江蘇、福建、山東等省電子發(fā)票池綜合管理平臺的應用實踐得出,企業(yè)電子發(fā)票池綜合管理平臺建設已成為推進財稅管理信息化的重要舉措。大中型企業(yè)利用大數(shù)據(jù)與云平臺技術(shù)優(yōu)勢,對接稅務總局大數(shù)據(jù)平臺,采集進銷項發(fā)票全量數(shù)據(jù),形成企業(yè)級“發(fā)票池”。依托此平臺,解決企業(yè)增值稅發(fā)票多業(yè)務部門、多入口驗票處理,多業(yè)務系統(tǒng)重復應用、月底海量發(fā)票集中登錄稅局網(wǎng)站,掃描或勾選認證時效性差等問題。
進而實現(xiàn)發(fā)票縱向數(shù)據(jù)全量貫通、橫向數(shù)據(jù)全面整合,基于發(fā)票全量數(shù)據(jù)、指標數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)展示,實現(xiàn)財稅管理全過程、全視角洞察。
1 業(yè)務與技術(shù)研究
1.1 業(yè)務研究
從當前多業(yè)務鏈條綜合分析來看,各類業(yè)務的交易結(jié)算過程按照業(yè)務環(huán)節(jié)不同,分布在各業(yè)務系統(tǒng)、財務系統(tǒng)、資金系統(tǒng)中進行處理;從交易業(yè)務單側(cè)鏈條看,合同簽約、收/發(fā)貨、服務提供/確認、發(fā)票開具/接收、財務結(jié)算、資金收付等交易環(huán)節(jié)分布在各業(yè)務管理部門及信息系統(tǒng)中;從交易雙方的全鏈條看,目前尚無針對購銷雙方交易結(jié)算過程進行監(jiān)管的信息化手段,尤其對于公司外部客戶及供應商而言,缺乏交易數(shù)據(jù)監(jiān)管的系統(tǒng)支撐。
結(jié)合國家電網(wǎng)等大中型企業(yè)的管理應用實踐分析,建立財稅系統(tǒng)與企業(yè)級發(fā)票池一體化應用體系,確保財務數(shù)據(jù)與發(fā)票全量數(shù)據(jù)實時核對并對差異提出預警。另一方面,在發(fā)票認證所屬期經(jīng)過篩選后,把符合認證的增值稅專用發(fā)票進行批量勾選,直接在企業(yè)發(fā)票池發(fā)起認證,并自動核對發(fā)票金額與憑證過賬金額。此應用模式改變多崗位手工核對稅票與賬務一致性,稅務專責登錄稅局網(wǎng)站勾選認證低效煩瑣等傳統(tǒng)工作模式。基于入池后的巨量發(fā)票信息,結(jié)合實時獲取的稅局發(fā)票底賬數(shù)據(jù),企業(yè)可積極利用寶貴的涉稅數(shù)字資源,針對增值稅發(fā)票數(shù)據(jù)做大量涉稅分析,并對發(fā)票狀態(tài)全程監(jiān)管進行深度探索。
通過企業(yè)級發(fā)票池綜合管理平臺建設,實現(xiàn)票據(jù)業(yè)務全過程、全角度展現(xiàn),確保發(fā)票信息更新及時,業(yè)務信息深度共享。以企業(yè)數(shù)據(jù)中臺建設為契機,依托發(fā)票池基礎(chǔ)數(shù)據(jù)的廣泛聚合,打造企業(yè)財稅智慧應用中心。基于全量發(fā)票數(shù)據(jù)關(guān)聯(lián)分析,配置靈活拓展的財稅洞察應用場景,改善用戶數(shù)據(jù)應用體驗;依托大數(shù)據(jù)和發(fā)票云平臺等技術(shù)支撐,打造基于發(fā)票平臺的高階數(shù)據(jù)服務,形成財稅數(shù)字管理超級視野。
1.2 系統(tǒng)設計和實現(xiàn)研究
搭建企業(yè)級發(fā)票池綜合管理平臺,在設計時需考慮對海量數(shù)據(jù)的處理分析,傳統(tǒng)關(guān)系型數(shù)據(jù)庫技術(shù)對于海量數(shù)據(jù)的處理已不能夠滿足要求,不但開發(fā)成本高、效率低、擴展性能差,最大的問題是難以滿足業(yè)務發(fā)展需求,數(shù)據(jù)量一旦增大,這部分問題將成為瓶頸。然而,基于大數(shù)據(jù)技術(shù)能夠很好地解決這個難題,且其成本低、擴展性能好、數(shù)據(jù)安全可靠等優(yōu)勢。
系統(tǒng)的基本設計思路是:從數(shù)據(jù)層、服務層、應用層三方面進行設計。數(shù)據(jù)層包括數(shù)據(jù)源、數(shù)據(jù)接入、數(shù)據(jù)存儲,其中數(shù)據(jù)源包含手工錄用、集成稅局抵賬庫、開票終端等;對數(shù)據(jù)源的接入方式包括利用kafka接收實時數(shù)據(jù)、OCR識別發(fā)票信息錄入、http接入第三方數(shù)據(jù)集成。數(shù)據(jù)存儲分為傳統(tǒng)關(guān)系型數(shù)據(jù)存儲和基于hadoop/hbase/hive/redis的分布式數(shù)據(jù)庫。其中,熱點數(shù)據(jù)存儲到內(nèi)存數(shù)據(jù)庫Redis中,可提供微秒級別的響應速度;實時非結(jié)構(gòu)化數(shù)據(jù)存儲到分布式數(shù)據(jù)庫Hbase中;非實時類數(shù)據(jù)存儲到hadoop/hive中。服務層包括數(shù)據(jù)分析和數(shù)據(jù)服務兩個模塊,數(shù)據(jù)分析主要通過大數(shù)據(jù)分析平臺spark、impala等工具對數(shù)據(jù)進行數(shù)據(jù)挖掘,分析處理(采用機器學習等),生成報表,提供管理決策支持;數(shù)據(jù)服務主要采用微服務架構(gòu),以微服務方式對外提供各種數(shù)據(jù)可視化、數(shù)據(jù)預測等服務;應用層主要提供企業(yè)門戶portal、移動終端接入、分析功能;系統(tǒng)整體架構(gòu)設計如下:
2 關(guān)鍵技術(shù)研究
整個解決方案的實現(xiàn)關(guān)鍵在于幾個重要問題的解決,其中發(fā)票全量入池、發(fā)票認證和數(shù)據(jù)分析是重要的數(shù)據(jù)處理邏輯模塊,以下對這3個模塊進行詳細描述。
2.1 發(fā)票全量入池過程
隨著接入用戶數(shù)的快速增長,發(fā)票數(shù)據(jù)源的多樣化,對發(fā)票全量入池處理環(huán)節(jié)提出了更高的要求。因此,通過引入分布式并行計算、實時處理技術(shù)與分布式存儲技術(shù),改造與關(guān)系數(shù)據(jù)庫混搭的技術(shù)架構(gòu),提高發(fā)票錄入的處理速度。
其中,企業(yè)發(fā)票底賬的獲取,需要構(gòu)建與國稅驗證云服務平臺間的數(shù)據(jù)通道,通過內(nèi)外網(wǎng)電子底賬代理服務定時從稅局獲取企業(yè)所屬增值稅發(fā)票底賬數(shù)據(jù)信息;實體發(fā)票信息的獲取,通過統(tǒng)一發(fā)票簽收入口規(guī)范,利用OCR識別技術(shù)或掃描二維碼技術(shù)提取增值稅發(fā)票相關(guān)信息。
以增值稅專用發(fā)票為例,表結(jié)果設計如下:
2.2 發(fā)票認證過程
發(fā)票認證是構(gòu)建與國稅增值稅發(fā)票選擇確認平臺的數(shù)據(jù)通道,通過勾選發(fā)票信息并觸發(fā)認證請求,更新發(fā)票認證狀態(tài)。具體方案為通過restful、webService形式將當期需抵扣、退稅、代辦退稅的發(fā)票數(shù)據(jù)采用JSON或XML的格式以POST方式提交參數(shù)到通道,通過通道發(fā)送給當?shù)囟惥烛炞C發(fā)票有效性,通道將稅局的認證結(jié)構(gòu)異步返回給發(fā)票池。
2.3 數(shù)據(jù)分析過程
發(fā)票池數(shù)據(jù)信息為省公司發(fā)票大數(shù)據(jù)分析提供基礎(chǔ)數(shù)據(jù)源,根據(jù)采集到發(fā)票池中的發(fā)票數(shù)據(jù),運用大數(shù)據(jù)和云計算等先進技術(shù),結(jié)合稅務稽查對企業(yè)發(fā)票全量數(shù)據(jù)進行統(tǒng)計分析。下圖以國家電網(wǎng)某網(wǎng)省公司購電費結(jié)算業(yè)務場景為例,描述發(fā)票簽收、狀態(tài)監(jiān)控、發(fā)票認證、賬稅核對、發(fā)票綜合分析等整體分析過程。
如圖所示,查詢和分析的種類較多,為滿足各類型分析計算需求,平臺采用流計算、內(nèi)存計算、批量計算和查詢計算四類計算能力。其中流計算主要用于對業(yè)務執(zhí)行過程中實時產(chǎn)生數(shù)據(jù)的即時處理,其一般特征是處理不落地數(shù)據(jù)、計算過程不使用歷史數(shù)據(jù)、即時響應要求很高;內(nèi)存計算主要用于對存儲在內(nèi)存中的數(shù)據(jù)做即時處理,其一般特征是處理過程不與持久化數(shù)據(jù)做交互、需要使用的歷史數(shù)據(jù)提前加載到內(nèi)存中、即時響應要求很高,如發(fā)票過賬會計憑證生成;批量計算主要用于離線獨立執(zhí)行的計算任務,其一般特征是計算過程主要使用歷史數(shù)據(jù)、往往服務與某個特定的場景和需求、往往對計算過程的實現(xiàn)和數(shù)據(jù)格式有特殊需求,如發(fā)票入池;查詢計算基于分布式文件存儲,提供類似SQL的查詢分析技術(shù),將查詢語句轉(zhuǎn)譯為并行的分布式計算任務,主要是MPP數(shù)據(jù)庫、Hbase的直接查詢。
3 結(jié)束語
成熟的大數(shù)據(jù)技術(shù)為發(fā)票池平臺建設提供了一個穩(wěn)定且有效的數(shù)據(jù)保障、數(shù)據(jù)處理、數(shù)據(jù)分析的解決方案,在現(xiàn)代財稅改革大背景之下,將體現(xiàn)其越來越重要的自身價值。本文從業(yè)務流程及技術(shù)實現(xiàn)兩方面給出了解決思路,并驗證了可行性。
未來隨著公司數(shù)據(jù)中臺及業(yè)務中臺戰(zhàn)略的逐漸落地,結(jié)合微服務微應用的架構(gòu)方式形成獨立的大數(shù)據(jù)發(fā)票服務平臺,為企業(yè)財稅信息化建設提供更優(yōu)質(zhì)的服務。
參考文獻:
[1] 原學軍,張帥,吳凡,等.分布式賬本技術(shù)在業(yè)財融合中的應用研究[J].中國市場,2020(5):155-156.
[2] 冉迅,袁建華,劉玉國,等.基于負載均衡的移動發(fā)票管理系統(tǒng)研究[J].計算機與現(xiàn)代化,2016(10):121-126.
[3] 韓榮鑫,杜青,郭淳,等.電力企業(yè)供應商服務大廳增值稅專用發(fā)票業(yè)務優(yōu)化研究[J].電力大數(shù)據(jù),2019,22(1):35-40.
[4] 宋瑜輝.基于MongoDB存儲和分析輔助決策系統(tǒng)中的海量日志[J].科技創(chuàng)新與應用,2019(33):5-8.
[5] 毋毅趙康.基于大數(shù)據(jù)平臺的電網(wǎng)全業(yè)務數(shù)據(jù)分析域研究[J].電腦知識與技術(shù),2016,12(34):15-17.
【通聯(lián)編輯:唐一東】