周旭 劉丹 鄧青 張彥彬 蘇楊 谷癑嬋
(1.廣州海關 廣東 廣州 510623;2.中國電子口岸數(shù)據(jù)中心廣州分中心;3.廣州海關技術中心;4.華檢通(北京)科技有限公司)
按照《“十四五”海關發(fā)展規(guī)劃》的總體部署,以高質量發(fā)展為主題,全面結合海關工作實際,海關總署印發(fā)關于推進海關風險管理高質量發(fā)展的指導意見。當前,進出口業(yè)務量快速增長與海關監(jiān)管資源相對不足之間的矛盾愈發(fā)突出,風險管理的基本目標就是在有限的資源條件下,盡可能以最少的成本獲取最大的安全保障,深度體現(xiàn)高質量發(fā)展的內涵需求。如何以最少的成本快速、精準、高效地實現(xiàn)各類風險信息的收集和整理,是現(xiàn)階段推進海關風險管理高質量發(fā)展的課題之一。意見指出要加快海關數(shù)據(jù)湖建設,匯聚跨層級、跨地域、跨系統(tǒng)、跨部門、跨業(yè)務的海關管理形態(tài)數(shù)據(jù)資源,標準化數(shù)據(jù)定義、計算、存儲方式,優(yōu)化風險管理大數(shù)據(jù)治理,不斷推進數(shù)據(jù)間的共享融合,實施大數(shù)據(jù)全生命周期的安全管理,為開展風險管理應用、分析及處置奠定堅實數(shù)據(jù)基礎。
進出口商品風險管理是海關風險管理的重要組成部分,進出口商品質量安全事關人民群眾的切身利益、國門安全和對外貿易的可持續(xù)發(fā)展。2017年9月,國務院印發(fā)《國務院關于完善進出口商品質量風險預警和快速反應監(jiān)管體系切實保護消費者權益的意見》(國發(fā)〔2017〕43號),要求完善進出口商品質量安全風險預警監(jiān)管體系,建立全國數(shù)據(jù)集成的風險信息平臺[1]。
為此,海關總署組織全國專家團隊研發(fā)建設“進出口商品質量安全風險管理信息化系統(tǒng)”,通過應用“互聯(lián)網+”、“大數(shù)據(jù)+云計算”等技術,在完善“智慧進出口工業(yè)品質量安全風險管理信息化平臺”的基礎上,整合“進出口工業(yè)產品質量安全風險預警平臺”、“出口退貨信息管理系統(tǒng)”及“RAPEX-CHINA中歐非食品消費品快速預警系統(tǒng)”等相關系統(tǒng)的功能,擬對接新一代海關業(yè)務系統(tǒng),包括信息系統(tǒng)、通關管理系統(tǒng)、風險作業(yè)系統(tǒng)、稽核查業(yè)務管理系統(tǒng)、e-Lab系統(tǒng)等,從海關大數(shù)據(jù)池中獲取相關信息。信息整理和標準化工作,是進出口商品質量安全風險管理整體工作中的重要環(huán)節(jié)和立足之本,
有助于打通從數(shù)據(jù)、信息、知識、至智慧的能力提升通道,提升大數(shù)據(jù)風險防控的智慧服務能力,推動風險管理向智能化、知識化升級發(fā)展。
目前,進出口商品質量安全風險信息整理工作缺乏一套統(tǒng)一、規(guī)范的方法和程序,無相關國家標準、行業(yè)標準或已立項未批準發(fā)布的行業(yè)標準。
在海關總署的進出口商品風險預警監(jiān)管專業(yè)技術規(guī)范體系中,進出口商品質量安全風險管理相關標準包括風險信息采集、評估、風險預警、處置等部分標準。其中,SN/T 4702-2016 8.2提出風險信息整理是風險信息采集程序中,尤其是風險信息獲取后的必經流程[2],SN/T 4836-2017 5.2.1提出風險信息整理工作的主要內容[3],但尚無針對或適用于進出口商品質量安全風險信息整理的通用技術要求和總體規(guī)范要求。
因此,亟需在海關總署進出口商品風險預警監(jiān)管專業(yè)海關技術規(guī)范體系中,研究制訂風險信息整理工作的相關標準,確保風險信息采集的規(guī)范性,提升風險評估結果的可靠性。
總體而言,進出口商品質量安全風險信息整理是要通過合適的信息整理手段,使復雜無序或不完整的信息轉化為適合后續(xù)分析和評估等工作的有效結構化信息,包括信息校驗、信息清洗、信息有序化、信息轉化和信息整合等。
(1)通過進出口商品質量安全風險信息校驗,在分析信息源特點的基礎上,找出信息質量問題的產生原因,排查并定位不符合規(guī)范的質量安全風險信息。
(2)通過自動信息清洗和人工信息清洗方式,建立清洗模型,應用清洗算法和方案,得到滿足質量要求的信息。
(3)通過進出口商品質量安全風險信息有序化,使信息按照一定的順序排列,得到符合范圍或順序的信息集。
(4)通過進出口商品質量安全風險信息轉換,對現(xiàn)有數(shù)據(jù)項進行運算比對,將其轉換為統(tǒng)一格式或新的信息項。
(5)通過進出口商品質量安全風險信息整合,對不同來源或數(shù)據(jù)表的數(shù)據(jù)進行匹配整合。
“進出口商品質量安全風險管理信息化系統(tǒng)”通過與海關大數(shù)據(jù)池、境內外政府部門機構通報系統(tǒng)進行對接,以及匯總網絡信息、消費者投訴信息等方式,采集進出口商品質量安全風險信息。需進行風險信息整理的內容和類型見表1。
表1 風險信息整理對象
例如,表1中“進出口商品檢驗監(jiān)管信息”和“風險監(jiān)測信息”部分來源于“進出口工業(yè)產品質量安全風險預警平臺”,其中與風險信息相關的部分見表2。
表2 “進出口工業(yè)產品質量安全風險預警平臺”風險信息相關表
進出口商品質量安全風險信息校驗包括以下內容:(1)為確保進出口商品質量安全風險信息的信息質量和風險分析的準確性,應對風險信息的正確性和真實性進行核查,必要時可開展信息調查。(2)進出口商品質量安全風險信息來自不同數(shù)據(jù)源,常存在缺失值、重復值,易出現(xiàn)信息重復、信息錯誤、字段命名沖突、屬性值和結構沖突、異常值錯誤等問題。(3)應通過算法邏輯對信息質量問題進行自動信息校驗并排查定位。(4)應對進出口商品質量安全風險的重點信息進行準確性、一致性、完整性和有效性校驗,必要時信息校驗還應包括規(guī)范性、重復性、同步性、可用性、可理解性、信息覆蓋范圍和信息衰變等。(5)對于通過自動信息校驗無法判定的信息質量問題,還可通過人工介入進行迭代和交互,通過信息可視化、人工反饋與交互等方式進行人工信息校驗。
進出口商品質量安全風險信息清洗應盡可能減少或簡化人工干預,自動化地完成海量風險信息的清洗工作,以降低系統(tǒng)風險、實現(xiàn)良好的信息清洗效果。風險信息清洗流程見圖1。
圖1 風險信息清洗流程圖
風險信息清洗的具體內容包括:(1)信息分析:通過詳細研究信息的源數(shù)據(jù)庫,分析其中的錯誤信息和不一致信息,判定信息是否有質量問題。(2)確定信息清洗規(guī)則和工作流:通過信息分析判定信息源是否可靠,建立適當?shù)男畔⑶逑捶椒?,確定信息清洗規(guī)則和工作流。(3)信息驗證:從信息源中抽取出一部分信息作為樣本,利用確定的信息清洗規(guī)則和工作流進行驗證,并分析驗證結果,以作相應的調整和改進,該過程往往需要進行多次,以確保信息清洗達到更高的精度。
信息清洗包括以下內容:(1)拆分字段屬性:字段屬性一般包含不同的信息,通過對屬性特征進行分析,將其拆分成不同的屬性字段,分別進行信息清洗,以提高信息清洗的準確率。(2)清洗:將數(shù)據(jù)字段按屬性拆分后,按照屬性間的特點,利用事先定義的算法,對其清洗和修正。(3)檢驗:經過清洗過程,信息集中無法使用的數(shù)據(jù)已被基本清理,為保證信息的可用性,還需對其進行考證,以免影響信息質量。(4)標準化:由于在清洗前對信息進行了拆分,為使其能夠與原有信息源中的信息相匹配,需要對清洗后的信息進一步處理,使其屬性結構恢復原樣。(5)清洗信息回流:在信息清洗后,將得到的信息回流至源數(shù)據(jù)庫,以達到提高信息質量的目的,防止重復處理,提高信息清洗的整體效率。
進出口商品質量安全風險信息有序化是為獲取風險信息提供快、準、全、便、省的檢索途徑,有助于信息檢查和糾錯,挖掘明顯特征和規(guī)律,以提升后續(xù)風險分析、風險評估等工作的效率,包括以下內容:(1)獲取進出口商品質量安全風險信息后,應建立信息自動檢索存儲系統(tǒng),形成索引文檔以備后續(xù)使用。(2)風險信息索引文檔應按照錄入或采集時間排序。(3)應將不同信息源、網域、存儲方式、格式和質量的業(yè)務源信息,按照商品類型、生產國別、生產企業(yè)、危害對象、不合格項目、危害等級等進行分類。
進出口商品質量安全風險信息轉化包括2類:(1)對信息名稱及格式的統(tǒng)一,即信息粒度轉換、規(guī)則計算及統(tǒng)一命名、信息格式、計量單位等。(2)通過字段的組合、分割或計算,形成信息來源中可能不存在的內容或信息,例如:(1)通過HS編碼、CIQ編碼對產品類別進行轉化。(2)通過貿易國別或原產國別對來源區(qū)域進行轉化。(3)按照匯率對金額信息進行轉化。(4)對危害等級進行轉化。
進出口商品質量安全風險信息整合應包括:(1)根據(jù)信息關聯(lián)規(guī)則或算法,將進出口商品質量安全風險信息和其它信息進行關聯(lián)。(2)全面梳理信息格式、內容和要求,提出信息整合方案,針對不同信息來源,制定數(shù)據(jù)庫讀取或數(shù)據(jù)接口方案,通過多渠道收集風險信息,并建立質量安全風險信息數(shù)據(jù)庫。(3)對不同來源或數(shù)據(jù)表的數(shù)據(jù)進行匹配整合,例如,對于通報召回信息,通過通報號作為關鍵字段,將通報信息表與反饋信息表進行關聯(lián),以便進行后續(xù)分析。
本文在參與海關總署“進出口商品質量安全風險管理信息化系統(tǒng)”研發(fā)和應用實踐的基礎上,對進出口商品質量安全風險信息整理工作的流程進行了深入分析,研究提出了進出口商品質量安全風險信息整理工作的規(guī)范化標準,以期提高進出口商品質量安全風險信息的質量,為后續(xù)風險分析和精準布控打下堅實的基礎,推進海關風險管理的高質量發(fā)展。